Динамика опубликования постов и комментариев в русскоязычном сегменте Facebook (на основе анализа данных за первые пять месяцев 2013 г.). Избранные моменты. | Мнение специалиста от 01 июня 2016 года | Конструктивная кибернетика

Динамика опубликования постов и комментариев в русскоязычном сегменте Facebook (на основе анализа данных за первые пять месяцев 2013 г.). Избранные моменты.


Летом 2013 г. нами было проведено исследование некоторых статистических характеристик, связанных с динамикой опубликования постов и комментариев в русскоязычном сегменте социальной сети facebook.com. В результате был получен ряд нетривиальных результатов. С двумя из них предлагаем ознакомиться в данной заметке. Полная версия работы (на английском языке) опубликована на сервере препринтов arxiv.org и на нашем web-сайте, в разделе Препринты, 2016 г.

Перед исследованием стояла задача разведочного анализа, так как объективные данные по статистике опубликования постов и комментариев в Фэйсбуке на тот момент просто отсутствовали (на самом деле корректных оценок в открытом доступе и сейчас очень мало). Сам анализ проводился на уровне базовых характеристик, идентичных для большинства площадок социальных медиа. Специфические свойства сети, такие как например «лайки» – не рассматривались. Это сделало возможным прямое сравнение полученных результатов с данными других площадок.

В отчёте мы также описали подход к структурированию исходных данных, связанных с формализацией и упорядочиванием информационных структурных элементов на площадках социальных медиа. Подход оперирует представлением структурных элементов социальных медиа в виде согласованной иерархии объектов-контейнеров и их отношений. Данный метод позволяет структурировать и анализировать исходные данные с различных площадок социальных медиа в рамках единой алгоритмической конструкции. Подробности см. в полной версии статьи по вышеуказанным ссылкам.

Рамки данной работы были ограничены анализом двух уровней иерархии (аккаунты и сообщения). Сообщения разделялись на два типа: посты и комментарии. При этом содержимое сообщений не анализировалось, а из их метаданных для анализа брались два параметра: автор сообщения и дата создания сообщения. Более того, для анализа брались только те посты, которые публиковались именно владельцем аккаунта. Исходные данные были предоставлены компанией «Лаборатория Цифрового общества (DSL)» в рамках договора с Институтом Проблем Управления РАН о сотрудничестве.

Один из самых примечательных результатов: выявлена существенная аномалия в количестве аккаунтов с производительностью написания постов около двух постов за три дня. Распределение числа пользовательских аккаунтов в зависимости от количества опубликованных ими постов приведено на левом рисунке, а сама область аномалии f100 в увеличенном масштабе – на правом (красным цветом выделено теоретическое степенное распределение):

Область f100 на распределении числа пользовательских аккаунтов в зависимости от количества опубликованных ими постов.

Эта аномалия тянет за собой второй примечательный результат: специфичное распределение доли опубликованных постов в функции производительности пользователей (на правом рисунке приведена кумулятивная доля постов):

Область f100 на распределении доли опубликованных постов в функции производительности пользователей.

Отметим, что область a8 примерно соответствует производительности – 1 пост в две недели, что вполне укладывается в типичную производительность обычных пользователей пишущих по значимым для них темам. Таким образом, посты «обычных» пользователей, существенно разбавляются постами за авторством «профессиональных» пользователей. При этом, в зону f100 не особо попадают новостные агентства, сообщества, рекламно-спамные боты и т.п., ибо они лежат существенно правее по оси производительности (число постов в сутки).

Взвешенное суммирование числа аккаунтов в области f100 позволило оценить (в первом приближении) общее количество «аномальных» пользовательских аккаунтов в русскоязычном сегменте Facebook на уровне 96 000. Анализ структурных и динамических характеристик позволил отделить эти аккаунты, от обычных (грубо говоря, под обычными аккаунтами понимаются аккаунты, по своим характеристикам попадающие на красную линию теоретического степенного распределения, см. первый рисунок справа). Дальнейший анализ, в том числе и на уровне контента сообщений, показал, что подавляющее большинство из этих аккаунтов так или иначе объединены в единую сеть. С учётом показанного влияния аккаунтов из зоны f100 на общее количество публикуемых постов в русскоязычном сегменте Facebook (см. предыдущий рисунок) получается, что в случае скоординированной политики публикаций, влияние f100, на информационный фон в Фэйсбуке будет весьма существенное.

И ещё три занимательных момента:

  • Около 55-ти % постов (имеющих хотя бы один комментарий) не комментируются самими авторами.

  • Около 50-ти % авторов постов (имеющих хотя бы один комментарий), имеют не более трёх комментаторов (авторов комментариев) каждый.

  • Около 50-ти % постов было впервые прокомментировано в течение 51-й минуты с момента опубликования поста. Наиболее вероятное время появления первого комментария с момента опубликования поста – 50 секунд. Зарегистрирована максимальная задержка появления первого комментария к опубликованному посту – 5 лет и 9 месяцев.

Если приведённые факты заинтересовали, то рекомендуем ознакомиться с полной версией отчёта (на английском языке): arxiv.org; или на нашем web-сайте, в разделе Препринты, 2016 г.. Конечно, некоторые из полученных характеристик, за прошедшие три года, вполне могли устареть, но, как показывает наш опыт анализа социальных медиа, многие структурные и вероятностно-временные характеристики площадок – достаточно робастны, и существенно изменяются только в случае либо реорганизации площадки, либо с изменением её позиционирования в среде масс-медиа. Но ничего подобного, за этот промежуток времени, за Фэйсбуком замечено не было.

01 июня 2016 года.

Андрей Макаренко,
группа «Конструктивная Кибернетика».

Обсуждение: contact@rdcn.ru

Ключевые слова: Социальные медиа, Facebook, посты, комментарии, динамика опубликования.