Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Диплом_Калинникова_ШБ_22.docx
Скачиваний:
2
Добавлен:
16.11.2019
Размер:
1.62 Mб
Скачать
    1. Математическая модель работы приложения

С точки зрения математики любая социальная сеть может быть представлена в виде графа – совокупности непустого множества вершин и множества пар вершин (связей между вершинами)9, где множеством вершин является множество людей, а множеством пар – наличие отношений между ними.

Принято говорить о том, что термин «Социальный граф» вошел в оборот благодаря Facebook в 2007 году. На самом деле, этой системе уже 80 лет. Идея «Social Graph» проста и заключается в том, чтобы создать график социальных взаимоотношений, на основе имеющихся в сети пользовательских данных10.

В 1932 году психиатр Джейкоб Морено (Jacob Moreno) исследовал эпидемию побегов в школе для девочек Хадсон (Hudson School for Girls). Тогда 14 девочек совершили побег из дома в течение двух недель. И вместо того, чтобы изучать каждый случай отдельно, Морено создал «карту» их социального взаимодействия (см. Рисунок 4), которая наглядно показывала, как и в каком случае каждая из них оказывала влияние на другую. Таким образом был сделан вывод, что это не медицинская, а именно социальная эпидемия, распространившаяся благодаря их взаимодействию.

Рисунок 4. «Карта» социального взаимодействий

В 80-е годы это направление стало развиваться все больше. На втором графике видно, как усложнился подход. Вместе с тем пришло и лучшее понимание процессов (см. Рисунок 5).

Рисунок 5. Эволюция графов

Со временем на Западе появилось множество исследований о том, как люди, заключенные в социальный граф, друг на друга влияют.

Но незадолго до этого в 1969 году американские психологи Стэнли Милгрэм и Джеффри Трэверс выдвинули ошеломляющую на первых взгляд теорию, о которой сегодня хорошо знают и даже частенько пытаются использовать – теорию 6 рукопожатий.

Предложенная ими гипотеза заключалась в том, что каждый человек опосредованно знаком с любым другим жителем планеты через цепочку общих знакомых, в среднем состоящую из шести человек.

Милгрэм опирался на данные эксперимента в двух американских городах. Жителям одного города было роздано 300 конвертов, которые надо было передать определённому человеку, который жил в другом городе. Конверты можно было передавать только через своих знакомых и родственников. До бостонского адресата дошло 60 конвертов. Произведя подсчеты, Милгрэм определил, что в среднем каждый конверт прошёл через пять человек. Так и родилась теория «шести рукопожатий».

Эксперимент Милгрэма был повторён учеными кафедры социологии Колумбийского университета при помощи электронной почты. Тысячам добровольцев они предложили «достучаться» до 20 засекреченных людей, о которых сообщали имя, фамилию, род занятий, место жительства, образование. Первой успешной попыткой стало определение почтового адреса одного из таких «засекреченных» в Сибири. Доброволец из Австралии нашёл адрес сибирской «цели» при помощи всего четырёх сообщений.11

Анализ экспертами Microsoft данных, полученных за месяц общения 242 720 596 пользователей, занял два года. Объём исследуемых данных составил около 4,5 ТБ. На этой базе данных было установлено, что каждый из 240 миллионов пользователей сервиса мог бы «дойти» до другого в среднем за 6,6 «шага». Чем исследователи математически доказали теорию и расхожую шутку о том, что через пять человек каждый из нас знаком с английской королевой.

Однако, результаты недавних исследований оказались еще более прогрессивными. Ученые из Миланского университета усилили гипотезу шести рукопожатий при помощи Facebook - оказалось, что большинство людей связано между собой в среднем через четырех посредников (то есть пять рукопожатий)12

В рамках работы ученые проанализировали "социальный граф" с более 700 миллионами вершин-пользователей социальной сети. Отбирались только активные пользователи - те, кто хотя бы раз заходил на сайт в мае 2011 года. Ребрами соединялись те вершины, между которыми была установлена дружба. Всего таких ребер в графе было более 69 миллиардов.

Для работы ученые использовали собственный алгоритм (и его программную реализацию) вычисления функции соседства N(t) - для фиксированного натурального t она возвращает количество пар вершин в графе, минимальный путь между которыми занимает не более t ребер. В результате им удалось установить, что среднее минимальное расстояние между двумя вершинами - 4,74 ребра (то есть пять рукопожатий или, что то же самое, четыре посредника).

Ученые отмечают, что если ограничиться рассмотрением не всех вершин, а только близких к данной по некоторому критерию (например, людей из одной страны, социальной или возрастной группы), то это расстояние уменьшается еще больше. Например, для людей из Италии этот показатель составляет порядка четырех ребер.

Длина пути всегда будет зависеть о степени влиятельности пользователя. Первое, что приходит в голову - пользователь тем влиятельнее, чем больше у него друзей. Однако это убеждение неверно.

Пусть, например, есть некто мистер Икс, у которого много друзей-изгоев, то есть таких пользователей, которые настолько скучны, что дружат только с мистером Икс. Пусть последний решил распространить некую информацию: запостил нечто у себя в блоге и просит своих друзей ему помочь. Они, конечно, перепостят эту запись по просьбе единственного друга, однако дальше эта информация не пойдет, так как у изгоев нет возможности продвигать информацию дальше. Из этого примера хорошо видно, что для эффективного распространения последней пользователь должен быть, в некотором смысле, в центре сети. Однако что значит в центре, если изображение у нас абсолютно схематическое (см.Рисунок 6)?

Рисунок 6. Граф мистера Икс

В рамках работы ученые нашли ответ. Каждому пользователю они присвоили целочисленный индекс: чем он выше, тем пользователь влиятельнее. Считать этот индекс предлагается при помощи так называемых k-оболочек. Алгоритм их построения опишем на примере приведенного рисунка. Сначала из схемы выкинем всех пользователей, у кого не более одного друга (то есть либо ноль, либо один). В нашей схеме такой пользователь ровно один - это пользователь номер 1. При этом в нашей схеме появился еще один пользователь, у которого ровно один друг - это пользователь номер 2. Продолжим выкидывать точки до тех пор, пока в нашей схеме не останется ни одной вершины с одним ребром. Все удаленные точки (в нашем случае это номера 1, 2 и 3) представляют собой 1-оболочку и получают индекс 1. Теперь повторим этот процесс уже для пользователей, у которых как минимум два друга (в нашем случае это вершина с номером 4). Выкинутые точки получат индекс два. И так далее.

Отбросив все вершины графа с индексом 2, мы получим четыре вершины, у каждой из которых будет по три ребра: номера 5, 6, 7 и 8. Их влияние будет равным (индекс 3), хотя изначально у номеров 6 и 8 было больше ребер (по четыре).

Таким образом, наш мистер Икс, хоть и имеет много друзей все равно имеет индекс влиятельности 1 и при применении описанного алгоритма будет выкинут довольно быстро. То есть количество друзей и индекс влиятельности – это совсем не одно и то же, и они даже не прямо пропорциональны.

В зависимости от степени влиятельности пользователь может быть отнесен к одной из трех групп: пограничник, связной и брокер (см. Рисунок 7).

Рисунок 7. Типы пользователей социальной сети

Пограничники (отмечен голубым цветом) – это пользователи находящиеся на «окраинах сети». Часто к ним относятся «сложные» люди, пользователи, недавно зарегистрировавшиеся в сети, а также уникальные «нишевые» эксперты.

Брокеры (отмечен розовым) – участники, связывающие людей из различный подгрупп. Типичными характеристиками брокеров являются: наиболее высокая скорость распространения информации, авторитетность и понимание культурных норм и практик различных групп.

Связные (отмечены оранжевым) – люди, у которых больше всего прямых связей. Часто к ним относятся перегруженные работой лидеры, восходящие звезды и политические игроки13.

С использованием данного алгоритма и данной классификации и будет вестись разработка программной части приложения.

Таким образом, чтобы гарантированно охватить всех своих друзей и друзей своих друзей, необходимо будет вычислить пользователей, которые обеспечат гарантированный охват и попросить их разместить запись на своей стене или ее перепостить. И несмотря на всю информационную перегрузку в ленте новостей, пользователь увидевший запись несколько раз вероятнее всего посмотрит на нее, если пропустил до этого14. Кроме того на основе исследований современных социальных сетей касающихся того, по какому признаку пользователи формируются в группы, возможно будет разрабатывать дальнейший функционал приложения с более глубоким анализом пользователей.