Азы социально-сетевого анализа (Social Network Analysis 101)
От переводчика. Автор этой публикации — Майкл Ву (Michael Wu), ведущий аналитик компании Lithium, специализирующийся в изучении социальных взаимодействий и онлайн-сообществ.
Чтобы понять, что такое «социально-сетевой анализ» (Social Network Analysis, SNA), нужно понимать, что такое «социальная сеть» и что такое «социальный граф». Говоря просто, социально-сетевой анализ — это способ изучения социальных сетей, а социальная сеть — это набор сущностей, между которыми есть определенные отношения. Социальные сети существуют с тех пор, как люди начали бродить по земле. По правде говоря, подобные структуры есть не только у людей, но и у социальных животных (например, у волков, львов, дельфинов, мышей и даже муравьев).
Безусловно, прежде всего нас интересуют такие сущности как люди, и такие отношения между ними как дружба (как на Facebook), совместная работа (как на LinkedIn), родство, общение и некоторые другие социальные взаимодействия. А в контексте SNA мы можем под социальным графом понимать просто визуализацию всего этого (я не собираюсь нагонять скуку формальным определением графа). В таком социальном графе каждая точка (или узел, или вершина) изображает человека, а ребро между двумя точками (людьми) изображает отношения между ними. А так как между людьми существует множество самых разных отношений, точно также существует множество разных социальных графов, изображающих эти отношения. Я покажу это на конкретном примере.
Репрезентативная социальная сеть и её социальный граф
Давайте предположим, что у меня, Майкла (Michael), очень маленькая социальная сеть, состоящая всего из семи друзей (смотри рис. 1). Предположим далее, что у меня очень простая жизнь, в которой я поддерживаю всего три типа социальных отношений: у меня есть коллеги по работе (обозначенные красными ребрами), собутыльники (синие ребра) и партнеры по бадминтону (зеленые ребра).
Что из себя представляет моя социальная жизнь? У меня есть коллеги по Литиуму (Фил и Джо, которые также являются коллегами друг для друга). А перед тем, как я пришел работать в Литиум, я работал с Джеком и Райаном в Калифорнийском университете в Беркли. А еще до этого я работал с Райаном и Доном в Национальной библиотеке Лос-Аламоса. Райан пришел в Беркли вместе со мной получать степень кандидата наук (PhD), таким образом мы с ним пересеклись на двух работах. Вот почему Райан также работал вместе с Джеком и Доном, но которые не являются коллегами друг для друга.
Другая часть моей социальной жизни связана с моими собутыльниками. Я часто ходил выпивать с Дагом, Адамом и Райаном во время аспирантуры. Однако Райан и Даг никогда не оставались друг с другом наедине и никогда никуда не ходили вместе. Когда я пришел в Литиум, я узнал, что Фил и Джек часто выпивают вместе, но я никогда ни с кем из них не делал этого.
Наконец, я люблю бадминтон. Везде, где я работал, я находил себе партнера по бадминтону. Я играл с Джо в Литиуме, с Джеком в Беркли, и с Доном в Лос-Аламосе. Райан тоже играет в бадминтон — с Филом и Дагом. Однако они играют гораздо лучше меня, поэтому я никогда ни с кем из них не играл.
Если вообразить себе всех моих семерых друзей на Facebook, то наш граф дружбы выглядел бы так, как показано на рисунке 2a. Черные грани обозначают дружбу, а точнее людей, которые знакомы друг с другом. Но если вы захотите увидеть мою профессиональную сеть, тогда мой социальный граф будет выглядеть так, как показано на рисунке 2b. В этом случае, красные ребра обозначают мои взаимоотношения с коллегами по работе. Обратите внимание, что Адам и Даг не включены в мою профессиональную сеть (между нами нет красных ребер), потому что мы никогда не работали вместе.
Граф моих собутыльников показан на рисунке 2c (где синие ребра обозначают тот факт, что мы выпиваем вместе) и включает в себя Дага, Адама и Райана, так как я никогда не выпивал ни с кем из моих других друзей. И несмотря на то, что Джек и Фил выпивают вместе, я никогда не делал этого с ними, поэтому между нами нет синих ребер. Таким образом, Джек и Фил оказываются в абсолютно отдельной сети выпивох.
И наконец, граф моих партнеров по бадминтону показан на рисунке 2d, где зеленые грани обозначают взаимоотношения, основанные на совместной игре в бадминтон. Только Джек, Джо и Дон включены в мою бадминтонную сеть. У Райана же своя собственная сеть, состоящая из Фила и Дага, и никто из них не включен в мою сеть.
Чтение и интерпретация социального графа
Заметьте, мы построили четыре различных социальных графа из одной и той же социальной сети, состоящей из восьмерых человек. Задавая, что будут обозначать грани, мы получаем свой особый граф со своими особыми метриками. Например, если мы решим, что грани должны обозначать совместное веселое времяпрепровождение, мы построим еще один, совсем другой социальный граф, который будет выглядеть как пересечение моего графа собутыльников и графа партнеров по бадминтону (безусловно, работа в Литиуме тоже доставляет много веселья, но я сейчас всё упрощаю). Таким образом, благодаря тому, что между людьми существует много разных отношений, много разных социальных графов может быть построено.
Поэтому, самое важное, что надо сделать перед интерпретацией любого социального графа, это понять, какого типа отношения обозначают его грани. Это, пожалуй, даже более важно, чем понимание, что обозначают вершины. В SNA сущности, обозначаемые вершинами, обычно всегда будут людьми, а вот 99% всех метрик графа будут сильно зависеть от его граней. Поэтому, если изменяется измеряемое отношение, изображаемое гранями, метрики также будут меняться.
Например, простейшей метрикой графа является степень центральности (degree centrality), показывающая, сколько связей есть у вершины. Так, всего существует 7 черных граней (рисунок 2a), т.е. у меня есть 7 друзей. При этом красных граней всего 5 (рисунок 2b), т.е. у меня 5 коллег. Моя степень центральности на графе собутыльников равна 3 (рисунок 2c), у мня всего 3 собутыльника. Степень центральности может быть посчитана для всех людей на графе. Например, степень центральности Райана на графе партнеров по бадминтону равна 2 (рисунок 2d).
Интерпретация метрик графа также зависит от взаимосвязи граней. Так, мы не можем узнать о том, сколько у меня коллег, глядя на граф друзей (рисунок 2a), потому что отношения с коллегами по работе не отображаются на графе друзей. И даже если мы предположим, что каждый, с кем я работаю, становится моим другом, опираясь только на граф друзей, мы можем только сказать, что у меня может быть любое число коллег, от нуля до семи. Поэтому, никогда не делайте выводов или заключений о существующих отношениях, основываясь на графе, в котором эти отношения не выражены явным образом в его гранях. Поступая так, вы будете просто гадать по кофейной гуще или делать случайные предположения.
В следующих публикациях на примере конкретных живых данных мы попробуем применить методы социально-сетевого анализа для выявления и измерения социального влияния внутри социальных сетей.