Показаны сообщения с ярлыком онлайн. Показать все сообщения
Показаны сообщения с ярлыком онлайн. Показать все сообщения

понедельник, 25 декабря 2017 г.

Кто с Марса, кто с Венеры


Если у человека спросить: "Кто Ваши близкие друзья? С кем Вы общаетесь больше всего? С кем Вы разговаривали сегодня?", то у него, скорее всего, наступит ступор. Что значит мои близкие друзья? Считать ли продавцов в магазине моими сегодняшними контактами? Что значит "много общаться"? Часто исследователи задают такие сложные вопросы в анкетах, и участникам часто бывает тяжело вспомнить такие мелочи, как случайные каждодневные контакты, они забывают указать кого-то важного, а также у каждого свои представления о том, кто настоящий друг, а кто нет. В результате, мы получаем неполные данные и можем сделать на основе их ложные выводы.
В последнее время появилось много работ, в которых социальные связи людей измеряются намного более точно. У людей больше не спрашивают, с кем они общаются или общались сегодня, это за них делают наши верные друзья - машины и техника. Часто можно увидеть работы, в которых людей просили поставить на телефон специальное приложение, отслеживающее их передвижения, или просили ходить целыми днями с чипами, которые отслеживают их передвижения и контакты. Конечно, все это делается с согласия самих людей.
Например, этим летом я была на школе по вычислительным социальным наукам, и всех участников и лекторов просили ходить с бейджами, в которые был вшит чип. Чипы измеряли близость в пространстве, и если два чипа находятся очень близко друг к другу на протяжении какого-то времени (например, люди начали разговаривать между собой), то это фиксируется как контакт. Это был сбор данных в рамках исследования SocioPatterns. SocioPatterns собирает данные на конференциях, в школах, музеях, больницах и подобного рода местах, где участники находятся в одном пространстве и общаются друг с другом. Они выкладывают эти данные в открытый доступ и собирают их преимущественно для того, что изучать распространение эпидемий по сетям контактов. На видео ниже - пример того, как люди коммуницируют на конференции.


       Также мы недавно писали про еще одно исследование, в котором людей просили поставить приложение, фиксирующее их звонки и сообщения и отслеживающее активность (загорается экран телефона - человек активен, экран не горит долгое время, например, ночью - человек не активен и, скорее всего, спит). На основе таких данных были показаны различия в общительности между совами и жаворонками, то есть теми, чья активность приходится на вечернее и ночное время, и теми, кто рано встает, но уже к вечеру вовсе не способен работать. Выяснилось, что у сов больше друзей, но жаворонки больше времени тратят на каждого нового друга.
На днях были опубликованы результаты еще одного подобного исследования, в котором изучаются различия в общительности между мужчинами и женщинами. В этом случае, помимо установки специального приложения на телефон, люди также заполняли анкету о психологических чертах. Например, это такие черты, как склонность к нарциссизму, открытости, экстраверсии. Около тысячи студентов, которые приняли участие в исследовании, дали доступ к нескольким типам социальных сетей: дружба в фейсбуке, сеть звонков и сообщений, близость в пространстве.

Социальные сети из статьи Psylla et al (2017). А - сеть личной коммуникации, B - сеть в Фейсбук, С - сеть звоноков. Оранжевые узлы - женщины, голубые узлы - мужчины. Оранжевая связь - связь между двумя женщинами, голубая связь - между двумя мужчинами, серая - связь между разными полами. Размер узла обозначает популярность в сети, толщина связей - частоту интеракций. В сети А видно, как студенты разбиты на учебные группы.

Итак, насколько все-таки мужчины и женщины различаются по своей общительности? Выяснилось, что во всех типах социальных сетей у женщин значительно большее число контактов, то есть они звонят, переписываются, дружат в Фейсбук и общаются в реальной жизни с большим количеством людей, чем мужчины. Помимо того, что женщины популярны в сети студентов (это результат того, что у них много контактов), они также намного чаще занимают позиции брокеров. Что это такое? Это такая позиция в социальных сетях, когда человек связывает несколько не связанных между собой групп. В случае студентов это, например, случай, когда женщина общается и со своей группой, и с несколькими другими группами одновременно. Мужчина, который не занимает позицию брокера, будет общаться только с одной подгруппой друзей. Несмотря на то, что в таком случае у него будут крепкие дружеские связи с этими людьми и поддержка от них, он может много го лишиться. Известно, что быть брокером в социальных сетях полезно. Ты очень быстро получаешь и передаешь информацию, всегда находишься в курсе того, что происходит во всей социальной сети. Второй интересный результат касается гомофилии, или схожести формировать связи с себе подобными. Выяснилось, что принцип гомофилии присутствует в большей степени в социальных сетях женщин. Они скорее будут формировать связи с другими женщинами, чем с мужчинами. Мужчины же общаются в одинаковой степени и с мужчинами, и с женщинами.
В этой работе есть еще несколько результатов о различиях в психологических чертах и передвижениях мужчин и женщин, но мы остановились на результатах всего лишь о социальных взаимоотношениях. Подробнее о  результатах можно почитать в самой статье. По результатам такого сравнения, исследователи предлагают классификатор, позволяющий очень точно угадывать, мужчина это или женщина по набору психологических черт, социальным контактам и паттернам передвижения. Если вы нарциссичны и у вас высокая самооценка, то вы, скорее всего, мужчина. Если вы дружите с себе подобными, эмоциональны и добросовестны, то вы, скорее всего, женщина.

вторник, 7 июня 2016 г.

Пробуем новый инструмент для анализа мемов на примере #денегнетновыдержитесь

Распространение мемов — одна из популярных тем в исследованиях онлайн-сетей и интернета. Не так давно вышел новый инструмент OSoMe (Observatory on Social Media), который позволяет каждому анализировать мемы и интернет-тренды в Твиттере. В этом посте протестируем его работу на примере недавнего мема "Денег нет, но вы держитесь".

Источник изображения

OSoMe: Observatory on Social Media
О выпуске нового инструмента для анализа онлайн-трендов и мемов было объявлено в прошлом месяце. Разработчики назвали его восхитительно  OSoMe, и говорят, что читать нужно именно как "awesome". OSoMe сделан на базе Network Science Institute университета Индианы, однако в его создании принимали участие ученые из разных университетов и компаний.
Авторы заявляют, что доступные ранее только специалистам в данные и возможности теперь открыты каждому бесплатно: журналистам, исследователям, каждому, кто хочет сделать свое маленькое исследование. У OSoMe очень простой интерактивный дизайн, который чем-то напоминает Gephi — программу для визуализации сетей.

Интерфейс OSoMe

OSoMe позволяет оценить общие тренды появления и исчезновения хэштегов; посмотреть на графы их совместной встречаемости, ретвитов и упоминаний; узнать, где чаще всего используется определенный хэштег; разобраться, с какой вероятностью аккаунт окажется ботом.
Сейчас известно, что OSoMe предлагает аналитику на основе 70 млрд публичных твитов в Твиттере, начиная с 2010 года и по сегодняшний день. 

Тренды по частоте употреблений хэштега
Вкладка "Trends" позволяет изучать тенденции употребления нескольких хэштегов одновременно, поэтому мы решили посмотреть на совместную динамику хэштегов #денегнетновыдержитесь и #медведев, начиная с 20 мая. Мем "Денег нет, но вы держитесь" возник только после 23 мая, поэтому до этого времени его на графике нет. Любопытно, что вместе с появлением этого хэштега также возрастает употребление и хэштега #медведев. Далее посмотрим на совместную употребляемость этих хэштегов, что нам также предлагает OSoMe.

Частота употреблений хэштегов "денегнетновыдержитесь" и "медведев" с 20 мая по 5 июня 2016

Совместное употребление хэштегов
Введя название интересующего хэштега, мы можем получить граф совместной встречаемости этого хэштега с другими. Нажав на связь между двумя хэштегами, можем дополнительно увидеть пользователя и его твит. На рисунке приведена часть графа, где мы видим, что #денегнетновыдержитесь употребляется с #медведев (что мы уже видели из трендов), #денегнету, #россия и другими.

Граф совместной встречаемости хэштега #денегнетновыдержитесь  с другими.

Графы пользователей
OSoME также предлагает нарисовать граф упоминаний и ретвитов заданного хэштега пользователями. В нашем графе упоминаний самыми популярными оказались пользователи IgorZ_ua и KKKushkin, которые, видимо, и были основоположниками мема.

Граф упоминаний пользователей, использующих #денегнетновыдержитесь

Видео 
Разработчики OSoMe также предлагают посмотреть на общие тенденции в видео-формате. Мы запросили сгенерировать видео о совместной встречаемости #денегнетновыдержитесь с другими хэштегами. OSoMe отправляет на почту ссылку на видео, однако оно достаточно низкого качества и едва ли из него можно почерпнуть что-то существенное, кроме как посмотреть на летающие графы.


Дополнительные опции
Помимо этого, OSoMe также предлагает оценить, насколько тот или иной Твиттер-аккаунт является ботом. Дополнительно производится анализ текстов этого пользователя, приложение может сказать, насколько текст твитов эмоционально положительный или отрицательный, построить различные графы и предоставить другую статистику по пользователю. Например, Наш Твиттер-аккаунт OSoMe оценил как что-то среднее между ботом и человеком.

Опция OSoMe -- бот или не бот?

вторник, 31 мая 2016 г.

Итоги месяца: май

И вновь итоги месяца. На этот раз про то, что произошло в мае.


пятница, 29 апреля 2016 г.

Итоги месяца: апрель

Мы решили начать новую рубрику с основными событиями месяца. Если вы что-то упустили, самое время прочитать последние новости и все равно быть в курсе:

Источник изображения

среда, 6 апреля 2016 г.

Загадка семи мостов, анархические социограммы и кумовство норвежских рыбаков: к истории сетевых исследований


Представляем гостевой пост от Егора Лавренчука - нашего коллеги и друга. Егор преподаватель, кандидат философских наук. Главный философ у себя в подъезде, любитель считать падающие звезды.

***
Принято считать, что сетевой подход зародился в начале XX века вместе с философскими идеями Георга Зиммеля. Его концепция «количественности» отношений в крупных индустриальных центрах в дальнейшем определила возникновение концепта «социальная сеть».
"Всякое достигнутое [городом] в его развитии расширение служит основанием для дальнейшего, не одинакового, но более значительного расширения; к каждой нити, выпряденной из процесса его развития, прирастают как бы сами собой новые нити... Тут именно количественность жизни непосредственно переходит в качественность, в характер"
 – писал он в работе «Большие города и духовная жизнь». Этот принцип впоследствии сформулирует Роберт Мёртон, назвав его «Эффект Матфея».
Между тем в научное употребление термин «социальная сеть» вошел не в начале XX в., с подачи Г. Зиммеля, а только через 50 лет. Британский антрополог Джеймс Барнс, изучая взаимоотношения жителей рыбацкого поселения Бремнес, расположенного на западной границе Норвегии, введёт понятие «социальная сеть», чтобы дать определение неформальным отношениям рыбаков (которые у нас принято назвать кумовством).
"Я провел 1952 и часть 1953 года в Норвегии, изучая то, что представлял себе как исследование малых групп. Вскоре я обнаружил, что люди, с которыми работал, обладали культурными ценностями, которые делали их восприятие общности отличным от привычного нам представления. Их социальный мир кишел различными формальными организациями, но большинство жителей опирались в принятии решений на личные связи, которые часто переступали через рамки формальных отношений. Я постарался собрать и зафиксировать их отношения, назвав это сетью."
– почти через 30 лет вспоминает Дж. Барнс в интервью для This Week’s Citation Classic.
Рыбаки. Источник изображения
Автор концепта не приобрел популярности в научных кругах в связи с предложенной идеей и отошел от исследований социальных сетей, занявшись социологией знания. Получил он свои «дивиденды славы» только спустя десятилетия. Гораздо известнее и влиятельнее в 1960-х был его коллега, также представитель Манчестерской антропологической школы, – Джеймс Клайд Митчелл, который впоследствии стал одним из учредителей Международной ассоциации исследователей социальных сетей (INSNA).
Сегодня мы наблюдаем множество удивительных и значимых открытий, которые совершают, используя сетевой подход, представители INSNA и их коллеги. Но базовые сетевые законы были открыты в экспериментах, авторы которых уже практически забыты. Один из таких авторов – американский социальный психолог Алекс Бейвлас. В 1948 году он основал Лабораторию сетевых групп в Массачусетском технологическом институте. Вместе со своими студентами, одним из которых был выдающийся психолог, соавтор «эксперимента о централи» – Харольд Левитт. А. Бейвлас и Х. Левитт поставили задачу изучить, каким образом способы коммуникации между людьми влияют на групповую структуру организаций.
Вплоть до 1950-х годов в исследовательской среде доминировала точка зрения, что коммуникация в организациях протекает или вдоль формальных линий структуры, или по направлению вверх – от сотрудников к их менеджерам и далее к руководству организации. Однако после Второй мировой войны ученые стали признавать, что существуют и другие типы потоков коммуникации в организациях. Проблема, с которой столкнулся А. Бейвлас, заключалась в том, чтобы измерить эти «неформальные» потоки коммуникации.
Наиболее известный эксперимент А. Бейвласа, направленный на её решение, был следующим: пять человек играют в игру, целью которой является решение задачи с помощью общения. В начале игры каждому участнику дают уникальную часть информации; для того, чтобы получить полный ответ, игроки должны объединить все эти части вместе. Участники эксперимента размещались в кабинах, расположенных так, чтобы они могли общаться друг с другом. Коммуникация продолжалось до тех пор, пока загадка не решалась. Цель каждого игрока – получить ответ первым.

Схемы расположения в эксперименте А. Бейвласа. Наверху слева направо - колесо, круг, штурвал. Внизу слева направо - цепь, игрек. Источник изображения.

А. Бейвлас проследил, как участники достигали этой цели, и выявил наиболее эффективные стратегии. Для этого он расставил кабины в порядке, имеющем различную сетевую топологию, и сравнил результаты для каждой из получившихся структур. Результаты эксперимента его очень удивили. Предполагалось, что разные модели коммуникации по-разному будут влиять на выполнение участниками поставленных задач. Сетевая структура в этих экспериментах обычно обеспечивалась искусственным разделением групп на такие подгруппы, где сообщения могли передаваться только в определенных направлениях и через определенные позиции. Эти структуры довольно часто упоминаются в социологической литературе: «круг», «колесо», «штурвал», «игрек», «цепь».
А. Бейвлас изначально полагал, что структура «круга» будет самой эффективной для решения проблемы, а «штурвал» будет наименее эффективным. Но оказалось всё наоборот. В итоге экспериментаторы пришли к заключению, что центральность является наиболее важным аспектом организационной коммуникации: чем более централизована организация, тем эффективней в ней происходит коммуникация. Центральный узел в такой структуре выступает интегратором, направляющим информационные потоки от одного узла к другому. А. Бейвлас в работе "Communication patterns in task-oriented groupsназвал это свойство сетей – «центральность по близости», определив его как естественную метрику расстояния между всеми парами узлов в связанных графах.
Однако последующие эксперименты продемонстрировали, что эффективность коммуникации зависит не только от централизации сетевой структуры (в действительности все оказалось не так однозначно). В эксперимент было внесено дополнительное условие – сложность выполняемой задачи. В итоге эксперимент показал, что тогда как централизованные организации могут эффективнее выполнять простые задачи, более сложные задачи нуждаются в децентрализованном подходе.
Слева - централизованная сеть, справа - децентрализованная. Источник изображения.

        Результаты этих экспериментов не так важны для сетевого подхода, они во многом совпадали с экспериментами психолога Якоба Морено (о котором речь пойдет далее), но было несколько ключевых отличий, которые стали критическими для развития современного сетевого анализа.
         Во-первых, в подходе Бейвласа-Левитта под социальной сетью понималась уже не совокупность людей, а их позиции. Таким образом, конечная модель отношений между позициями выглядела как основа структуры. То есть, важно не то, какие в группе находятся люди (мужчины или женщины, с высшим образованием или без него и т.д.), а как они связаны между собой, с какой структурой. В таком подходе топология связей имеет первостепенное значение, по отношению к личностным характеристикам участников группы.
      Во-вторых, связи между позициями обозначали потоки информационных ресурсов, а не отношения, как у Я. Морено. По Я. Морено, группе приписывались определенные позиции, а выборы (как позитивные, так и негативные) указывались стрелками. Таким образом, строилась «структура» предпочтений в группе. Он назвал такие схемы структурами притяжения или отталкивания.
        В 1934 году Я. Морено опубликовал монографию «Кто выживет?». В этой работе психолог, в частности, описал эксперимент, проведенный им в школе для трудных подростков-девочек. В столовой пансионата он предложил девочкам пересесть за столы так, как им больше нравится. В итоге получилось, что «восьмеро бегут к одному и тому же столу, к девушке, с которой они все страстно желают сидеть вместе. Остальные распределяются по немногим притягивающим их "звездам" и одна - остается в изоляции, то есть вообще без выборов, без внимания» (цитата из работы Р. А. Золотовицкого).

Примеры социограмм из работы Я. Морено "Кто выживет?". Источник изображения.

        Я. Морено зафиксировал получившуюся в результате перестроения новую структуру, назвав её анархической социограммой. После чего он провел социометрический тест (раздал анкеты с различными провокационными вопросами), на основе которого предложил новое распределение – более равномерное, но при этом учитывающее выборы, сделанные изначально воспитанницами школы. Он составил таблицы, куда внёс все диспозиции взаимных выборов девочек, распределяя их на несколько уровней. После этого он продолжил эксперимент уже в жилых комнатах кампуса. Эти таблицы (социограммы) стали первыми моделями социальных графов, применяемыми на практике.
        Вы, конечно, возразите, вспомнив статью математика Леонарда Эйлера, опубликованную в 1736 году, где он описывает задачу семи мостов Кёнигсберга: можно ли пройти каждый мост по одному разу и вернуться в исходное место? В этой статье Л. Эйлер впервые применяет теорию графов, показывая, что для положительно решения задачи нужно, чтобы у каждой вершины её степень (число выходящих из вершины рёбер) была чётной. Но в оправдание своего тезиса я замечу, что для исследования общества модель графов Л. Эйлером не применялась.


Иллюстрация задачи Л. Эйлера "Семь мостов Кенигсберга". Источник изображения.

Возвращаясь в ХХ век, перейдем от психологии к социологии, ведь по настоящему «расцвел» сетевой подход именно в рамках этой дисциплины. В 1970-х годах группа исследователей Гарвардского университета под руководством социолога Харрисона Уайта «взяла на щит» сетевую модель общества, заложив такую дисциплину как Анализ социальных сетей. Показательно, что статья Марка Грановеттера (ученика Х. Уайта) «Сила слабых связей», опубликованная в 1973 году, до сих пор остается наиболее цитируемым текстом о социальных сетях.
        Осмелюсь предположить, что такую популярность она приобрела благодаря своей лаконичности и математической точности. В статье М. Грановеттер вводит новые варианты описания социальных сетей (такие, например, как исключённая триада), обозначая их математическими символами, и элегантно оперирует ими для анализа информационной диффузии. Кроме того, он приводит дайджест наиболее значимых сетевых исследований. Так, автор апеллирует к эксперименту еще одного выпускника Гарвардского университета – психолога Стенли Милгрема.
       Разрабатываемая С. Милгремом (и его коллегами) гипотеза «6-ти рукопожатий» заключалась в том, что каждый житель Земли опосредованно знаком с любым другим жителем через цепочку общих знакомых, в среднем состоящую из пяти человек. Для её проверки исследователи решили географически ограничиться США. Они отправили конверты с буклетами, в которых содержалось обращение с просьбой передать через своих знакомых и родственников это послание конкретному человеку, а также отметки о том, кто и кому их до этого отправлял. Те письма, которые дошли до своего адресата, подтвердили, что в среднем каждый конверт прошёл через пять получателей.
Иллюстрация идеи 6 рукопожатий. Источник изображения.
М. Грановеттер произвёл расчеты, основанные на неопубликованных данных о расе участников этого эксперимента, и пришел к выводу, что слабые межрасовые связи оказались более эффективными при передаче ресурсов. Так как в 50% случаев, когда белый описывал темнокожего как знакомого, цепочка оказывалась завершённой; но когда белый отправлял буклет темнокожему другу, показатель завершения падал до 26%.
Впоследствии этот эксперимент повторялся различными исследовательскими группами. Самое «свежее» исследование провела команда Facebook. Они пришли к выводу, что радиус сети пользователей этой площадки равняется 3,5. Кстати, вскоре после этого в Facebook повторили эксперимент и М. Грановеттера, описанный в «Слабых связях».
Исследуя случайную выборку специалистов, вспомогательного персонала и управленцев, недавно сменивших работу, М. Грановеттер пришел к выводу, что для них слабые связи оказались важным источником возможной мобильности (смены работы). Исследование Facebook также показало, что слабые связи важны при поиске работы, потому что они более многочисленны, но единственная сильная связь будет полезней, чем единственная слабая связь.
В 1980-1990-х академический интерес к сетевому подходу подогревало возникновение виртуального мира и зарождающихся в нем онлайн-сообществ. В этой теме «пальмовую ветвь» можно отдать еще одному ученику Харрисона Уайта – канадскому социологу, основателю INSNA, Бари Веллману. В его концепции архаичные модели сообществ, которые он назвал «little boxes communities» (плотно связанные группы людей), трансформировались под воздействием массового использования новых видов транспорта и как следствие, возрастающей мобильности населения. «Door-to-door» коммуникация, характерная для архаичных сообществ уступила место «place-to-place» коммуникации, когда члены сообществ продолжали общаться, преодолевая расстояния.
       Так, например, если вы учились в школе в одном городе, а переехали учиться в университет в другой, после чего нашли работу в третьем городе и уехали снова, вы будете встречаться с вашими школьными и университетскими друзьями, приезжая к ним время от времени. В этом случае, по Б. Веллману, вы станете членом нескольких «glocalized networks» (под глокализацией понимается комбинация глубоких локальных и широких глобальных взаимодействий). Третий этап в развитии сообществ наступил в эпоху онлай-общения. Б. Веллман называет это «сетевым индивидуализмом» со свойственной ему «person-to-person» коммуникацией.
Ключевые исследователи социальных сетей. Фото из архива автора.

        Описание выдающихся работ, опубликованных в 2000-х, может очень сильно увеличить эту статью, а мне бы хотелось остановиться всё-таки на тех исследованиях, которые представляют собой разнообразные с дисциплинарной точки зрения подходы, не посвящая большую её часть Web Science и Big Data. Есть, правда, несколько сетевых исследователей XXI века, упомянуть которых просто необходимо. Прежде всего, я бы отметил физика Ладу Адамик, о которой в этом блоге уже писалиОна известна, например, исследованием использования Твиттера во время выборов в США в 2010 году.
        Ещё хотелось бы упомянуть психолога Николаса Кристакиса и политолога Джеймса Фаулера, опубликовавших работу «Связанные одной сетью». Эта книга произвела фурор благодаря их теории о том, что лишний вес и счастье, а также курение могут передаваться по каналам социальных сетей. Помимо этого, у них есть работа о том, что такое поведение, как развод также передается по социальным сетям. Если наши друзья разводятся, то эта участь также может с большой вероятностью ожидать и нас. Об этом исследовании авторы этого блога также написали один из наиболее увлекательных постов.
Думаю, следует также отметить дану бойд, опубликовавшую статью «Why Youth (Heart) Social Network Sites»где анализируется влияние социальных сетей интернета на личности подростков. На этом пока остановлюсь, так как более подробное рассмотрение современных авторов заслуживает отдельной статьи.

***
В заключение хотелось бы сказать, что для написания этой статьи были использованы материалы учебного курса «Социальные сети в междисциплинарном аспекте», который я читаю магистрам ГАУГНа. Также хочу поблагодарить своих коллег Софию Докуку и Диляру Валееву за предложение опубликовать этот текст на их замечательном ресурсе «Asocial Networks».

среда, 9 марта 2016 г.

Парадоксы социальных сетей


Мы не перестанем удивляться тому, как интересно устроены порой социальные взаимоотношения. В этом посте расскажем про парадокс дружбы и другие загадки социальных сетей.

Парадокс дружбы
Про парадокс дружбы наслышаны многие. В самой простой форме его можно сформулировать следующим образом: Мои друзья в среднем имеют больше друзей, чем я. Ключевое слово здесь, конечно, «в среднем».
Этот утверждение построено на основании того, что количество друзей в любой социальной сети распределено по степенному закону, а не нормально. Это хорошо видно на рисунке, где по оси х представлена степень узла (его количество связей), а по оси у — количество узлов с такой степенью.

Распределение степени (количества связей) в случайных графах и реальных социальных сетях. Слева мы видим нормальное распределение, справа - по степенному закону. Рисунок с сайта Network Science

Слева мы видим распределение степеней у случайного графа. Как правило, в случайных графах у большинства узлов показатель степени распределен нормально, то есть варьируется у среднего значения. В таких сетях практически нет очень популярных людей и изолированных акторов. Справа мы видим реальную социальную сеть. В ней есть малое количество людей, у которых очень много друзей. Также, есть значительная доля людей, у которых достаточно мало друзей. Как правило, большинство людей находятся в левой части распределения, а всю картину смещают как раз топовые персонажи с большим количеством связей в тяжелом правом «хвосте» этого распределения. Отсюда и получается, что если мы посчитаем количество друзей у наших друзей, в среднем, их у наших друзей окажется больше.
Парадокс дружбы впервые был озвучен в работе Скотта Фелда "Почему у твоих друзей больше друзей, чем у тебя", а затем много раз продемонстрирован на различных типах сетей. Если изначально идея касалась только степени (количество связей узла), то затем было показано, что это правило работает и на атрибутах участников сети, которые сильно скоррелированы со степенью. Например, если в определенной сети заядлые курильщики более популярны, то изучение их окружения покажет нам, что в среднем друзья этих курильщиков курят еще больше. Сегодня мы знаем, что наши друзья в Фейсбуке и Твиттере в среднем имеют намного больше друзей и фолловеров, что наши друзья в среднем более богаты и счастливы, что наши партнеры имеют намного больше сексуальных партнеров, а наших соавторов цитируют намного чаще.
Значит ли это, что можно расстраиваться и уже начинать считать себя неудачниками? Конечно, нет, потому что мы знаем, что друг моего друга — мой друг, а значит, также может быть нам полезен. А если их намного больше — то и возможностей намного больше.

Иллюзия большинства
Помимо парадокса дружбы, в прошлом году еще была предложена иллюзия большинства. Во многом, эта иллюзия основана на парадоксе дружбы, так как тоже связана с высокой популярностью небольшого количества людей в сети.
Авторы, которые обнаружили эту иллюзию, в своей работе представляют следующий рисунок. Перед нами две абсолютно идентичные по своей структуре сети. Единственное отличие в том, что красным цветом в них раскрашены различные узлы.

Иллюзия большинства из работы Lerman et al (2015). Обе сети идентичны по своей структуре, различаются они лишь по тому, что в них окрашены красным цветом разные узлы.

Если мы посчитаем количество прямых (не опосредованных) связей между белыми и красными узлами в обоих сетях, то обнаружим следующее. В сети слева белые узлы видят, что больше половины их друзей — красные узлы. В сети справа белые практически не связаны с красными узлами и у них практически нет красных в ближайшем окружении.
Так как на левом рисунке большое количество белых имеет друзей-красных, они думают, что такое поведение как «быть красным» очень распространено в этой сети. Белые на правом рисунке так не считают, потому что видеть красных в своем окружении — для них редкость. Это и есть иллюзия большинства. Она основана на том, что при принятии решений мы часто ориентируемся на свое ближайшее окружение, не видя при этом всю структуру сети.
Как это объяснить? Также, как и в парадоксе дружбы — наличием популярных узлов, которые меняют представление о сети в целом. Красные узлы на левом рисунке — это узлы с большим количеством связей, они тоже смещают среднее значение, как и в парадоксе дружбы.
Исследователи, обнаружившие эту иллюзию, протестировали ее на различных сетях (соавторство, онлайн-сеть фолловеров, сеть блогов) и показали, что она работает. Эта иллюзия еще раз доказывает идею, что при распространении какой-либо идеи или влияния необходимо в первую очередь воздействовать на узлы, которые наиболее популярны и связаны с большим количеством других узлов в сети.

Загадка онлайн-дружбы
Также есть более простая загадка, которая пока всерьез не изучалась, но заботит некоторых блогеров (например, тут и тут). Вопрос в том, как изменилась дружба и представление о ней с появлением онлайн-сетей, которые начали сильно ее опосредовать. Сегодня друзья — это все-таки только те, с которыми мы лично встречаемся, говорим и проводим время? Или друзья — это также и все те сотни и тысячи незнакомцев, с которыми мы связаны в Фейсбуке, Твиттере и других онлайн сетях?

понедельник, 8 февраля 2016 г.

Кого читать: Юрий Лесковец



    Продолжим нашу серию постов про интересных исследователей социальных сетей. Раньше мы уже писали про Ладу Адамик.
       Одним из наиболее значимых исследователей онлайн-сетей последнего времени по праву считается Юрий Лесковец. Он информатик, в сферу интересов которого входит анализ социальных сетей, преимущественно онлайн, методами машинного обучения. В настоящее время Лесковец работает на факультете компьютерных наук Стэнфорда, а также в лабораториях искусственного интеллекта и изучения информации. Ранее он работал в Корнелльском университете, а Phd защитил в университете Карнеги Меллон.
Его интересует анализ структуры социальных сетей, а также процессы распространения информации. Охватить вниманием все работы Юрия у нас не получится, поэтому мы расскажем о двух наиболее интересных его статьях.
Источник

Работа «Моделирование диффузии информации в скрытых сетях» не только стала лучшей статьей конференции IEEE International Conference On Data Mining (ICDM) в 2010 году, но и задала тон в исследовании распространения информации в социальных онлайн-сетях. Дело в том, что Лесковец и его соавтор Йевон Янг предсказали механизм распространения информации по социальной сети фактически без учета структуры графа. Для этого они разработали модель линейного влияния (Linear Influence Model). Таким образом, зная определенные параметры распространяемой новости можно предсказать с какой скоростью она будет распространяться по социальной сети и какое число участников соцсети в результате ее прочтут.
Статья «Жизнь и смерть онлайн-сообществ: предсказание роста и продолжительности существования групп» посвящена описанию механизмов роста и развития онлайн-сообществ в социальной сети Ning. Проанализировав данные о более чем 4 тысячах групп в соцсети, авторы пришли к выводу о том, что формирование и рост сети может происходить по двум механизмам: диффузионном и недиффузионному. В ходе диффузионного роста к сообществу присоединяются друзья участников сообщества, в случае недиффузионного роста – участники, у которых нет связей с теми, кто уже состоит в сообществе. При этом наибольшего роста могут достигнуть сообщества, которые развиваются по преимущественно недиффузионному механизму. Это говорит о том, что для развития сообществ необходимо в первую очередь качественное наполнение, которое привлечет новых пользователей.
За кадром осталось множество других интересных исследований Лесковца. С полным списком его работ можно ознакомиться здесь.
Расскажем немного про образовательную деятельность. Юрий Лесковец читает в Стэнфорде курсы по анализу социальных сетей, причем все материалы курса доступны. А по этой ссылке можно просмотреть некоторые материалы воркшопов, которые проводились Лесковцом. Совместно с коллегами он написал учебник «Mining of Massive Datasets», которая размещена в открытом доступе. По этой книге впоследствии был создан курс на Курсере по анализу больших данных, несколько лекций которого читает Лесковец.



В ходе обучения в аспирантуре Лесковец начал разрабатывать инструментарий для анализа графов, впоследствии проект получил название SNAP (Stanford Network Analysis Platform). Основным отличием SNAP от привычных инструментов по визуализации и расчету описательных статистик для сетей является ее эффективность при работе с большими сетями. В настоящий момент программа доработана и ее можно загрузить здесь.
Очень важной инициативой, на наш взгляд, является размещение сетевых данных в открытом доступе. На сайте Лесковца размещены данные о сетях Facebook, Amazon, Twitter и т.д., при этом большинство сетей представляют собой большие данные. Например, 35 млн обзоров с сайта Amazon, данные о 5 млн пользователей и почти 70 млн взаимодействий между ними с сайта Livejournal. Вишенкой на торте можно считать данные о более чем 65 млн пользователей соцсети Friendster и почти 2 млрд взаимодействиями между ними. Публичное размещение данных позволяет, во-первых, осуществить проверку результатов исследования, что в последние месяцы стало важным направлением дискуссий в научной среде. Во-вторых, именно на доступных данных начинающие исследователи могут сделать первые шаги в исследовании больших сетевых данных. 
Помимо обширной и активной научно-преподавательской работы Лесковец является научным руководителем в социальном фото-хостинге Pinterest. Кроме того Лесковец пробовал себя и в качестве стартапера и стал одним из сооснователей компании Kosei, выполняющей задачи машинного обучения. Kosei была приобретена Pinterest.