Показаны сообщения с ярлыком размер сети. Показать все сообщения
Показаны сообщения с ярлыком размер сети. Показать все сообщения

среда, 20 марта 2019 г.

Скандалы, интриги, расследования и степенной закон


Есть вещи, за которыми можно наблюдать бесконечно. Течение ручья, пламя костра, скандалы, интриги, расследования вокруг степенного закона в сетях. Итак, напомним, чем закончилась предыдущая серия нашего шоу. В начале 2018 года Анна Бройдо и Аарон Клаузет публикуют на arxiv препринт “Scale-free network are rare”. В этой статье на обширном эмпирическом материале они показывают, что на самом деле степени центральности у сетей обычно распределены лог-нормально, а не в соответствии со степенным законом. Иными словами, модель безмасштабных сетей, разработанная А.-Л. Барабаши и Р. Альтерт, может быть ошибочной.
Реакция общественности была разная. Кто-то посчитал это важным эмпирическим результатом, кто-то посетовал на недостаточное количество хороших исследований по сетям и жажду хайпа, а Альберт-Ласло Барабаши призвал коллег думать не об эмпирических подтверждениях, а о механизмах, формирующих социальные системы. Обсуждения в Твиттере были такими жаркими и насыщенными, что ученые уже не казались отстраненными обитателями башни из слоновой кости. Это была практически дуэль в прямом эфире!


Разница между случайными и реальными (например, социальными) сетями. В случайных сетях (слева) у каждого узла примерно одинаковое количество связей. В реальных сетях (справа) есть небольшая группа узлов с очень большим количеством связей, однако большинство узлов имеют достаточно малое количество связей. Источник изображения.


Прошел год, но интерес к теме не утихает. Наконец, статья Бройдо и Клаузет вышла в Nature Communications. Петер Холм в своем комментарии для Nature Communications постарался увязать между собой и теоретическую модель Барабаши-Альберт, и эмпирические результаты Бройдо и Клаузета. При этом в конце 2018 подоспела статья (пока тоже на arxiv) про то, что “scale-free network well done”. Не будем удивляться, что большинство авторов статьи из Northeastern University, где работает и Барабаши, один из основателей модели безмаштабных сетей.
И вот, анализируя то, что происходит, хочется задать вопрос - почему это распределение вызывает столько дебатов? Ведь подавляющее большинство исследователей охотятся не за распределениями, а за объяснением того, что за механизм лежит в основе этих распределений. Барабаши и Альберт не открывали Америку, механизм предпочтительного присоединения в социальных науках известен давно. Это эффект Матфея, по которому распределение благ происходит неравномерно. В случае сетей - популярные люди с течением времени становятся все более популярными. И если эффект Матфея работает и в случае социальных, и других типов сетей, то это важный механизм. Однако могут ли какие-то отдельные особенности распределения и его хвостов опровергнуть этот эффект? В общем, продолжаем следить за сериалом и размышляем, будет ли в результате этой дискуссии выявлен еще какой-то интересный содержательный результат или все же нет. Не хотелось бы, чтобы именитые ученые тратили бы ресурсы на борьбу за амбиции.

среда, 30 декабря 2015 г.

Что запомнилось в 2015

В декабре принято подводить итоги минувшего года, и мы решили последовать этой традиции. В этом посте мы расскажем о трех направлениях в исследованиях социальных сетей этого года, показавшихся нам интересными.

Графы-близнецы

В конце ноября социальные сети облетела новость о том, что предложен способ уменьшения вычислительной сложности при работе с изоморфными графами. Хотя формулировка задачи может показаться тяжеловесной, на деле все не так уж и сложно.
Изоморфными называются графы G и H, если путем перестановки строк и столбцов матрицы смежности графа G удается получить матрицу смежности графа H.  Другими словами, два рассматриваемых графа одинаковы.

Изоморфные графы. Источник.

Так называемая «проблема изоморфизма графов» (graph isomorphism problem) заключается в том, что перебор всех возможных перестановок занимает очень много времени. И в случае анализа больших графов эти сравнения могут в принципе не выполняться, что ограничивает возможности исследователя. Например, невозможно сравнить между собой граф социальных сетей Facebook и Twitter.
Профессор Ласло Бабаи из университета Чикаго предложил альтернативный метод для выявления изоморфизма графов. Подробности о методе можно прочесть в работе.
Хотя эта работа из области теоретических компьютерных наук, она способна оказать большое влияние на многие прикладные области, где так или иначе используется теория графов. В настоящее время статистические методы ERGM (экспоненциальные модели случайных графов) сравнивают реальную сеть с симулированными графами на основе нескольких индексов (взаимность, транзитивность и т.д.). Будем надеяться, что методы, реализованные на основе работ Бабаи, дадут нам возможность не концентрироваться на отдельных сетевых параметрах, а фокусироваться на более сложных различиях между сетями.

Множество сетевых измерений

Исследование многоуровневых социальных сетей (multilevel social networks) нельзя назвать новой темой, однако в текущем году вышло много исследований по этой тематике, и с большой долей уверенности можно утверждать, что это не конец. Многоуровневой называют такую социальную систему, в которой рассматривается сразу несколько типов связей между агентами. Одной из наиболее цитируемых работ, рассматривающей развитие одновременно двух социальных сетей, стала статья Леи Эллвардт с соавторами. В ней рассматривается влияние «сплетен» и обсуждений сотрудников в организации на формирование дружеских взаимоотношений внутри коллектива. Результаты эмпирических оценок свидетельствуют о том, что эти отношения находятся в сложной взаимозависимости.
В этом году в  журнале Social Networks вышел специальный выпуск, посвященный многоуровневым сетям. Исследователи теперь получили возможность рассматривать социальные взаимоотношения не в каком-либо узком контексте, а принимать во внимание и другие события, происходящие с людьми.

Как предотвратить эпидемию

Все большее внимание сетевиков приковывают исследования в области эпидемиологии. Это происходит из-за целого комплекса факторов: развития матметодов, совершенствования процедур сбора данных о пандемиях, новых вспышках эпидемий и т.д.


География лихорадки Эбола. Источник.

Хотя число исследований эпидемий и пандемий растет в геометрической прогрессии, на данный момент нет готового инструмента, позволяющего предсказать, во что выльется заболевание тем или иным вирусом. Разработкой таких методов занимаются в центре сетевых исследований университета Норсвестерн. Об исследованиях можно почитать здесь, здесь и здесь. Схожий проект есть в институте сложных адаптивных систем Санта Фе (о проекте можно почитать здесь). Ученые анализируют как распространение гриппа (работа 1, работа 2), так и лихорадку Эбола, вспышки холеры и т.д. Современные исследования принимают во внимание сразу многие факторы – природу и устойчивость вируса, структуру контактных сетей, влияние мобильности людей на развитие эпидемии. Так что мы все ближе и ближе приближаемся к пониманию всех механизмов распространения заболеваний а, значит, и к контролю над ними.

Желаем в Новом году найти новых близких по духу друзей (как изоморфные графы), иметь многогранные отношения с близкими (мультисетевые), и не болеть (и не заражать)!

понедельник, 2 ноября 2015 г.

И все-таки, сколько друзей мне нужно иметь?


Так называемое «Число Данбара» широко обсуждалось в интернете в прошлом году. Напомним, число Данбара равно 150 – это количество людей, с которыми человек на когнитивном уровне может поддерживать стабильные взаимоотношения.
Почему 150? Во времена Роберта Данбара, антрополога из Оксфорда, была популярна так называемая гипотеза социального мозга. Согласно ее предпосылкам, мозг приматов относительно большой, так как они способны находиться в сложных социальных взаимоотношениях друг с другом. Данбар, изучая такое социальное поведение обезьян, как чистка шерсти, попробовал предсказать оптимальный размер социальной группы, в которой могут находиться люди (которые также относятся к отряду приматов). Он связал такой показатель, как относительная доля неокортекса в мозгу с размером социальной группы у приматов и предсказал, что размер этой группы у людей будет равен 148 (при округлении, 150).


Иллюстрация взаимосвязи между средним размером социальной группой у приматов и долей неокортекса по отношению к размеру мозга. Источник: bloomberg.com


Одно из первых исследований, в котором предположения Данбара были подтверждены эмпирически — это его собственная работа, выполненная совместно с антропологом Расселом Хиллом. По аналогии с экспериментом «малого мира» Милграма, в котором рассылались письма, Данбар и Хилл просили британцев рассылать поздравительные рождественские открытки – практика, которая была намного более распространена в то время, чем сейчас, и могла быть использована для оценки размера социальной сети контактов. На основе полученных данных исследователи пришли к выводу, что среднее количество контактов человека равно 154, то есть очень близко к теоретическим оценкам Данбара, построенным на основе предположений о размере неокортекса. В недавних работах было показано, что это число работает даже в социальных онлайн-сетях, где, казалось бы, иметь тысячи друзей и фолловеров — норма.

Кто еще пытался оценить подобные числа?
На самом деле, попытки оценить размер социальной группы, в которой может находиться человек, были и до, и после работ Роберта Данбара. Некоторые исследователи обнаруживали схожие числа, другие числа сильно отличаются.
Наиболее активной в этой сфере была группа исследователей Киллворт, Бернар и МакКарти, которые делали эксперименты в конце 1970-х — начале 1980-х. В одной из работ в их выборке были американцы, которым предлагался список людей с именами, профессиями, местами проживания. Участникам предлагалась следующая гипотетическая ситуация: они должны передать какое-то сообщение человеку из списка. Нужно было использовать свои личные знакомства, чтобы сообщение достигло цели. Участник исследования мог выбрать из своей сети знакомств одного человека, через которого можно передать это сообщение. Согласно их результатам, среднее число знакомых составляло 250. Однако важно, что это исследование касается инструментальных знакомств, которых можно активно задействовать, а не держать “в пассиве”.
Другая работа этой же группы была проведена на основе телефонных опросов по репрезентативной выборке американского населения в 1998-1999 годах. МакКартис коллегами (2001) разработали два метода, которые позволили оценивать размер личной социальной сети. Первый метод они назвали «метод масштабирования». Его идея заключалась в том, чтобы спрашивать у людей о личной сети через специфические группы населения, с которыми они знакомы. К примеру, респондентов просили назвать со сколькими людьми, больными диабетом или попавшими в аварию, они знакомы. В среднем в выборке исследователей люди знали 3 диабетиков, 4 женщин, которые родили ребенка за последний год, 2 почтовых служащих и т.д.
Второму методу они дали название «метод суммирования». В этом случае, исследователи просили обозначить социальное окружение через группы, с которыми у человека существуют какие-либо отношения. К примеру, к таким группам могли относиться члены семьи, близкие, друзья, коллеги. Выяснилось, что в среднем у людей 4 близких члена семьи и 24 — членов расширенной семьи, 36 коллег, 4 лучших друга, 18 знакомств со школы. После подсчетов и сравнения обоих методов, личная социальная сеть знакомств оценивалась в 290 человек для обоих методов.
Помимо этого, еще в 1950-х были работы, в которых исследователи пытались оценить размер личной социальной сети через дневники наблюдения или телефонные книжки. В их случае, редко можно встретить средние числа, так как их в большей степени интересовали границы сети знакомств. Максимум достигал пяти тысяч знакомых.


Почему число Данбара стало популярным, а другие — нет?
При оценке числа 150, Данбар руководствовался когнитивными особенностями человека. Он отсылает к особенностям мозга и к тому, что это число связей на физиологическом уровне уже заложено в нас как в приматах, и мы не в силах его изменить. Это и привлекает большое внимание и интерес.

Чистка шерсти у приматов как социальное поведение. Источник


      В то же время, МакКарти с коллегами подходят к вычислению этого числа очень «по-человечески» - посредством телефонных опросов, экспериментальных ситуаций, телефонных книжек. Более того, при сравнении различных культур, выясняется, что числа могут значимо разниться. Иными словами, если даже способность к социальности и заложена в мозге, ее демонстрация может быть связана со специфическими культурными особенностями.
Почему мы знаем про число 150, и что нам делать со знанием о том, что в некоторых исследованиях это число близко 300? Здесь, конечно же, мы сталкиваемся с различиями в способах измерения оптимального количества знакомств. Одна группа работ, используя различные методы, показывает, что это 150, другая группа работ, также используя разные подходы, говорит о 300. Несомненно, эти числа очень усреднены и разнятся в зависимости от культуры, профессии человек, возраста и многих других факторов. Единственное, что мы можем с уверенностью сказать - поддерживать одновременно 500 знакомств, скорее всего, будет совсем непросто.