Показаны сообщения с ярлыком процессы в сетях. Показать все сообщения
Показаны сообщения с ярлыком процессы в сетях. Показать все сообщения

среда, 20 марта 2019 г.

Скандалы, интриги, расследования и степенной закон


Есть вещи, за которыми можно наблюдать бесконечно. Течение ручья, пламя костра, скандалы, интриги, расследования вокруг степенного закона в сетях. Итак, напомним, чем закончилась предыдущая серия нашего шоу. В начале 2018 года Анна Бройдо и Аарон Клаузет публикуют на arxiv препринт “Scale-free network are rare”. В этой статье на обширном эмпирическом материале они показывают, что на самом деле степени центральности у сетей обычно распределены лог-нормально, а не в соответствии со степенным законом. Иными словами, модель безмасштабных сетей, разработанная А.-Л. Барабаши и Р. Альтерт, может быть ошибочной.
Реакция общественности была разная. Кто-то посчитал это важным эмпирическим результатом, кто-то посетовал на недостаточное количество хороших исследований по сетям и жажду хайпа, а Альберт-Ласло Барабаши призвал коллег думать не об эмпирических подтверждениях, а о механизмах, формирующих социальные системы. Обсуждения в Твиттере были такими жаркими и насыщенными, что ученые уже не казались отстраненными обитателями башни из слоновой кости. Это была практически дуэль в прямом эфире!


Разница между случайными и реальными (например, социальными) сетями. В случайных сетях (слева) у каждого узла примерно одинаковое количество связей. В реальных сетях (справа) есть небольшая группа узлов с очень большим количеством связей, однако большинство узлов имеют достаточно малое количество связей. Источник изображения.


Прошел год, но интерес к теме не утихает. Наконец, статья Бройдо и Клаузет вышла в Nature Communications. Петер Холм в своем комментарии для Nature Communications постарался увязать между собой и теоретическую модель Барабаши-Альберт, и эмпирические результаты Бройдо и Клаузета. При этом в конце 2018 подоспела статья (пока тоже на arxiv) про то, что “scale-free network well done”. Не будем удивляться, что большинство авторов статьи из Northeastern University, где работает и Барабаши, один из основателей модели безмаштабных сетей.
И вот, анализируя то, что происходит, хочется задать вопрос - почему это распределение вызывает столько дебатов? Ведь подавляющее большинство исследователей охотятся не за распределениями, а за объяснением того, что за механизм лежит в основе этих распределений. Барабаши и Альберт не открывали Америку, механизм предпочтительного присоединения в социальных науках известен давно. Это эффект Матфея, по которому распределение благ происходит неравномерно. В случае сетей - популярные люди с течением времени становятся все более популярными. И если эффект Матфея работает и в случае социальных, и других типов сетей, то это важный механизм. Однако могут ли какие-то отдельные особенности распределения и его хвостов опровергнуть этот эффект? В общем, продолжаем следить за сериалом и размышляем, будет ли в результате этой дискуссии выявлен еще какой-то интересный содержательный результат или все же нет. Не хотелось бы, чтобы именитые ученые тратили бы ресурсы на борьбу за амбиции.

вторник, 13 марта 2018 г.

Старая история на новый лад - почему физикам и лирикам не удается договориться

Все чаще социологи и «компьютерщики» работают над одними и теми же вопросами, но получают на них разные ответы. Часто такие работы относят к аналитической социологии (analytical sociology, дальше будем называть «AS») или вычислительным социальным наукам (computational social science, далее «CSS»). И в том, и в другом направлении много и социологов, и исследователей из компьютерных наук, однако в AS преобладают социологи, а в CSS - физики, математики, информатики. Мы задались вопросом, в чем же различия между этими направлениями, и попробовали спрогнозировать, какими будут социальные исследования в будущем.
Сразу начнем с плохого – пока между социологами и исследователями их компьютерных наук нет любви и взаимопонимания. Представители аналитической социологии во многих своих статьях, в личных беседах и публичных обсуждениях пытаются продемонстрировать скептическое отношение к представителям компьютерных социальных наук. Например, «аналитики» в недавней статье в журнале «Journal of Computational Social Science» назвали своих коллег из CSS просто «физиками, занимающимся вычислениями в социологии» и подчеркнули, что «несмотря на то, что аналитическая социология и компьютерные социальные науки имеют много общего (…), у них различная исследовательская ориентация и амбиции», откровенно намекая на то, что исследования компьютерных социальных наук какие-то не такие. Звучит обидно.


Где-то здесь находятся AS и CSS. Источник.

       В чем же разница в этих «исследовательских ориентациях и амбициях» у AS и CSSПредставители AS очень часто упрекают CSS в зацикленности на анализе взаимосвязей между переменными, а не на поиске причинно-следственных связей, построении сложных механизмов и социологической рефлексии. «Если результаты [эмпирического исследования] не могут быть впоследствии переведены на язык механизмов, то исследование ценится меньше», указывают представители аналитической социологии.
У представителей AS два аргумента. Во-первых, социальные механизмы «более интеллектуально удовлетворительны» (cогласимся, не самое убедительное и весьма эфемерное утверждение). Во-вторых, эти социальные механизмы должны быть понятны для того, чтобы использоваться при принятия решений. И если относительно первого пункта еще можно поспорить, то второе замечание выглядит убедительно. Чтобы принимались какие-то решения, например, о вакцинации населения, ученые должны предоставить простое объяснение того, каким образом происходит заражение, и почему только определенный порядок вакцинации приведет к снижению заболеваемости. Вполне вероятно, что современные методы анализа данных, например, нейронные сети, смогут продемонстрировать куда большую предсказательную силу и смоделировать значительно более продуктивную политику вакцинации. Но это будут данные, полученные из «черного ящика», а к такому лица, принимающие решения, на данном этапе не готовы. Аналогичной точки зрения придерживается и Петр Сафронов из Института Образования ВШЭ. «Методы науки о данных, позволяя делать предсказания, часто не дают возможности выстроить объяснение, интерпретацию», - говорит он в интервью для Постнауки.  При этом новые методы данных постепенно все чаще и чаще используются в коммерческом секторе, принося значительную прибыль и демонстрируя высокую эффективность. Почему бы не воспользоваться уже зарекомендовавшими себя инструментами и довериться «черному ящику»?
Журналы, где публикуются приверженцы CSS и AS также совершенно разные. Статьи по аналитической социологии публикуются в социологических журналах: American Journal of Sociology, Sociological Review, Social Networks. А вот CSS публикуются чаще в естественно-научных изданиях из ‘hard science’ – Nature, Science, PNAS, Scientific Reports. И, разумеется, представители AS и CSS не очень активно ссылаются друг на друга, хотя, порой, эти ссылки напрашиваются сами собой.




        Приведем простой пример, который близок нам, как большим любителям социальных сетей. Одно из свойств сетей - это гомофилия, или склонность похожих людей быть связанными друг с другом. Например, наши друзья, как правило, одного с нами пола, у нас схожее образование, интересы и вкусы. В вычислительных социальных науках для оценки гомофилии широко применяется коэффициент ассортативности, предложенный Марком Ньюманом. Он очень прост и элегантен – это коэффициент корреляции между характеристиками человека и его друзей. Соответственно, если похожие люди дружат  – то коэффициент ассортативности ближе к 1. Если непохожие люди дружат, то ассортативность будет стремиться к -1. Но аналитические социологи вряд ли будут оценивать степень гомофилии через ассортативность. Скорее всего, в статье будут использованы более сложные методы, например, модели случайных графов или стохастического моделирования, и будет показано, что сходство по каким-то признакам - статистически значимый предиктор формирования связей, и он меняется со временем определенным образом. Одним словом, будет показано, каким образом и почему гомофилия может формироваться, но сама степень гомофилии не будет оценена! И это лишь один из примеров того, как «аналитики» и «компьютерщики» игнорируют друг друга. 
Дункан Ваттс отмечает, что в социальных науках сейчас есть два типа исследователей – «высокомерные компьютерщики» и «обороняющиеся социологи». Любопытно, что каждая группа стопроцентно уверена в своей уникальности, хотя выигрышной стратегией в данном случае выглядит именно объединение усилий и совместное решение научных задач. И если исследователи предполагают, что, вызывая на поединок своих коллег они все делают правильно, то мы в этом не уверены. Новые технологии, новые данные, новые методы и новая жизнь задают крайне высокую планку исследователям общества. Чтобы осмыслить дивный новый мир нужно уметь всё: получать и анализировать большие данные с использованием новых методов, интерпретировать полученные результаты, а также делать на основе этого практические выводы.
        В этой связи расскажем об исследовательнице, которая успешно совмещает в своей работе и теорию, и методы – Сандру Гонзалез-Бэйлон. Занимаясь коллективным действием и политическими сетями, Сандра корректно и аккуратно встраивает в свои исследования как глубокую теорию, так и современные методы на больших данных. Она публикует результаты своих исследований как в классических социологических и политологических, так и в естественно-научных журналах. Например, ее недавняя статья о том, как происходит вовлечение Твиттер-пользователей в обсуждение испанских протестов. Сандра с коллегами (между прочим, физиками) проанализировали структуру и динамику социальной сети протестующих в Твиттере, то есть речь идет о по-настоящему больших данных. Участниками сети становились пользователи, использовавшие определенный протестный хэштэг. Выяснилось, что позиция в социальной сети - степень центральности и близость к «центру» или к «периферии» - фактически не связана с реальным поведением пользователя. Получается, что активным может быть как человек, активно вовлеченный в протестное сообщество и общающийся с другими активистами, так и довольно «изолированный». Эти выводы подтверждают теорию о том, что протесты, организованные через социальные сети, оказываются более «горизонтальными» по структуре. Эта работа ставит вопросы о коллективном действии, о разных типах поведения в онлайн и оффлайн-пространстве и показывает, насколько социальный мир - комплесная система. Вот такой случай успешного совмещения теории и методов. Такие примеры показывают, что совместить AS и CSS реально.