Показаны сообщения с ярлыком ERGM. Показать все сообщения
Показаны сообщения с ярлыком ERGM. Показать все сообщения

пятница, 11 ноября 2016 г.

Пять рассылок о социальных сетях

        Часто информацию о специальных выпусках журналов, предстоящих конференциях и летних школах и технических особенностях работы программного обеспечения не так просто найти. Удобный способ быть в курсе - это получать специализированные рассылки. В этом посте мы расскажем о пяти ресурсах, благодаря которым можно узнавать про самые горячие обсуждения в сетевом анализе.        


1.   Socnet
Подписаться можно по этой ссылке.
Socnet – это рассылка ассоциации сетевых исследований INSNA, посвященная очень широкому кругу сетевых вопросов. В этой рассылке можно найти вакансии, анонсы конференций и воркшопов, приглашения к публикации в специальных выпусках журналов. Помимо объявлений, в Socnet появляются общие вопросы по поводу литературы в области. 

2.   Igraph
Подписаться можно по этой ссылке.
Здесь обсуждаются вопросы по работе в пакете igraph. Здесь достаточно много простых вопросов, и новички смогут найти большое количество информации для работы в этом пакете. На вопросы чаще всего отвечает сам создатель пакета Габор Ксарди.

3.   Statnet
Подписаться можно по этой ссылке.
В основном, эта рассылка посвящена пакету statnet и оценке моделей группы ERGMоднако иногда здесь появляются и общие вопросы по работе с сетевыми данными в среде R. Чаще всего отвечают на вопросы разработчики пакетов Мартина Моррис и Картер Баттс.

4.   Epimodel
Подписаться можно по этой ссылке.
Эта рассылка будет интересна и полезна тем, кто моделирует распространение эпидемий с использованием сетевых данных в пакете EpiModel. Большинство вопросов о технических деталях и трудностях, но иногда публикуется информация о летних школах и конференциях. Чаще всего на вопросы отвечает разработчик пакетов Сэмуэль Дженнис.

5.   Stocnet
Подписаться можно по этой ссылке.
Здесь обсуждаются вопросы, связанные с моделями группы SAOM (Siena). В основном, в рассылке обсуждают технические вопросы, но нередко появляется информация о вакансиях, анонсах конференций, воркшопах и летних школах. Чаще всего на вопросы отвечает создатель этой модели Том Снайдерс.

четверг, 19 мая 2016 г.

Sex, drugs and social networks

На самой большой конференции по социальным сетям Sunbelt всегда есть секция «Sex, drugs and social networks». Она состоит из нескольких подсекций, длится несколько дней, и на ней всегда можно послушать интереснейшие доклады. Например, про первые сексуальные опыты подростков, про использование наркотиков в ЛГБТ среде, про предпочтения свингеров в партнерах и про заболевания, передающиеся половым путем. Более того, эти доклады часто бывают очень практические и помогают бороться со многими социальными и медицинскими проблемами. Все эти темы нам также очень интересны, поэтому в этом посте мы решили рассказать про сексуальные и романтические сети.

Романтические сети школьников: первый поцелуй, первая любовь
Большое количество сетевых исследований — про школьников их поведение. Например, мы уже писали про то, как подростки начинают употреблять алкоголь и как их друзья и окружение влияют на это. Конечно, первые романтические переживания школьников также не остались без внимания исследователей.
Одно из важнейших исследований - про "любовные цепи" Питера Бирмана, Джэймса Муди и Катрин Стовел ("Chains of Affection: The Structure of Adolescent Romantic and Sexual Networks"). Работа основана на большой базе данных по здоровью американских школьников AddHealth. В этом исследовании используется подвыборка из ~800 старших школьников, которые учились в одной школе с 1993 по 1995 гг.
Какого рода связи изучались? У школьников спрашивали, имели ли они с кем-то особые романтические отношения в течение последних 18 месяцев. Помимо этого, просили указать, были ли у них не романтические сексуальные отношения с кем-то в течение последних 18 месяцев. В обоих случаях можно было указать до 3 человек, с которыми были те или иные отношения. Только около четверти учеников ответило, что у них не было ни одного типа отношений за последние полгода. На основе этих даных была выстроена сеть романтических и сексуальных взаимоотношений школьников.

Сеть романтических и сексуальных контактов школьников из статьи Bearman et al (2004). Синим обозначены мужчины, розовым - женщины. Есть плотно связанный компонент (слева вверху) и более мелкие не связанные с другими структуры. Цифры обозначают количество таких микроструктур в выборке. Источник изображения.

Внимательно изучая сетевую структуру романтических и сексуальных связей, мы можем лучше понять, как развиваются заболевания, передающиеся через половые контакты. Не всегда простое количество партнеров говорит о многом, так как гораздо важнее понять, как человек вписан в более широкую сеть взаимодействий. Например, возьмем два случая. В первом — человек в настоящий момент имеет всего лишь одного партнера. Однако оба партнера имели в прошлом других партеров, которые, в свою очередь имели множество других партнеров. Если проследить все эти связи, то получится что-то похожее на цепочку. Во втором случае — у человека несколько партнеров, но все они находятся в закрытой обособленной структуре, не связанной с большой сетью, по которой "гуляет" какая-нибудь контактная болезнь. На самом деле, вероятность заболеть будет выше у человека в первом случае, даже если у него всего лишь один партнер на настоящий момент.
Это не новость в подобных эпидемиологических исследованиях. Например, во многих работах показано, что микросообщества сексуальных и романтических контактов имеют структуру ядра и периферии. Воздействуя на ядро (например, бесплатно раздать презервативы для вич-инфицированных или шприцы для употребляющих инъекционные наркотики), мы можем предотвратить дальнейшую передачу заболевания по всей сети. Центральные персонажи связаны с большинством участников в сети и особое внимание именно на них обезопасит многих в этом сообществе.

Четыре основных сетевых структуры, которые встречаются при передаче инфекционного заболевания. Слева наверху (А) - модель ядро-периферия, где ядро инфицировано и ввиду своего центрального положения передает болезнь по всей сети. Справа наверху (В) - перевернутая модель ядро-периферия, где ядро инфицировано и передает болезнь  другим на периферии, но не передает между собой. Например, секс-работники и дальнобойщики, где дальнобойщики - выделены белым. Слева внизу (С) - модель брокера, где есть различные группы, одна с высокорисковым поведением (например, употребляющие наркотики), вторая - нет (не употребляющие наркотики). Между ними есть брокер, который соединяет их и передает инфекцию в низкорисковую группу. Справа внизу (D) - модель цепи, которая обнаружена в работе Bearman et al (2004). Сеть представляет собой цепь, чтобы дойти от одного конца до другого необходимо проделать множество сетевых шагов. Изображение из статьи Bearman et al (2004).

Бирман и его соавторы показывают, что не всегда сексуальные и романтические сети выстраиваются по ядро-периферийной структуре, как это показано в большинстве работ. Однако в случае из школьников это оказалась цепь, для которой не так важно выделять центральных персонажей, то есть ядро. Цепь сама по себе очень хрупкая структура, ее можно разорвать где угодно и она тут же распадается на несколько не связанных между собой компонентов. А распад обозначает остановку в передаче заболевания, если оно проходит по этой сети.
Помимо таких сугубо сетевых результатов о том, цепь это или ядро-периферия, конечно, Бирман с коллегами также обнаруживают несколько любопытных социальных эффектов. Самый важный — это, несомненно, гомофилия, или склонность людей со схожими характеристиками завязывать связи. О ней и о ее многомерности мы уже писали раньше в этом блоге. В этом исследовании было показано, что школьники более склонны формировать пары с теми, кто близок им по социоэкономическому статусу, оценкам, планам на будущее, IQ. Если оба подростка употребляют алкоголь, то они с большей вероятностью заведут отношения. То же самое касается курения и прошлого сексуального опыта. Опытность и плохое поведение связывает.
В целом, работа важна для понимания того, какие нужно делать интервенции, чтобы остановить передачу заболеваний. Основной посыл работы в том, что важно детально изучать структуру взаимоотношений и, в зависимости от нее, проводить предотвращение передачи. Будет ли это воздействие исключительно на ядро (если сеть выстроена по структуре «ядро-периферия») или обрыв связей в нескольких местах и последующий распад сети (если сеть выстроена как цепочка) — важно понять для того, чтобы верно выстроить механизмы профилактики и предотвращения контактных болезней.

Медсестры и медбратья
В коллективном научном блоге BadHessian есть очень понятный пост про то, как моделировать сети на примере сексуальных сетей из сериала «Grey's Anatomy». Это популярный американский сериал из 2000-х, который описывает рабочие будни сотрудников больницы, которые, помимо работы, занимаются и решением своих личных проблем, а именно, флиртуют и занимаются сексом. В посте изучается сеть половых контактов и предсказывается, кто с кем будет иметь интрижку.
В целом, одна из важнейших задач в сетевом анализе — это предсказать, как формируется сеть. Иными словами, почему в этой больнице сотрудники будут вступать в половые контакты? Может быть, потому что они оба несколько раз участвовали в проведении сложнейших операций и это их сблизило? Или их познакомил ординатор из дерматологического отделения, который в прошлом имел отношения с ними обеими?
Один из методов для ответа на эти вопросы — это ERGM (экспоненциальное моделирование случайных графов). На самом деле, в интернете не так много простых и очень понятных коротких учебников про то, как сделать ERGM в какой-либо статистической программе. Наш коллега и друг сделал такой для работы в статистической среде R после того, как много лет назад мы задавали ему миллионы вопросов про то, как лучше работать с такого типа моделями.

Сеть сексуальных контактов, построенная на основе сериала Grey's Anatomy. Синим обозначены мужчины, розовым - женщины. Источник изображения.

В посте много скриптов, простых и ироничных объяснений, но что мы узнаем по существу? Вполне ожидаемые вещи: большинство сексуальных контактов происходят между людьми разных полов, близких по возрасту, в рамках одной расовой группы, а также в сети есть тенденция к моногамным отношениям.
Пост заканчивается вопросами, на которые еще возможно ответить с использованием этого метода. Например, можно предположить, что мужчины и женщины будут по-разному выстраивать свои половые связи, потому что мы знаем из литературы, что мужчины в среднем сообщают большее количество партнеров. Другое предположение, которое можно проверить — это сегрегация по положению в больнице. Мы знаем, что больница — достаточно иерархизированное сообщество, поэтому можно предположить, что ординаторы будут спать с ординаторами, а врачи — только с врачами.

Как меняется поведение с онлайн-знакомствами
Со сбором данных про сексуальные контакты всегда возникает много проблем. Во-первых, если мы говорим о таких группах, как секс-работники или люди, употребляющие тяжелые наркотики, то к ним очень сложно получить доступ. Помимо прочего, в таких исследованиях выборка выстраивается методом снежного кома, что показывает нам только особую часть сообщества. Во-вторых, если мы изучаем заболевания, передающие контактным путем, то желательны медицинские анализы, которые бы позволяли с точностью определить наличие болезни. Это требует больших затрат, однако часто обходится тем, что у самих респондентов спрашивают об их статусе болезни. Конечно, они могут не знать о своем заболевании или могут солгать исследователю по какой-либо причине.
Одним из новых направлений, которое не позволило бы решить все эти вопросы, но позволило бы расширить и разнообразить выборку, могло бы быть исследование контактов, образовавшихся после пользования dating-приложениями. Например, было несколько громких журналистских заявлений о том, что, якобы, после появления Tinder увеличилось количество людей с заболеваниями, передающимися половым путем.


"Поздравлем, у Вас и у Элисон есть хламидия". Картинка, отображающая интерфейс приложения Tinder и возможные уведомления о болезнях. Источник изображения.

Конечно, у онлайна тоже есть свои ограничения. Например, как узнать, был ли сексуальный контакт между людьми или нет? Подобные приложения пока не ввели такую функцию, но совсем скоро такая опция вполне могла бы и появиться. Например, после мэтча (совпадение, когда оба пользователя понравились друг другу) и после переписки приложение могло бы отправлять уведомления с просьбой оценить произошедшее. Было ли свидание, был ли секс, было ли что-то еще. Большинство пользователей не будет отвечать ввиду волнений об анонимности, но определенная доля вполне будет готова оценить свои успехи или неуспехи ввиду охотничьего азарта или в стремлении насолить неудачному партнеру.
Опять же, в данном случае мы ничего не узнаем про сами заболевания, однако это позволило бы изучить структуры сетей, которые выстраиваются на основе таких приложений. Что это: цепь, ядро и периферия или множество не связанных кусочков? Как по них могли бы передаваться контактные заболевания? Но так как таких возможностей пока нет, и это только наши исследовательские фантазии о (почти) идеальных данных, то остановимся на том, что пока есть.
Сами Tinder и OkCupid периодически публикуют небольшие отчеты на основе своих данных, однако пока не дают их другим исследователям, насколько нам известно. Сами они дают ценные рекомендации о том, как себя вести оптимальным образом и быть успешным пользователем. Например, недавно на сайте ХХ2 век появилась статья и инфографика про то, как приручить такие сервисы.
Иногда такими же вопросами задаются и сами data scientist'ы, которые смогли выгрузить часть данных сами, чтобы разобраться в своей личной жизни. Например, на ТЕД есть увлекательная лекция Эми Вэбб, которая решила найти себе партнера, который бы соответствовал десяткам пунктов ее требований к идеальному партнеру. Она выгрузила данные по сайту знакомств, проанализировала профили успешных участников, создала фейковые аккаунты, чтобы отвлечь одних участников от ее потенциальных кандидатов и много всего еще немыслимого сделала с данными, чтобы найти себе идеального партнера.




четверг, 28 января 2016 г.

Эпидемия гриппа, ВИЧ и бешенство енотов

Люди начинают болеть по разным причинам. Одной из этих причин могут стать окружающие. Так, каждую зиму мы ждем наступления гриппа, когда друзья и коллеги начинают болеть и повсюду слышатся советы «не ходите на работу или учебу, не заражайте других», «носите марлевые повязки», «не бывайте в местах большого скопления людей».
Так как очередная эпидемия гриппа уже наступила, расскажем о нескольких любопытных исследованиях, в которых изучались болезни, передающиеся по социальным контактам. Поговорим об актуальном сейчас гриппе, об актуальных всегда заболеваниях, передающихся половым путем, и, напоследок, о бешенстве диких енотов.

Грипп в учебных заведениях
Грипп — одно из наиболее простых для изучения заболеваний. Вирус гриппа передается воздушно-капельным путем, массовые заболевания происходят с определенной периодичностью (обычно зимой) и его просто наблюдать. В то же время, школьные классы или университетские курсы — наиболее простые условия для сбора данных о заболеваемости и социальных контактах учащихся.
Одно из любопытных исследований про грипп и социальные связи — это работа Симона Кочемеза и его коллег, которые изучали заражение гриппом H1N1 (также известен как свиной грипп) в начальной школе. В то время, когда они делали исследование, была пандемия этого гриппа, поэтому эта работа была важным этапом в понимании особенностей передачи и распространения этого заболевания.


Иллюстрации из статьи Cauchemez et al (2010). Рисунок B - схема классной комнаты, где ARI - школьники с известным диагнозом гриппа.
Рисунок D - социальная сеть школьников, построенная на основе вопроса "С кем вы играете?". Красный цвет узлов обозначает девочек, синий - мальчиков. Красный цвет связи обозначает связь "девочка-девочка", бирюзовый цвет связи обозначает связь "мальчик-мальчик", салатовый цвет связи обозначает связь "девочка-мальчик". Фигура узла обозначает обучение в одном классе.

Исследователи хотели ответить на вопрос, какие факторы влияют на распространение болезни в школе, чтобы впоследствии можно было эти факторы контролировать и, соответственно, влиять на распространение заболевания. Они обнаружили, что важную роль в передаче гриппа играет распределение студентов по классам и годам обучения. Также важную роль играет пол: по той причине, что дети, как правило, дружат со сверстниками своего пола, они также заражают других детей своего же пола. В то же время, они не обнаружили, что совместная игра с кем-то или сидение за одной партой в классе влияет на увеличение вероятности заболеть.
Также есть любопытная работа на примере студентов в университете, где отслеживалась передача гриппа по сетям взаимодействий. Было показано, что важные передатчики болезни - это студенты, занимающие центральные позиции в сети.

Заболевания, передающиеся половым путем
Существует большое количество работ про ВИЧ и другие заболевания, которые передаются по сетям половых контактов. Как правило, работы о ВИЧ выполнены на основе баз данных HIV Transmission Network или на основе индвидуально собранных данных в африканских странах.
Расскажем про исследование Стива Гудро и коллег о передаче ВИЧ-инфекции в Зимбабве. Исследователей интересовала передача этой инфекции в случае пересекающихся партнерств. Пересекающиеся партнерства (concurrent partnerhips) — это ситуация, когда у одного человека есть одновременно несколько половых партнеров. Такая ситуация давно изучается эпидемиологами, так как известно, что в таком случае вероятность передачи заболеваний по партнерам увеличивается по сравнению с ситуацией моногамных отношений.


Пример симулированной сети половых контактов из статьи Goodreau et al (2012). Сеть построена с учетом характеристик наблюдаемой сети половых контактов в Зимбабве, которые изучались исследователями.

Работа Гудро с коллегами интересна в методологическом плане. Они делают обзор существующих работ о параметрах эпидемиологического положения в Зимбабве и используют динамические ERGM для симуляции сетей половых контактов. Ученые делают множество различных моделей и показывают, что эпидемия ВИЧ в Зимбабве будет продолжаться при двух условиях: люди активно практикуют пересекающиеся партнерства и в случае наличия инфекции в ранней ее стадии. Важность работы в том, что на конкретном случае исследователи моделируют ситуации, которые приведут к значительному снижению уровня заболеваемости.

Передача бешенства по сети енотов
Животные также являются переносчиками заболеваний и паразитов, которые могут затем передаваться как другим животных, так и людям. В этом обзоре представлены основные исследования об использовании сетевого подхода в паразитологии.


Еноты в лесу. Источник изображения

Бен Хирш и коллеги решили рассмотреть сеть контактов енотов, для того, чтобы понять, как еноты могут передавать различных паразитов. Известно, что эти животные являются переносчиками вируса бешенства, и способны заразить им не только своих сородичей, но и, например, человека.


Визуализация сети связей между енотами из статьи Hirch et al (2013) в течение одного месяца. Красные узлы обозначают самок, синие - самцов. Размер узла отображает возраст енота (больше = взрослее). А - время коммуникации в течение месяца составило >= 1 мин, В -  >= 5 мин, С - >= 15 мин,  >= 30 мин.

Используя радио-ошейники, исследователи собрали данные о популяции диких енотов и построили их динамические сети взаимодействий. Основной вывод авторов в том, что сеть контактов енотов — намного более плотная, чем было показано в предыдущих работах, и большую роль при передаче заболеваний может иметь длительность контактов. Они делают вывод, что понимание коммуникаций между животными важно использовать при предсказании передачи различных заболеваний.

среда, 30 декабря 2015 г.

Что запомнилось в 2015

В декабре принято подводить итоги минувшего года, и мы решили последовать этой традиции. В этом посте мы расскажем о трех направлениях в исследованиях социальных сетей этого года, показавшихся нам интересными.

Графы-близнецы

В конце ноября социальные сети облетела новость о том, что предложен способ уменьшения вычислительной сложности при работе с изоморфными графами. Хотя формулировка задачи может показаться тяжеловесной, на деле все не так уж и сложно.
Изоморфными называются графы G и H, если путем перестановки строк и столбцов матрицы смежности графа G удается получить матрицу смежности графа H.  Другими словами, два рассматриваемых графа одинаковы.

Изоморфные графы. Источник.

Так называемая «проблема изоморфизма графов» (graph isomorphism problem) заключается в том, что перебор всех возможных перестановок занимает очень много времени. И в случае анализа больших графов эти сравнения могут в принципе не выполняться, что ограничивает возможности исследователя. Например, невозможно сравнить между собой граф социальных сетей Facebook и Twitter.
Профессор Ласло Бабаи из университета Чикаго предложил альтернативный метод для выявления изоморфизма графов. Подробности о методе можно прочесть в работе.
Хотя эта работа из области теоретических компьютерных наук, она способна оказать большое влияние на многие прикладные области, где так или иначе используется теория графов. В настоящее время статистические методы ERGM (экспоненциальные модели случайных графов) сравнивают реальную сеть с симулированными графами на основе нескольких индексов (взаимность, транзитивность и т.д.). Будем надеяться, что методы, реализованные на основе работ Бабаи, дадут нам возможность не концентрироваться на отдельных сетевых параметрах, а фокусироваться на более сложных различиях между сетями.

Множество сетевых измерений

Исследование многоуровневых социальных сетей (multilevel social networks) нельзя назвать новой темой, однако в текущем году вышло много исследований по этой тематике, и с большой долей уверенности можно утверждать, что это не конец. Многоуровневой называют такую социальную систему, в которой рассматривается сразу несколько типов связей между агентами. Одной из наиболее цитируемых работ, рассматривающей развитие одновременно двух социальных сетей, стала статья Леи Эллвардт с соавторами. В ней рассматривается влияние «сплетен» и обсуждений сотрудников в организации на формирование дружеских взаимоотношений внутри коллектива. Результаты эмпирических оценок свидетельствуют о том, что эти отношения находятся в сложной взаимозависимости.
В этом году в  журнале Social Networks вышел специальный выпуск, посвященный многоуровневым сетям. Исследователи теперь получили возможность рассматривать социальные взаимоотношения не в каком-либо узком контексте, а принимать во внимание и другие события, происходящие с людьми.

Как предотвратить эпидемию

Все большее внимание сетевиков приковывают исследования в области эпидемиологии. Это происходит из-за целого комплекса факторов: развития матметодов, совершенствования процедур сбора данных о пандемиях, новых вспышках эпидемий и т.д.


География лихорадки Эбола. Источник.

Хотя число исследований эпидемий и пандемий растет в геометрической прогрессии, на данный момент нет готового инструмента, позволяющего предсказать, во что выльется заболевание тем или иным вирусом. Разработкой таких методов занимаются в центре сетевых исследований университета Норсвестерн. Об исследованиях можно почитать здесь, здесь и здесь. Схожий проект есть в институте сложных адаптивных систем Санта Фе (о проекте можно почитать здесь). Ученые анализируют как распространение гриппа (работа 1, работа 2), так и лихорадку Эбола, вспышки холеры и т.д. Современные исследования принимают во внимание сразу многие факторы – природу и устойчивость вируса, структуру контактных сетей, влияние мобильности людей на развитие эпидемии. Так что мы все ближе и ближе приближаемся к пониманию всех механизмов распространения заболеваний а, значит, и к контролю над ними.

Желаем в Новом году найти новых близких по духу друзей (как изоморфные графы), иметь многогранные отношения с близкими (мультисетевые), и не болеть (и не заражать)!