Показаны сообщения с ярлыком базы данных. Показать все сообщения
Показаны сообщения с ярлыком базы данных. Показать все сообщения

четверг, 3 мая 2018 г.

Отчуждение любви. Как искусственный интеллект будет решать, на ком жениться

На ежегодной конференции Фейсбук Марк Цукерберг объявил о том, что в скором времени социальная сеть запустит свой сервис знакомств. "В Фейсбуке 200 миллионов человек называют себя одинокими, и с этим точно можно что-то сделать", - заинтриговал Цукерберг. Он отметил, что Фейсбук будет стремиться создавать долгосрочные серьезные отношения (в противовес Тиндеру, где знакомства часто всего лишь на одну ночь). Рекомендации одиноким людям Фейсбук будет выдавать на основании их общих интересов. Чем больше у людей общих увлечений, тем выше будет вероятность того, что они будут интересны друг другу.
С одной стороны, инициатива Цукерберга, как и большинство его инициатив, выглядит очень интригующе. Что может быть лучше человека, разделяющего с тобой твои интересы и увлечения, имеющего схожий взгляд на мир? С другой стороны, после речи Цукерберга возникает ощущение того, что теперь и сфера романтических отношений уходит из нашего прямого контроля, и задача выбора партнера делегируется искусственному интеллекту. Ведь как, по нашему предположению, будет работать сервис? Каждый из нас проводит огромное количество времени в интернете, в том числе и в социальных сетях, и оставляет массу "цифровых следов" (digital traces). Тут кто-то лайкает видео, тут напишет комментарий... Вся эта информация никуда не исчезает, она аккумулируется  и хранится в Фейсбуке и Гугл. Поисковик и социальная сеть знают когда вы встаете, какими аппаратами вы пользуетесь, что вам интересно, каковы ваши маршруты передвижения. И, на основании имеющихся массивов информации о вас и о других пользователях, информационные сервисы могут делать определенные выводы с применением методик искусственного интеллекта, обычно речь идет о машинном обучении.  Вспоминается одна из серий нашумевшего сериала "Черное зеркало", который очень точно описывает возможные результаты от сегодняшнего технологического прогресса. В этой серии некий алгоритм подбирает идеальных партнеров для всех. Этот выбор нельзя отменить, алгоритму нужно какое-то время, чтобы научиться и подобрать идеального партнера. Это значит, что человеку нужно пройти через несколько удачных или неудачных свиданий и отношений, прежде чем алгоритм обучится и подберет идеальную половинку на основе общих увлечений, интересов, переживаний. В одной сцене партнеры разговаривают о прелестях такой жизни: "Как прекрасно, что больше не нужно ничего делать, искать партнеров самим! Не представляю, как это было в прошлом - нужно было самим знакомиться, организовывать свидания, думать об интересах другого...".



Самый просто пример, и уже даже хрестоматийный пример того, как работают алгоритмы Фейсбука - это таргетированная реклама. Ваши друзья - люди, ведущие схожий образ жизни, если они любят джинсы Levi's, скорее всего, они понравятся и вам - поэтому тартегированной рекламы вам в ленту. Сразу видно, что искусственный интеллект в данном случае не означает создания гениального робота, который стремится к миру во всем мире, устранению парникового эффекта и спасению вымирающих видов животных. Вовсе нет. Сегодня искусственный интеллект - это стандартные методики машинного обучения, но на огромных массивах персональных данных. И практика показывает, что чем больше данных сервисы используют для обучения своих моделей, тем более точными становятся их предсказания. Получается, что отправной точкой для искусственного интеллекта служат именно данные, а не социальные закономерности. Так что любая ошибка в данных может привести к существенным смещениям результатов и к принятию неверного решения. К примеру, многие используют Фейсбук для профессионального позиционирования, и с большой долей вероятности таким Ромео алгоритм по подбору партнеров будет предлагать вероятных партнеров по бизнесу, но не вторых половинок. Хотя, и от новых бизнес-партнеров тоже может быть толк.

Подводя итог, еще раз хотим обратить внимание на планомерное "отчуждение принятия решений". Обладая мощным предсказательным потенциалом, искусственный интеллект становится все более востребован в процессе принятия решений. Инструменты искусственного интеллекта используются в продажах, рекрутинге, юриспруденции, банковской деятельности, и, согласно одному из недавних номеров журнала The Economist, в будущем будут использоваться в еще большем количестве сфер. Мы не можем отрицать высоких перспектив машин, но все же это наша жизнь, принимать в ней решения и нести за них ответственность выпало на нашу долю. Не забывайте.

понедельник, 29 января 2018 г.

Безмасштабные сети и сферические коровы

Теория сетей покоится на трех столпах. Первый основополагающий принцип сетевой теории – это гомофилия. Это значит, что похожие люди будут формировать друг с другом связи. Второй – транзитивность, то есть друг моего друга – мой друг. Третий – социальные сети безмаштабны (scale-free). Иными словами, распределение степеней вершин в сети подчиняется степенному закону – в сети присутствует большое количество людей, у которых очень мало связей, и совсем немного тех, у кого связей очень много. И в начале этого года третий столп решили подпилить.

Распределение центральности в случайных графах и реальных социальных сетях. На графике слева мы видим нормальное распределение, то есть все акторы в среднем имеют одинаковое количество связей. На графике справа мы видим распределение по степенному закону, то есть в сети есть небольшая доля акторов с очень большим количеством связей, но большинство имеет достаточно малое количество связей. Рисунок с сайта Network Science

Безмасштабность сетей подробно изучается уже почти 20 лет Альбертом-Ласло Барабаши и его группой. Они  проанализировали гигантское количество сетей и в каждой из них обнаружили подтверждение степенного закона.
Однако исследователи Анна Бройдо и Аарон Клаузет (про него можно подробно почитать тут) из университета Колорадо и Санта Фе проанализировали около тысячи социальных, биологических, технологических и информационных сетей и на днях пришли к выводу, что не все так однозначно с этими сетями. В технологических и биологических сетях распределение больше похоже на безмасштабное, а вот в социальных сетях оно уже лог-нормальное. То есть много людей, у которых среднее количество связей. А вот в животном мире как раз много тех, кто живет изолированно, а активно взаимодействующих особей очень мало.

Cферическая корова. Источник изображения.

Результаты Бройдо и Клаузета сейчас очень активно обсуждают. Кто-то хвалит исследователей за смелость, кто-то призывает заниматься насущными проблемами, а не изучать в сотый раз распределение центральностей. Выдвигаются и конспирологические теории. Некоторые подозревают, что дискуссия была искусственно создана для подогрева интереса к конференции NetSci, организатором и вдохновителем которой является сам  А.-Л. Барабаши. В Твиттер-обсуждении статьи А.-Л. Барабаши, написал, что «Каждые пять лет кто-то с ужасом пишет, что степенной закон не подходит ко многим реальным сетям. На самом деле у реальных сетей могут быть отклонения и приписывать его [степенной закон] ко всем сетям все равно, что вписывать корову в шар». 

понедельник, 25 декабря 2017 г.

Кто с Марса, кто с Венеры


Если у человека спросить: "Кто Ваши близкие друзья? С кем Вы общаетесь больше всего? С кем Вы разговаривали сегодня?", то у него, скорее всего, наступит ступор. Что значит мои близкие друзья? Считать ли продавцов в магазине моими сегодняшними контактами? Что значит "много общаться"? Часто исследователи задают такие сложные вопросы в анкетах, и участникам часто бывает тяжело вспомнить такие мелочи, как случайные каждодневные контакты, они забывают указать кого-то важного, а также у каждого свои представления о том, кто настоящий друг, а кто нет. В результате, мы получаем неполные данные и можем сделать на основе их ложные выводы.
В последнее время появилось много работ, в которых социальные связи людей измеряются намного более точно. У людей больше не спрашивают, с кем они общаются или общались сегодня, это за них делают наши верные друзья - машины и техника. Часто можно увидеть работы, в которых людей просили поставить на телефон специальное приложение, отслеживающее их передвижения, или просили ходить целыми днями с чипами, которые отслеживают их передвижения и контакты. Конечно, все это делается с согласия самих людей.
Например, этим летом я была на школе по вычислительным социальным наукам, и всех участников и лекторов просили ходить с бейджами, в которые был вшит чип. Чипы измеряли близость в пространстве, и если два чипа находятся очень близко друг к другу на протяжении какого-то времени (например, люди начали разговаривать между собой), то это фиксируется как контакт. Это был сбор данных в рамках исследования SocioPatterns. SocioPatterns собирает данные на конференциях, в школах, музеях, больницах и подобного рода местах, где участники находятся в одном пространстве и общаются друг с другом. Они выкладывают эти данные в открытый доступ и собирают их преимущественно для того, что изучать распространение эпидемий по сетям контактов. На видео ниже - пример того, как люди коммуницируют на конференции.


       Также мы недавно писали про еще одно исследование, в котором людей просили поставить приложение, фиксирующее их звонки и сообщения и отслеживающее активность (загорается экран телефона - человек активен, экран не горит долгое время, например, ночью - человек не активен и, скорее всего, спит). На основе таких данных были показаны различия в общительности между совами и жаворонками, то есть теми, чья активность приходится на вечернее и ночное время, и теми, кто рано встает, но уже к вечеру вовсе не способен работать. Выяснилось, что у сов больше друзей, но жаворонки больше времени тратят на каждого нового друга.
На днях были опубликованы результаты еще одного подобного исследования, в котором изучаются различия в общительности между мужчинами и женщинами. В этом случае, помимо установки специального приложения на телефон, люди также заполняли анкету о психологических чертах. Например, это такие черты, как склонность к нарциссизму, открытости, экстраверсии. Около тысячи студентов, которые приняли участие в исследовании, дали доступ к нескольким типам социальных сетей: дружба в фейсбуке, сеть звонков и сообщений, близость в пространстве.

Социальные сети из статьи Psylla et al (2017). А - сеть личной коммуникации, B - сеть в Фейсбук, С - сеть звоноков. Оранжевые узлы - женщины, голубые узлы - мужчины. Оранжевая связь - связь между двумя женщинами, голубая связь - между двумя мужчинами, серая - связь между разными полами. Размер узла обозначает популярность в сети, толщина связей - частоту интеракций. В сети А видно, как студенты разбиты на учебные группы.

Итак, насколько все-таки мужчины и женщины различаются по своей общительности? Выяснилось, что во всех типах социальных сетей у женщин значительно большее число контактов, то есть они звонят, переписываются, дружат в Фейсбук и общаются в реальной жизни с большим количеством людей, чем мужчины. Помимо того, что женщины популярны в сети студентов (это результат того, что у них много контактов), они также намного чаще занимают позиции брокеров. Что это такое? Это такая позиция в социальных сетях, когда человек связывает несколько не связанных между собой групп. В случае студентов это, например, случай, когда женщина общается и со своей группой, и с несколькими другими группами одновременно. Мужчина, который не занимает позицию брокера, будет общаться только с одной подгруппой друзей. Несмотря на то, что в таком случае у него будут крепкие дружеские связи с этими людьми и поддержка от них, он может много го лишиться. Известно, что быть брокером в социальных сетях полезно. Ты очень быстро получаешь и передаешь информацию, всегда находишься в курсе того, что происходит во всей социальной сети. Второй интересный результат касается гомофилии, или схожести формировать связи с себе подобными. Выяснилось, что принцип гомофилии присутствует в большей степени в социальных сетях женщин. Они скорее будут формировать связи с другими женщинами, чем с мужчинами. Мужчины же общаются в одинаковой степени и с мужчинами, и с женщинами.
В этой работе есть еще несколько результатов о различиях в психологических чертах и передвижениях мужчин и женщин, но мы остановились на результатах всего лишь о социальных взаимоотношениях. Подробнее о  результатах можно почитать в самой статье. По результатам такого сравнения, исследователи предлагают классификатор, позволяющий очень точно угадывать, мужчина это или женщина по набору психологических черт, социальным контактам и паттернам передвижения. Если вы нарциссичны и у вас высокая самооценка, то вы, скорее всего, мужчина. Если вы дружите с себе подобными, эмоциональны и добросовестны, то вы, скорее всего, женщина.

четверг, 3 августа 2017 г.

"Вне контакта". Вспомним, что мы могли изучать, когда данные "ВК" были открытыми.



31 июля газета «Известия» написала о том, что Роскомнадзор (РКН) запретил сторонним компаниям собирать открытую персональную информацию пользователей «ВКонтакте». Это ставит под вопрос проведение многих онлайн-исследований, так как «ВК» предоставлял возможность свободного доступа к открытым данным, чем активно пользовались и мы, и наши коллеги. В этом посте мы решили вспомнить некоторые работы, которые были сделаны на данных из «ВК».

Протесты
Динисса Дуванова с соавторами проанализировали структуру политических обсуждений в «ВК» в регионах Украины. Ученые показали, что пользователи предпочитают взаимодействовать с теми, кто разделяет их политические взгляды. Получается, что хотя онлайн-сети и имеют все шансы стать полноценной площадкой для политических дискуссий, эти возможности на практике не реализуются.
Мария Петрова и Рубен Ениколопов с коллегами также провели несколько исследований о взаимосвязи социальных сетей и протестов. Они показали, что чем выше уровень проникновения «ВК» в регионе, тем выше вероятность протеста и число участников протеста (подробнее читайте здесь). Исследователи также предположили, что участие в онлайн-группе существенно повышает вероятность участия в реальном протесте (все исследование здесь).

Здоровье
Петр Мейлахс, Юрий Рыков, Олеся Кольцова изучили группы посвященные СПИДу в «ВК» и выяснили, что группы, посвященные разным задачам имеют разную сетевую структуру дружбы и коммуникаций. Например, в группах, которые посвящены знакомству ВИЧ-положительных пользователей, преобладают связи между разнополыми пользователями. Особо подробно изучены группы «СПИД-диссидентов» - тех людей, которые отрицают факт наличия СПИДа. Авторы приходят к выводу, что в группах происходит формирование «эхокамеры», то есть в группе постоянно циркулируют одни и те же идеи, а альтернативные точки зрения не рассматриваются. Об исследовании можно прочитать здесь и здесь.

Образование 
        Иван Смирнов изучил тексты пользователей «ВК» за девять лет и пришел к выводу, что с возрастом пользователи «ВК» начинают употреблять более длинные слова (исследование можно прочитать здесь). Полученные результаты автор сопоставляет с «эффектом Флинна», по которому IQ населения в целом растет с течением времени.



        Иван также анализирует связи студентов и школьников в «ВК». В одном из своих исследований он показал, что и студенты, и школьники склонны формировать онлайн-связи (в данном случае в качестве связей были «лайки» в «ВК») с людьми со схожими академическими достижениями. Казалось бы, онлайн должен был бы способствовать общению всех со всеми, но, видимо, сегрегация настолько присуща человеческой природе, что студенты даже лайкают тех, кто также учится.

Мы тоже изучали социальные связи студентов «ВК» (статьи можно почитать тут и тут). Мы ставили перед собой задачу понять, каким образом студенты формируют друг с другом связи на самых начальных этапах обучения в университете, в течение первых же недель, и что с ними происходит после. Оказалось, что на первых порах студенты стремятся сформировать связи хоть с кем-то из курса или потока, а со временем формирование связей начинает происходить уже более выборочно. Например, студенты больше и активнее добавляют своих одногруппников и тех людей, с кем у них есть общие интересы.
Закрытие доступа к данным «ВК» говорит о необходимости поиска новых источников данных. «Фейсбук» довольно давно жестко регулирует доступ к персональным данным пользователей, поэтому скачать что-то оттуда вряд ли получится. А вот данные из Твиттера все ещё открыты и доступны для анализа (про анализ мемов в Твиттере можно почитать здесь).