Журнал для юных умов
Меню сайта

Предскажите, кто ваши друзья?

Ваши друзья могут влиять на вас так, как вы, возможно, и не подозреваете. Они могут влиять на то, как вы думаете и ведете себя, на ваши симпатии и антипатии, на то, что вы покупаете, на то, насколько хорошо вы учитесь в школе. Информация о ваших знакомых полезна для ученых, потому что с ее помощью мы можем лучше понять, как распространяются идеи или, в некоторых случаях, болезни. Ученые и математики могут использовать данные и передовую математику, чтобы сделать обоснованные предположения о том, насколько вероятно, что что-то произойдет. Например, мы можем предсказать вероятность того, что вы подружитесь с другим человеком, учитывая всего несколько сведений, например, в какой школе вы учитесь, какие у вас увлечения и с кем вы знакомы! В этой статье вы узнаете о некоторых инструментах, позволяющих стать сетевым ученым и делать собственные математические прогнозы о дружбе!

Могут ли ученые предсказать, кто ваши друзья?

Говорят, что "важно не то, что ты знаешь, а то, кого ты знаешь". Вероятно, у вас и ваших друзей много общего. Можете ли вы составить список ваших общих черт? Какие у вас общие интересы и черты характера? Ходите ли вы в одну школу или играете в одной команде? Живете ли вы в одном районе или городе? Есть ли у вас общие друзья? Вы наверняка ответили бы "да" хотя бы на некоторые из этих вопросов для каждого из ваших близких друзей. Возможно, вы не осознаете этого, но вы и ваши друзья также обмениваетесь информацией, отношением и поведением, связанными со школой. Ученые обнаружили, что люди, которые тебя окружают, то, что они знают и думают о школе, и то, как они себя ведут, может повлиять на твое академическое будущее [ 1 ]. Другими словами, ваши друзья влияют на ваши привычки и на то, насколько хорошо вы учитесь в школе. С другой стороны, то, насколько хорошо вы учитесь в школе, может повлиять на то, кто ваши друзья [ 2 ]! Оказывается, социологи и математики даже могут в какой-то степени предсказать, кто ваши друзья!

Что такое социальная сеть?

Ученые, изучающие сети, используют математические уравнения для построения графиков и измерения поведения и качеств отношений, например, к кому вы обращаетесь за помощью и насколько близки друзья [ 3 ]. Социальная сеть - это сеть личных связей, в которой люди обмениваются знаниями и ресурсами. Количество знаний и ресурсов, которыми обмениваются в сети, зависит от моделей и качества отношений внутри сети [ 4 ]. Если вы хотите узнать больше о науке о сетях, прочитайте эту статью в журнале Frontiers for Young Minds.

Мы также можем визуализировать социальные сети, создавая графы. В графах социальных сетей люди представлены цветными кругами, называемыми узлами. Цвет узлов может отражать характеристики людей в сети, такие как уровень образования, возраст или пол. Связи между людьми (например, дружеские отношения) представлены линиями между узлами, которые называются ребрами (Рисунок 1).

Прогнозирование друзей с помощью расширенной математики и ERGMS

Экспоненциальная модель случайных графов (ERGM) - это продвинутый математический инструмент, который предсказывает, могут ли два человека стать друзьями, основываясь на характеристиках сети. ERGM сравнивает все возможные случайные связи в сети, чтобы выяснить, насколько вероятно, что два человека будут связаны в какой-то момент в будущем. По сути, ERGM - это инструмент для прогнозирования связей между людьми.

С помощью нашей упрощенной модели вы можете делать собственные прогнозы, основываясь всего на пяти вопросах. У вас есть кто-то на примете? Отлично! Давайте попробуем!

Насколько плотна ваша сеть?

Можете ли вы вспомнить спортивную команду или клуб, в котором большинство людей дружат друг с другом? Это плотная сеть, в которой большинство людей, которые могли бы быть друзьями, на самом деле ими являются. Плотность описывается процентным значением, которое рассчитывается как количество реальных связей (связей) в группе (сети), деленное на все возможные связи (связи) в группе (сети). Например, обе сети на изображении ниже (рис. 2) имеют 50 узлов, но сеть справа имеет гораздо больше связей (линий) между узлами, поэтому она более плотная!

Рисунок 2 - (слева) Пример социальной сети с меньшей плотностью связей.

Плотность важна для калькуляторов ERGM, потому что она может увеличить или уменьшить вероятность того, что два человека соединятся. В сети с высоким значением плотности вероятность связи между двумя людьми будет гораздо выше. Другими словами, в очень плотной сети гораздо выше вероятность того, что два человека в сети в конечном итоге свяжутся друг с другом.

Сколько у вас общих друзей?

Можете ли вы вспомнить кого-нибудь из своих друзей, которые также дружат друг с другом? Это и есть триангуляция - когда люди дружат с друзьями своих друзей. Благодаря этому вы с большей вероятностью будете дружить с их друзьями. На сетевом графике эти связи (линии) образуют фигуры треугольников, поэтому это и называется триангуляцией! Когда в сетевом графе много треугольников, вы получаете высокое значение триангуляции. Высокое значение триангуляции увеличивает вероятность того, что два человека в конечном итоге окажутся связаны друг с другом, в то время как низкое значение триангуляции не так сильно.

Называют ли ваши друзья вас другом?

Допустим, мы спросим вас, кто ваш лучший друг, назовет ли этот человек вас своим лучшим другом? Если да, то это то, что мы называем взаимностью. Вот еще один пример: в сети класса, возможно, один ученик называет вас человеком, к которому он обращается за помощью, и вы тоже называете его человеком, к которому обращаетесь за помощью. В обеих ситуациях люди "посылают" связи друг другу. Поскольку взаимность - это форма увеличения связности в сети, она является важным значением для калькуляторов ERGM. Как и в случае с плотностью и триангуляцией, высокое значение взаимности увеличивает вероятность того, что два человека в конечном итоге окажутся связаны друг с другом.

Обращаетесь ли вы за советом к своим друзьям?

Если мы попросим вас составить список ваших друзей, а затем список людей, к которым вы обращаетесь за помощью в выполнении домашнего задания, и список людей, к которым вы обращаетесь за поддержкой в трудную минуту, то у вас наверняка найдется хотя бы один друг, который будет присутствовать в нескольких из этих списков. По мнению специалистов по сетевым технологиям, у вас будет много видов связей ("краев") с этим одним другом. Когда у вас есть несколько видов связей ("краев") с одним человеком, это называется феноменом краевых эффектов. Термин "краевые эффекты" в основном означает, что если вы проводите много времени с другом, то, скорее всего, вы связаны с ним несколькими способами. Чем больше краевых эффектов в сети, тем выше вероятность того, что два человека в конечном итоге окажутся связаны друг с другом, что делает этот показатель еще одним важным для калькуляторов ERGM.

Есть ли у вас общие черты характера?

Слышали ли вы выражение "птицы, похожие на перья, собираются вместе"? Замечали ли вы, что у вас и ваших друзей часто бывают общие симпатии, антипатии, хобби, может быть, даже убеждения? Это говорит о гомофилии, когда люди общаются с себе подобными. Таким образом, когда в сети больше гомофилии, люди склонны устанавливать больше связей. Как и три другие характеристики сети (плотность, триангуляция, взаимность и краевые эффекты), гомофилия может увеличивать или уменьшать вероятность того, что два человека в конечном итоге окажутся связаны друг с другом, поэтому ученые-сетевики любят включать ее в калькуляторы ERGM.

Предсказание друзей - как это работает?

Оценки, полученные с помощью ERGM, приводятся в единицах "лог-одд" (логарифм отношения шансов). Математики используют log-odds, потому что это простой инструмент для объединения нескольких переменных вероятности.

Коэффициент - это отношение вероятности успеха (выигрыша в игре между вами и мной) к вероятности неудачи (проигрыша в игре). Например, допустим, вероятность того, что вы выиграете (успех), составляет 1 к 4 (0,25), а вероятность того, что вы не выиграете (неудача), составляет 3 к 4 (0,75). Чтобы получить коэффициент на выигрыш, разделите вероятность успеха (0,25) на вероятность неудачи (0,75); таким образом, мы получим (0,25/0,75).

Теперь допустим, что я не так хорош в игре, как вы, поэтому вероятность того, что я выиграю, равна (0,10), а вероятность того, что я не выиграю, равна (0,9). Чтобы получить мои шансы на победу, мы разделим мой шанс на успех (0,10) на мой шанс на неудачу (0,9), так что мы получим (0,10/0,9).

Далее, чтобы сравнить ваши и мои шансы на победу, нам нужно объединить шансы, создав соотношение, разделив ваши шансы на мои шансы. Отношение шансов между нашими шансами на победу в игре записывается как (0,25/0,75)/(0,1/0,9), что упрощенно равно 3. Другими словами, вероятность того, что вы выиграете, в 3 раза больше, чем вероятность того, что выиграю я.

Вы можете заметить, что коэффициенты несимметричны. На обычной числовой прямой наименьшее число - отрицательная бесконечность, наибольшее - положительная бесконечность, а "центральное" число - ноль. Однако в случае коэффициентов шансов наименьшее возможное число равно нулю, наибольшее - положительной бесконечности, а "центральное" число - единице!

Подумайте об этом так: если у меня в два раза больше шансов обыграть вас в теннис, то у вас в два раза меньше шансов обыграть меня. С точки зрения соотношения эти показатели эквивалентны, но численно они (2 и 0,5) находятся на разных расстояниях от 1 на числовой прямой, и 1 будет означать, что у нас равные шансы победить друг друга. Поэтому мы берем логарифм отношения шансов. У функции log много свойств, но самое важное для нас то, что log от 1 равен 0, а для положительных x мы знаем, что log( x ) = -log(1/ x ). Например, log от 2 равен 0,69, а log от 1/2 раве н-0,69. Таким образом, если вы рассчитаете отношение шансов как вероятность моего выигрыша к вероятности вашего выигрыша или наоборот, то, взяв логарифм, мы получим те же самые числа. Они отличаются только знаком плюс/отрицательный. Другими словами, теперь они находятся на равном расстоянии от 0 на числовой прямой.

Таким образом, взятие логарифма шансов сдвигает равные шансы к 0 и позволяет получить симметричную оценку шансов. Математики используют логарифмические коэффициенты, потому что это более простой инструмент для комбинирования нескольких коэффициентов, что и будет делать наш интерактивный калькулятор. В нашем случае вместо логарифмических коэффициентов мы можем использовать "очки".

Использование интерактивного калькулятора

Мы выбрали конкретные значения для интерактивного калькулятора (модели) ниже, основываясь на типичных результатах работы социальных сетей. Например, вероятность того, что люди, имеющие общих друзей, будут дружить, высока (в данном случае втрое выше), даже в обычно менее плотных сетях, таких как сети дружбы.

Цифры в интерактивном калькуляторе (модели) ниже (рис. 3) можно менять в зависимости от того, какие виды сходства, по мнению создателей модели, более важны для возникновения дружбы в конкретной сети. Такие варианты, как "4 балла за взаимные советы, 1 балл за одинаковую гендерную идентичность", - это именно варианты, а не установленные правила. Большая часть прикладной математики - это корректировка модели для более точного отображения реальности. Правда, в ходе исследований было установлено, что некоторые виды сходства вносят больший вклад в дружбу в больших школьных сетях (поэтому мы включили некоторые из них ниже). Например, если у вас есть общие друзья, вероятность того, что вы будете дружить, очень высока, а если вы прислушиваетесь к советам кого-то в школе, вероятность того, что вы будете дружить, еще выше. Однако реальные значения являются гипотетическими.

"Баллы" дружбы

Представьте себе двух людей, которые учатся в одной школе, - вас и меня! Крупные школьные сети дружбы, как правило, не очень плотные, поэтому мы начнем с предположения о (низкой) плотности сети, что даст нам отрицательные шесть баллов. Давайте представим, что у нас есть два общих друга (триангуляция), что добавляет 6 очков к оценке. Мы с вами оба говорим друг другу, что являемся друзьями (взаимность), что добавляет еще 2 очка к нашей оценке. Однако ни один из нас не обращается к другому за советом (краевой эффект), а значит, эти очки нам не добавляются. Теперь предположим, что мы оба разделяем одну и ту же гендерную идентичность (гомофилия), что добавляет еще 1 балл к нашей оценке. Если сложить наши общие баллы, то получитс я-6 + 6 + 2 + 0 + 1 = 3.

Вычисление шансов

Получив сумму (3) ваших баллов дружбы, мы вычисляем логарифмический коэффициент вероятности того, что мы подружимся. Чтобы преобразовать его в дружеское число (процент шансов), нам нужно вычислить обратный логарифм. Формула в интерактивном калькуляторе как раз это и делает! Она преобразует ваши логарифмические коэффициенты в процентные шансы. Для этого мы увеличиваем число Эйлера (математическую константу~равное 2,718) на экспоненту суммы баллов дружбы, деленное на 1 плюс число Эйлера, возведенное в экспоненту суммы баллов дружбы. Подставив числа из нашего примера в приведенную ниже формулу, мы получим 0,95, или 95 % вероятности того, что мы подружимся.

Ваша очередь!

В зависимости от ваших ответов на вопросы, приведенные ниже, итоговое значение баллов ERGM будет меняться. Мы преобразовали значение баллов в процентное соотношение, когда вы закончили, чтобы облегчить работу в реальной ситуации. Если процентное соотношение высокое, выше 50 %, то, скорее всего, вы друзья. Если процентное значение низкое, ниже 50 %, скорее всего, вы не друзья.

Теперь вы можете самостоятельно использовать наш интерактивный калькулятор ERGM, чтобы определить вероятность того, что вы подружитесь с реальным человеком, которого вы знаете!

Продвинутые ходы

Если вы хотите попробовать что-то более сложное, попробуйте поиграть с моделью, изменив эти числа, и посмотрите, что получится - какие значения дают наиболее точные реальные сети? Ведь именно так работает реальное моделирование.

Важно помнить, что наш пример со школьной сетью дружбы не очень плотный. Но допустим, вы захотите попробовать повторить этот опыт с меньшей, более плотной сетью, например с конкретным клубом или внеклассной программой, например с джаз-бандом или клубом речей и дебатов. Было бы сложно знать каждого человека в вашей школе, не говоря уже о том, чтобы дружить со всеми. С другой стороны, гораздо проще узнать всех в небольшой группе и подружиться с ними. В случае небольшой группы или клуба вы, скорее всего, получите в калькуляторе положительный коэффициент плотности (например, 3 или 6 баллов, а не отрицательные 6). Вы даже можете оценить фактическую плотность небольшой сети, рассчитав реальные существующие дружеские связи в группе, разделенные на общее количество возможных связей между людьми в группе.

Теперь, когда вы знаете, как это делается, попробуйте составить схему своей собственной социальной сети и использовать свои собственные числа плотности в калькуляторе! Вы заметите, что с ростом плотности увеличивается и процентный шанс подружиться! Теперь вы действительно занимаетесь сетевой наукой!

Заключение

Вы, наверное, думаете, зачем кому-то понадобилось предсказывать, кто мои друзья? Оказывается, для такой информации есть множество применений. Способность точно предсказывать ваши социальные связи полезна для поиска "друзей" в приложениях социальных сетей, а также является выгодной возможностью для интернет-магазинов, политических кампаний или тех, кто надеется распространить ложную информацию, и так далее. Скажем так: если приложение бесплатное, то товаром являетесь вы и ваши социальные связи (социальные сети). Фишинговые мошенники также используют ваши социальные сети для распространения компьютерных вирусов, загружая все ваши контакты и отправляя им вирус, как будто вы отправляете письмо. Эпидемиологи используют крупномасштабные модели прогнозирования сетей и отслеживания контактов, чтобы принимать решения о том, как наилучшим образом защитить вас от распространения инфекционных заболеваний. Но друзья не просто обмениваются микробами и компьютерными вирусами, они обмениваются идеями и взглядами на мир. Вы влияете на поведение друг друга, включая физические нагрузки, интересы, прогулы и оценки в школе. Это не значит, что ваши друзья должны быть лучшими в классе, чтобы вы преуспели в жизни, но, судя по математике, вам точно не повредит поддерживать связь с друзьями, которые хорошо учатся в школе. Помните, что важно также качество ваших отношений. Теперь вы знаете, что, с точки зрения математики, важно, кого вы знаете!

Это интересно: