Специалисты по обработке данных становятся экспертами по выстраиванию предположений о людях, основываясь на едва заметных нюансах из открытых соцсетей, таких как используемый язык, круг друзей и темы, которые обсуждают пользователи. Наблюдая за моделями поведения в бесконечном потоке информации Твиттера, эксперты разработали способы, с помощью которых они могут предсказать возраст пользователя, пол, местоположение, индивидуальные особенности, политические предпочтения и даже пребывание в депрессии, даже если такая информация дана не явно.
«Дело даже не в том, что вы говорите и как: ваши связи с друзьями и подписчиками тоже многое о вас рассказывают», — говорит Кристо Вильсон, IT-специалист из Северовосточного университета, который изучал влияние алгоритмов, используемых для оценки потребителей в интернете.
По теме: Twitter потратит $10 млн на исследование MIT о поведении людей
Последнее открытие в этой области, опубликованное в журнале PLoS One в сентябре, показало, что через Твиттер можно вычислить примерный уровень дохода пользователей.
В этом исследовании учёные рассмотрели около 5000 профайлов, которые ясно описывали работу человека, будь то исполнительный директор или шахтёр. Полагаясь на трудовую классификацию правительства Великобритании, они сопоставили работу пользователя с его средней зарплатой и изучили поведенческие модели в Твиттере, которые могли бы предугадать точный заработок каждого. После создания прогнозирующей модели учёные могли определить доход неизвестного пользователя с высокой точностью — достаточной для того, чтобы сказать, к какой группе населения с каким уровнем дохода он относится.
Источник: extremetech.com.
Команда ученых заинтересована в том, чтобы демографические данные стали более доступными для исследований в области социальных наук. Однако те же самые прогнозы могли бы быть полезны для маркетологов, компаний, торгующих информацией, работодателей и государственных органов.
«Всё что, люди выкладывают, находится в открытом доступе, поэтому им стоит понимать, сколько информации компании могут о них собрать», — говорит Даниель Преотиук-Пьетро, исследователь в университете Пенсильвании и ведущий автор работы.
В прошлом году отчёт Федеральной торговой комиссии показал, что дата-брокеры — фирмы, собирающие подробные профайлы людей, зачастую нарушая их права, для продажи маркетологам — уже включили соцсети в свой анализ. Не за горами и более углублённое изучение Твиттера для подробного прогнозирования.
Учёные проводили лингвистические анализы десятилетиями — на основе писем, заметок, а теперь и электронной почты. Но бум соцсетей упростил этот процесс и позволил развернуть его в более крупных масштабах. Согласно данным PLoS, исследователи обнаружили, что пользователи с высоким доходом склонны выражать больше «злости» и «страха» в своих твитах, но в целом меньше эмоций. Пользователи с низким доходом, с другой стороны, бранились больше и при этом были оптимистичнее. В их твитах было меньше ссылок — размышления пользователей в 140 знаков были более личными.
Анализ твитов от jessleber. Источник: AnalyzeWords.
Значит ли это, что богатство делает вас злее? Разумеется, исследование доказывает не это. Оно лишь показывает, что выражение гнева, особенно в Твиттере, и зарабатывание большего количества денег сопутствуют друг другу. В другом примере общественный инструмент, разработанный Джеймсом Пиннбейкером, психологом из университета Техаса, позволяет анализировать особенности вашей личности, полагаясь на Твиттер (Преотиук-Пьетро утверждает, что он работает над похожим инструментом, который прогнозирует доход любого человека). Просто вбейте свой id из Твиттера в AnalyzeWords.site, и он выдаст вам результаты, схожие c теми, что на графике выше.
Почему это так важно? Помимо того, что вы заботитесь о сохранности вашей личной информации, благодаря данным о возрасте и доходе становится легче вас дискриминировать при приеме на работу или совершении онлайн-покупки.
По теме: Твиттер решил зарабатывать на Big Data
«Эту информацию можно применить множеством способов, но самый мощный из них — это маркетинговый анализ: кто пишет твиты о моей компании/продукте, какие чувства они выражают в беседах, к какому слою населения относятся эти люди? Отсюда вы начинаете переходить к стратегиям влияния (как мы можем повлиять на разговор?) и сегментацию (разделяя людей на категории по качественным признакам)», —пишет в письме Вилсон. Он отмечает, что, скорее всего, это обусловлено покупкой Твиттером Gnip — компании, которая поставляет информацию из ленты в социальных сетях другим компаниям.
И поскольку алгоритмы принимают всё более и более автоматизированные решения, результаты могут стать менее прозрачными для общественности. Неужели я настолько же высокомерный, как утверждает анализ моей ленты в Твиттере? Хотелось бы думать, что нет, но если какое-то программное обеспечение в мире оценит меня таким образом, я никогда даже не узнаю об этом.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Кейсы предпринимателей: как справиться с вызовами»
- 1 Как Facebook, Twitter и Pinterest завоевывают внимание пользователей
- 2 WP: в Twitter может появиться возможность помечать фейковые новости
- 3 Ди Каприо побил рекорд упоминаний в Twitter
- 4 Противостояние Apple с ФБР поддержали Facebook и Twitter
ВОЗМОЖНОСТИ
04 декабря 2024
04 декабря 2024
04 декабря 2024
05 декабря 2024