Истории

Ваши старые твиты выдают о вас больше информации, чем вы думаете

Истории
Анна Самойдюк
Анна Самойдюк

Ex-редактор направления «Истории».

Анна Самойдюк

Международная группа исследователей разработала инструмент, который с большой точностью автоматически определяет места проживания и работы людей на основе их старых твитов.

Ваши старые твиты выдают о вас больше информации, чем вы думаете
Присоединиться

Инструмент LPAuditor опирается на то, что исследователи называют «инвазивной политикой» Twitter – обновления, когда компания представила функцию указания геотегов в твитах в 2009 году. На протяжении многих лет пользователи, которые отмечали свое местоположение – даже если оно было абстрактным, вроде Нью-Йорка – автоматически делились своими точными GPS-координатами. Ни сами пользователи, ни их фолловеры не могли их увидеть. Однако информация все равно заключалась в метаданных твита, и к ней можно было получить доступ через API.

Компания не меняла политику до апреля 2015 года. Сейчас пользователи должны дать согласие на то, чтобы делиться точным местоположением – и, согласно представителю Twitter, мало кто так делает. Но GPS-данные из старых твитов все еще остаются доступными через API.

Исследователи разработали LPAuditor для анализа таких твитов и определения детальной информации о том, где тысячи людей живут, работают и проводят свободное время.

Фото: Unsplash

Член команды по защите целостности сайта Twitter объяснил, что обмен данными о местоположении в Twitter всегда был добровольным и компания давала пользователям возможность удалить их в настройках. «В 2015 году мы поняли, что можем донести эту информацию еще понятнее, но суть все время заключалась в том, что пользователи могли сами выбирать, чем хотят и не хотят делиться», – сказал он.

Стать востребованным специалистом по кибербезопасности можно, выбрав онлайн-курс в каталоге курсов по информационной безопасности.

Действительно, люди сами выбирали, стоит ли делиться местоположением в твите. Но есть большая разница между указанием абстрактного геотега «Париж» и своего дома в Париже. И все равно Twitter предпочитал хранить информацию о точных GPS-координатах людей на протяжении многих лет. Тот факт, что эти детали были объяснены в Настройках, никак не помог бы пользователю, который не знал, что ему нужна эта помощь.

«Если вы не знаете о проблеме, вы никогда не удалите эти данные», – сказал соавтор исследования Джейсон Полакис.

В ноябре 2016 года, после того как Twitter сменила политику, Полакис и остальные исследователи начали вытаскивать метаданные твитов из API компании. Они проанализировали около 15 миллионов постов 87 тысяч пользователей. Для определения местоположения дома исследователи смотрели на локации, где человек выкладывал больше всего твитов. Они думали так: в течение недели чаще всего люди сидят в социальных сетях по утрам, по вечерам и по выходным; дом – это место, где люди проводят больше всего времени в субботу и воскресенье.

Для поиска офиса они сделали противоположное: анализировали закономерности твитов в течение недели. LPAuditor анализировал местоположения, где пользовали твитили больше всего, а затем исследовал временные рамки этих постов.

Фото: Unsplash

Для большей точности результатов исследователи вручную проверили твиты 2000 пользователей. Два аспиранта самостоятельно искали в них ключевые фразы, которые подтверждали, что человек был дома или на работе. Они также исследовали каждый твит в поисках контекста, который мог предоставить дополнительную информацию.  

Затем аспиранты сравнили свои выводы с прогнозами инструмента и обнаружили, что он определял локацию дома пользователей с 92% точностью. С работой все обстояло немного хуже – инструмент угадывал местоположения работы с 55% точностью. Вероятно, это связано с тем, что в некоторых случаях место, которое он определил как работу, было университетом или просто зданием, где люди бывали в рабочее время.

Наконец, исследователи решили определить другие места, которые мог бы посетить пользователь. Для этого они сравнили местоположения твитов с каталогом предприятий и заведений Foursquare. Они искали больницы, центры неотложной помощи, места для молитвы, а также стриптиз-клубы и гей-бары. Любое заведение, находящееся радиусе 25 метров от GPS-координат твита, считалось потенциальной локацией. Затем они провели похожий анализ ключевых слов – они искали фразы, связанные со здоровьем, религией, сексом и ночной жизнью для сверки результатов. Исследователи обнаружили, что LPAuditor правильно определял такие места в 80% случаев.

Большая часть исследования основывалась на твитах, написанных до смены политики Twitter в 2015 году. Это событие сильно повлияло на то, сколько данных о точном местоположении можно получить через API. Исследователи исключили из эксперимента все твиты, написанные до апреля 2015 года, и обнаружили, что правильно определили ключевые локации пользователей в 15 раз реже.

Тот факт, что Twitter сменила политику – это хорошо. Проблема в том, что посты, выложенные до 2015 года, все еще содержат ценную информацию, к которой можно получить доступ через API. «Мы не считаем, что было бы целесообразно вернуться назад и изменить твиты людей без их согласия», — прокомментировал представитель Twitter.

Фото: Unsplash

Информатик Генри Каутц утверждает, что Twitter – не единственное приложение, собирающее и использующее данные о местоположении пользователей. На самом деле, это представляет собой еще относительно небольшую проблему. Чего только стоят приложения для прогноза погоды и другие социальные сети, которые продают информацию о пользователях сторонним лицам.

И все равно смены политики здесь недостаточно, считает Поласкис, поскольку разработчики все еще могут получить данные о местоположении. Да, некоторая информация может быть уже устаревшей: люди переезжают, меняют работу. Но даже она может оказаться полезной хакерам. Кроме того, прочая личная информация меняется куда реже – например, ориентация человека.

Исследование показало, что получить доступ к данным пользователей довольно просто – машина может сделать это за считанные секунды. Пока же все, что могут сделать люди – это удалить информацию о своем местоположении и подумать дважды, прежде чем делиться ей в будущем.

Источник.


Материалы по теме:

Как Facebook использует ИИ для определения психического здоровья по постам

Блокчейн может изменить рынки образования и рекрутмента. И вот как

Летающие такси и робот-пекарь: чем удивила CES в 2019 году

Пять технологий, которые изменят сферу культуры и искусства

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Facebook и Twitter против Clubhouse: что будет, когда крупнейшие игроки скопируют функционал аудиочатов
  2. 2 От IBM до Uber: история крупнейших компаний — в 33 книгах
  3. 3 5 незаменимых сервисов для SMM-специалиста
  4. 4 60 влиятельных женщин, на которых стоит подписаться в Twitter
  5. 5 5 женщин-лидеров в сфере технологий