Американские ученые научили компьютер определять на основе постов в Twitter, где и когда люди потребляют алкоголь.
Об этом пишет MIT Technology Review, со статьей самих ученых можно ознакомиться здесь
Сначала исследователи из Университета Рочестера собрали 11 тысяч твитов с геотегами (отметками о местоположении), написанных пользователями сервиса в городе Нью-Йорке и округе Монро (входит в штат Нью-Йорк) и содержащих относящиеся к алкоголю слова вроде «напился», «пиво», «вечеринка» и др. Затем на краудсорсинговой платформе Amazon Mechanical Turks они наняли несколько человек, чтобы те просмотрели все твиты и определили в каждом случае, пишет ли человек просто об алкоголе или о том, что сам выпивает в момент написания твита.
Собранные данные потом показали компьютеру (SVM), который с помощью методов машинного обучения постепенно научился самостоятельно отделять твиты выпивающих от тех, кто только обсуждал алкоголь.
Ученые, однако, на этом не остановились. Используя ту же базу геотегированных твитов, отфильтрованную по ключевым словам, связанным с домом (вроде «Наконец-то дома!» или «телевизор», «диван», «ванная» и т.д.), ученые вновь обратились к пользователям Amazon Mechanical Turks, чтобы те просмотрели твиты и высказали свое мнение, написан ли тот или иной твит из дома/квартиры автора сообщения или из какого-либо другого места.
Если все трое нанятых людей сообщали «да», то эти твиты ученые помечали как написанные из дома. Затем эти данные вновь показывали той же SVM, которую учили самостоятельно определять «домашние» твиты – и компьютер действительно научился это делать с точностью до 80% (самый лучший результат среди подобных исследований).
В результате ученые получили программу, способную не только определять «пьяные» твиты, но и место, где выпивает человек – дома или где-либо еще.
Целью исследования было углубиться в понимание закономерностей в «алкогольном поведении» людей, учитывая, что среди причин предотвратимой смертности в США потребление алкоголя занимает третье место (75 тысяч смертей в год). Все полученные данные позволили ученым составить и сравнить «тепловые карты», показывающие, где люди пьют чаще всего.
Также ученым действительно удалось найти несколько интересных закономерностей. К примеру, данные показали, что жители густонаселенного и высокоурбанизированного Нью-Йорка по какой-то причине чаще пьют дома, чем жители менее населенной и более «пригородной» территории в округе Монро, где крупная часть людей предпочитают выпивать более чем в километре от дома.
Стоит отметить, что сами ученые признают, что методология их исследования не идеальна – пользователи Twitter, по их мнению, не могут представлять собой корректную репрезентативную выборку населения.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Искусство переговоров»
- 1 WSJ узнала об IPO космической компании Voyager Technologies при оценке $2–3 млрд
- 2 Blue Origin впервые запустила ракету New Glenn с мыса Канаверал во Флориде
- 3 Ученые обнаружили связь между курением и более низким заработком
- 4 Рациональное мышление: понятие, методы и развитие