Олег Овечкин

Ученые научили компьютер определять, где и когда люди выпивают

Американские ученые научили компьютер определять на основе постов в Twitter, где и когда люди потребляют алкоголь.


Об этом пишет MIT Technology Review, со статьей самих ученых можно ознакомиться здесь

Сначала исследователи из Университета Рочестера собрали 11 тысяч твитов с геотегами (отметками о местоположении), написанных пользователями сервиса в городе Нью-Йорке и округе Монро (входит в штат Нью-Йорк) и содержащих относящиеся к алкоголю слова вроде «напился», «пиво», «вечеринка» и др. Затем на краудсорсинговой платформе Amazon Mechanical Turks они наняли несколько человек, чтобы те просмотрели все твиты и определили в каждом случае, пишет ли человек просто об алкоголе или о том, что сам выпивает в момент написания твита.

Собранные данные потом показали компьютеру (SVM), который с помощью методов машинного обучения постепенно научился самостоятельно отделять твиты выпивающих от тех, кто только обсуждал алкоголь.

Ученые, однако, на этом не остановились. Используя ту же базу геотегированных твитов, отфильтрованную по ключевым словам, связанным с домом (вроде «Наконец-то дома!» или «телевизор», «диван», «ванная» и т.д.), ученые вновь обратились к пользователям Amazon Mechanical Turks, чтобы те просмотрели твиты и высказали свое мнение, написан ли тот или иной твит из дома/квартиры автора сообщения или из какого-либо другого места.

Если все трое нанятых людей сообщали «да», то эти твиты ученые помечали как написанные из дома. Затем эти данные вновь показывали той же SVM, которую учили самостоятельно определять «домашние» твиты – и компьютер действительно научился это делать с точностью до 80% (самый лучший результат среди подобных исследований).

В результате ученые получили программу, способную не только определять «пьяные» твиты, но и место, где выпивает человек – дома или где-либо еще.

Целью исследования было углубиться в понимание закономерностей в «алкогольном поведении» людей, учитывая, что среди причин предотвратимой смертности в США потребление алкоголя занимает третье место (75 тысяч смертей в год). Все полученные данные позволили ученым составить и сравнить «тепловые карты», показывающие, где люди пьют чаще всего.

Тепловые карты пьянок

Также ученым действительно удалось найти несколько интересных закономерностей. К примеру, данные показали, что жители густонаселенного и высокоурбанизированного Нью-Йорка по какой-то причине чаще пьют дома, чем жители менее населенной и более «пригородной» территории в округе Монро, где крупная часть людей предпочитают выпивать более чем в километре от дома.

Стоит отметить, что сами ученые признают, что методология их исследования не идеальна – пользователи Twitter, по их мнению, не могут представлять собой корректную репрезентативную выборку населения.


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно