Оказывается, не для всех в США победа Дональда Трампа на президентских выборах в США стала сюрпризом. Специалисты инженерной команды Трампа обнаружили изменения в результатах предварительных опросов благодаря алгоритмам анализа больших данных, пишет Wired.
Агентство Associated Press еще не успело объявить Дональда Трампа избранным президентом США, и исход гонки в колеблющихся штатах Пенсильвания и Нью-Гэмпшир еще был неизвестен, но Мэтт Оцковски и все остальные члены команды штаба Трампа по обработке данных и цифровым технологиям уже начали праздновать победу в Сан-Антонио, штат Техас, где они провели последние несколько месяцев.
Сторонники Дональда Трампа радуются новым голосам в отеле New York Hilton Midtown 8 ноября 2016 года. Фото: Джессика Риналди/Boston Globe/Getty Images
По телефону Оцковски, директор по продукту команды по обработке данных нового президента Cambridge Analytica, казался радостным, но не очень удивленным. Опросы, эксперты и анализ данных в целом указывали на вероятный провал, но Оцковски уверяет, что он и его команда еще несколько недель назад поняли, что Дональд Трамп имеет серьезные шансы на победу. «Вряд ли ваше политическое чутье скажет вам о таком, но наши модели верно предсказали исход выборов в большинстве штатов», – говорит он.
В этом они были одиноки. Все другие алгоритмы с большой вероятностью прогнозировали победу Клинтон – и модель Нэйта Сильвера из FiveThirtyEight, и Upshot из New York Times, и собственные прогнозы команды Клинтон.
Однако, рассказывает Оцковски, в последние десять дней компания заметила сокращение разрыва между кандидатами по результатам внутренних опросов. Когда стали поступать результаты заочного и досрочного голосований, команда обнаружила уменьшение явки среди афроамериканцев и увеличение – среди латиноамериканцев и людей старше 55 лет.
«В общем случае политическая теория подсказала бы, что увеличение явки пожилых людей – это хорошо, снижение явки среди афроамериканцев – тоже, а рост явки латиноамериканцев может сулить проблемы, – говорит он. – Но мы поняли, что, скорее всего, опросы избирателей и анализ возможного распределения голосов проводились некорректно».
Команда Трампа модифицировала свои модели в соответствии с этими актуальными данными и увидела, что шансы на победу резко возросли в штатах «Ржавого пояса», к которым относятся Огайо, Мичиган, Айову и Висконсин. «Cельское население сегодня наделало шуму, – сказал Оцковски. – Значительное число жителей сельской местности, лишенных права голоса, все же пришли на выборы».
Оцковски признает, что потребуется еще немало времени на то, чтобы понять, почему явка оказалась именно такой. У активистов за равные права голоса есть кое-какие идеи. Они указывают на законы об идентификации избирателей и серьезное усечение возможностей по досрочному голосованию в Северной Каролине и подобных штатах – и считают это доказательством того, что республиканцы во власти намеренно пытались снизить явку. В одном получившем широкую огласку пресс-релизе Республиканской партии Северной Каролины сообщалось о высокой явке среди белого населения и низкой явке среди афроамериканцев на досрочном голосовании.
Если об этих изменениях знали в штабе Клинтон, то решили ничего не предпринимать. Еще в пятницу один из руководителей кампании Клинтон Робби Мук праздновал создание так называемой «Коалиции за Клинтон» среди досрочных избирателей, которые, как он считал, приведут кампанию к победе. Оцковски, который ранее работал над кампанией губернатора Скотта Уокера, подобное упущение кажется естественным. «Кампания Клинтон была построена как традиционная большая кампания с четким следованием политическим нормам, – говорит он. – Скорее всего, если бы даже они знали, они не смогли признаться в этом себе».
Big Data мертвы?
Неожиданный исход выборов придал новый импульс разговорам о том, что большие данные умирают. Но, в конце концов, Трамп не признавал необходимости в анализе данных до последнего, и только летом, уже после победы в праймериз, нанял Cambridge Analytica. Однако Оцковски считает, что все эти разговоры – следствие такого же неверного видения ситуации, как и при анализе результатов опросов.
«Данные не умирают», – сказал он и повторил старое политическое изречение о том, что данные не помогают выиграть кампанию, они помогают выиграть преимущество. «Данные живее всех живых. Вопрос только в том, как вы их используете и готовы ли вы отказаться от привычных политических принципов, чтобы правильно интерпретировать данные». Действительно, это проблема существует: вы можете подтверждать свою точку зрения с помощью больших данных, если захотите этого, и не брать во внимание доказательства других сторон.
Big Data не умирает, а ошибается. Большие данные всегда могли ошибаться.
Для выборов, которые низвергли все возможные политические принципы, доказав ошибочность практически всех прогнозов, подобное заключение кажется подходящим – и пугающим.
Материалы по теме:
5 фактов о бизнес-империи Дональда Трампа
Мировые фондовые рынки падают на фоне успехов Трампа на выборах
Как блокчейн меняет бизнес-модели
Российские специалисты разработали алгоритм для определения популярности политиков
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter