Тысячи людей слушают чужие запросы Alexa, чтобы сделать ее умнее

Анна Самойдюк
Расскажите друзьям
Анна Самойдюк

Издание The Verge рассказало о том, как Amazon удается поддерживать и совершенствовать своего голосового ассистента Alexa. Оказалось, один из немногих способов делать это – заставить людей прослушивать ваши голосовые запросы.

Amazon, как и множество других технологических компаний, инвестирует большие средства в искусственный в интеллект. Компания всегда честно утверждала, что ее ассистент Alexa находится пока на стадии разработки. «Чем больше данных мы используем для обучения систем, тем лучше работает Alexa», – написано на сайте голосового помощника.

Чего компания вам не говорит, так это того, что чтобы усовершенствовать технологию, записи ваших запросов слушают люди. Конечно, все это скрыто в положениях и условиях сервиса, которые прочитают лишь несколько пользователей, но способы обучения искусственного интеллекта только продолжат вызывать тревогу, особенно потому, что мало кто знает, как эта технология работает.

Процесс прослушивания и анализа называется аннотацией данных, и он незаметно лег в основу революции машинного обучения, которая привела к успехам в обработке естественной речи, машинного перевода и распознавания объектов и изображений. Суть в том, что алгоритмы ИИ совершенствуются только тогда, когда данные, к которым у них есть доступ, могут быть легко проанализированы и классифицированы – и они не всегда могут сделать это сами. Возможно, Alexa неправильно расслышала вашу просьбу, или система думает, что вы спрашиваете не про британский город Брайтон, а про пригород Нью-Йорка. В работе с разными языками есть множество нюансов, таких как региональные диалекты и сленг, которые не учитывались при разработке.

Фото: BrainFacts

Во многих случаях эти пробелы восполняют люди, слушая записи голосовых запросов и правильно маркируя данные. Этот процесс называется «обучением с учителем», и в некоторых случаях он совмещается с другими, более автономными техниками, известными как «обучение с частичным привлечением учителя».

Издание Bloomberg написало о тысячах сотрудниках Amazon по всему миру, которые прослушивают записи Alexa, чтобы улучшить ассистента. Хотя, несомненно, в этом подходе нет ничего гнусного, большинство пользователей часто не осознают, что это происходит. К тому же, записи могут содержать явно идентифицируемые характеристики и биографическую информацию о говорящем. Также неизвестно, как долго хранятся эти данные и попадали ли они в руки третьим лицам.

В статье Bloomberg упоминаются случаи, когда некоторые сотрудники слышали сексуальные домогательства или другие формы преступной деятельности – и в таких ситуациях у Amazon есть право задействовать правоохранительные органы. Иногда сотрудники делятся фрагментами разговоров, которые кажутся им смешными или неловкими, с коллегами.

Подписывайтесь на канал Rusbase в «Яндекс.Дзен», чтобы ничего не пропустить

В своем заявлении Amazon сказала Bloomberg: «Мы прослушиваем очень малую часть голосовых записей Alexa, чтобы улучшить качество сервиса. Например, эта информация помогает нам обучать наши системы распознавания и понимания естественной речи, чтобы Alexa могла лучше понимать ваши запросы». Компания утверждает, что сотрудники не имеют доступа к информации о личности человека, и любые такие данные «обрабатываются с высокой степенью конфиденциальности» и защищаются «мультифакторной аутентификацией».

И все равно критики такого подхода высказывают свое беспокойство – обычно когда Amazon совершает ошибку и случайно отправляет записи не тем людям или раскрывает тот факт, что хранит их месяцами или даже годами. В прошлом году из-за серии странных ошибок Alexa запись личного разговора пользовательницы была отправлена коллеге ее мужа. В декабре мужчина из Германии сообщил о том, что получил 1700 записей от Amazon, хотя у него не было Alexa.

Amazon активно ищет способы отказаться от обучения с учителем. Издание Wired рассказало в своей статье в конце прошлого года о том, как Amazon использует новые, более передовые методы вроде так называемого активного и трансферного обучения, чтобы сократить количество ошибок и расширить базу знаний Alexa без вмешательства людей.

Фото: protectamerica.com

Директор по прикладным наукам Alexa Рухи Сарикайя ранее в этом месяце опубликовал в Scientific American статью под названием «Как обучается Alexa». В ней он детально рассказал, что цель такого широкомасштабного машинного обучения всегда будет заключаться в сокращении человеческого труда для исправления ошибок. «В недавних ИИ-исследованиях преобладало обучение с учителем. Но сегодня коммерческие ИИ-системы производят куда больше данных, чем мы можем маркировать вручную. Единственный способ продолжить совершенствовать сервис – перейти на обучение с частичным привлечением учителя или без привлечения учителя вообще. Наши системы должны сами научиться совершенствоваться», – пишет он.

А пока Amazon все еще нужны люди, понимающие культуру и язык, чтобы анализировать взаимодействия с Alexa и извлекать из них смысл. Это значит, что где-то в мире есть люди, которые слушают, как вы разговариваете с Alexa в вашей гостиной, спальне и даже ванной. Такова цена предоставляемого ИИ удобства, по крайней мере в глазах Amazon.

Источник.


Материалы по теме:

Хакеры могут взломать Alexa с помощью пения птиц

Как выглядит центр разработки Amazon, где обучают голосового помощника Alexa

«Умная» колонка Amazon отправила запись личного семейного разговора случайному человеку

Amazon научила Alexa распознавать команды без подключения к интернету

Фото на обложке: TechCrunch


В нашем Instagram @rusbase сегодня есть на что посмотреть! Подписаться

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

‡агрузка...

Комментарии

Зарегистрируйтесь, чтобы оставлять комментарии и получить доступ к Pipeline — социальной сети, соединяющей стартапы и инвесторов.
VOX Anagelis 2019
13 сентября 2019
Ещё события


Telegram канал @rusbase