Издание The Verge рассказало о том, как Amazon удается поддерживать и совершенствовать своего голосового ассистента Alexa. Оказалось, один из немногих способов делать это – заставить людей прослушивать ваши голосовые запросы.
Amazon, как и множество других технологических компаний, инвестирует большие средства в искусственный интеллект. Компания всегда честно утверждала, что ее ассистент Alexa находится пока на стадии разработки. «Чем больше данных мы используем для обучения систем, тем лучше работает Alexa», – написано на сайте голосового помощника.
Чего компания вам не говорит, так это того, что чтобы усовершенствовать технологию, записи ваших запросов слушают люди. Конечно, все это скрыто в положениях и условиях сервиса, которые прочитают лишь несколько пользователей. Однако способы обучения искусственного интеллекта только продолжают вызывать тревогу, особенно потому, что мало кто знает, как эта технология работает.
Процесс прослушивания и анализа называется аннотацией данных, и он незаметно лег в основу революции машинного обучения, которая привела к успехам в обработке естественной речи, машинного перевода и распознавания объектов и изображений. Суть в том, что алгоритмы ИИ совершенствуются только тогда, когда данные, к которым у них есть доступ, могут быть легко проанализированы и классифицированы – и алгоритмы не всегда могут сделать это сами. Возможно, Alexa неправильно расслышала вашу просьбу, или система думает, что вы спрашиваете не про британский город Брайтон, а про пригород Нью-Йорка. В работе с разными языками есть множество нюансов, таких как региональные диалекты и сленг, которые не учитывались при разработке.
Фото: BrainFacts
Во многих случаях эти пробелы восполняют люди, слушая записи голосовых запросов и правильно маркируя данные. Этот процесс называется «обучением с учителем», и в некоторых случаях он совмещается с другими, более автономными техниками, известными как «обучение с частичным привлечением учителя».
Издание Bloomberg написало о тысячах сотрудниках Amazon по всему миру, которые прослушивают записи Alexa, чтобы улучшить ассистента. Хотя, несомненно, в этом подходе нет ничего гнусного, большинство пользователей часто не осознают, что это происходит. К тому же, записи могут содержать явно идентифицируемые характеристики и биографическую информацию о говорящем. Также неизвестно, как долго хранятся эти данные и попадали ли они в руки третьим лицам.
В статье Bloomberg упоминаются случаи, когда некоторые сотрудники слышали сексуальные домогательства или другие формы преступной деятельности – и в таких ситуациях у Amazon есть право задействовать правоохранительные органы. Иногда сотрудники делятся фрагментами разговоров, которые кажутся им смешными или неловкими, с коллегами.
В своем заявлении Amazon сказала Bloomberg: «Мы прослушиваем очень малую часть голосовых записей Alexa, чтобы улучшить качество сервиса. Например, эта информация помогает нам обучать наши системы распознавания и понимания естественной речи, чтобы Alexa могла лучше понимать ваши запросы». Компания утверждает, что сотрудники не имеют доступа к информации о личности человека и любые такие данные «обрабатываются с высокой степенью конфиденциальности» и защищаются «мультифакторной аутентификацией».
И все равно критики такого подхода высказывают свое беспокойство – обычно когда Amazon совершает ошибку и случайно отправляет записи не тем людям или раскрывает тот факт, что хранит их месяцами или даже годами. В прошлом году из-за серии странных ошибок Alexa запись личного разговора пользовательницы была отправлена коллеге ее мужа. В декабре мужчина из Германии сообщил о том, что получил 1700 записей от Amazon, хотя у него не было Alexa.
Amazon активно ищет способы отказаться от обучения с учителем. Издание Wired рассказало в своей статье в конце прошлого года о том, как Amazon использует новые, более передовые методы, вроде так называемого активного и трансферного обучения, чтобы сократить количество ошибок и расширить базу знаний Alexa без вмешательства людей.
Фото: protectamerica.com
Директор по прикладным наукам Alexa Рухи Сарикайя ранее в этом месяце опубликовал в Scientific American статью под названием «Как обучается Alexa». В ней он детально рассказал, что цель такого широкомасштабного машинного обучения всегда будет заключаться в сокращении человеческого труда для исправления ошибок. «В недавних ИИ-исследованиях преобладало обучение с учителем. Но сегодня коммерческие ИИ-системы производят куда больше данных, чем мы можем маркировать вручную. Единственный способ продолжить совершенствовать сервис – перейти на обучение с частичным привлечением учителя или без привлечения учителя вообще. Наши системы должны сами научиться совершенствоваться», – пишет он.
А пока Amazon все еще нужны люди, понимающие культуру и язык, чтобы анализировать взаимодействия с Alexa и извлекать из них смысл. Это значит, что где-то в мире есть люди, которые слушают, как вы разговариваете с Alexa в вашей гостиной, спальне и даже ванной. Такова цена предоставляемого ИИ удобства, по крайней мере в глазах Amazon.
Материалы по теме:
Хакеры могут взломать Alexa с помощью пения птиц
Как выглядит центр разработки Amazon, где обучают голосового помощника Alexa
«Умная» колонка Amazon отправила запись личного семейного разговора случайному человеку
Amazon научила Alexa распознавать команды без подключения к интернету
Фото на обложке: TechCrunch
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Старт работы на Wildberries»
- 1 Nvidia в 2025 году выпустит комплексное ПО для управления человекоподобными роботами
- 2 Apple, Microsoft, Nvidia, Amazon и Alphabet инвестировали от $1 млн в 149 стартапов за год
- 3 РКН хочет ограничить работу Amazon Web Services, HostGator, Network Solutions в РФ
- 4 Конкуренты Илона Маска опасаются его политического влияния — WSJ
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025