Первые дни с «Яндекс.Станцией»: впечатления от early bird

Григорий Петров
Григорий Петров

Технический евангелист Voximplant

Расскажите друзьям
Полина Константинова

10 июля 2018 года в продажу вышла умная колонка от «Яндекса»: благодаря голосовому помощнику Алисе она включает музыку, находит нужный фильм и напоминает о событиях в календаре. К моменту открытия официального магазина очередь растянулась на 300 метров, а первая двадцатка покупателей была на посту уже за полтора часа до старта продаж. Среди них — DevRel компании Voximplant Григорий Петров.

Почему я купил колонку

Приобретение «Яндекс.Станции» — это реальная возможность прикоснуться к будущему, к технологиям, которые в корне меняют наше взаимодействие с окружающим миром. Автоматизация ежедневных задач и живое общение с роботом входят в топ наиболее актуальных тем в IT-сфере, и колонка отвечает на оба запроса рынка.

Безусловно, ассистенты еще не распространены настолько, чтобы говорить об их глобальном влиянии на быт человека, но поэтому и интересно быть в первых рядах. Точно так же у меня были первые iPhone, iPad, очки виртуальной реальности и колонка от Google.

Многие усомнятся в уместности использования громких слов «технологии будущего», так как западные коллеги «Яндекса» представляли подобные решения и ранее, но нельзя упускать ключевой момент — язык.

Очередь за колонкой. Крайний справа — Григорий Петров (скриншот истории из Instagram «Яндекса»).

Для подобных систем главным критерием качества становится то, насколько хорошо компьютер понимает человека, и разработок, предназначенных для русскоговорящей аудитории, до сих пор не было. Другие помощники рассчитаны на английский и поддерживают остальные языки по остаточному принципу.

Первый опыт: плюсы и минусы

Станция оправдала ожидания в полной мере, хотя есть и определенные сложности в общении с Алисой. Один из главных плюсов: большой ассортимент действий, которые умеет совершать система. Она не только ставит музыку и фильмы по запросу, но также ищет информацию в «Яндексе» и Википедии, рассказывает последние новости, предупреждает о дожде или пробках на дороге.

Раньше, кстати, не обнаруживал потребность в голосовом помощнике: не было подходящих сценариев и задач, с которыми он справился бы лучше, чем я с помощью пары кликов на телефоне или компьютере. А вот колонка, которая, помимо прочего, может завести будильник на утро, — это круто.

Главный минус или, скорее, особенность технологии заключается в том, что нужно хорошо артикулировать, обращаясь к ассистенту. Если фразу произносить бегло и не слишком выразительно, Алиса может не понять смысла сказанного и попросит повторить запрос. К чести разработчиков стоит отметить, что при внятной артикуляции помощник все прекрасно понимает.

Тестирование голосового помощника в компании

Второй момент — это формулировка просьбы. Чтобы максимально использовать предлагаемый ассортимент команд, нужно учиться четко излагать свой запрос. Произвольные разговорные фразы Алиса не осилит. Что удобно — при подключении колонки к телевизору на экран выводятся подсказки, как стоит выразиться, чтобы быть стопроцентно понятым.

У Алисы сложный характер

Если говорить более детально о впечатлениях от использования колонки, то вот несколько интересных моментов, которые мы с коллегами уже отметили:

  • Алиса обижается, причем причины для такого поведения могут быть самые разные — упоминание других ассистентов вроде Siri и Google, указание на ее ошибки и так далее. Это приближает модель общения бота к естественной, но когда Алиса говорит, что «обидеть голосового бота может каждый», это звучит неуместно. Хотя и забавно.

  • Алиса хамит, и это общепризнанный факт. «Как смешно, придумай что-нибудь поумнее», — такой ответ, например, можно получить на запрос «Алиса, поздоровайся с Толей».

  • Сложной оказывается ситуация, когда с системой общается двое-трое людей одновременно, тогда она начинает тормозить.

  • Ассистент воспроизводит контент только при наличии подписки на платные сервисы, если же подписки нет, он настойчиво предлагает приобрести лицензию. На запрос «Алиса, хочу смотреть “Том и Джерри” бесплатно» уклончиво отвечает «Я ничего не знаю об этом».

  • Бот не реагирует на просьбу рассказать, что он умеет. Это странно, учитывая, что в официальном магазине «Яндекса» имеется перечень всех навыков станции.

  • Один раз у нашей Алисы произошло «раздвоение личности» — она заговорила двумя голосами одновременно.

Таким образом, технология еще требует развития и доработки, но все эти вопросы, уверен, будут решены при последующих обновлениях.

Голосовые боты: что дальше

Я не берусь прогнозировать будущее голосовых помощников, но могу сказать, что данный тренд все активнее развивается. Мы делаем конструктор облачной телефонии, и одним из «кубиков» является как раз распознавание и синтез голоса. Регулярно к нам поступают запросы на разработку голосовых ассистентов для банковской и HR-сферы, недавно был релиз бота по заказу пиццы, собранного на базе Dialogflow, на нас также работает HR-робот Вера — с каждым днем подобных запросов становится больше.

Голос Алисы приятный и плавный, его трудно отличить от живого человека, если речь идет о несложных вопросах. Еще пару лет обучения, и Алиса будет отвечать на наши запросы так же круто, как сейчас «Яндекс.Навигатор» распознает произносимые адреса.

Разработки компании «Яндекс» позволяют создавать решения для российского бизнеса на нативном языке, — что тоже влияет на рынок и способствует массовому внедрению голосовых интерфейсов в потребительском сегменте.


Материалы по теме:

Актуальные материалы — в Telegram-канале @Rusbase

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter


Комментарии

Зарегистрируйтесь, чтобы оставлять комментарии и получить доступ к Pipeline — социальной сети, соединяющей стартапы и инвесторов.
EMERGE
31 мая 2019
Ещё события


Telegram канал @rusbase