Голосовые роботы стали нормой даже для самых, казалось бы, консервативных сфер бизнеса. Они берут на себя типовые задачи, работая быстрее, дешевле и эффективнее людей. Они все больше похожи на человека. О главных трендах в развитии речевых технологий в 2021 году и о том, что дает бизнесу их кастомизация, рассказывает Никита Ткачев, менеджер по развитию ML-сервисов Yandex.Cloud.
В проекте Dig(IT)al рассказываем о технологиях, которые помогут вам заработать. Переходите на цифровую сторону бизнеса.
Запрос на «индивидуальный пошив» — главный тренд
Сегодня робота обучают быть живым. Он должен не только хорошо понимать, что ему говорят и правильно интерпретировать сказанное, но и показывать простые человеческие реакции. Клиент звонит сразу после того, как сделал заказ в интернет-магазине? Используй этот контекст. Тебя перебивают? Замолчи и послушай, реши, можешь ли ты переформулировать свой ответ, чтобы быть более полезным. Клиент не понял? Попробуй переформулировать свой вопрос, а не повторяй одно и то же. Он недоволен? Разряди обстановку, адаптируй свою речь или мягко переключи на оператора-человека.
Над разработкой голосового робота также работают специалисты в области аналитики, психологии и контента. Часть задач решается техническими средствами. Речевые технологии, распознавание и синтез речи — основа успешной коммуникации робота и человека. Если на этом этапе мы потеряем важную информацию, то вся остальная работа с роботом становится фактически бессмысленной.
Улучшение кастомизации распознавания речи
Роботы работают с текстом и доверяют результатам распознавания речи. Как мы можем определить, что хорошо решаем эту задачу? Существует определенная метрика распознавания речи (в данном случае WER) — это количество верно распознанных слов по отношению к оригиналу. Если робот, например, некорректно распознает название улицы для доставки товара, то какой-то адресант может остаться без подарка к Новому году.
Для исключения ошибок модель распознавания сегодня обучают на примерах диалогов из реальной жизни, поэтому в приоритете используют настоящие звонки. К тому же бизнес меняется, меняются запросы, а, следовательно, модель необходимо дообучать. Причем это должно происходить на основе реальных метрик, а не субъективного ощущения со стороны заказчика. Мы уже на пути к этому.
Улучшение кастомизации синтеза речи
Для бизнеса важно, чтобы клиент не чувствовал дискомфорта от разговора с роботом. Обычный синтез речи обеспечивает информативное общение, но по манере общения бот отличается от человека, и не все люди хотят разговаривать с роботом. В погоне за конверсией и пользовательским опытом синтез часто меняется на предзаписанные фразы в исполнении профессионального оператора. Эти фрагменты вставляются в нужном контексте и диалог собирается как конструктор. Такой подход не универсален — для добавления переменных, например: имени абонента, его адреса, названия и цены товара — придется монтировать фразу частями. Но разница в произношении разрушит магию человеческого общения. Записать же все возможные варианты невозможно.
Самый современный и универсальный метод — синтез речи с максимальным приближением к стилю диктора, включая генерацию переменных частей. Уже удалось достичь 98% сходства с человеком. Растет спрос на индивидуальный синтез для повышения узнаваемости бренда. Многие компании стремятся индивидуализировать роботов в колл-центрах. Например, «Альфа-Банк» создал голосового помощника на основе индивидуального полнотекстового синтеза.
Другие тренды
Увеличение доли использования голосовых интерфейсов
Люди привыкают общаться с приложениями голосом без нажатия кнопок на клавиатуре или экране. Распространение широких каналов связи и облачных платформ позволит применять полноценных обучаемых роботов даже малому бизнесу с очень небольшими усилиями.
Очеловечивание
Время чат-ботов, отвечающих текстовыми сообщениями, уходит в прошлое. Текстовый интерфейс будет комбинироваться с голосом и видео в зависимости от потребностей клиента. Будущее за виртуальными собеседниками со своим характером и манерами. Они смогут использовать жаргон собеседника, идиомы и афоризмы, составлять фразы со включением «лишних» слов и звуков, включая междометия или вздохи. В общем, использовать весь арсенал коммуникационных приемов.
Безопасность взаимодействия роботов и людей
Роботы будут учиться новым навыкам, получать доступ к большему количеству информации, а также брать на себя больше ответственности. Все это потребует от его создателей внимательного отношения к управлению рисками и контролю, аналогичному работе с другим персоналом.
Алгоритмы обучения роботов, создание лиц и синтез голоса станут ценными объектами интеллектуальной собственности — их будут патентовать, использовать по лицензии, они станут объектами крупных судебных исков.
Расширение интеграции речевых технологий
Разработчики решений для умного дома начнут стандартизировать голосовое управление и включать его во все бытовые приборы и электронику, включая устройства интернета вещей, к которому в 2020 году подключены около 8 млрд устройств, а к 2030 году их количество может утроиться.
Как получить максимум от речевых технологий в бизнесе
- Пользуйтесь экспертизой существующих платформ. Инструменты кастомизации готовых решений позволяют получить преимущества индивидуализации без необходимости разрабатывать все с нуля.
- Используйте облачные решения. Они доступны везде как сотрудникам, так и клиентам. Оплачиваются только потребленные ресурсы, часто предоставляется бесплатное тестирование.
- Уделите внимание адаптации решения под свой бизнес. Профессиональная кастомизация обеспечит конкурентное преимущество через повышения качества сервиса и лояльности клиентов при небольших затратах.
- Не забывайте о поддержке. Речевые технологии не из сервисов «настроил и забыл» — система будет развиваться вместе с бизнесом.
Фото на обложке: panuwat phimpha/shutterstock.com
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
-
Пройти курс «Старт работы на Ozon»
- 1 Анатомия бота: как работают и из чего состоят современные голосовые технологии
- 2 Как речевые технологии помогают бизнесу сократить затраты и повысить качество обслуживания клиентов
- 3 «Наши разговоры — это новая big data»: как речевые технологии помогают бизнесу лучше узнать клиентов