Top.Mail.Ru
Колонки
DIG(IT)AL

Бот, будь человеком: за какими трендами в развитии речевых технологий следить в 2021 году

Колонки
Никита Ткачев
Никита Ткачев

Менеджер по развитию ML-сервисов Yandex.Cloud

Ирина Печёрская

Голосовые роботы стали нормой даже для самых, казалось бы, консервативных сфер бизнеса. Они берут на себя типовые задачи, работая быстрее, дешевле и эффективнее людей. Они все больше похожи на человека. О главных трендах в развитии речевых технологий в 2021 году и о том, что дает бизнесу их кастомизация, рассказывает Никита Ткачев, менеджер по развитию ML-сервисов Yandex.Cloud.

Бот, будь человеком: за какими трендами в развитии речевых технологий следить в 2021 году


В проекте Dig(IT)al рассказываем о технологиях, которые помогут вам заработать. Переходите на цифровую сторону бизнеса.


Запрос на «индивидуальный пошив» — главный тренд

Сегодня робота обучают быть живым. Он должен не только хорошо понимать, что ему говорят и правильно интерпретировать сказанное, но и показывать простые человеческие реакции. Клиент звонит сразу после того, как сделал заказ в интернет-магазине? Используй этот контекст. Тебя перебивают? Замолчи и послушай, реши, можешь ли ты переформулировать свой ответ, чтобы быть более полезным. Клиент не понял? Попробуй переформулировать свой вопрос, а не повторяй одно и то же. Он недоволен? Разряди обстановку, адаптируй свою речь или мягко переключи на оператора-человека.

Над разработкой голосового робота также работают специалисты в области аналитики, психологии и контента. Часть задач решается техническими средствами. Речевые технологии, распознавание и синтез речи — основа успешной коммуникации робота и человека. Если на этом этапе мы потеряем важную информацию, то вся остальная работа с роботом становится фактически бессмысленной.

Улучшение кастомизации распознавания речи 

Роботы работают с текстом и доверяют результатам распознавания речи. Как мы можем определить, что хорошо решаем эту задачу? Существует определенная метрика распознавания речи (в данном случае WER) — это количество верно распознанных слов по отношению к оригиналу. Если робот, например, некорректно распознает название улицы для доставки товара, то какой-то адресант может остаться без подарка к Новому году. 

Для исключения ошибок модель распознавания сегодня обучают на примерах диалогов из реальной жизни, поэтому в приоритете используют настоящие звонки. К тому же бизнес меняется, меняются запросы, а, следовательно, модель необходимо дообучать. Причем  это должно происходить на основе реальных метрик, а не субъективного ощущения со стороны заказчика. Мы уже на пути к этому. 

RB.RU рекомендует лучших поставщиков цифровых решений для вашего бизнеса — по ссылке

Улучшение кастомизации синтеза речи 

Для бизнеса важно, чтобы клиент не чувствовал дискомфорта от разговора с роботом. Обычный синтез речи обеспечивает информативное общение, но по манере общения бот отличается от человека, и не все люди хотят разговаривать с роботом. В погоне за конверсией и пользовательским опытом синтез часто меняется на предзаписанные фразы в исполнении профессионального оператора. Эти фрагменты вставляются в нужном контексте и диалог собирается как конструктор. Такой подход не универсален — для добавления переменных, например: имени абонента, его адреса, названия и цены товара — придется монтировать фразу частями. Но разница в произношении разрушит магию человеческого общения. Записать же все возможные варианты невозможно.

Самый современный и универсальный метод — синтез речи с максимальным приближением к стилю диктора, включая генерацию переменных частей. Уже удалось достичь 98% сходства с человеком. Растет спрос на индивидуальный синтез для повышения узнаваемости бренда. Многие компании стремятся индивидуализировать роботов в колл-центрах. Например, «Альфа-Банк» создал голосового помощника на основе индивидуального полнотекстового синтеза.

Другие тренды

Увеличение доли использования голосовых интерфейсов

Люди привыкают общаться с приложениями голосом без нажатия кнопок на клавиатуре или экране. Распространение широких каналов связи и облачных платформ позволит применять полноценных обучаемых роботов даже малому бизнесу с очень небольшими усилиями.

Очеловечивание 

Время чат-ботов, отвечающих текстовыми сообщениями, уходит в прошлое. Текстовый интерфейс будет комбинироваться с голосом и видео в зависимости от потребностей клиента. Будущее за виртуальными собеседниками со своим характером и манерами. Они смогут использовать жаргон собеседника, идиомы и афоризмы, составлять фразы со включением «лишних» слов и звуков, включая междометия или вздохи. В общем, использовать весь арсенал коммуникационных приемов.

Безопасность взаимодействия роботов и людей

Роботы будут учиться новым навыкам, получать доступ к большему количеству информации, а также брать на себя больше ответственности. Все это потребует от его создателей внимательного отношения к управлению рисками и контролю, аналогичному работе с другим персоналом.

Алгоритмы обучения роботов, создание лиц и синтез голоса станут ценными объектами интеллектуальной собственности — их будут патентовать, использовать по лицензии, они станут объектами крупных судебных исков.

Расширение интеграции речевых технологий

Разработчики решений для умного дома начнут стандартизировать голосовое управление и включать его во все бытовые приборы и электронику, включая устройства интернета вещей, к которому в 2020 году подключены около 8 млрд устройств, а к 2030 году их количество может утроиться.

Как получить максимум от речевых технологий в бизнесе

  1. Пользуйтесь экспертизой существующих платформ. Инструменты кастомизации готовых решений позволяют получить преимущества индивидуализации без необходимости разрабатывать все с нуля.
  2. Используйте облачные решения. Они доступны везде как сотрудникам, так и клиентам. Оплачиваются только потребленные ресурсы, часто предоставляется бесплатное тестирование.
  3. Уделите внимание адаптации решения под свой бизнес. Профессиональная кастомизация обеспечит конкурентное преимущество через повышения качества сервиса и лояльности клиентов при небольших затратах.
  4. Не забывайте о поддержке. Речевые технологии не из сервисов «настроил и забыл» — система будет развиваться вместе с бизнесом.


Читайте все материалы про итоги года здесь

Фото на обложке: panuwat phimpha/shutterstock.com


Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Анатомия бота: как работают и из чего состоят современные голосовые технологии
  2. 2 Как речевые технологии помогают бизнесу сократить затраты и повысить качество обслуживания клиентов
  3. 3 «Наши разговоры — это новая big data»: как речевые технологии помогают бизнесу лучше узнать клиентов