Бот, будь человеком: за какими трендами в развитии речевых технологий следить в 2021 году
Время текстовых сообщений от чат-ботов уходит в прошлое
Голосовые роботы стали нормой даже для самых, казалось бы, консервативных сфер бизнеса. Они берут на себя типовые задачи, работая быстрее, дешевле и эффективнее людей. Они все больше похожи на человека. О главных трендах в развитии речевых технологий в 2021 году и о том, что дает бизнесу их кастомизация, рассказывает Никита Ткачев, менеджер по развитию ML-сервисов Yandex.Cloud.
В проекте Dig(IT)al рассказываем о технологиях, которые помогут вам заработать. Переходите на цифровую сторону бизнеса.
Запрос на «индивидуальный пошив» — главный тренд
Сегодня робота обучают быть живым. Он должен не только хорошо понимать, что ему говорят и правильно интерпретировать сказанное, но и показывать простые человеческие реакции. Клиент звонит сразу после того, как сделал заказ в интернет-магазине? Используй этот контекст. Тебя перебивают? Замолчи и послушай, реши, можешь ли ты переформулировать свой ответ, чтобы быть более полезным. Клиент не понял? Попробуй переформулировать свой вопрос, а не повторяй одно и то же. Он недоволен? Разряди обстановку, адаптируй свою речь или мягко переключи на оператора-человека.
Над разработкой голосового робота также работают специалисты в области аналитики, психологии и контента. Часть задач решается техническими средствами. Речевые технологии, распознавание и синтез речи — основа успешной коммуникации робота и человека. Если на этом этапе мы потеряем важную информацию, то вся остальная работа с роботом становится фактически бессмысленной.
Улучшение кастомизации распознавания речи
Роботы работают с текстом и доверяют результатам распознавания речи. Как мы можем определить, что хорошо решаем эту задачу? Существует определенная метрика распознавания речи (в данном случае WER) — это количество верно распознанных слов по отношению к оригиналу. Если робот, например, некорректно распознает название улицы для доставки товара, то какой-то адресант может остаться без подарка к Новому году.
Для исключения ошибок модель распознавания сегодня обучают на примерах диалогов из реальной жизни, поэтому в приоритете используют настоящие звонки. К тому же бизнес меняется, меняются запросы, а, следовательно, модель необходимо дообучать. Причем это должно происходить на основе реальных метрик, а не субъективного ощущения со стороны заказчика. Мы уже на пути к этому.
Улучшение кастомизации синтеза речи
Для бизнеса важно, чтобы клиент не чувствовал дискомфорта от разговора с роботом. Обычный синтез речи обеспечивает информативное общение, но по манере общения бот отличается от человека, и не все люди хотят разговаривать с роботом. В погоне за конверсией и пользовательским опытом синтез часто меняется на предзаписанные фразы в исполнении профессионального оператора. Эти фрагменты вставляются в нужном контексте и диалог собирается как конструктор. Такой подход не универсален — для добавления переменных, например: имени абонента, его адреса, названия и цены товара — придется монтировать фразу частями. Но разница в произношении разрушит магию человеческого общения. Записать же все возможные варианты невозможно.
Самый современный и универсальный метод — синтез речи с максимальным приближением к стилю диктора, включая генерацию переменных частей. Уже удалось достичь 98% сходства с человеком. Растет спрос на индивидуальный синтез для повышения узнаваемости бренда. Многие компании стремятся индивидуализировать роботов в колл-центрах. Например, «Альфа-Банк» создал голосового помощника на основе индивидуального полнотекстового синтеза.
Другие тренды
Увеличение доли использования голосовых интерфейсов
Люди привыкают общаться с приложениями голосом без нажатия кнопок на клавиатуре или экране. Распространение широких каналов связи и облачных платформ позволит применять полноценных обучаемых роботов даже малому бизнесу с очень небольшими усилиями.
Очеловечивание
Время чат-ботов, отвечающих текстовыми сообщениями, уходит в прошлое. Текстовый интерфейс будет комбинироваться с голосом и видео в зависимости от потребностей клиента. Будущее за виртуальными собеседниками со своим характером и манерами. Они смогут использовать жаргон собеседника, идиомы и афоризмы, составлять фразы со включением «лишних» слов и звуков, включая междометия или вздохи. В общем, использовать весь арсенал коммуникационных приемов.
Безопасность взаимодействия роботов и людей
Роботы будут учиться новым навыкам, получать доступ к большему количеству информации, а также брать на себя больше ответственности. Все это потребует от его создателей внимательного отношения к управлению рисками и контролю, аналогичному работе с другим персоналом.
Алгоритмы обучения роботов, создание лиц и синтез голоса станут ценными объектами интеллектуальной собственности — их будут патентовать, использовать по лицензии, они станут объектами крупных судебных исков.
Расширение интеграции речевых технологий
Разработчики решений для умного дома начнут стандартизировать голосовое управление и включать его во все бытовые приборы и электронику, включая устройства интернета вещей, к которому в 2020 году подключены около 8 млрд устройств, а к 2030 году их количество может утроиться.
Как получить максимум от речевых технологий в бизнесе
- Пользуйтесь экспертизой существующих платформ. Инструменты кастомизации готовых решений позволяют получить преимущества индивидуализации без необходимости разрабатывать все с нуля.
- Используйте облачные решения. Они доступны везде как сотрудникам, так и клиентам. Оплачиваются только потребленные ресурсы, часто предоставляется бесплатное тестирование.
- Уделите внимание адаптации решения под свой бизнес. Профессиональная кастомизация обеспечит конкурентное преимущество через повышения качества сервиса и лояльности клиентов при небольших затратах.
- Не забывайте о поддержке. Речевые технологии не из сервисов «настроил и забыл» — система будет развиваться вместе с бизнесом.
Фото на обложке: panuwat phimpha/shutterstock.com
-
Бизнес Анатомия бота: как работают и из чего состоят современные голосовые технологии 23 декабря 2020, 19:30
-
Искусственный интеллект Как речевые технологии помогают бизнесу сократить затраты и повысить качество обслуживания клиентов 25 ноября 2020, 16:55
-
Бизнес «Наши разговоры — это новая big data»: как речевые технологии помогут бизнесу лучше узнать клиентов 15 октября 2020, 18:17
-
Искусственный интеллект Нам не нужен свой OpenAI: где России искать эффект от ИИ и что для этого делать 19 мая 2026, 11:00
-
Бизнес «Команде не вырасти выше лидера»: как изменить неписаные правила взаимодействия в группе 19 мая 2026, 10:00
-
Тренды В Москве растёт спрос на бизнес-центры со спортивными объектами: в офисах появляются футбольные поля и падел-корты 21 мая 2026, 15:15
-
Бизнес OpenAI может подать документы на IPO уже 22 мая — компания рассчитывает выйти на биржу в сентябре 21 мая 2026, 13:45
-
Технологии Минпромторг может ввести требования по локализации дата-центров: аналитики предупреждают — появление ЦОД замедлится 21 мая 2026, 13:00
-
Искусственный интеллект Google представила новые умные очки — устройства получат аудиоуправление на базе ИИ Gemini 20 мая 2026, 16:15
-
Бизнес Т-Технологии опубликовали финансовый отчет за I квартал 2026 года — прибыль компании достигла 46,5 млрд ₽ 21 мая 2026, 18:15
-
Бизнес Wildberries запустит в приложении покупку ЦФА для массовых пользователей: минимальная сумма инвестиций — 10 тыс ₽ 21 мая 2026, 16:45
-
IT «Теперь все ищут не единорогов, а рабочих лошадок»: IT-рынок вошёл в зрелую стадию — инвестиции стали прагматичнее 21 мая 2026, 12:00
-
Бизнес VK опубликовала финансовые результаты за I квартал 2026 года — чистый долг компании сократился на 20 млрд ₽ 21 мая 2026, 11:20