Бот, будь человеком: за какими трендами в развитии речевых технологий следить в 2021 году
Время текстовых сообщений от чат-ботов уходит в прошлое
Голосовые роботы стали нормой даже для самых, казалось бы, консервативных сфер бизнеса. Они берут на себя типовые задачи, работая быстрее, дешевле и эффективнее людей. Они все больше похожи на человека. О главных трендах в развитии речевых технологий в 2021 году и о том, что дает бизнесу их кастомизация, рассказывает Никита Ткачев, менеджер по развитию ML-сервисов Yandex.Cloud.
В проекте Dig(IT)al рассказываем о технологиях, которые помогут вам заработать. Переходите на цифровую сторону бизнеса.
Запрос на «индивидуальный пошив» — главный тренд
Сегодня робота обучают быть живым. Он должен не только хорошо понимать, что ему говорят и правильно интерпретировать сказанное, но и показывать простые человеческие реакции. Клиент звонит сразу после того, как сделал заказ в интернет-магазине? Используй этот контекст. Тебя перебивают? Замолчи и послушай, реши, можешь ли ты переформулировать свой ответ, чтобы быть более полезным. Клиент не понял? Попробуй переформулировать свой вопрос, а не повторяй одно и то же. Он недоволен? Разряди обстановку, адаптируй свою речь или мягко переключи на оператора-человека.
Над разработкой голосового робота также работают специалисты в области аналитики, психологии и контента. Часть задач решается техническими средствами. Речевые технологии, распознавание и синтез речи — основа успешной коммуникации робота и человека. Если на этом этапе мы потеряем важную информацию, то вся остальная работа с роботом становится фактически бессмысленной.
Улучшение кастомизации распознавания речи
Роботы работают с текстом и доверяют результатам распознавания речи. Как мы можем определить, что хорошо решаем эту задачу? Существует определенная метрика распознавания речи (в данном случае WER) — это количество верно распознанных слов по отношению к оригиналу. Если робот, например, некорректно распознает название улицы для доставки товара, то какой-то адресант может остаться без подарка к Новому году.
Для исключения ошибок модель распознавания сегодня обучают на примерах диалогов из реальной жизни, поэтому в приоритете используют настоящие звонки. К тому же бизнес меняется, меняются запросы, а, следовательно, модель необходимо дообучать. Причем это должно происходить на основе реальных метрик, а не субъективного ощущения со стороны заказчика. Мы уже на пути к этому.
Улучшение кастомизации синтеза речи
Для бизнеса важно, чтобы клиент не чувствовал дискомфорта от разговора с роботом. Обычный синтез речи обеспечивает информативное общение, но по манере общения бот отличается от человека, и не все люди хотят разговаривать с роботом. В погоне за конверсией и пользовательским опытом синтез часто меняется на предзаписанные фразы в исполнении профессионального оператора. Эти фрагменты вставляются в нужном контексте и диалог собирается как конструктор. Такой подход не универсален — для добавления переменных, например: имени абонента, его адреса, названия и цены товара — придется монтировать фразу частями. Но разница в произношении разрушит магию человеческого общения. Записать же все возможные варианты невозможно.
Самый современный и универсальный метод — синтез речи с максимальным приближением к стилю диктора, включая генерацию переменных частей. Уже удалось достичь 98% сходства с человеком. Растет спрос на индивидуальный синтез для повышения узнаваемости бренда. Многие компании стремятся индивидуализировать роботов в колл-центрах. Например, «Альфа-Банк» создал голосового помощника на основе индивидуального полнотекстового синтеза.
Другие тренды
Увеличение доли использования голосовых интерфейсов
Люди привыкают общаться с приложениями голосом без нажатия кнопок на клавиатуре или экране. Распространение широких каналов связи и облачных платформ позволит применять полноценных обучаемых роботов даже малому бизнесу с очень небольшими усилиями.
Очеловечивание
Время чат-ботов, отвечающих текстовыми сообщениями, уходит в прошлое. Текстовый интерфейс будет комбинироваться с голосом и видео в зависимости от потребностей клиента. Будущее за виртуальными собеседниками со своим характером и манерами. Они смогут использовать жаргон собеседника, идиомы и афоризмы, составлять фразы со включением «лишних» слов и звуков, включая междометия или вздохи. В общем, использовать весь арсенал коммуникационных приемов.
Безопасность взаимодействия роботов и людей
Роботы будут учиться новым навыкам, получать доступ к большему количеству информации, а также брать на себя больше ответственности. Все это потребует от его создателей внимательного отношения к управлению рисками и контролю, аналогичному работе с другим персоналом.
Алгоритмы обучения роботов, создание лиц и синтез голоса станут ценными объектами интеллектуальной собственности — их будут патентовать, использовать по лицензии, они станут объектами крупных судебных исков.
Расширение интеграции речевых технологий
Разработчики решений для умного дома начнут стандартизировать голосовое управление и включать его во все бытовые приборы и электронику, включая устройства интернета вещей, к которому в 2020 году подключены около 8 млрд устройств, а к 2030 году их количество может утроиться.
Как получить максимум от речевых технологий в бизнесе
- Пользуйтесь экспертизой существующих платформ. Инструменты кастомизации готовых решений позволяют получить преимущества индивидуализации без необходимости разрабатывать все с нуля.
- Используйте облачные решения. Они доступны везде как сотрудникам, так и клиентам. Оплачиваются только потребленные ресурсы, часто предоставляется бесплатное тестирование.
- Уделите внимание адаптации решения под свой бизнес. Профессиональная кастомизация обеспечит конкурентное преимущество через повышения качества сервиса и лояльности клиентов при небольших затратах.
- Не забывайте о поддержке. Речевые технологии не из сервисов «настроил и забыл» — система будет развиваться вместе с бизнесом.
Фото на обложке: panuwat phimpha/shutterstock.com
-
Бизнес Анатомия бота: как работают и из чего состоят современные голосовые технологии 23 декабря 2020, 19:30
-
Искусственный интеллект Как речевые технологии помогают бизнесу сократить затраты и повысить качество обслуживания клиентов 25 ноября 2020, 16:55
-
Бизнес «Наши разговоры — это новая big data»: как речевые технологии помогут бизнесу лучше узнать клиентов 15 октября 2020, 18:17
-
Тренды Будущее под камерами: шесть сценариев, как видеонаблюдение перепишет реальность к 2036 году 19 января 2026, 10:57
-
Деньги Персональные данные и цифровой след: кто и как на них зарабатывает 27 марта 2026, 10:11
-
IT Эксперты рассказали, как «вкатиться» в ИТ в 2026 году: новичкам потребуется знание бизнес-процессов и работа с ИИ 11 мая 2026, 19:00
-
Тренды 30% россиян ездят в путешествия трижды в год — от отпуска готовы отказаться только ради покупки квартиры 12 мая 2026, 21:00
-
Бизнес В начале 2026 года выручка производителя Labubu выросла на 80% — но спрос на товары Pop Mart продолжает падать 12 мая 2026, 20:30
-
Искусственный интеллект Сооснователи OpenAI впервые раскрыли доли в стартапе: у Грега Брокмана — $30 млрд, у Ильи Суцкевера — $7 млрд 12 мая 2026, 20:00
-
Россия MAX заключил соглашение с операторами «большой четвёрки» — теперь уведомления будут приходить в мессенджер 12 мая 2026, 15:00
-
Банки ЦБ поддержал повышение лимита переводов для бизнеса по СБП до 30 млн ₽ — изменения вступят в силу в 2027 году 12 мая 2026, 18:40
-
Тренды Гендерный разрыв зарплат в России достиг максимума за 13 лет — мужчины зарабатывают на 34% больше женщин 07 мая 2026, 15:00
-
Банки Кредитный рейтинг «Делимобиля» повысился: среди причин — включение в «белый список» Минцифры и поддержка от ВТБ 07 мая 2026, 13:00