Виртуальные ассистенты, озвучивание текста, автоматическая генерация субтитров — уже часть нашей реальности. Речевые технологии позволяют отказаться от дополнительного персонала, ускоряют все рабочие процессы, а также помогают сделать услуги для самых разных клиентов максимально доступными.
Скорость жизни увеличивается — мы уже не хотим вводить текст и даже нажимать на кнопки, чтобы получить информацию или проанализировать действия сотрудника. Речевые технологии позволяют многим рынкам масштабировать свои сервисы и услуги.
В первую очередь речевые технологии представлены в бизнесе так:
Cинтез речи
- озвучивание любых текстов: например, новостей, элементов управления, обучающих материалов;
- создание звуковых роликов с анонсами, предупреждениями и прочим.
Распознавание речи, ASR (Automatic Speech Recognition)
- контроль качества и аналитика (анализ диалогов с клиентами, эмоциональной окраски и скриптов);
- голосовое управление;
- преобразование речи в текст.
Для таких процессов, как автоматизация телефонии, создание голосовых ассистентов, нужны как распознавание речи, так и ее синтез.
На рынке постоянно появляются новые проекты, связанные с подобными технологиями, потому что современный мир требует оптимизации всех процессов.
Например, платформа SmartSpeech, разработанная командой SberDevices, позволяет и генерировать, и распознавать речь. Она дает возможность создать интерактивное голосовое меню (IVR), подключить голосового ассистента, может использоваться в чатах и рекламных сервисах; служить для озвучивания контента и команд голосового ввода. Приведем несколько примеров из разных сфер.
Общественный транспорт
В рамках транспортной инфраструктуры применение речевых технологий упрощает работу всех служб. Голосовой интерфейс может давать пассажирам информацию о маршрутах и пересадках, делать объявления, помогать с покупкой билетов и решать любые проблемы, не требующие общения с сотрудниками. Кроме того, для слабовидящих озвучивание текста в транспорте — необходимость, а не дополнительная опция.
Фото в тексте: DenPhotos /
Автомобили
В ситуации, когда нет возможности прочитать текст или посмотреть карту, синтез речи — самое лучше решение. Здесь речевые технологии находят свое применение в системах навигации и взаимодействия с водителем по голосу, в бортовых компьютерах, озвучивании новостей с сайтов. Голосовые помощники служат для того, чтобы избежать аварийных ситуаций и повысить уровень безопасности дорожного движения.
Визуальный контент
Еще одна возможность применения SmartSpeech — преобразование речи в текстовый формат для распознавания видео- и аудиоконтента, а также для создания субтитров. В этой сфере важны: экономия времени, точность преобразованного текста, сокращение рутины и, главное, расходов на производство контента.
Высокое качество и скорость распознавания речи в рамках платформы SmartSpeech обеспечивается качественными данными, высокотехнологичными кластерами для обучения и талантливыми разработчиками.
EdTech
В сфере EdTech возможности речевых технологий на самом деле не имеют границ. Озвучивание текста из учебников и расшифровка лекций; автоматическая генерация субтитров для людей с проблемами слуха; ассистенты и самые разные средства обучения. Ведь сегодня многие люди предпочитают слушать тексты, а не читать их.
В рамках работы SmartSpeech технологии синтеза речи (TTS, Text to speech) позволяют генерировать «человечную» речь: это достигается с помощью уникальной акустической модели. Кроме того, при озвучании робот делает меньше фонетических ошибок благодаря собственной модели расстановки ударений и мощному комплексу нормализации текста (раскрытие сокращений, адресов, чисел).
E-Commerce
В сфере электронной торговли речевые технологии применяются для создания IVR (интерактивного голосового меню) и автоответчиков — это оптимизирует работу контакт-центров, служб поддержки, телемаркетинга, рекрутинга и HR. Робот способен озвучивать пункты меню, описания товаров, навигационные элементы. А каждый бренд может выбрать подходящее звучание и тембр голоса.
Банкинг
К голосовым помощникам в банках мы уже привыкли. Звонящий говорит, какая услуга ему необходима, и либо сразу попадает на нужного оператора, либо получает ответ от робота. Заранее записывать «живую» речь не нужно: достаточно указать текст, и голосовой помощник прочтет его вслух.
Кроме того, распознавание речи используется для расшифровки звонков клиентской поддержки: это позволяет определить смысл и эмоциональную окраску коммуникации для анализа качества обслуживания и улучшения клиентского опыта. Подобные технологии в сфере банкинга значительно сокращают расходы, повышают качество обслуживания, снижают нагрузку сотрудников.
SmartSpeech используется и в СберБанке. Например, можно узнать баланс банковской карты по номеру 900 в любое время суток без ожидания ответа оператора. Платформа является основой в семействе виртуальных ассистентов Салют, которые помогают пользователю с его запросами, умеют управлять финансами, заказывать еду, рекомендовать подходящий контент и многое другое.
Фото в тексте: AlliancePhotos /
Медицина
В медицине уже давно применяются голосовые администраторы для больниц и поликлиник; голосовые справки и touch-free интерфейсы.
Распознавание речи также дает возможность врачам не заполнять формы и документы вручную, а использовать технологии голосового ввода, что экономит их время. Из-за пандемии внедрение подобных разработок становится всё более актуальным.
IoT
IoT (Internet of Things), или интернет вещей давно вошёл в нашу жизнь. Физические объекты уже могут передавать друг другу информацию: с помощью голосовых интерфейсов можно управлять самыми разными устройствами и поисковыми системами.
В любое устройство или приложение можно добавить функцию голосового управления. Например, для распознавания поисковых запросов: пользователь говорит, что именно он ищет («смартфон с хорошей камерой до 30 тысяч рублей»), и видит подобранные варианты в приложении или на сайте компании.
Туризм
Пандемия приучила нас обходиться без взаимодействия с людьми. Работа с речью позволяет делать экскурсии с голосовыми ассистентами, прокладывать маршрут для прогулки и покупать билеты. Использование новых разработок повышает лояльность к бренду и позволяет оптимизировать расходы: это важный маркетинговый инструмент для бизнеса.
Hospitality
В сфере гостеприимства многие вопросы можно решать с помощью голосовых помощников и роботизированных колл-центров: обрабатывать запросы, анализировать уровень сервиса и подбирать услуги для гостей.
Внедрение платформы SmartSpeech не требует дополнительного оборудования, позволяет оптимизировать работу с аналитикой и сэкономить на операторах. Клиенты получают программный интерфейс (API) для подключения и использования речевых сервисов в продуктах. Такие технологии можно интегрировать в уже существующие продукты бизнеса — например, клиент для телефонной платформы.
Разработки SmartSpeech дают возможность снизить нагрузку на людей, создав голосовые интерфейсы взаимодействия. Это продукт экосистемы Сбера, который предлагает качественное распознавание речи и ее синтез.
Фото на обложке: WAYHOME Studio /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Как открыть кофейню»
- 1 Голосовые технологии, адаптация и рост: пять лет Fromtech на рынке
- 2 В «Алисе» «на железном уровне» блокируется навык «подслушивания»
- 3 SberDevices представила семейство моделей машинного обучения для распознавания речи и эмоций
- 4 Skyeng разработал разговорный ИИ-тест для определения уровня владения английским языком
ВОЗМОЖНОСТИ
28 января 2025
03 февраля 2025
28 февраля 2025