Колонки

Как сделать эффективного многоязычного чат-бота

Колонки
Наталия Кетурко
Наталия Кетурко

Руководитель отдела компьютерной лингвистики и разговорного AI Just AI

Ирина Печёрская

Недавно команда Just AI, разработчика технологий разговорного искусственного интеллекта, провела V конференцию по разговорному ИИ Conversations. Состав спикеров украсили четверо звездных зарубежных экспертов. Бриэль Николофф, соосновательница и директор по продукту Botmock, рассказала о ключевых моментах при разработке многоязычного бота. 

Специально для Rusbase Наталия Кетурко, руководитель отдела компьютерной лингвистики и разговорного AI Just AI,  собрала инсайты с ее выступления и дополнила собственной экспертизой.

Как сделать эффективного многоязычного чат-бота

Зачем нужен многоязычный чат-бот

Многоязычные боты поддерживают запросы на трех и более языках. Этим они отличаются от одноязычных и двуязычных ботов, понимающих один и два языка соответственно. 

Функционал многоязычных ботов, как и любых других, зависит от целей автоматизации: ответы на запросы пользователей в режиме 24/7, предоставление справочной информации, прием и оформление заказов, помощь в выборе продуктов и др. Нюансы начинаются при адаптации этого функционала под разные языковые аудитории. 

Многоязычные боты актуальны для крупных компаний, работающих в нескольких странах, или глобальных социальных проектов.

Так, в ответ на пандемию коронавируса эксперты ЮНИСЕФ/РОЕЦА и ВОЗ/Европа запустили интерактивного чат-бота HealthBuddy Europe. 

Он помогает получить достоверную информацию, связанную с COVID-19: какие варианты заболевания существуют, как проявляются симптомы, есть ли вакцины и др. В настоящее время бот доступен на 19 языках, включая английский, испанский, итальянский, казахский, португальский и русский.

Также многоязычные боты востребованы, если в регионе присутствия компании пользователи говорят на разных языках. Например, по данным KPMG и Google, в Индии 72,9% пользователей общаются на хинди, 27,1% — на английском. 

Существуют также другие языки и многочисленные диалекты. Принимая во внимание этот факт, диагностический медицинский центр Dr. Lal PathLabs со штаб-квартирой в Дели решил внедрить в службу поддержки клиентов многоязычного бота.

 

Как сделать многоязычный чат-бот

Для реализации многоязычного бота используются разные языки NLU (Natural language understanding, понимание естественного языка). Поддерживаемые языки и принципы, по которым бот переключается с одного языка на другой, различаются и зависят от возможностей платформ (Botmock, Xenioo, BotMyWork и др.).

Например, Dialogflow поддерживает более 50 языков, а язык общения бот выбирает в зависимости от локали девайса или канала, в котором происходит диалог.

Благодаря встроенному мультиязычному NLU-ядру CAILA на базе JAICP от Just AI можно создавать ботов на 16 языках, а также подключать к проекту внешние NLU-сервисы для поддержки других языков.

Язык общения может задаваться настройками канала, также платформа позволяет реализовать динамический выбор языка в процессе разговора. 

В случае с двуязычным ботом это работает так: допустим, клиент общается с русскоязычным ботом, а потом пишет запрос на английском. Бот переключает контекст на англоязычного бота — теперь клиент продолжает общение с этим ботом. Позже пользователь снова может написать запрос на русском, и контекст беседы будет возвращен на русскоязычного бота. 

Описанная схема не подойдет, если к русскому и английскому добавить французский: слишком частое переключение контекста без возврата может привести к переполнению стека ботов. В схему требуется добавить еще один компонент — роутер.

Бот-роутер представляет собой промежуточное звено между одноязычными ботами, он определяет язык входящих запросов и перенаправляет их на нужного бота.

 

На что обратить внимание при разработке 

 

  • На семантические различия слов

Семантика как лингвистическая наука изучает смысловое значение единиц языка, например, слов и выражений. При создании многоязычных ботов нельзя механически переводить, так как значения слов в разных языках могут отличаться. 

Например, в русском языке есть слова голубой и синий, и мы понимаем разницу между ними, но в английском оба цвета называются blue. Выражения Good evening и Good night технически представляют собой одно и то же, но первое звучит как приветствие, а второе — как прощание. Это и есть семантические различия.  

 

  • На глубину перевода 

Переводчик интерпретирует смысл текста на одном языке и создает эквивалентный текст на другом. Его главная задача — без искажений передать смысл оригинала. 

Существует вид перевода, требующий более высокой квалификации специалиста и творческого подхода, — транскреация. Ее используют в рекламных или маркетинговых целях, для передачи названий фильмов. 

Специалист, который занимается транскреацией, должен ориентироваться на новую целевую аудиторию и сделать текст максимально понятным для нее. Транскреация учит думать о ситуации в целом и переводить с учетом различий в психологии пользователей и языковых особенностей, поэтому такой подход полезно использовать при разработке многоязычных ботов. 

 

  • На культурные различия между странами 

Когда между пользователями многоязычного чат-бота существуют весомые культурные различия, личность бота на каждом рынке нужно создавать заново. Например, есть игра с голосовым ботом в образе добродушного почтальона.

Француз будет в восторге, если виртуальный персонаж спросит о том, как прошел день рождения дочери. Англичанина такое общение насторожит. Он подумает: «Откуда этот странный почтальон знает, что у моей дочери вчера был день рождения?». 

В одной стране принят small talk перед тем, как перейти к делу, в другом регионе не любят терять времени зря. В Китае считается неприличным открыто говорить «нет». Культурные особенности влияют на характер бота, словарь и структуру вопросов и ответов, цель и структуру пользовательского опыта. Все это нужно отразить в сценарии бота. 

 

  • На состав команды 

Чтобы не прогадать с переводом и психологией пользователей, стоит включить в состав команды носителя языка. Особенно это актуально для таких сложных языков, как китайский, и закрытых культур, например, Японии.

 

  • На процесс тестирования 

Тестирование имеет смысл проводить с участием носителей языка и тех, для кого используемый язык второй или третий. Теоретически может быть такая ситуация: во время заграничной поездки русскоязычный клиент захочет воспользоваться ботом и выберет английский, если опции с его родным языком не будет. 

Фото на обложке: TippaPatt/shutterstock.com

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 7 технологий, которые помогут банку стать экосистемой
  2. 2 Машины завоевывают рабочие места в сфере услуг. К чему готовиться людям?
  3. 3 Владивостокские школьники победили в международных соревнованиях по робототехнике
  4. 4 4 иллюзии о цифровых помощниках, которые мешают бизнесу
  5. 5 5 распространенных ошибок чат-ботов и как их исправить
FutureFood
Кто производит «альтернативную» еду
Карта