Колонки

Понимающие алгоритмы: зачем бизнесу нужны боты с распознаванием эмоций

Колонки
Игорь Калинин
Игорь Калинин

Основатель компании Twin

Дарья Мызникова

Голосовые боты уже достигли той стадии эволюции, когда им недостаточно распознавать и воспроизводить речь. Они должны обладать не только базовым, но и эмоциональным интеллектом. Современные сервисы считывают настроение пользователя, чтобы предлагать ему более релевантные услуги, оценивать его психологическое состояние и оказывать поддержку. 

Основатель компании Twin Игорь Калинин рассказывает, какие эмоции уже можно распознать с высокой точностью и как бизнесу извлечь максимум из технологии даже на раннем этапе ее развития.

Понимающие алгоритмы: зачем бизнесу нужны боты с распознаванием эмоций

Инновации в области EQ у роботов

Эмоциональный интеллект долгое время оставался недостающим элементом систем на базе машинного обучения. Алгоритмы уже неплохо справляются с синтезом речи и текста, все лучше распознают контекст и поддерживают диалог, но проявлять эмпатию им по-прежнему сложно.

При этом исследования показывают, что люди предпочтут общаться с ботом, который способен проявлять эмпатию и сочувствие. Наделить алгоритмы высоким уровнем EQ пытаются многие разработчики — для этого даже выделили отдельное направление аффективных вычислений (affective computing). 

В развитии эмпатии у роботов заинтересованы не только исследователи. Рынок систем для аналитики и распознавания эмоций оценивается уже в $21,6 млрд, а к 2024 году вырастет больше, чем в два раза. А эксперты Gartner полагают, что к 2022 году у 10% всех устройств будет функция «эмоциональной диагностики». 

Технологию уже исследуют технологические гиганты. Например, Facebook планирует оснастить распознаванием эмоций устройство для видеозвонков Portal. Недавно Amazon представил фитнес-браслет Halo, который в фоновом режиме анализирует голос пользователя и определяет его эмоциональное состояние. 

Аffective computing не ограничивается голосовыми технологиями — это еще и распознавание эмоций по мимике, жестам, позе, походке, биометрическим параметрам, текстовым сообщениям и даже по агрегированным данным из соцсетей или ситуативному контенту

Ученые из Университета Мэриленда создали алгоритм ProxEmo, который анализирует походку человека в реальном времени, после чего определяет его настроение. Уже есть сервисы, которые относительно успешно определяют настроение по подкожному кровотоку лица или по мимике.

Потенциально это огромный рынок, который охватывает десятки сфер, — от образования и здравоохранения до HR и гейминга. Многие компании, алгоритмы которых в распознавании речи уже достигли паритета с человеком, переключаются на развитие EQ. 

photoShutterstock/Lidiia

От полиграфа к умному боту

Проблемы индустрии заключается в сложности обработки данных. Эмоции слишком субъективны и зачастую их трудно классифицировать. Тренировка любого алгоритма — это долгий и кропотливый процесс разметки данных и создания релевантных дата-сетов, а в случае с эмоциями он усложняется еще больше. 

Как показала наша практика, даже люди не всегда с точностью определяют эмоции, чтобы верно разметить их в дата-сете. Мы пробовали работать со сторонними сервисами, но в итоге создали свою команду разметчиков, которые специализируются именно на определении эмоций. 

Разметчики прослушивают диалоги, выделяют отрывки с выраженным эмоциональным окрасом, маркируют их и заносят в дата-сет. 

Одна ошибка в распознавании может нарушить точность всего алгоритма, поэтому это сложная работа, с которой не справится человек без опыта.

Многие приемы определения настроения по внешним параметрам далеки от совершенства — крупное метаисследование показало, что определить эмоции только по выражению лица невозможно. Часто подобные обещания компаний граничат с псевдонаукой. Особенно когда это касается оценки преступных наклонностей человека по лицу, проверки благонадежности по голосу или определения психологической устойчивости по нескольким фразам. Кстати, широко распространенные детекторы лжи — это тоже пример технологии распознавания эмоций.

Пока наиболее обоснованный с научной точки зрения метод — это определение вида эмоций: позитивного, негативного и нейтрального. Мы работаем как раз в этом направлении и уже добились успехов — наши специалисты обучили нейросеть распознавать три базовые эмоции по голосу собеседника с точностью до 93-95% (разница в 5-7% зависит от качества связи).

Разработанный модуль корректно работает практически с любой речью (за исключением шепота). Это позволяет переключать клиента с одного бота на другого (или на оператора) в зависимости от его эмоционального состояния. 

Эмоции для бизнеса

По прогнозам Gartner, к 2024 году больше 50% рекламы в сети будет строиться на основе распознавания эмоций. Технология позволяет брендам более чутко реагировать на запросы клиента. Например, по выражению лица зрителя стриминговая платформа определит, нравится ли ему контент. Такой прием уже использует Disney

Во многом драйвером роста для технологии распознавания эмоций стали голосовые помощники, которые уже применяют многие компании в сфере финтеха, логистики, страхования и e-commerce. Виртуальные ассистенты становятся дополнительным каналом коммуникаций для бизнеса. С их помощью можно давать кастомизированные рекомендации, транслировать рекламу и повышать лояльность пользователя.

Только в США около 45% жителей используют голосовых помощников для покупок.

Например, Walmart сотрудничает с Google Assistant и с Siri: с их помощью можно добавлять товары в корзину голосовой командой, а оплачивать привязанной банковской картой. 

Технологию широко применяют и в банковской среде. В России с ней экспериментируют Сбербанк, «Альфа-Банк», ВТБ и Росбанк. Пока распознавание эмоций чаще всего используют для сбора фидбека и аналитики, но в будущем алгоритмы помогут банкам принимать решения о выдаче кредитов.

Например, в Китае технологию уже применяют для определения благонадежности заемщиков. Финтех-конгломерат Ping An утверждает, что благодаря ей сократил потери при выдаче кредитов на 60%.

Распознавание эмоций чаще всего применяют для обработки запросов или оповещения клиентов. Например, заказчик звонит в транспортную компанию и узнает о задержке груза. Он рассержен, наша система определяет негативные эмоции по его голосу. Бот, который пока не умеет проявлять эмпатию, вероятно, еще больше выведет человека из себя. В этой ситуации важно переключить клиента на оператора, который сможет найти решение проблеме. Использовать шаблонные диалоги и сценарии тут опасно — есть риск потерять клиента. 

Этот прием можно использовать и при создании чат-ботов. В этом случае маркерами эмоций могут быть эмодзи. Например, рассерженный или расстроенный смайлик усилит месседж, а улыбчивый эмодзи, наоборот, создаст дружелюбную атмосферу. На пиктограммах может строиться весь диалог с клиентом, причем механизм работает в обе стороны: модель позволяет и распознавать эмодзи, и применять их в нужном контексте.

photoShutterstock/Lidiia

Как извлечь максимум из технологии распознавания эмоций

  • Определите, какие задачи бизнеса поможет решить алгоритм с развитым EQ — сокращение расходов, улучшение качества обслуживания, расширение охвата сервиса. Проведите пилотные испытания, чтобы проверить гипотезу. Технология может обогатить уже существующие продукты — например, сделать голосовых ботов более эмоциональными и эмпатичными. 
  • Собирайте и систематизируйте данные — это поможет извлечь ценные инсайты и более четко сформулировать задачу для разработчиков и вендоров. Бизнес, который не инвестирует в аналитику, вряд ли извлечет пользу из технологии. Например, компания выясняет, что 20% клиентов отказываются от услуг компании, если менеджер вызвал у них негатив. Этот инсайт помогает понять, где и как применять распознавание эмоций, чтобы сократить отток клиентов.  
  • Занимайтесь собственными разработками, но не отказывайтесь от готовых решений. Гибридные сервисы помогут быстрее запускать и усовершенствовать продукты.
  • Анализируйте рынок и изучайте исследования в сфере распознавания эмоции. Какие продукты спекулируют на хайпе, а какие приносят пользу и действительно работают? Как о разработках отзываются специалисты по компьютерным наукам? Не внедряйте эмоциональный ИИ только потому, что так делают все.
  • Обращайте внимание на этические вопросы и приватность. Пользователи все более настороженно относятся к новым технологиям (особенно в России), поэтому важно не злоупотреблять их доверием.


Фото на обложке: Shutterstock/turlakova

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Эмоциональный ИИ: кто и зачем распознаёт эмоции в России и за рубежом
  2. 2 Ставить крест на голосовых роботах еще рано – и вот почему
  3. 3 Как мы разрабатывали ИИ для чтения эмоций

Актуальные материалы —
в Telegram-канале @Rusbase