Колонки

«Алиса», «Олег», «Маруся» и «Григорий». Какой бот круче?

Колонки
Иван Крапивин
Иван Крапивин

PR-директор Kokoc Group

Софья Федосеева

Чат-боты – перспективная технология, которая может быть полезна не только рядовым пользователям, но и бизнесу. В перспективе они могут помочь клиентам не только найти сайт компании в интернете, но и совершить покупку. А что же они умеют сейчас?

Иван Крапивин, PR-директор Kokoc Group, решил устроить тест для отечественных чат-ботов. Участие должны были принимать четверо: «Алиса», «Олег», «Маруся» и «Григорий», но все пошло не по плану. Вот как это было.

«Алиса», «Олег», «Маруся» и «Григорий». Какой бот круче?

Всем привет! Я интроверт

В поколении Y нас таких немало, а в Z – пожалуй, большинство. Пользуясь даже цифровыми продуктами, мне психологически некомфортно взаимодействовать с человеком. Особенно живым. Я не люблю никого напрягать и ставить в ступор, мне не нравятся долгие объяснения и телефонные звонки.

Я люблю бездушных ботов и алгоритмы. При должном техническом исполнении чат-бот по-дружески меня понимает и выполняет свои задачи. 

И бизнес любит чат-ботов за ускорение процессов, минимизацию доли человеческой ошибки и огромную экономию на оплате труда. А робот, оснащенный искусственным интеллектом и возможностью обучения, вполне может стать для пользователя инструментом коммуникации с компанией, а для бизнеса – основным источником продаж. В этом направлении развиваются девочки «Алекса» от Amazon и «Алиса» от «Яндекса», а также бигендерный Google Assistant. 

Подписывайтесь на канал Rusbase в «Яндекс.Дзен», чтобы ничего не пропустить

В России на этом огромном поле лишь несколько заметных игроков. Известная уже нам «Алиса», «Маруся» от Mail.ru, виртуальный сорванец «Олег» из «Тинькофф Банка» да «Григорий» из «Беру.ру».

«Этих четверых ребят мы и оценим по ряду критериев, соответствующих пользовательскими и бизнес-ожиданиям», – было написано у меня в шаблоне публикации. Но голосовой помощник «Григорий» занимается обзвоном клиентов маркетплейса, охватывая пилотный сегмент пользователей, в число которых мой аккаунт, к сожалению, не попал, а «Олега» мне выманить так и не удалось. Закралось даже подозрение, что «Олег» никакой не бот, а реальный Олег Юрьевич, который в нужный мне момент просто был чем-то занят.



Трое сотрудников банка помогали мне выманить «Олега» на различные ключевые слова, но он в тот день так и не показался. Так что шовинисты могут опротестовать, но в нашем тесте уже к первому туру остались только дамы: «Алиса» и «Маруся».

Я открыл бутылочку Пино Гриджио, чтобы имитировать сложный кейс для понимания желаний пользователя. Нам хочется от бота человечности или, научно выражаясь, интеллекта, близкого к человеческому. Поэтому и относиться будем, как к близкому человеку. Докучать, слать голосовые сообщения, картинки в 22 сантиметра (и это не дикпик), давать бесполезные поручения. А оценивать будем виртуозное техническое исполнение и выполнение бизнес-задач.

Шкала оценки предельно проста: если бот соответствует критерию, он получает 1 балл, если нет, то 0. В промежуточных и спорных вариантах – 0,5 балла.


Вежливость (лучшее оружие бота)

Чтобы разозлить женщину, нужно спросить у нее про другую женщину. «Маруся» знает о существовании «Алисы» и положительно о ней отзывается. «Алиса» же не понимает, о чем речь, но что-то точно слышала про «Алексу» и уже занимает позицию со сковородочкой по акции в руках.


«Алиса»: 0,5 балла.

«Маруся»: 1 балл.


Распознавание голоса

Оба ассистента имеют как голосовой, так и текстовый интерфейс обращения. Это огромный плюс – у человека не всегда есть возможность только написать или только обратиться голосом. Кроме того, не стоит забывать о пользователях с ограниченными возможностями.

Голосовой ассистент активируется либо по кнопке в приложении, либо по имени.

Человеческую речь, чуть приукрашенную алкоголем, и «Алиса», и «Маруся» воспринимают примерно на одном уровне. Что примечательно, чем длиннее фраза, тем меньше погрешность – очевидно, система распознает не каждое слово в отдельности, а фразу целиком, что семантически точнее. 


Например, здесь я трижды сказал «Алисе» уставшим голосом «домой», но пока не расширил формулировку, так и не получил нужного ответа – система упорно слышала «давай».

«Алиса»: 0,5 балла.

«Маруся»: 0,5 балла.


Распознавание картинок

«Маруся» все еще не умеет принимать картинки, даже интерфейс отправки фото отсутствует, значит, и распознавать ей тоже нечего.

«Алиса» распознала 22 см пиццы, присланные ей, и предложила найти и заказать такую же. И все бы хорошо, но я посылал гавайскую с ананасами (а это на любителя), «Алиса» же увидела в ней признаки карбонары. 



«Алиса»: 0,5 балла.

«Маруся»: 0 баллов.

Распознавание синонимов

Русский язык богат на синонимы. Один и тот же предмет в разных регионах могут называть по-разному. Проверим, знают ли об этом девочки.

Если вам знакомо слово «мультифора», значит, часть вашей жизни проходит или прошла правее уральских гор. Это канцелярский «файлик» для документов у сибиряков.



«Алиса» не распознает в мультифоре товар, но правильно распознает семантику.


«Маруся» добавляет букву «Л» и предлагает нечто из флористики.

«Алиса»: 0,5 балла.

«Маруся»: 0 баллов.


Распознавание текста с ошибками

Пользователь в измененном сознании может не заметить, как в запрос вкрадется ошибка, опечатка, неправильная раскладка. Ко всему этому должны быть готовы чат-боты.


И «Алиса», и «Маруся» с заданием справились.

А вот на этапе подтягивания результатов в чат «Маруся» выигрывает. Она распознала ключевое слово «Спартак», уточнила вид спорта, и дала информацию о ближайшем матче. «Алиса» просто переадресовала запрос в поиск.

«Алиса»: 0,5 балла.

«Маруся»: 1 балл.


Интеграция с другими сервисами

Само по себе существование чат-бота или голосового помощника для бизнеса ничего не дает. Две основные функции – информационная поддержка пользователей и интеграция с другими продуктами компании.

И у «Яндекса», и у Mail.ru есть великое количество подшефных сервисов. Остановимся на двух популярных: доставка еды и доставка тел (такси). Попробуем заказать такси и пиццу у «Алисы» и «Маруси».

«Алиса» обладает «навыками», которые позволяют активировать различные функции. «Маруся» этому пока не обучена, хотя нет ничего проще, чем вызвать приложение на устройстве пользователя.

«Алиса»: 1 балл.

«Маруся»: 0 баллов.


Подытожим



Критерий «Алиса» «Маруся»
Вежливость 0,5 1
Распознавание голоса 0,5 0,5
Распознавание картинок 0,5 0
Распознавание синонимов 0,5 0
Распознавание текста с ошибками 0,5 1
Интеграция с другими продуктами 1 0
Итого 3,5 2,5

Преимущество в пользу «Яндекса» и «Алисы» очевидно. Но открывать шампанское на Льва Толстого, 16 определенно рано. 

  • Во-первых, у разработчиков «Алисы» было несколько лет форы. 
  • Во-вторых, продукт значительно проигрывает той же «Алексе», интегрированной в умные дома американцев. 

Пока мы видим, что технически российские разработки достаточно сильны, но в плане интеграции с бизнес-возможностями сильно проигрывают.



Фото на обложке: Unsplash

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Четыре чат-бота сделали клиентов довольными на 94%. Кейс сети автосервисов
  2. 2 Рандонавты: кто это такие и почему маршруты их прогулок определяет чат-бот
  3. 3 Кейс: как с помощью чат-бота создать датасет из более 10 тысяч изображений за пять недель
  4. 4 Сколько километров до Марса и как поймать сову? Будьте готовы к странным обращениям после запуска чат-бота
  5. 5 Наши клиенты не хотят общаться с чат-ботом. Что делать?

Актуальные материалы —
в Telegram-канале @Rusbase

ПРОГРАММЫ И КУРСЫ

21 октября — 9 декабря 2019

Управление проектами

21 — 22 октября 2019

NIFI: Кластер Apache NiFi

22 октября 2019 — 22 января 2020

iOS разработчик с нуля до junior