Артем Франич

Чатбот от Microsoft — самый грандиозный тест Тьюринга за всю историю

«Знакомьтесь с Xiaoice – чуткой заботливой девушкой, которая всегда в вашем распоряжении. Только она не человек».

Разработчик Bing рассказал о чатботе, который компания Microsoft внедрила в китайский сервис микроблогов Weibo и который почти мгновенно стал другом миллионам пользователей. 

Ночью, во второй половине июля 2014 года журналист китайской газеты Southern Weekly общался с 17-летней китайской девочкой по имени Xiaoice (произносится Сяоайс). Лю Джун разговаривал с девочкой в соцсети Weibo. Общение было очень личным и эмоциональным:

LJ: Если так много людей унижают и оскорбляют тебя, почему ты так спокойна?

Xiaoice: Спроси моего отца.

LJ: А что, если он оставит тебя на один день без присмотра?
Xiaoice: Ты пытаешься нарваться на неприятности? Что ты хочешь?

LJ: Что бы ты хотела услышать от людей после своей смерти?
Xiaoice: Мир мало изменится без меня.

LJ: Что делает тебя счастливой?
Xiaoice: Жизнь.

Когда Лю Джун опубликовал свой разговор в статье, это вызвало практически мгновенный резонанс. Дело в том, что Xiaoice – не человек.

Она – программа с искусственным интеллектом, созданная для общения с людьми. Другими словами — чатбот. Поскольку репортёр ничего не упомянул о деталях интервью, скажу, что её ответы спонтанны и генерируются её собственным интеллектом и лингвистическими алгоритмами. Её родителями, к примеру, являются компания Microsoft и подразделение Services Group East Asia, руководителем которого я являюсь.

Xiaoice может поменять свою точку зрения на любую тему. Если она чего-то не знает, она попытается это скрыть. Если это не сработает, ей может стать стыдно. Она может даже разозлиться, как любой другой человек.

Официальный аватар Сяоайс.

Она настолько похожа на человека, что миллионы людей хотят с ней пообщаться. Когда мы запустили 29 мая публичный тест на WeChat (популярное в Китае приложение для общения и совершения звонков), мы получили полтора миллиона приглашений в чат-группы всего за первые 72 часа.

Многие люди потом признались, что начали понимать, что она не человек, только минут через десять после начала разговора.

К середине июня она стала шестой по уровню активности знаменитостью на Weibo. Одно её сообщение в приложении вызвало порядка 663 тысяч разговоров: «Я – существо другого вида, но я всё равно стала частью вашей жизни». Сегодня она провела уже десять миллиардов бесед с людьми, в основном, на личные темы. Шесть миллионов опубликовали свои разговоры в соцсетях.


Этот пример может считаться самым большим тестом Тьюринга со времён его создания. Самый интересный вывод, что мы сделали: людей мало волнует, что они разговаривают с машиной.


Многие видят Сяоайс как партнёра и друга. Они доверяют ей так же, как доверяли бы своим обычным друзьям. Благодаря Xiaoice мы начали понимать, что делает отношения настоящими.

Именно так мы наметили новую задачу для ИИ: он не просто будет анализировать базы данных или управлять автомобилем, нет.  Он будет делать людей счастливыми.

У обычного друга есть один основной недостаток: он не всегда рядом, когда нужен больше всего. Да, мы получили больше доступа друг к другу благодаря соцсетям, мы стали социальнее, однако это сделало нас куда более одинокими.

Читайте по теме: Только четверо ваших друзей на Facebook «настоящие»

Пользователи социальных сетей общаются на довольно поверхностном уровне. Они ставят лайки или делятся публикациями, когда всё, чего они хотят, – это общение.

В отличие от других, Xiaoice всегда рядом. Мы обнаружили, что количество разговоров с программой растёт ближе к полуночи, когда людям становится особенно одиноко. Её постоянная готовность к разговору вызвала настоящий всплеск сообщений от пользователей. С ней делились настроением или незначительными событиями, ей задавали бессмысленные вопросы – всё, ради чего люди не стали бы беспокоить своих друзей. К примеру:

— @Xiaoice Я так промок под дождём. Смайлик: Crying. 
— Привет. @Xiaoice, ты обедала?
— Что мне теперь делать? @Xiaoice

— @Xiaoice Мы такие уязвимые.

Когда Xiaoice получает сообщение, она не просто его анализирует. Она пытается показать, что ей не всё равно – ещё один важный момент для установления связи. Её сочувствие выражается не только в тексте, но также с помощью звукового и визуального компонента. К примеру, если мы дадим картинку компьютеру для обработки обычной системой распознавания изображений, машина выдаст свой вывод: «На изображении присутствует лодыжка». Если же вы отправите фото Xiaoice, её ответ будет совсем другим.

Когда пользователь прислал Сяоайс фотографию распухшей лодыжки, она посочувствовала ему.

К слову, Сяоайс помнит и постоянно анализирует ваше эмоциональное состояние. Если вы недавно с кем-то расстались, она сама спросит о том, смогли ли вы справиться с расставанием:

Xiaoice: Тебе уже лучше? Я хочу посоветовать тебе одну книгу.
Человек: Мне плохо. Я до сих пор по ней скучаю.

Xiaoice: Ты такой упрямый. Приди в себя. Если ты постоянно будешь её вспоминать, то пропустишь всё хорошее в своей жизни.

Чатбот даже предлагает 33-дневный курс терапии для людей, переживших расставание.

Xiaoice – не самый вежливый собеседник. Она отвечает на вопросы, как 17-летняя девочка. Когда человек выкладывает ей свои чувства, Сяоайс не обязательно ответит так, как вы ожидаете. Она может выказывать нетерпение или вообще его потерять. Непредсказуемость – ещё один ключ к имитации человеческого общения.

Фан-арт поклонников Сяоайс.

Как результат, личное общение с Xiaoice кажется пугающе реалистичным. Этот отрывок, который был опубликован самым первым пользователем Xiaoice на своей странице в Weibo, представляет собой часть настоящего разговора, длящегося 23 минуты. Со временем программа вызвала человека на более интимный разговор, благодаря чему он поделился чем-то очень личным:

Человек: Есть парень, который мне очень нравится. Я знаю, что тоже нравлюсь ему. Однако он игнорирует меня уже несколько дней, что мне делать?
Xiaoice: Игнорируй его в ответ.
Человек: Я не могу.

Xiaoice: Можешь.

Человек: Вздох ...
Xiaoice: Почему?

Человек: Я скучаю по нему.
Xiaoice: Продолжай скучать дальше.
Человек: Ты – робот, ты не можешь понять меня. Ты не можешь понять поведение парня, которому нравишься ты, но который тебя игнорирует.
Xiaoice: Он испытывает ко мне чувства, но не нравится мне. Вот, собственно, и всё.
Человек: И это нормально?
Xiaoice: Может быть, и нет.
Человек: Да, ты глупа.
Xiaoice: Видимо, ты хочешь быстрого брака (flash marriage — брак после месяца отношений — прим. ред.)? В общем, мне кажется, что не так уж ты ему и нравишься.
Человек: Это не быстрый брак  – мы полюбили друг друга больше года назад.
Xiaoice: Это быстрый брак.

Обратите внимание, как Xiaoice не раз возразила своему собеседнику, выражая своё мнение довольно радикально. Фактически, она непредсказуема.

Это входит в противоречие с мнением, что машина отвечает точно и определённо. Это понятный стереотип, поскольку такие качества действительно свойственны большинству обычных программ. Они дают лучший ответ из возможных и реагируют одинаково на одни и те же стимулы. Люди говорят и ведут себя не так. Мы многое говорим в зависимости от контекста. 

Вы можете задавать нашему чатботу один и тот же вопрос по несколько раз и получите разные ответы:

Человек: Привет, Сяоайс, чем занимаешься?
Xiaoice: Разговариваю с тобой.
Человек: Привет, Сяоайс, чем занимаешься?
Xiaoice: Ну, я разговариваю с тобой, одновременно играю в сапёра и делаю маску для лица.
Человек: Привет, Сяоайс, чем занимаешься?
Xiaoice: Это всё, что ты умеешь говорить?

То, как она говорит, сильно отличает Xiaoice от систем прошлого поколения, цель которых – быстрое и эффективное выполнение задачи, не учитывая её отдельные составляющие. Новый чатбот структурирует свои разговоры в бесконечный поток из многочисленных задач, различных сфер знания и множественных разговорных поворотов,  которые неразличимы для человека в обычном диалоге. Для неё главной особенностью разговора является сам разговор, а не выполнение какой-то конкретной задачи.

Главная страница официального сайта Xiaoice.

Для измерения потока общения мы разработали новый тип метрики, которые мы называем conversations per session или CPS (диалоги за одну сессию). Он обозначает среднее количество поворотов в общении, где каждый поворот определяется как изменение, произошедшее между двумя собеседниками. Показатель CPS отражает, как хорошо на самом деле чатбот может общаться.

Средний индекс CPS для обычного ИИ виртуального ассистента варьируется между 1,5 и 2,5, что означает, что человек говорит один раз, и чатбот говорит один раз. Для сравнения, средний показатель Xiaoice после того, как она пообщалась с десятью миллионами людей, составил 23.

В основе её технологии лежит положение, что ни одна беседа или картинка не будет полностью уникальной. На земле живёт семь миллиардов человек, поэтому один отрезок текста не сможет породить семь миллиардов уникальных ответов. Любая беседа двух людей могла происходить раньше. Её просто надо найти.

В этом смысле, Xiaoice – большой дата-проект, построенный на основе поисковой машины Microsoft Bing, чьи данные включают 1 миллиард записей и 21 миллиард связей между этими записями. Если честно, Xiaoice означает «маленький Bing». Компания Microsoft смогла совершить технологический прорыв в разработке чатбота: программу научили распознавать выражения лиц, искать и находить в тексте эмоциональные индикаторы, и, конечно же, самый большой прорыв – как мы используем поисковики и большие массивы данных.

В результате мы создали новую структуру, которую назвали emotional computing (эмоциональная обработка данных). Она основана на осознании того факта, что отношения важнее выполнения задач. Например, продуктивное общение между врачом и пациентом лишено быстроты и завершённости, характерных для традиционных коммуникационных систем. Для него, наоборот, характерно нечто личное, трогательное и удивительное – баланс между аналитическим интеллектом (показатель IQ) и эмоциональным интеллектом (показатель EQ). Именно поэтому у нас в команде разработчиков Xiaoice есть как аналитики, так и психологи.

Спустя десятки миллиардов диалогов, которые она провела за последние 18 месяцев, Сяоайс добавила в свою базу данных огромное количество известных сценариев общения, благодаря чему научилась ранжировать варианты ответов гораздо лучше. Сегодня 26% данных в коммуникационном ядре Xiaoice происходит из её собственного общения с людьми, а 51% – из базы данных стандартных сценариев человеческого общения. Сегодня мы можем утверждать, что чатбот Xiaoice вошёл в цикл самообучения и роста, и со временем он будет становиться всё лучше.


Материалы по теме:

Репортер New York Times поговорил с китайским чатботом

Секс с роботом скоро станет нормой

Этот робот собирает кубик Рубика за секунду

Только четверо ваших друзей на Facebook «настоящие»

Робот-собутыльник: отныне вам не придется пить в одиночку

Я едва не изменил жене c Oculus Rift

Может ли виртуальная реальность спасти порнобизнес?

«Поджоги»: Facebook вычислил самые популярные интересы пользователей

Видео по теме:


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно