Rusbase
Умные экраны с камерами, биометрия, контекстуальность и интерактивные драмы — как виртуальные ассистенты станут реальными
24 января 2019



Рынок виртуальных ассистентов стремительно растёт — голосовые помощники быстро и верно становятся частью нашей повседневной жизни. Сказать Siri поставить будильник, узнать у Google Assistant прогноз погоды, поговорить с Алисой в машине «Яндекс.Драйва» или попросить «Яндекс.Станцию» включить песню Green Day в первый день октября уже не представляется чем-то сверхъестественным (хотя по-прежнему вызывает восторг).

На западе возможностей для общения с виртуальными ассистентами ещё больше — устройства от Amazon с помощником Alexa давно уже позволяют людям взаимодействовать с «умным» домом — например, включать телевизор или контролировать отопление. Умные колонки с невидимыми помощниками могут помочь вам и на работе — поставить встречу в календарь прямо во время конференции и напомнить завершить все дела к определенному времени.

Rusbase изучил рынок виртуальных ассистентов и поговорил с экспертами в этой области, чтобы понять, куда движется технология и что может помешать её развитию.
Фото The Daily Dot
«Горизонт массового внедрения виртуальных ассистентов для России — ещё два года»
Разговорный искусственный интеллект используется как в персональных виртуальных ассистентах вроде Siri, Google Assistant и Алисы, так и в специализированных чат-ботах и IVR-системах (Interactive Voice Response — интерактивное голосовое меню) для обслуживания клиентов компаниями. По данным ResearchAndMarkets, мировой рынок умных виртуальных ассистентов оценивался в $1,7 млрд в 2017 году и вырастет до $9 млрд к 2023 году. Другое исследование от MarketsandMarkets оценивает один только рынок умных колонок в $2,7 млрд в 2018 году и прогнозирует его рост до $11,8 млрд к 2023.

По оценкам Gartner, к 2020 году 85% коммуникаций с клиентами будет осуществляться без участия человека. Согласно данным Accenture, к 2024 году большинство интерфейсов не будут иметь экрана и будут интегрированы в ежедневные задачи, а к 2027 году цифровые помощники будут поддерживать продуктивность сотрудников 24/7/365, работая в фоновом режиме на рабочем месте. Несмотря на некоторые различия в цифрах от разных аналитических агентств, можно сделать общий однозначный вывод: уже достаточно большой рынок виртуальных голосовых помощников ожидает быстрый рост в ближайшие годы.

По словам Кирилла Петрова, основателя и управляющего директора Just AI, к 2022 году в мире будет более 500 млн умных колонок, а к 2025 их количество превысит миллиард.
«В странах Европы, в России, в США проникновение ассистентов в домохозяйства перешагнет порог в 80%. Это значит, что голос станет наиболее привычным и естественным способом обращения к различным сервисам: мы будем беседовать со своим ассистентом, искать в интернете голосом, бронировать столик в ресторане с помощью умной колонки.
Я бы сказал, что горизонт массового внедрения виртуальных ассистентов — это еще 1 год для США (где уже сейчас умные колонки используются почти в 50% домохозяйств), еще 2 года для России (уже сейчас ежемесячная аудитория Алисы — 35 млн человек), 2—4 года для Европы и Китая».
Кирилл Петров
Основатель и управляющий директор Just AI
«Яндекс.Станция» (фото: Hype.ru)

«В первую очередь необходимо, чтобы они приносили пользу»
Виртуальные ассистенты уже распространены на рынке — по данным отчёта Strategy Analytics, доля смартфонов с голосовыми помощниками превысит 50% в 2019 году и вырастет до 90% к 2023. Стремительно увеличивается количество умных колонок — в США, например, процент домохозяйств с Wi-Fi, которые владеют смарт-спикерами, вырос с 12% в ноябре 2017 года до 20% в феврале 2018 года. Быстрому распространению умных колонок в США способствовало расширение выбора и снижение цен — например, Google выпустил свою Home Mini в октябре и продавал её всего за $29 в праздничный период. В этом ценовом диапазоне можно также найти устройства Amazon Echo.
В России распространение виртуальных ассистентов тоже перешагнуло раннюю стадию: достаточно вспомнить, что ежемесячная аудитория Алисы составляет 35 млн уникальных пользователей, а в поисковом приложении «Яндекса» голосом выполняются уже 20% всех запросов.

Кирилл Петров выделяет несколько факторов, которые будут способствовать ещё более массовому распространению виртуальных помощников:
Появление новых умных устройств, в том числе колонок от разных производителей и по все более доступным ценам.
«Умные колонки создают удобный пользовательский опыт по взаимодействию с разговорными интерфейсами. Мы ожидаем, что в следующем году сразу несколько производителей выйдут на рынок — среди них Xiaomi, Samsung и другие — а цена на некоторые смарт-спикеры опустится ниже 5000 рублей», — рассказывает Кирилл.
Появление большого количества развлекательных и образовательных навыков и игр.
Пока на рынке не хватает интересного и уникального контента, который крайне привлекателен для аудитории — к нему относятся, например, интерактивные драмы (микс квестов и аудиокниг). Однако уже сейчас виртуальные ассистенты предлагают своим пользователям развлекательный контент — так, с Алисой можно сыграть в «Виселицу», «Верю — не верю», «Слова», «Города» и другие классические игры. Виртуальные помощник также может загадать вам загадку, предложить пройти квест, зачитать стихи под нейромузыку и поделиться мудростью.
Интеграция ассистентов со все большим числом B2C-сервисов из «реального мира».
К таким сервисам относится заказ столиков в ресторанах и кафе, доставка еды, запись на прием к врачу, покупка билетов на мероприятия и другие услуги.

«Для массового распространения виртуальных ассистентов требуется, в первую очередь, бесшовное встраивание в пользовательский опыт — то есть возможность простого и быстрого контакта с ассистентом в нужный момент времени и получение ответа в подходящем формате, — соглашается с Кириллом Петровым Антон Кучма, руководитель практики новых технологий Accenture Russia, — Чем больше элементов цифровой экосистемы вокруг конкретного пользователя будет доступно виртуальному помощнику, тем более полным и удобным будет взаимодействие. Сюда попадает и возможность взаимодействия с другими приложениями, кроссплатформенность, доступ к большим данным с устройств».
Доступность и полезность ассистентов.
Алексей Айларов, CEO компании Voximplant, тоже считает полезность ключевым фактором, который будет способствовать массовому распространению ассистентов. «В первую очередь необходимо, чтобы они приносили пользу, то есть чтобы юзеры ассистентов понимали, зачем им этот дополнительный способ взаимодействия с сервисами. Ассистент — это, по сути, один из видов интерфейса к сервисам, доступным через интернет. Функций у разных ассистентов уже более чем достаточно, но какие-то из них массово востребованы, а какие-то не очень. Это напрямую связано с удобством такого типа интерфейса для определенного вида сервисов», — рассказывает эксперт.
Фактор виральности.
Вы с большей вероятностью захотите пользоваться виртуальными помощниками, когда у ваших друзей появятся устройства с таким функционалом.
Сергей Шлыков, CEO chatme.ai, выделяет среди факторов, способствующих распространению ассистентов, само усовершенствование технологии.
«Для рынка виртуальных ассистентов долгое время было характерно недостаточное развитие технологий при высоких ожиданиях со стороны общественности. Массовому распространению, в первую очередь, будет способствовать совершенствование технологий (качество распознавания, проработка удобных диалоговых сценариев с учетом возможности задать уточняющие вопросы и предугадывать дальнейшие действия пользователей) и, как следствие, повышение доверия к решениям».



Сергей Шлыков
CEO chatme.ai
«Адаптация под владельцев
сделает из виртуальных помощников
персональных, личных ассистентов»
Тестирование виртуальных ассистентов
В декабре 2018 года Джин Мюнстер, управляющий партнёр Loop Ventures и аналитик с многолетним опытом работы, поделился последними результатами тестирования виртуальных ассистентов в умных колонках на предмет понимания человеческой речи и способности корректно отвечать на вопросы. Тестируемым ассистентам — Alexa, Siri, Google Assistant и Microsoft Cortana — задали по 800 вопросов. Каждый ответ помощника оценивался по двум критериям: смог ли он 1) понять вопрос и 2) правильно на него ответить.

Google Assistant оказался самым понятливым — ассистент распознал 100% вопросов и дал корректные ответы для 87,9% из них. Второе место досталось Siri, которая правильно ответила на 74,6% вопросов. Третье и четвёртое место в рейтинге заняли Alexa и Cortana с 72,5% и 63,4% соответственно. Ещё в прошлом году результаты тестирования были значительно ниже — Google Assistant смог ответить на 81% вопросов, Siri — на 52%, Alexa — 64% и Cortana — на 56%.

Эксперимент наглядно демонстрирует, как развивается технология — одним из ключевых направлений сейчас является повышение качества синтеза и распознавания речи и удержание ассистентами контекста разговора. Ассистенты уже достигли значительных успехов в общении на английском языке, однако на российском рынке им есть, куда стремиться: Google Assistant, который летом 2018 года наконец заговорил по-русски, пока сильно отстаёт от своей английской версии.
Повышение качества распознавания речи — далеко не единственное направление развития для умных помощников. Кирилл Петров, основатель и управляющий директор Just AI, считает, что стоит ожидать ещё несколько важных технологических изменений на рынке виртуальных ассистентов:

1
Интеграция ассистентов с технологиями биометрии и появление NLU-алгоритмов и сценариев, поддерживающих одновременное ведение диалога с несколькими собеседниками.
Ассистенты смогут распознавать собеседников, удерживать контекст и переключать контекст между ними. Например, если в семье есть взрослые и несколько детей, умные колонки и ассистенты научатся общаться с каждым из них индивидуально.

Разработки в этом направлении уже ведутся: еще в октябре 2017 года Google анонсировал новую «фичу» платформы Google Home — устройства теперь могут распознавать голоса разных людей и взаимодействовать с ними соответственно. Автоматическое распознавание владельца голоса разработал и Amazon для своей Alexa. Пользователям умных колонок больше не придётся слушать плейлист своего партнёра вместо собственного — ассистент сможет автоматически подстроиться под говорящего.
2
Трансформация умных колонок в умные экраны с камерами.
Такое направление развития не только открывает большой потенциал для разговорных интерфейсов в области электронной коммерции, но и делает очень удобной видеосвязь. Примером подобного устройства является Portal от Facebook.
3
Более человечное, эмоциональное общение людей с ассистентами.
Более человечное общение станет возможным за счёт развития технологий для такой коммуникации — от более точного распознавания тональности человеческой речи по интонации и по смыслу до более разнообразных и эмоционально окрашенных ответов ассистента.
4
Адаптация под владельцев, что сделает из виртуальных помощников персональных, личных ассистентов.
Это приведет к появлению и распространению технологий наподобие Google Duplex, когда ассистент может понимать предпочтения и типовые сценарии действий своих пользователей и представлять их в реальном мире, общаясь голосом в том числе с другими людьми, выполнять те или иные задания (например, в случае Google Duplex, звонить в сервисные службы и общаться в интересах своих владельцев).
Google Duplex представили на конференции Google I/O в мае 2018 года — робот позвонил в парикмахерскую и попросил записать своего владельца на стрижку. Особенно аудитории запомнились паузы и междометия вроде «ага» и «угу», которые Google Duplex вставлял в речь, чтобы сделать её более похожей на человеческую. Можно сказать, что по крайней мере в этой локальной задаче робот успешно прошёл Тест Тьюринга.
Portal от Facebook (фото: ExtremeTech)
Алексей Ушаков, руководитель продуктового управления автоматизации дистанционного обслуживания группы компаний ЦРТ, также считает, что новые тренды развития виртуальных ассистентов будут сопряжены с возможностью параллельного слушания, анализа настроения, окружения и предсказания желаний пользователя.

«Это будет предъявлять значительные требования к диалоговой платформе, — объясняет эксперт, — В результате многие навыки, которые сегодня достаточно просто разрабатывают сторонние компании, станут бесполезными, уровень сложности функционала не будет доступен стартапам, а стоимость входа в разработку и содержание ассистентов будет довольно высокой. Тем не менее, есть высокий шанс, что появятся новые открытые проекты, которые помогут расти интересным начинаниям».
«Крупные компании-разработчики будут продолжать развивать виртуальных ассистентов, реализовывая сложный бизнес-функционал через экосистему навыков, разрабатываемых сторонними компаниями. В связи с этим активно развивается, например, направление аутентификации и авторизации человека по голосу — для того, чтобы предоставлять персонифицированные данные и производить более сложные операции, такие как переводы денежных средств при обращении в банк. Все это делается не только для того, чтобы обслуживать клиентов, но для социализации общения, втягивания в экосистемы данных, товаров и услуг» .
Алексей Ушаков, руководитель управления, ЦРТ
Напомним, что в мае завершилось тестирование платформы «Яндекс.Диалоги», которая позволяет любому разработчику создать чатбота или обычный чат с оператором и подключить его к Алисе или Поиску. Платформа расширяет возможности и умения виртуального помощника — компании могут создавать диалоги для консультации своих клиентов, перевода денег, заказа еды и других задач.

Историю с созданием дополнительных навыков запустил ещё Amazon для Alexa — разработчики используют SDKs, APIs и сэмплы кодов компании, чтобы делать игры, детские и музыкальные «приложения» (навыки), оригинальный контент и другие скиллы, которые адаптируются под различные устройства с ассистентом. По данным на сентябрь 2018 года, количество навыков для голосового помощника уже превысило 50 тысяч.
«Рынок ассистентов и умных колонок развивается слишком быстро, и новые смежные рынки за ним не успевают»
Несмотря на стремительное развитие технологии, существует несколько факторов, которые пока мешают распространению умных помощников.
Человеческий фактор
Сложности восприятия виртуальных ассистентов как привычной и удобной технологии
Нехватка интересного контента
Отсутствие оригинального контента, который адаптирован для умных колонок и ассистентов
Точность распознавания речи и синтез голоса
Технологии пока трудно назвать идеальными
«Skill discovery»
Отсутствие всеобъемлющего решения, чтобы сделать релевантные навыки доступными и легко находимыми для каждого из пользователей
Низкое качество навыков для ассистентов
Отсутствие «лучших практик» в области дизайна разговорного UX и опыта в этом направлении
Безопасность данных
Опасения относительно безопасности и защиты личных данных

Информационная безопасность и защита данных — одни из самых обсуждаемых тем (и проблем) на рынке виртуальных ассистентов. По мере развития голосовых помощников и появления у них новых функций, усиливаются и соответствующие риски.
«Оформление и заказ покупок через Интернет, управление компонентами умного дома, компьютерами и мобильными устройствами, работа с личными данными пользователей, — все это становится или может стать объектом для атак злоумышленников, элементами схем мошенничества, или, как минимум, может быть выведено из строя, принося значительные неудобства большому числу людей. Кроме того, подобные решения начинают активно применяться в системах управления автотранспортом, что порождает риски уже непосредственно для жизни людей и инфраструктуры».


Алексей Мальнев
Руководитель центра мониторинга и реагирования Jet CSIRT компании «Инфосистемы Джет»
«Для фундаментального повышения уровня защищенности необходимо подключение разработчиков»
Alexa, кукольный домик и два кило печенья
В начале 2017 года жительнице Далласа, штат Техас, доставили большой кукольный домик и два килограмма печенья. Оказалось, что заказ сделала её шестилетняя дочь — точнее, она просто попросила подарки у Alexa, которая восприняла это как команду «купить». После этого женщина установила на колонку защиту от детей (при подтверждении заказа человек должен ввести код) — однако на этом история не закончилась.

Ситуацию с кукольным домиком осветили в выпуске новостей на канале CW6 в Сан-Диего, штат Калифорния. В конце сюжета ведущий произнес фразу «Мне нравится эта маленькая девочка, которая сказала: «Алекса, закажи для меня кукольный домик». После этого на телеканал начали поступать жалобы — оказалось, колонки Amazon Echo у многих владельцев, которые в тот момент смотрели телевизор, восприняли фразу ведущего как команду.
Amazon Echo и убийство в штате Нью-Гэмпшир
Куда менее забавная история — в ноябре 2018 года суд штата Нью-Гэмпшир заключил, что власти могут использовать записи виртуального ассистента Amazon Echo для расследования обстоятельств смерти двух женщин. По словам прокурора дела, устройство могло записать подробности нападения и убийства. Несмотря на то, что колонка должна активироваться только после использования человеком специального слова, известны многочисленные ситуации, когда устройства начинали разговаривать — и смеяться — без активации пользователя.
DolphinAttack
Ещё один показательный пример — в 2017 году учёные из Чжэцзянского университета представили технику DolphinAttack, позволяющую контролировать виртуальных ассистентов с помощью частот, которые не распознаёт человеческое ухо (это объясняет, откуда взялось название работы). Специалисты «протестировали» атаку на ассистентах Alexa, Cortana, Google Now, Huawei HiVoice, Samsung S Voice и Siri на разных устройствах — среди них смартфоны, компьютеры, автомобили и «умные» дома. Тестирование заключалось в запуске Facetime на iPhone, проигрывании музыки на Amazon Echo и управлении системой навигации в автомобилях Audi с помощью этой техники. На частоте от 25 до 39 кГц и на расстоянии 1,75 метра технология позволяла управлять устройствами без ведома их хозяина.
Дмитрий Березин, эксперт направления информационной безопасности КРОК, рассказывает, что современные голосовые ассистенты уже включают в себя базовые меры безопасности — так, колонки Google Home, Amazon Echo и «Яндекс.Станция» можно «лишить слуха», отключив микрофон с помощью кнопки на устройстве. Голосовые ассистенты «спят», пока не услышат ключевое слово (например, «Привет, Siri»).

Несмотря на это, продолжает эксперт, у виртуальных ассистентов случаются сбои. Это подтверждает история с кукольным домиком и Burger King. Компания вынудила колонки Google Home рекламировать свой продукт, выпустив 15—секундный ролик, в котором молодой человек говорит, что перечислить все свежие ингредиенты воппер-бургера за такое короткое время невозможно, а затем произносит фразу: «Окей, Google, что такое воппер-бургер?».
Алексей Мальнев, руководитель центра мониторинга и реагирования Jet CSIRT компании «Инфосистемы Джет» говорит, что для фундаментального повышения уровня защищенности необходимо подключение разработчиков. При применении голосовых помощников в корпоративных информационных системах эксперт рекомендует обращаться к специализированным командам профессионалов за помощью в анализе и выборе наиболее защищенных систем, для безопасной настройки устройств и их последующей инфраструктурной защиты.
«Большая задача – научить когнитивные системы персонализировать своих владельцев по голосовым сигнатурам, отсечь потенциально опасные частоты голосового управления, научить их понимать общий контекст запросов и запрашивать повторное подтверждение команд, которые могут потенциально нанести вред».
Алексей Мальнев
Руководитель центра мониторинга и реагирования Jet CSIRT компании «Инфосистемы Джет»
Эксперты советуют пользователям придерживаться нескольких простых рекомендаций, пока голосовые ассистенты не научатся проводить биометрическую идентификацию по голосу человека и понимать настоящие желания пользователей:
Выключать микрофон голосовых помощников для защиты конфиденциальной информации;
Сделать кодовое слово для активации голосовых ассистентов персональным, чтобы минимизировать риск их самопроизвольного включения
(случайно хозяином устройства или злоумышленниками);
Запретить или защитить паролем потенциально опасные и нежелательные действия голосовых ассистентов — например, онлайн-покупки;
Не подключать к голосовому помощнику критические системы (охранную сигнализацию, системы видеонаблюдения);
Использовать устройства крупных производителей, которые защищают данные пользователей на конечных устройствах и в облаке;
Защищать мобильные устройства специализированными приложениями по защите информации и внешними сервисами: EDR (Endpoint Detection and Response), антивирус, Sandbox («песочница»), антиспам, антифишинг и так далее.

«Крупные корпорации — лидеры интернет-технологий или производители железа — будут доминировать на этом рынке»
ИТ-гиганты мирового рынка уже представили своих ассистентов — среди них Google, Apple, Amazon и Microsoft. Активно развивается китайский рынок — свои решения выпустили Xiaomi, Alibaba, Tencent, Baidu и JD.com. В России основной ассистент — Алиса, однако в ноябре 2018 года стало известно, что своего игрока представит также Mail.ru — компания разрабатывает голосового помощника «Марусю» и умную колонку. Ассистентов предлагают и отраслевые компании: «Тинькофф» недавно анонсировал помощника «Олега», который поможет клиентам банка с финансовыми операциями (и не только — например, позволит заказать столик в ресторане), а «Мегафон» ещё с 2014 года развивает «Елену», используя технологию синтеза и распознавания речи SpeechKit от «Яндекса». В связи с этим возникает вопрос — как будет выглядеть рынок виртуальных ассистентов в будущем и сможет ли один ассистент его монополизировать?
«Рынок вряд ли монополизирует один игрок. В США и Европе будут конкурировать Amazon и Google, в Китае уже борются между собой Xiaomi, Alibaba, Tencent, Baidu и JD.com. В России «Яндекс» тоже недолго будет один. Скоро на всех рынках своих ассистентов представят Samsung и Huawei, большей активности стоит ждать и от Apple. Однако основных, «верхнеуровневых» ассистентов, способных общаться на множество общих тем, много не будет. Крупные корпорации — лидеры интернет-технологий либо производители железа — будут доминировать на этом рынке».


Кирилл Петров
Основатель и управляющий директор Just AI
«С другой стороны многие компании создадут (и уже создают) своих, более нишевых и узкоспециализированных ассистентов, сначала как отдельные решения для своих клиентов или как скиллы/навыки для существующих виртуальных помощников. Среди таких компаний могут быть банки, сети отелей, туристические операторы, телеком-компании, медиабизнес и ритейл, лидеры на рынке игрушек. В дальнейшем они могут расширять функциональность, становясь все более универсальными».

Кирилл Петров
Just AI
Конечный потребитель, по мнению эксперта, вероятнее всего будет взаимодействовать с несколькими подобными ассистентами. Хотя основными все-таки будут те, кто сегодня предлагает наибольший выбор сервисов, и те, кто получит широкий охват аудитории за счет устройств, в которые они встроены — и это те же компании, с которыми мы контактируем ежедневно. Для России это «Яндекс», Google, Apple, подводит итог эксперт.
Алексей Ушаков, руководитель продуктового управления автоматизации дистанционного обслуживания группы компаний ЦРТ, считает, что крупные ИТ-компании, такие как Microsoft, Amazon, «Яндекс» будут продолжать развивать разработку продуктов, но сумеет ли кто-то из них стать агрегатором – пока не ясно. «Виртуальные ассистенты крупных компаний будут соперничать между собой, в то время как специализированные боты для обслуживания клиентов смогут сосуществовать, ведь они не являются конкурентами и работают в разных отраслях, — объясняет Ушаков, — Сейчас многие телеком-компании и банки идут по пути создания собственных IT-продуктов».
«Виртуальный ассистент (особенно голосовой) — решение, которому можно добавить индивидуальности, и «Мегафон» и «Тинькофф» воспользовались этой возможностью, сделав из них имиджевые проекты. При этом заказ такого решения у компании-разработчика будет дешевле при сохранении возможности кастомизации. Поэтому компании без собственных центров разработки несомненно будут пользоваться услугами внешних поставщиков».
Алексей Ушаков
Руководитель продуктового управления автоматизации дистанционного обслуживания группы компаний ЦРТ
Сегодня каждый ассистент стремится создать вокруг себя экосистему клиентов, данных, товаров и услуг, поскольку без этого он будет бесполезен, а содержать и развивать ассистента накладно, продолжает Ушаков. Некоторые компании — экосистемы, а значит их ассистенты дружественны и будут помогать друг другу. Другие, конкурирующие, будут сотрудничать только из-за законодательных инициатив или бизнес-выгоды.

«Забавной выглядит ситуация, когда вы общаетесь с несколькими ассистентами и просите объяснить, чья услуга лучше, — добавляет эксперт, — Разные ассистенты будут иметь свой характер, умные устройства смогут перейти на другого ассистента (по аналогии со сменой оператора). Часть пользователей, которые покупают брендированные устройства, попробуют мультивендорные. Пока на рынке есть много свободного места, и далеко не факт, что первые вошедшие с частным решением останутся ведущими и не поменяют его на более унифицированное».
В августе 2018 года Amazon и Microsoft «подружили» своих ассистентов Alexa и Cortana. Теперь владельцы Amazon Echo могут позвать Cortana непосредственно через свой девайс, чтобы воспользоваться возможностями Windows и Office (колонка сможет отправить письмо в Outlook или добавить вам встречу в календарь). По аналогии пользователи Windows 10 получат доступ к колонке с Alexa и огромному количеством навыков, которыми ассистент обладает, и смогут управлять через неё своим «умным» домом. Под российский рынок решения, к сожалению, всё ещё не адаптированы.
Кто сможет составить конкуренцию Алисе в России?
Летом 2018 года Google Assistant, наиболее понятливый из всех виртуальных ассистентов, наконец заговорил на русском языке. В декабре украинский блогер Ярослав Шевчук опубликовал небольшой видеоролик с демонстрацией возможностей «Ассистента» на русском в Google Home, из чего можно сделать вывод, что Google также приступил к «русификации» устройства для умного дома.

После выхода русскоязычного виртуального ассистента от ИТ-гиганта пользователи опубликовали многочисленные обзоры на новинку, из которых становится понятно, что «Ассистент» пока ещё далёк от своей более продвинутой англоязычной версии — ему намного сложнее понимать пользователей, общаться и шутить, а также выполнять поручения менее очевидные, чем «поставь будильник» и «скажи, какая завтра будет погода». В большинстве случаев «Ассистент» выдаёт своим владельцам ссылки на статьи — это означает, что русскоязычная версия только начинает обучаться корректному общению на новом языке. Cмогут ли крупные корпорации вроде Google и Amazon достигнуть уровня Алисы в понимании и распознавании русского языка?

Кирилл Петров говорит, что и Google, и Apple имеют очень мощные технологии распознавания и синтеза русской речи, а также собственные NLU-технологии и, конечно, контент. «Обе компании вполне могут составить конкуренцию Алисе и, я думаю, составят ее. Сложнее это будет сделать Amazon — у них на российском рынке нет сильных позиций, и, я полагаю, если Amazon и будет сюда выходить, то нескоро. А значит, ему уже сложно будет занять значимую долю», — рассказывает эксперт.

Конкурентами, считает Кирилл, скорее станут китайские компании-производители и, например, Mail.ru Group. Однако для Яндекса залогом успеха и сохранения лидерства будет наличие собственного эксклюзивного контента и сервисов. «Как действует Google? Он зачастую просто не дает доступа к YouTube через виртуальных ассистентов других компаний, — объясняет эксперт, — Если «Яндекс.Такси», «Яндекс.Еда», «Яндекс.Музыка» и прочие сервисы «Яндекса» будут для российских пользователей основными, то попытки других компаний стать лидерами здесь успехом не увенчаются. И поэтому наиболее явными конкурентами для «Яндекса» являются именно Google и Mail.ru Group».

Алексей Ушаков напоминает, что как для западных, так и для отечественных разработчиков для успеха на рынке качественного распознавания и синтеза речи недостаточно. «Успешность и популярность виртуальных ассистентов будет зависеть в том числе от целостности, удобства и распространенности экосистемы, их продуктов и сервисов. Если западные компании с именами, имиджем, развитыми дистрибьютерскими сетями примут решение активизироваться на русскоязычном рынке — разумеется, конкуренция обострится. Однако с учетом текущих реальностей скорей всего мы увидим попытки азиатских компаний выходить на наш рынок. Они уже готовятся», — говорит Ушаков.

Нужна ли ассистентам мультиязычность?
В сентябре 2018 года стало известно, что «Алиса» станет мультиязычной — и для начала ее обучат украинскому, белорусскому и казахскому языкам. Заговорить на иностранных языках «Алиса» может уже в 2019 году.

По словам Кирилла Петрова, управляющего директора Just AI, мультиязычность важна для ассистентов, которые хотят стать мировыми лидерами — например, она критична для Google или Amazon. Однако на конкретном рынке пользователю нужен только его основной язык – мало кто переключается в своем повседневном общении с русского на английский и наоборот. Вместе с тем наличие скиллов для перевода с одного языка на другой будет преимуществом и атрибутом виртуальных ассистентов (а значит, потребуется поддерживать синтез и распознавание наиболее популярных языков) так же, как и возможность поиска в англоязычном сегменте интернета достаточно важна для европейского и даже российского рынка. Но, скорее всего, присутствие иноязычных ассистентов будет чем—то напоминать текущее присутствие крупных интернет—поисковиков, считает эксперт.

«Google и Amazon будут доминировать в США, Европе, Юго-Восточной Азии, Южной Америке, Японии. В России, где языковой барьер заметен, лидирующие позиции займет Яндекс, с ним будет конкурировать Google и еще несколько игроков поменьше, — рассказывает Петров, — В Китае уже возник рынок, почти независимый от остальных стран. Лишь некоторые китайские игроки, наподобие Xiaomi, могут стать заметными в Индии и России. Возможно, в небольших странах с менее распространенными языками появятся свои локальные лидеры».

Алексей Ушаков считает, что мультиязычность на данном этапе не представляет высокой ценности, так как виртуальные ассистенты еще не распространены глобально, а их функционал довольно прост. «Технически сделать ассистента под любой язык возможно – логика взаимодействия ассистента с сервисами и информационными ресурсами от языка не зависит. Понимание или непонимание китайского языка зависит только от качества модуля распознавания китайского, к которому подключен ассистент», — объясняет эксперт.
«Вход новых стартапов на рынок будет способствовать развитию технологий»
«Чем больше игроков внедряют искусственный интеллект в свои решения, тем более интеллектуальными становятся виртуальные ассистенты — поэтому вход новых стартапов на рынок будет способствовать развитию технологий. Стартапы, чтобы их заметили, обычно создают более инновационные решения и применяют новые методологии для ускорения разработки.

Кроме того, основатели и сотрудники стартапов – это часто люди с опытом и знаниями, пришедшие из корпораций вроде Amazon, Google, Microsoft. Это позволяет стартапам быть конкурентоспособными на рынке, и Gartner предсказывает, что к 2019 году прорывные решения ИТ-стартапов обгонят крупных игроков в продвижении инноваций в AI».
Сергей Шлыков, CEO chatme.ai
Несмотря на то, что крупные ИТ-игроки скорее всего будут доминировать на рынке, место для стартапов в этом быстрорастущем сегменте по-прежнему есть. Среди продуктов, которые, по мнению экспертов, буду востребованы:
Решения под небольшие рынки для отдельных языковых групп или в нишевых сегментах
«Выход на глобальный рынок абсолютно нового игрока, который смог бы конкурировать с Google или Amazon, мне кажется маловероятным. Но могут появиться свои лидеры в конкретных странах — у гигантов индустрии часто недостаточно ресурсов, чтобы охватить небольшие рынки, особенно в отдельных языковых группах (к примеру, в странах СНГ — Армении, Грузии, Казахстане). Кроме того, есть место и для самостоятельных стартапов в нишевых сегментах — например, образовательные ассистенты для детей, которые могут встраиваться в игрушки».

Кирилл Петров
Основатель и управляющий директор Just AI
Один из ярких примеров таких «детских» виртуальных ассистентов — Mishka AI, который сейчас проходит программу акселерации от 500 startups и Сбербанка. Mishka, благодаря встроенному чипу и детской облачной платформе, имеет доступ к ежедневно обновляемому контенту, разработанному специально для дошкольников — детей 3—6 лет. Игрушка расскажет ребёнку сказки и истории, позовёт его обедать, научит чистить зубы и примет активное участие в его обучении — поможет выучить буквы, загадает загадки и предложит интересную игру в цифры. В январе 2018 года стартап стал участником пятого набора Starta Accelerator и получил $130 тысяч за 7% своего капитала.

Решения в узких областях с данными, к которым у ИТ—гигантов нет доступа (в частности, хорошие шансы есть у финтех—проектов и телеком—компаний)
Алексей Ушаков считает, что текущий этап развития индустрии напоминает развитие поисковых систем до появления Google. Основной проблемой, по словам эксперта, является монетизация помощника, поэтому местом рождения глобальных ассистентов становятся компании, в которых есть много пользователей, а значит постоянно актуализирующиеся большие данные, алгоритмы по работе с ними и экосистемы сервисов в различных направлениях.

Эксперт считает, что «независимые» ассистенты скорей всего будут концентрироваться в узких областях с данными, к которым не имеют доступ ИТ—гиганты, например внутри крупных компаний. Большой шанс на появление таких ассистентов имеют финтех-проекты и телеком-компании.
«Большинство стартапов с надеждой ждут своего ангела, пытаясь получить данные, чтобы на их основе удивить инвесторов. Как только доступ к данным теряется, стартап гаснет».
Алексей Ушаков, ЦРТ
Новые ассистенты на основе инновационных технологий (для последующей продажи крупному игроку)
«Место для стартапов (направленных на разработку "ядра" ассистентов) есть в силу низкого порога входа. Потом, однако, перед каждым стартапом с ценными наработками стоит выбор — быть поглощенным крупным игроком или развивать собственный сервис. Основной риск для стартапов при выборе второго варианта — ассистент без доступа к большим данным для обучения и возможности взаимодействия с экосистемой конечного потребителя не будет интересен пользователям».

Антон Кучма
Руководитель практики новых технологий Accenture Russia
«На стороне крупных компаний преимущество в виде экосистемы, но стартапы более быстрые и гибкие, чем корпорации — они могут предлагать инновационные решения, которые крупные компании по какой-то причине не успеют реализовать».

Алексей Айларов
CEO Voximplant
Навыки и инструменты для одного или нескольких лидеров рынка
«Начинающим игрокам следует сделать ставку на 1-3 популярных помощника и предложить свои наборы навыков и инструментов, которые можно будет интегрировать в ассистенты.

Путь посложнее заключается в том, чтобы разработать такую инновационную технологию, которую заходят приобрести ИТ-гиганты. Для создания подобных помощников и ассистентов требуется огромный массив пользовательских данных, которые сейчас есть у поисковиков, социальных сетей и разработчиков мобильных устройств. Часть данных есть у представителей e-commerce, телекома, финтеха. Однако их набор данных, хоть и огромный, достаточно однобокий. Игроки будут вынуждены либо переплачивать за недостающие данные, либо интегрироваться с компаниями первого типа».
Антон Орлов, CEO AiSales
«Некоторые российские стартапы идут на западные рынки и разрабатывают навыки для крупных компаний на иностранных языках. При этом разработка в некотором случае проще, чем на российском рынке, и на этом реально зарабатывать деньги. На нашем рынке можно получить разовое вознаграждение за интересный навык, который может быть потерян (потому что его дорого поддерживать, или же он включается в основной пул навыков ассистента).

По нашему опыту компаниям с запада сложнее адаптировать свои продукты — по большей частью они входят в различные конкурсы только с целью получить русскоязычные данные. Русскоязычного ассистента проще адаптировать под западные рынки, но большинство успешных компаний предпочитают сосредоточиться на местном рынке».
Алексей Ушаков, ЦРТ
Дешевые аналоги ассистентам от крупных ИТ-игроков
«Место для стартапов, безусловно, есть. Мы уже видим ряд команд, работающих в этом направлении. Кроме того, многие ИТ-гиганты отдают бесплатно свои «движки» искусственного интеллекта и машинного обучения, на основании которых стартапы могут разрабатывать собственных ассистентов. Когда технология достигнет зрелости, скорее всего появятся множество более дешевых аналогов ассистентов Яндекс, Amazon и Google. За эту нишу и стоит конкурировать стартапам».

Павел Лихницкий
Генеральный директор DIS Group
Технологии для выведения виртуальных ассистентов в оффлайн
«Потенциально интересная ниша для стартапов — разработка чипа, позволяющего виртуальным ассистентам работать без подключения к интернету.

Сейчас нейронные сети обрабатывают данные в облаке, в то время как смартфоны играют роль «передатчика» информации. По такому принципу работает, например, Siri — поэтому пользователи айфонов даже не могут поставить будильник, находясь в режиме оффлайн. Огромные затраты энергии, которые необходимы для функционирования нейросетей на GPU (graphics processing unit — графический процессор) не позволяют нейросетям работать на устройствам с ограниченной памятью.

Через 5 лет любой девайс, управляемый с помощью голоса, будет способен сделать огромное количество вещей без интернета. В этой сфере есть реальная возможность для создания глобального стартапа, в том числе и у hardware компаний. Пока никто ещё не сделал оптимального чипа, подходящего именно для нейросетей. Системы ИИ работают на существующих CPU и GPU, которые разрабатывались для других задач и для другой логики. И это — место для будущего прорыва».
Максим Нальский, CEO Pyrus

В феврале 2018 года стало известно, что инженеры из Массачусетского технологического института (MIT) разработали новый чип, сокращающий энергопотребление нейронной сети на 95% за счет снижения потребности передачи данных между памятью чипа и процессорами. Устройство может позволит нейросетям работать на мобильных устройствах с батареями.

Подводя итоги — ключевые события на рынке виртуальных ассистентов в 2018 году и прогнозы от экспертов рынка
Среди ключевых событий, которые произошли на рынке виртуальных ассистентов в 2018 году, эксперты выделяют:
Запуск платформы «Яндекс.Диалоги» в конце мая, которая позволяет создавать навыки в Алисе и чаты в Поиске;
Выход «Яндекс.Станции» — первой умной колонки на российской рынке — и старт её массовых продаж осенью;
Старт продаж портативных смарт—устройств с голосовым ассистентом Алиса – гаджетов Irbis A и DEXP Smartbox;
Выход «Яндекс.Телефона», имеющего встроенного голосового помощника Алису;
Запуск «Google Ассистента» на российском рынке в июле, в работе над которым российские разработчики смогли поучаствовать с помощью создания диалоговых приложений (экшенов);
Разработка голосового помощника «Маруся» от холдинга Mail.ru (анонсирована в ноябре);
Запуск разработок русских версий ассистентов четырьмя крупными российскими и зарубежными компаниями (инсайд от Кирилла Петрова, основателя и управляющего директора Just AI).
Irbis A и DEXP Smartbox (фото: Комсомольская правда)
Основные направления, на которые следует обратить внимание молодым игрокам:
Разработка новых разговорных интерфейсов в области электронной коммерции;
В связи с появлением новых умных устройств, в том числе колонок от разных производителей по все более доступным ценам, и трансформацией этих умных колонок в умные экраны с камерами
Интеграция ассистентов с технологиями биометрии и разработка NLU-алгоритмов и сценариев;
Развитие технологии необходимо для одновременного ведение диалога с несколькими собеседниками
Разработка решений для компаний без собственных центров (с сохранением возможности кастомизации);
Разработка самостоятельных стартапов в нишевых сегментах;
Например, стартапы могут развиваться в сегменте образовательных ассистентов для детей
Разработка ассистентов для конкретных языковых групп, на которые у крупных ИТ-компаний не хватает ресурсов;
Разработка ассистентов в узких областях с данными, к которым не имеют доступ ИТ-гиганты — например, внутри крупных компаний;
Разработка новых навыков для виртуальных ассистентов с упором на дизайн разговорного UX;
Производство интересного контента, адаптированного под умные колонки и ассистенты;
Создание решения для поиска релевантных для каждого из пользователей навыков;
Разработка решений, позволяющих виртуальным ассистентам работать без подключения к интернету.
©Rusbase, 2019
Автор: Татьяна Петрущенкова

Фото на обложке: Depositphotos
Татьяна Петрущенкова
Умные экраны с камерами, биометрия, контекстуальность, интерактивные драмы: виртуальные ассистенты станут реальными