Петр Жегин

Microsoft на пути к интеллектуальному ПО

Историю о том, как Microsoft захватывает свою долю рынка «интеллектуального» ПО, рассказывают Петр Жегин, ассоциат венчурного фонда Flint Capital и Данила Корнев, основатель Zet Universe

Крупнейшие технологические компании являются заметными инвесторами и покупателями стартапов, работающих в сфере когнитивных технологийПодразумеваются технологии машинного обучения, компьютерного видения, обработки естественных языков, распознавания речи и др.. Внимание средств массовой информации приковано к гигантам интернет-эры, Google и Facebook, которые представляют человекоподобных роботов, дронов и одерживают победы над человеческим интеллектом за игровой доской.

В то же время Microsoft, по-видимому, придерживается иного подхода.  В конце 90-ых Билл Гейтс описал «цифровую нервную систему» корпорации, которая «обеспечивает глубоко интегрированный поток информации в нужные части организации в нужное время» и которая так же, как и нервная система человека, «предупреждает о самых важных вещах и блокирует неважные»Bill Gates. Business at the Speed of Thought: Succeeding in the Digital Economy, 1999.. По сути, цифровая система действует как «агент» пользователя, предвосхищая его желания и принимая некоторые решения за него.  

На недавней конференции Build Microsoft обозначил ключевые направления развития. Среди прочего можно отметить развитие «диалогового интерфейса» (conversational interface), призванного решить информационную перегрузку пользователя.

Компания усиливает степень интеграции цифрового ассистента Cortana с собственными и сторонними продуктами. Ассистент, с одной стороны, делает работу с традиционными приложениями удобнее, например, по запросу находит и пересылает документ. С другой, ассистент самостоятельно действует от лица пользователя, например, при бронировании отеля.

Вряд ли случайность – что после ухода с поста председателя Билл Гейтс заявил, что продолжит работать в компании в роли Technology Advisor над проектом Personal Agent, который, в том числе «…будет помогать [пользователям] определять, каким задачам стоит уделять больше внимания».

Движение компании в сторону интеграции искусственного интеллекта в свое и стороннее программное обеспечение сейчас кажется еще более очевидным. Однако внимание Microsoft к когнитивным технологиям впервые проявилось более двадцати лет назад. Долгосрочное видение также было сформулировано Биллом Гейтсом десятки лет назад.

Microsoft удалось продвинуться в разработке как минимум пяти важных когнитивных технологий и в различной мере интегрировать их в свои продукты, в том числе:

  • Машинное обучение стало ключевым элементом прототипов Priorities и Notification Platform, адаптивного интерфейса;
  • Технологии распознавания речи были интегрированы в Windows с версии XP, затем перенесены в облако и включены в Cognitive Services (ранее известные как проект Oxford);
  • Обработка естественного языка в текстовой форме является частью API Bing/Cognitive Services;
  • Разработки в сфере компьютерного видения привели к появлению Bing's Lenses, Office Lenses в Windows Phone and iOS, Kinect, HoloLens. Компьютерное видение также может стать частью цифрового ассистента, например, описывающего увиденные изображения – например, так работает Caption Bot;
  • Графы знаний, разрабатываемые в компании с середины 2000-ых, позволили описать окружающий мир и также нашли применение в Cortana.

Инвестиционная активность Microsoft дополняет внутреннюю разработку, и также укладывается в логику интеграции искусственного интеллекта в продукты компании и создания цифрового «агента». Компания завершила как минимум семнадцать транзакций, направленных на приобретение активов в сфере когнитивных технологий.

Данные Pitchbook

Вероятно, первая сделка, имевшая целью приобретение актива, который позволял сделать продукты компании «умнее», произошла в 1993 году, когда Microsoft приобрела Knowledge Industries. CEO компании, Эрик Хорвиц (Eric Horvitz), стал бессменным руководителем группы Adaptive Systems and Interactions (ASI), возглавившей исследования машинного обучения и искусственного интеллекта в Microsoft Research.

Приобретенные технологии нашли применение, среди прочего, и в помощнике от Microsoft (Clippy в Office), прототипах Notification Platform, а также в адаптивном интерфейсе продуктов MS Office, который подстраивал наполнение разделов меню под пользователя.

В 2000-ых Microsoft существенно усилила позиции в сферах распознавания речи, обработки естественных языков и построения графов знаний, завершив сделки по приобретению компаний Tellme Networks и Powerset за €591 млн и €63 млн соответственно. Компетенции в области устных поисковых запросов и распознавания запросов, сформулированных на естественном языке, были усилены и использованы в Bing.

Наконец, в этой декаде произошли поглощения Equivio, который облегчает поиск данных для e-discovery, и Swiftkey, предугадывающего намерения пользователя при вводе текста.  

Возможно, для того, чтобы усилить экосистему цифрового агента, Microsoft направила €384 млн на приобретение активов в сфере личной продуктивности, в том числе компаний Acompli (Outlook) и Wunderkinder, разработчика Wunderlist.

Также были приобретены как минимум четыре актива, разрабатывающие технологии компьютерного видения, например, компания VideoSurf, в том числе работавшая над поиском по видео контенту.

Важно отметить, что помимо инвестиций непосредственно в когнитивные технологии, Microsoft уделила внимание инфраструктуре, необходимой для их поддержки.

Было приобретено шесть компаний, связанных с интеграцией и обменом данными. Например, поглощение компании Fast Search & Transfer за €761M позволило Microsoft получить «… гибкую и масштабируемую технологическую платформу и персонализированный портал, [который] связывает пользователей с необходимой информацией независимо от используемого средства коммуникации».

Вопросы инфраструктуры, необходимой для интеграции, были затронуты и на конференции Build. Компания открыла доступ к 22 APIs, объединённым в Cortana Intelligence Suite. Также Microsoft презентовала инструмент для визуализации данных непосредственно в приложениях, Power BI Embedded.

Опыт разработок когнитивных систем показал Microsoft, что основной преградой для построения персональных агентов является не столько технология, сколько ее подходящее применение в виде конкретных продуктов. После неудачного внедрения ассистента Clippy в Office и попытки предоставить центр управления нотификациями в Windows Longhorn (частично воплощенный лишь в Windows 10 более чем десятилетие спустя), а также сделать интегрированную систему хранения данных (WinFS) частью операционной системы, Microsoft вела большинство разработок когнитивных систем весьма непублично, лишь изредка показывая прототипы на саммитах Microsoft Research и конференциях PDC (MyLifeBitsLifeBrowser, Situated Interaction – MSR Receptionist, Microsoft Semantic Engine).

Последний проект, Microsoft Semantic Engine, как и WinFS, особенно интересен своим фундаментальным вкладом в развитие инфраструктуры для функционирования цифрового агента.

В отличие от WinFS, проект Semantic Engine получил мало освещения в прессе, но при этом цели и результаты проекта во многом превзошли своего предшественника.

Semantic Engine имел целью всесторонний анализ пользовательских и публичных данных с целью дальнейшего построения графа знаний пользователя вкупе с публичным графом знаний (предтеча Bing Knowledge Graph). Система использовала целый спектр когнитивных технологий для «понимания» контента – метаданные для определения авторства, местоположения, дат, анализ изображений для определения изображенных людей и объектов, анализ текстов для определения ключевых слов и упомянутых объектов.

С помощью Semantic Engine пользователь мог не только делать «умный» поиск по своим данным (например, «покажи все фотографии, которые я сделал на природе в Греции в прошлом году»), или увидеть эти же фотографии на карте, но и получить «брифы» (краткие обзоры) о публичных объектах (например, «расскажи основные факты о Томе Крузе»На основании: Данила Корнев, «Поиск и семантическая революция XXI века»).

Учитывая опыт и внимание Microsoft к интеграции искусственного интеллекта в традиционные продукты, интерес к вопросам продуктивности, а также вложения в инфраструктуру, можно предположить, что цифровой агент может стать следующей важной вехой развития компании и искусственного интеллекта в целом. Потребители и корпоративные пользователи офисного программного обеспечения вскоре смогут почувствовать на себе то, что почувствовали пилоты коммерческих лайнеров, передавшие машине огромную часть рутинных операций, но при этом сохранившие штурвал в своих руках.

 


Материалы по теме:

Как конкуренция с Google меняет бизнес корпораций

Взлет и падение Мариссы Майер

Эти 5 вещей искусственный интеллект сделает в ближайшие два года

Что Стив Джобс, Билл Гейтс и 13 других успешных людей делали в 25 лет

Видео по теме:

Фото: drserg / Shutterstock.com.


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно