Андрей Черногоров

Как современные российские ИТ-разработки меняют мир

Принято считать, что со времен распада СССР российская ИТ-сфера прекратила развиваться и, как следствие, безнадежно отстала от остального мира. Отчасти так оно и есть, но тем не менее во многих областях российские технологии продолжают лидировать и вести за собой. Андрей Черногоров, генеральный директор компании Cognitive Technologies, рассказывает, что это за области и как уже существующим разработкам находится новое применение.


Парадокс современной науки состоит в том, что исследователи всех стран мира ежедневно производят огромное количество научной информации, но не могут добыть из нее и половины имеющегося потенциала. Практически никто не в силах систематически изучить все исследовательские данные, чтобы сложить мозаику в общую картину, найти точки соприкосновения между несколькими отраслями, где научные открытия могут быть одинаково востребованы.

Ситуация усугубляется еще и тем, что современные специалисты – это исследователи высокоспециализированной науки. В науке полно примеров, когда вновь открывали то, что было найдено много лет, а то и десятилетий назад, но не получило признания, не было привязано к решению конкретной задачи, не имело конкретного технологического воплощения. Подобное явление часто называют «слепотой погружения» – когда человек погружен в решение конкретно своей задачи настолько, что подчас не видит простых и эффективных решений, лежащих на поверхности где-то рядом. Порой простое упорядочивание всей имеющейся в распоряжении информации и ее ранжирование по приоритетам помогает для решения задачи в разы больше, чем любые сложные интеллектуальные изыскания. Вот почему хочется поделиться с читателями некоторыми соображениями о том, как и – самое главное – где современные научные разработки в ИТ сегодня уже формируют контуры нашего будущего.

Сфера информационно-коммуникационных технологий и наука все глубже интегрируются друг в друга. В международном масштабе ИТ-отрасль всегда была полигоном для проверки и тестирования самых разных гипотез и научных разработок. Однако в России особенно активно подобная тенденция стала проявляться именно в последние годы. Важнейшим фактором является социологический подтекст: в нашей стране выросло поколение людей, внедренных в экосистему разнообразнейших ИТ-продуктов так глубоко, как никто ранее до них. Это накладывает свой отпечаток на проведение научных разработок в потребительском секторе. Эпоха персонализации в самом разгаре, и сегодня научные разработки чаще всего ориентируются именно на конечных потребителей, рядовых граждан. Ведь требования, предъявляемые частными клиентами, подчас настолько специфические, что вывод разработки на b2c-рынок становится для нее настоящим стресс-тестом, сразу обнажающим все недоработки.

В отечественной ИТ-сфере сегодня можно выделить по меньшей мере четыре направления, которые сопряжены с наиболее перспективными инновациями и научными разработками. Рассмотрим каждую из них последовательно и сразу проведем параллели с теми отраслями, где они найдут себе новое применение.


Технология: анализ данных для электронных закупок

Первое такое направление – информатизация государственных закупок. С пятью миллионами электронных закупочных процедур в год Россия стала единственной страной в мире со столь высоким уровнем развития онлайн-торгов. В следующей за нами по этому показателю стране, Великобритании, результат всего около сотен тысяч процедур ежегодно. Показатель электрификации электронных сделок – та точка роста, которая даст рынку импульс для развития в последующие годы, причем далеко за пределами закупочных решений. Это же направление одновременно является и самым политизированным, потому что большинство законов, принимаемых государством в сфере ИТ, сегодня так или иначе затрагивает именно закупочные процессы между субъектами страны. Тем не менее, реализуемые ИТ-проекты в области госзакупок и закупок госкомпаний сегодня формируют содержание тех решений и продуктов, которые в самом ближайшей будущем изменят жизнь обычных граждан.

В современном мире существуют определенные классы программного обеспечения, которое ориентированно в основном на корпоративный сегмент (крупный и средний бизнес) и поэтому не имеет широкого распространения. Но некоторые программные решения имеют достаточно интересные функции, которые можно применить не только в бизнесе, но и для решения широкого спектра задач физических лиц.

В сфере электронных закупок такой технологией является система анализа больших данных Business Intelligence (BI). Система BI, как правило, представляет алгоритм, способный упорядочивать и находить эффективные взаимосвязи в неограниченных объемах информации, в том числе и в сфере торговых операций и тендеров. Подобная система аналитики дает возможность не только выделить и проанализировать большие объемы данных в реальном режиме, визуализировать полученную информацию о состоянии бизнеса, но и сделать реалистичные прогнозы о его развитии, используя и сопоставляя при этом показатели из разных источников.


Новая сфера применения: медицина

Сегодня главной проблемой, с которой в здравоохранении должны справиться системы анализа и обработки больших данных, стабильно применяемые в сфере электронных закупок, является повышение точности диагностики пациентов. С увеличением объема информации по новым лекарствам, болезням и способам их лечения, которые у себя в голове должен держать врач, заметно снижается его способность оперировать такими большими потоками данных. В результате утрачивается ключевая врачебная функция – вовремя и правильно диагностировать болезнь и назначить лечение, наиболее эффективное и безопасное для конкретного человека с учетом всех его индивидуальных особенностей.

Главным инструментом американских врачей широкого профиля становится сегодня суперкомпьютер Watson корпорации IBM. В его память заложены алгоритмы выявления всех основных болезней и данные обо всех существующих вариантах лечения из различных источников, в том числе современных медицинских справочников и других пособий национальных библиотек и медицинских центров. Компьютер анализирует имеющееся от пациента «техническое задание» в виде симптомов и данные его анализов и сопоставляет их со своей базой алгоритмов уже проведенного лечения миллионов других пациентов, чтобы выявить комбинацию лечебных действий и препаратов, максимально соответствующую конкретному врачебному случаю. Как утверждается, в результате применения компьютера Watson точность диагностирования в ряде клиник США выросла с традиционных 50% (в случае, когда прием вел живой врач), до 95%. Удивительно, но анонсированный еще в 2010 году IBM Watson имеет предшественника старше него на 36 лет, и родом из нашей страны. Аналогичную способность к оперированию большими объемами информации имеет легендарный советский суперкомпьютер «Каисса» – первый советский чемпион мира по шахматам среди компьютеров. «Каисса» получила такой статус еще в августе 1974 года.


Разработчики шахматной программы «Каисса» в 1992 году в Монреале. Слева направо: Владимир Арлазаров, Кеннет Лейн Томпсон, Михаил Донской


Для понимания принципа работы системы уровня Watson и «Каисса» следует помнить, что это не человек, и даже не искусственный интеллект в полном смысле этого слова, а сверхмощная экспертная система, работающая с готовыми массивами данных. Соответственно, такой компьютер может отвечать на вопросы, делать прогнозы, находить нетривиальные связи между единицами информации, проводить анализ, строить детальнейшие классификации не в любых произвольных, а в строго заданных разработчиками сферах. Поэтому, чем точнее сформулирован вопрос и поставлена задача, тем больший эффект будет получен от Watson. Это своего рода глобальный офлайн-поисковик, которые всесторонне изучает информацию ровно в той области знаний, какую в него загрузили.

Система так называемой глубокой обработки естественного языка, используемая в IBM Watson, позволяет для поиска правильного ответа на заданный вопрос оценивать как можно более обширный контекст с применением различных баз данных. Эта же система помогла людям найти решение и для другой проблемы – анализа огромного количества информации, которая ежедневно создается в электронном пространстве. Это неструктурированные массивы данных, вроде статей, загруженных в сеть бизнес-планов и отчетов, сообщений в социальных сетях и блогах, твиты, ветки на форумах, подписи к фотографиям, данные с опросных форм на сайтах и так далее. IBM Watson научился использовать все это для решения задач, поставленных человеком.

Получив от человека вопрос, Watson сначала выполняет его синтаксический анализ, чтобы выделить основные особенности вопроса, понять, как вообще нужно ответить на вопрос (ответить на него в формате «правильно – неправильно», дать развернутый комментарий по запрашиваемому термину и так далее). Система генерирует ряд «гипотез», просматривая в поиске фраз условное ядро, которое с некоторой долей вероятности может содержать необходимый ответ. После этого система выполняет глубокое сравнение языка вопроса и языка каждого из возможных вариантов ответа, применяя для этого различные алгоритмы логического вывода, включая поиск подходящих источников контекстуальной информации. Каждый алгоритм логического вывода затем выставляет одну или несколько оценок, которые в свою очередь показывают, с какой долей вероятности возможный ответ находится в «подконтрольной» ему области данных. Каждой полученной оценке затем присваивается весовой коэффициент по статистической модели, которая фиксирует, насколько успешно справился алгоритм с выявлением логических связей между двумя аналогичными фразами из этой области. Благодаря этой статистической модели Watson многократно повторяет процесс для каждого возможного варианта ответа – до тех пор, пока не найдет ответы, которые будут иметь больше шансов оказаться правильными, чем остальные.



По теме: Почему в России не развиваются технологии



Технология: системы управления предприятиями

Второе направление, в котором сегодняшние научные разработки плотно переплетаются с ИТ-решениями – это системы управления предприятиями (SRM-, CRM-, HRM, ECM-системы, task-менеджеры). Еще 5 лет назад большая часть программных разработок в этой среде представляла собой заранее спроектированные информационные программы, в которые разработчики после внедрения на предприятие вручную вносили различные модификации и доработки. Сегодня на рынке появляется новое поколение самообучаемых программ со своего рода элементами искусственного интеллекта. Они способны переключить на себя важнейшие бизнес-процессы больших предприятий.

Многие из этих решений базируются на таком подходе, который в современной практике менеджмента называется адаптивным кейс-менеджментов (АКМ). Суть подхода заключается в том, что все знания, которые ежедневно генерируются во внутрикорпоративных бизнес-процессах по всему миру, могут и должны отчуждаться от их носителей и сохраняться для общекорпоративного использования во избежание появления «узких мест» и сотрудников, чьи компетенции и функционал нельзя при необходимости заменить. Инструментом такого отчуждения, обеспечивающим своевременное и стабильное исполнение сотрудниками своей работы, и является информационная система с правила и принципами АКМ. Часто ее еще называют «базой знаний» компании.


Новая сфера применения: образование

Сколько времени человеку нужно для того, чтобы научиться играть на пианино? А выучить английский язык? Раньше такие вопросы могли поставить педагога в ступор и вызывали только недоумение и усмешку: в обучении все индивидуально; если будешь работать на совесть, то и выучишься быстрее, если будешь отлынивать, то процесс затянется, но в любом случае точные сроки получения гарантированного результата тебе никто не назовет. Сегодня все иначе. Главным параметром эффективности в сфере образования становится фактор предсказуемости результата. В условиях глобализации и непрекращающейся интенсификации времени и нагрузок современный человек должен четко понимать, сколько времени у него займет то или иное действие: как быстро приедет заказанное через приложение такси; как скоро оператор ответит на звонок; наконец, сколько конкретно дней потребуется, чтобы с нуля выучиться на дизайнера интерьеров или php-программиста. Современные технологии искусственного интеллекта в сфере ПО для управления предприятиями могут дать ответ и на этот вопрос.



По теме: Мы — это данные. Будущее искусственного интеллекта



Ключевая проблема классической модели образования заключается в том, что весь учебный процесс по-прежнему, как и веками до этого, замыкался на учителе как на монополисте знаний. Мы уважаем и в особых случаях даже категорически поддерживаем сохранение живого контакта детей и студентов с реальным, живым педагогом, который выступает для них экспертом и модератором учебных занятий. Но есть нюанс, который заставляет задуматься: знаний и информационных массивов становится все больше, а когнитивные способности учителя сокращаются. В этом плане ситуация идентична «когнитивному кризису», с которым сталкиваются современные врачи из приведенного нами ранее примера. Для того чтобы достичь с учеником по-настоящему выдающихся результатов, необходимо разработать для него индивидуальную образовательную траекторию, которая бы учитывала все его психосоматические и ментальные особенности. Один ученик усваивает информацию быстрее и ему требуется меньше раз повторять материал или упражнение; другой, наоборот, более медленно погружается в учебный материал, поэтому повторение нужно с большей интенсивностью. Но как учителю запомнить весь этот сонм персональных образовательных портретов даже в рамках одного небольшого класса в 15-20 человек? В какие моменты нужно повторить материал для одного ученика, а в какие – для другого?

Самообучаемые алгоритмы управления данными, которые сегодня активно используются в ПО для предприятий, кажется, имеют все шансы, чтобы в перспективе 5-10 лет заменить сотрудникам образовательных учреждений и ученикам электронные дневники и дидактические материалы. Рядовым пользователям все эти технологии на бытовом уровне доподлинно известны. Достаточно лишь открыть свой аккаунт на Facebook. То, как у пользователя выглядит его новостная лента, – является прямым результатом работы аналогичных механизмов, только более примитивных. Они беспрерывно обрабатывают наши действия, оценивают то, как часто, куда и во сколько мы кликаем, а затем проектируют модель наиболее вероятных предпочтений и ранжируют новостную выдачу в ленту от наиболее интересных к наименее интересным материалам. Подобная механика может применяться и уже применяется для обучения иностранным языкам. С той лишь разницей, что, вместо ленты с приоритетными новостями, пользователь получает упражнения на запоминания иностранных слов, исходя из того, в каких из них он чаще всего делает ошибки. Слова или грамматические конструкции, в которых студент ошибается чаще, выводятся ему для запоминания больше остальных. Весь этот процесс сугубо персонализирован и максимально заточен под индивидуальные особенности обучения. Учебные задания как бы подстраиваются под способности ученика.

Рассмотрим миграцию этой технологии на конкретной паре примеров. Интеллектуальный task-менеджер для мобильного устройства «Е-1 Евфрат» обладает функцией «маршруты». Она наглядно показывает реальный статус делового поручения внутри компании, помогает выявлять слабые точки коммуникации между сотрудниками и отделами, благодаря чему руководитель при желании держит руку на пульсе или легко находит того, на ком эффективно можно замкнуть процесс или кому делегировать важную его часть. Аналогичный механизм, но уже для образовательных нужд, использует проект по обучению английскому языку Skyeng. В качестве «маршрутов» выступает определенное грамматическое правило. Чтобы правило было верно усвоено учеником, оно должно пройти несколько этапов закрепления. Каждый ученик по мере освоения материала «коллекционирует» все допущенные ошибки в отдельный буфер и может при необходимости либо разом все их разобрать, либо, если разнообразие тем, в которых они были допущены, слишком велико, еще раз пройти нужные темы в необходимом срезе – конкретно по той ситуации, где допущена ошибка.

Продолжение статьи доступно тут.

Фото на обложке: Михаил Донской, российский программист и предприниматель, один из создателей шахматной программы «Каисса».


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно