Колонки

TechTrends: последние достижения ИИ в сфере обработки текста

Колонки
Ринат Максутов
Ринат Максутов

Руководитель практики «Новые технологии» Accenture в России

Полина Константинова

«Профессор — лопух, но аппаратура при нем...» Фраза из фильма «Операция «Ы» и другие приключения Шурика» скоро снова может зазвучать повсеместно, преподавателям придется обзаводиться глушилками bluetooth, а составителям экзаменационных тестов — изучать способы противодействия генеративным языковым моделям. Как обычно во всем виноват технический прогресс.

Ринат Максутов, руководитель практики «Новые технологии» Accenture в России, рассказывает о последних достижениях искусственного интеллекта в сфере обработки текста в первом дайджесте TechTrends. 

TechTrends: последние достижения ИИ в сфере обработки текста

ИИ для ЕГЭ?

Четыре года назад группа ученых организовала соревнование с призовым фондом в $80 тысяч, в котором ИИ-алгоритмы должны были пройти выпускной тест для американских восьмиклассников (аналог российского ОГЭ). Долгое время задача была нерешаемой, но около месяца назад сотрудники Allen Insitute for Artificial Intelligence сообщили, что разработанному ими алгоритму это удалось. 

Их система, названная Aristo, способна ответить, например, на такой вопрос:

Какой предмет позволит отделить перемешанные скрепки и горошины черного перца?

  • Магнит
  • Фильтрующая бумага
  • Весы
  • Вольтметр

И это лишь один из недавних примеров огромного прогресса техник обработки естественного языка (Natural Language Processing) за последнее время. 

Российские компании также проявляют интерес к подобным системам. Сбербанк в рамках своего ежегодного соревнования по ИИ представил задачу разработать модель, которая была бы способна проходить экзаменационные тесты. 

Маловероятно, что Сбербанк хочет на основе этого построить помощник по ЕГЭ. Скорее всего, наработки, полученные в ходе соревнования, будут использованы для лучшего понимания клиентов банка, извлечения новых знаний о них из доступных текстовых источников.

Бот от Microsoft

Не отстают от коллег и разработчики из Microsoft, однажды уже прославившиеся своим Twitter-ботом, который всего лишь за один день общения с реальными людьми, стал расистом. На этот раз они представили бота, который читает новостную статью, а затем вступает в дискуссию с людьми в комментариях к ней.

В первой версии научной статьи, опубликованной на arXiv.org, разработчики предложили использовать бота в качестве катализатора дискуссии и повышения уровня вовлеченности пользователей в контент на сайтах. Но поняли, что такие инструменты не совсем этичны. В итоге они убрали это предложение из второй версии своей статьи. 

Отметим, что оба бота разрабатывались с прицелом на Китай, где властвует деанонимизированный и контролируемый интернет.

ИИ как райтер 

The Economist, солидное международное издание, недавно проводило Open Future essay competition (открытое соревнование по написанию эссе), в котором нужно было развернуто и аргументированно ответить на несколько вопросов на тему изменения климата. В рамках этого соревнования они решили посмотреть, а как на эти вопросы ответит ИИ. 

Журналисты подали вопросы на вход алгоритму GPT-2, разработанному OpenAI, а затем представили его ответы жюри конкурса, не редактируя результат и не сообщая им, что это текст, сгенерированный машиной.

Эссе не получило высоких баллов от рецензентов, но их отзывы о тексте довольно интересны: «Не предлагается практических решений. Рассуждения гипотетичны и абстрактны», «Написано неплохо, но размышления идут к сути довольно медленно, а предлагаемые решения оформлены не четко» или даже «Довольно хорошо сформулировано, подкреплено аргументами, но сама идея не очень оригинальна». 

То есть ИИ вполне мог бы выступить в ООН не хуже 16-летней школьницы.

Российская компания с помощью специалистов Accenture разработала систему, которая способна анализировать сотни страниц технической документации о промышленном оборудовании и выделять из нее характеристики оборудования и связи между различными узлами.

Идея в том, чтобы знания об устройстве оборудования сохранялись не только в головах сотрудников, но и в цифровой форме. Тот случай, когда ситуация «в одно ухо влетело — в другое вылетело» исключается, а база корпоративных знаний гарантированно формируется, пополняется, хранится и всегда доступна.

The big picture

Конечно, никто не позволит хитрить на выпускных экзаменах с помощью ИИ хотя бы потому, что у школьников перед экзаменом отбирают все мобильные устройства. Боты-комментаторы также, скорее всего, будут интересны только в качестве демонстрации возможностей языковых моделей.

Реальные применения ИИ в бизнесе гораздо более прозаичны, но в то же время имеют ощутимый экономический потенциал.

Например, в анализе юридических документов или извлечении концентрированных знаний из научных публикаций — там, где количество и объем документов слишком велики для анализа человеком, как это сделали ученые из того же института Аллена еще в 2015 году.

Тогда специалисты института создали поисковую платформу на основе ИИ Semantic Scholar, которая позволяет искать наиболее релевантные научные статьи по ключевым словам и строить связи между ними. 

Платформа получила неожиданное применение: на ее основе был создан сервис проверки взаимодействия лекарств Supp.ai, учитывающий данные из научных статей, рефератов, исследований и даже закрытых научных источников. Сегодня Supp.ai — «Библия» для биохакеров и всех, кто интересуется темой расширения возможностей человеческого организма, долголетия и здоровья.  

Фото в материале и на обложке: Unsplash

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 35 самых успешных предпринимателей в сфере AI
  2. 2 Когда появится равный человеку ИИ: мнение исследователей
  3. 3 Чем различаются слабый, сильный и супер-ИИ

Актуальные материалы —
в Telegram-канале @Rusbase