Как искусственный интеллект написал свою первую научную работу
Рассказываем, что это означает для рынка.
Количество исследований, которые сегодня публикует научное сообщество, больше, чем любой ученый может прочитать. Однако скоро в этом вопросе исследователи смогут надеяться на искусственный интеллект, который будет изучать тысячи статей и формировать их краткое содержание — именно так поступила команда из университета Гёте.
Вы можете прочитать первую работу, написанную «Beta Writer», здесь. Правда, если вы не фанат литий-ионных аккумуляторов и их химического состава, работа может показаться вам немного «сухой».
Само исследование креативно называется «Литий-ионные аккумуляторы: автоматическое краткое изложение текущих исследований». Всё именно так, как звучит — вы увидите 250 страниц чего-то вроде:
Структура пор и толщина сепаратора должны тщательно контролироваться, так как необходимо поддерживать удовлетворительный баланс между механической прочностью и ионной электропроводностью (Арора и Чжан [40]; Ли и другие [33]; Чжан [50]), чтобы удовлетворять этим двум функциям [5]. Структура пор и пористость материала, безусловно, имеют решающее значение для производительности сепаратора в батарее в дополнение к материалу сепаратора [5].
Как бы не было интересно исследование литий-ионных аккумуляторов, оно имеет лишь косвенное отношение к реальной цели проекта. Создатели ИИ в подробном и интересном предисловии к книге объясняют, что их основная цель — начать обсуждение научной литературы, созданной машиной, и поднять вопросы, связанные с авторством, технической составляющей, этикой и другими аспектами.
Другими словами, их задачей было задать вопросы, а не выдать результат. И вопросов у них в избытке.
Кто является создателем машинного контента? Могут ли разработчики алгоритмов рассматриваться как авторы? Или это человек, который вводит данные (например, термин «литий-ионные батареи») и настраивает различные параметры? Можно ли вообще определить создателя? Кто решает, что именно машина должна сгенерировать? Кто несет ответственность за «машинный» контент с этической точки зрения?
Бурные дебаты между исследователями, их коллегами и экспертами, которые помогали в производстве этой книги, дают понять, что это — только начало. Но как Хеннинг Шёненбергер пишет в предисловии, нужно с чего-то начинать, и это такой же хороший старт, как и любой другой.
В самом деле, нам удалось разработать первый прототип, который также показывает, что нам ещё предстоит долгий путь: выборочное изложение больших текстовых корпусов всё ещё несовершенно, а перефразированные тексты, синтаксис и словосочетания иногда кажутся неуклюжими. Однако мы специально решили не «полировать» и не править текст, чтобы показать текущие возможности машины с точки зрения производства контента и обозначить границы того, что она ещё не умеет.
Сама книга, как и говорят создатели, несовершенная и довольно тяжеловесная. Но естественно звучащий язык — это лишь одна из задач, которой пытается достичь ИИ, поэтому неправильно концентрироваться только на ней, не учитывая другие достижения.
Этот ИИ отсортировал и проанализировал более 150 статей по высокотехнологичной теме, находя в них ключевые слова, отсылки, выводы, «местоименную анафору» и так далее. Затем документы были сгруппированы и распределены в соответствии с их выводами, чтобы получились логично собранные главы.
Репрезентативные предложения и краткие изложения пришлось переформулировать, как из-за авторского права, так и потому, что синтаксис оригиналов мог не сочетаться в новом контексте. (Эксперты, с которыми беседовала команда, сказали, что нужно максимально придерживаться смысла оригинальных работ, избегая «творческих» интерпретаций.)
Представьте себе, что предложение начинается с «Следовательно, это даёт на 24% более высокий коэффициент изоляции, как предполагали в работе 2014 года».
ИИ должен понимать документ достаточно хорошо, чтобы знать, что такое «это» и, перефразируя предложение, заменить «это» на конкретный элемент. Он также должен понять, что может убрать «следовательно» и отсылку к году в конце.
В конечном итоге книга читабельна и, по-видимому, полезна, поскольку она приводит тысячи страниц исследований к гораздо более приемлемым 250. Но, по словам исследователей, технология может намного больше.
Цель, которая совсем не кажется недостижимой, состоит в том, чтобы можно было сказать ИИ: «дай мне 50-страничную сводку с информацией о происходящем в биоинженерии за последние 4 года». И спустя несколько минут — бум — она появится перед вами. «Гибкость» текста будет означать, что вы также сможете запросить сводку на испанском или корейском языке. Параметризация — что вы легко сможете настроить ключевые параметры, выделив регионы и авторов или исключив определённые слова или ненужные темы.
Такая платформа обеспечит вас этими и множеством других возможностей, если, конечно, вы не против довольно неестественного языка.
Если вы хоть немного заинтересованы в научных публикациях или обработке естественного языка, предисловие авторов стоит прочитать.
Фото: ktsdesign, Фотодженика
Материалы по теме:
Как мы разрабатывали ИИ для чтения эмоций
Семь лекций, чтобы понять искусственный интеллект
Люди больше не нужны: роботы тоже займутся искусством
Пять проблем, которые пока не может решить искусственный интеллект
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Искусственный интеллект Книга «Дикие ягодки», первый в мире ИИ-терминал и главная проблема российской экономики: итоги ПМЭФ–2026 06 июня 2026, 08:00
-
Искусственный интеллект Выступление Владимира Путина и новые правила для маркетплейсов: главные события и тезисы третьего дня ПМЭФ–2026 05 июня 2026, 22:00
-
Технологии Яндекс Карты добавили 120 тыс. отметок о доступности мест маломобильным людям: данные обновляет ИИ — автоматически 05 июня 2026, 20:42
-
Искусственный интеллект Anthropic предложила ИТ-компаниям приостановить разработку ИИ — эксперты опасаются потери контроля над нейросетями 05 июня 2026, 20:06
-
Искусственный интеллект Развитие ИИ затронет 60% профессий — каждая десятая специальность может исчезнуть с рынка труда 05 июня 2026, 21:26
-
Бизнес С 16 по 19 июня пройдёт форум недвижимости «Движение» — в 2026 году его впервые посетят не только девелоперы 05 июня 2026, 19:07
-
Технологии Минцифры предложило ввести аренду самокатов по биометрии — систему протестируют в «Сириусе» 05 июня 2026, 15:15
-
Технологии Средний чек на вычислительные мощности для ИИ в России вырос на 64% — до 2,3 млн ₽ в месяц 04 июня 2026, 20:10