Как искусственный интеллект написал свою первую научную работу
Рассказываем, что это означает для рынка.
Количество исследований, которые сегодня публикует научное сообщество, больше, чем любой ученый может прочитать. Однако скоро в этом вопросе исследователи смогут надеяться на искусственный интеллект, который будет изучать тысячи статей и формировать их краткое содержание — именно так поступила команда из университета Гёте.
Вы можете прочитать первую работу, написанную «Beta Writer», здесь. Правда, если вы не фанат литий-ионных аккумуляторов и их химического состава, работа может показаться вам немного «сухой».
Само исследование креативно называется «Литий-ионные аккумуляторы: автоматическое краткое изложение текущих исследований». Всё именно так, как звучит — вы увидите 250 страниц чего-то вроде:
Структура пор и толщина сепаратора должны тщательно контролироваться, так как необходимо поддерживать удовлетворительный баланс между механической прочностью и ионной электропроводностью (Арора и Чжан [40]; Ли и другие [33]; Чжан [50]), чтобы удовлетворять этим двум функциям [5]. Структура пор и пористость материала, безусловно, имеют решающее значение для производительности сепаратора в батарее в дополнение к материалу сепаратора [5].
Как бы не было интересно исследование литий-ионных аккумуляторов, оно имеет лишь косвенное отношение к реальной цели проекта. Создатели ИИ в подробном и интересном предисловии к книге объясняют, что их основная цель — начать обсуждение научной литературы, созданной машиной, и поднять вопросы, связанные с авторством, технической составляющей, этикой и другими аспектами.
Другими словами, их задачей было задать вопросы, а не выдать результат. И вопросов у них в избытке.
Кто является создателем машинного контента? Могут ли разработчики алгоритмов рассматриваться как авторы? Или это человек, который вводит данные (например, термин «литий-ионные батареи») и настраивает различные параметры? Можно ли вообще определить создателя? Кто решает, что именно машина должна сгенерировать? Кто несет ответственность за «машинный» контент с этической точки зрения?
Бурные дебаты между исследователями, их коллегами и экспертами, которые помогали в производстве этой книги, дают понять, что это — только начало. Но как Хеннинг Шёненбергер пишет в предисловии, нужно с чего-то начинать, и это такой же хороший старт, как и любой другой.
В самом деле, нам удалось разработать первый прототип, который также показывает, что нам ещё предстоит долгий путь: выборочное изложение больших текстовых корпусов всё ещё несовершенно, а перефразированные тексты, синтаксис и словосочетания иногда кажутся неуклюжими. Однако мы специально решили не «полировать» и не править текст, чтобы показать текущие возможности машины с точки зрения производства контента и обозначить границы того, что она ещё не умеет.
Сама книга, как и говорят создатели, несовершенная и довольно тяжеловесная. Но естественно звучащий язык — это лишь одна из задач, которой пытается достичь ИИ, поэтому неправильно концентрироваться только на ней, не учитывая другие достижения.
Этот ИИ отсортировал и проанализировал более 150 статей по высокотехнологичной теме, находя в них ключевые слова, отсылки, выводы, «местоименную анафору» и так далее. Затем документы были сгруппированы и распределены в соответствии с их выводами, чтобы получились логично собранные главы.
Репрезентативные предложения и краткие изложения пришлось переформулировать, как из-за авторского права, так и потому, что синтаксис оригиналов мог не сочетаться в новом контексте. (Эксперты, с которыми беседовала команда, сказали, что нужно максимально придерживаться смысла оригинальных работ, избегая «творческих» интерпретаций.)
Представьте себе, что предложение начинается с «Следовательно, это даёт на 24% более высокий коэффициент изоляции, как предполагали в работе 2014 года».
ИИ должен понимать документ достаточно хорошо, чтобы знать, что такое «это» и, перефразируя предложение, заменить «это» на конкретный элемент. Он также должен понять, что может убрать «следовательно» и отсылку к году в конце.
В конечном итоге книга читабельна и, по-видимому, полезна, поскольку она приводит тысячи страниц исследований к гораздо более приемлемым 250. Но, по словам исследователей, технология может намного больше.
Цель, которая совсем не кажется недостижимой, состоит в том, чтобы можно было сказать ИИ: «дай мне 50-страничную сводку с информацией о происходящем в биоинженерии за последние 4 года». И спустя несколько минут — бум — она появится перед вами. «Гибкость» текста будет означать, что вы также сможете запросить сводку на испанском или корейском языке. Параметризация — что вы легко сможете настроить ключевые параметры, выделив регионы и авторов или исключив определённые слова или ненужные темы.
Такая платформа обеспечит вас этими и множеством других возможностей, если, конечно, вы не против довольно неестественного языка.
Если вы хоть немного заинтересованы в научных публикациях или обработке естественного языка, предисловие авторов стоит прочитать.
Фото: ktsdesign, Фотодженика
Материалы по теме:
Как мы разрабатывали ИИ для чтения эмоций
Семь лекций, чтобы понять искусственный интеллект
Люди больше не нужны: роботы тоже займутся искусством
Пять проблем, которые пока не может решить искусственный интеллект
-
Партнёрский материал Экс-директор Xiaomi о том, как делать сильные продукты и внедрять ИИ без иллюзий 06 апреля 2026, 16:14
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Искусственный интеллект «Идея „ИИ всех заменит“ похожа на мыльный пузырь». Прогноз на 2026 год от специалиста по будущему 24 декабря 2025, 11:29
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Бизнес Анна Симакова: «В кризис выживают крупные структуры» 20 февраля 2026, 10:06
-
Бизнес «Точно розовый?»: как Eburet из табурета-трансформера вырос в B2B-бренд, который заходит на рынок в 50 млрд ₽ 11 февраля 2026, 19:48
-
Личное Евгений Касперский: «От пароля „123“ мы не спасаем. Но есть и хорошие новости» 04 февраля 2026, 12:35
-
Бизнес Сергей Косинский: «Мне достался Франкенштейн, из которого попросили сделать нормального человека» 02 февраля 2026, 19:51
-
Россия Госзакупки корпоративного VPN выросли на 20% в начале 2026-го: компании усиливают защищённые каналы передачи данных 07 апреля 2026, 13:40
-
Искусственный интеллект Компании повышают зарплаты за работу с ИИ: специалистам со знанием нейросетей готовы платить на 20% больше 07 апреля 2026, 11:25
-
Искусственный интеллект Бизнес теряет потенциальных клиентов из-за ИИ: каждый шестой заказчик кладёт трубку, если ему отвечает нейросеть 06 апреля 2026, 16:00
-
Россия На Госуслугах произошёл сбой: пользователи сообщают о проблемах со входом в личный кабинет и загрузкой сайта 07 апреля 2026, 12:15
-
Россия В работе «Ростелекома» произошёл масштабный сбой из-за DDoS-атаки — пользователи жалуются на проблемы с интернетом 06 апреля 2026, 23:59
-
Искусственный интеллект Потребление токенов в компаниях выросло на 32 000% — но только 9% бизнеса обеспечены инфраструктурой для ИИ 27 марта 2026, 17:30
-
Искусственный интеллект VK Tech купила CedrusData — независимого разработчика решений для больших данных и ИИ 27 марта 2026, 12:30
-
IT Искусственный интеллект изменит ИТ-отрасль в ближайшие годы — так считают 83% специалистов 25 марта 2026, 14:45