YandexGPT 2 сдала ЕГЭ по литературе и приблизилась к среднему баллу российских школьников
Усредненная оценка составила 55 баллов по итогам сдачи нескольких вариантов
Языковая модель YandexGPT 2 решила несколько вариантов ЕГЭ по литературе. Нейросеть приблизились к среднему баллу по этому предмету среди российских школьников (составлял 64 по итогам 2022 года), говорится в сообщении «Яндекса».
Усредненная оценка YandexGPT 2 составила 55 баллов. Таким образом, нейросеть преодолела минимальный порог, который необходим для поступления в вуз, — 40 баллов.
Отмечается, что это первый случай в России, когда генеративная нейросеть сдала единый госэкзамен, выполнив все его задания, включая творческое.
Сочинение YandexCPT 2
В «Яндексе» добавили, что пройти ЕГЭ по литературе — сложная задача для нейросети, так как знания проверяются сразу с нескольких сторон: есть задания для оценки эрудиции, стиля письма и творческих способностей.
«Стандартным тестом для оценки эрудиции языковых моделей в мире считается MMLU: он включает вопросы разной степени сложности из 57 областей знания. Так можно объективно сравнить несколько нейросетей, но нельзя оценить качество их ответов на открытые или творческие вопросы. Именно поэтому мы предложили YandexGPT 2 сдать ЕГЭ по литературе», — пояснил технический директор «Поиска» «Яндекса» Алексей Гусаков.
Для эксперимента специалисты «Яндекса» получили варианты ЕГЭ по литературе, которые были использованы при проведении тренировочных экзаменов в 2021–2023 годах, и убедились, что применявшаяся для обучения YandexGPT база данных не содержит ответов на них.
«Яндекс» представил YandexGPT 2 в начале сентября. Это улучшенная версия нейросети YandexGPT — она способна решать больше различных типов задач, также было улучшено качество ее ответов.
Изображение: «Яндекс»
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Кибербезопасность Как пополнить Apple ID в России после 1 апреля 2026 года 03 апреля 2026, 19:34
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Технологии Подключённые автомобили: как интернет меняет автопром 25 марта 2026, 13:17
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Технологии KakaoTalk — мессенджер из Кореи: полный обзор и ключевые особенности 24 марта 2026, 22:52
-
Тренды Туры на 1 и 9 Мая 2026 года: куда поехать, какие есть форматы и сколько стоит 18 апреля 2026, 12:00
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Искусственный интеллект Рынок критикует закон о маркировке ИИ-контента: юристы указывают на противоречия, бизнес — на технические сложности 22 апреля 2026, 12:00
-
Искусственный интеллект Яндекс опубликовал единую модель обучения специалистов по физическому ИИ — в разработке участвовали ведущие вузы 22 апреля 2026, 09:30
-
Технологии Ростелеком начал тестировать «Спектр» — российский «аналог» Figma: для бизнеса будет версия с локальным размещением 21 апреля 2026, 20:00
-
Россия Операторы просят Минцифры отложить введение платы за использование VPN — системы сложно перенастроить за месяц 22 апреля 2026, 14:10
-
Россия Число занятых на неполный день выросло до 1,6 млн человек — это самый высокий показатель с 2020 года 21 апреля 2026, 21:00
-
Россия 64% россиян выступили за введение уроков финансовой грамотности в школах — детей хотят обучать защите от мошенников 21 апреля 2026, 19:30
-
Бизнес Тим Кук покидает пост CEO Apple — его преемником станет главный инженер компании Джон Тернус 21 апреля 2026, 00:07
