YandexGPT 2 сдала ЕГЭ по литературе и приблизилась к среднему баллу российских школьников
Усредненная оценка составила 55 баллов по итогам сдачи нескольких вариантов
Языковая модель YandexGPT 2 решила несколько вариантов ЕГЭ по литературе. Нейросеть приблизились к среднему баллу по этому предмету среди российских школьников (составлял 64 по итогам 2022 года), говорится в сообщении «Яндекса».
Усредненная оценка YandexGPT 2 составила 55 баллов. Таким образом, нейросеть преодолела минимальный порог, который необходим для поступления в вуз, — 40 баллов.
Отмечается, что это первый случай в России, когда генеративная нейросеть сдала единый госэкзамен, выполнив все его задания, включая творческое.
Сочинение YandexCPT 2
В «Яндексе» добавили, что пройти ЕГЭ по литературе — сложная задача для нейросети, так как знания проверяются сразу с нескольких сторон: есть задания для оценки эрудиции, стиля письма и творческих способностей.
«Стандартным тестом для оценки эрудиции языковых моделей в мире считается MMLU: он включает вопросы разной степени сложности из 57 областей знания. Так можно объективно сравнить несколько нейросетей, но нельзя оценить качество их ответов на открытые или творческие вопросы. Именно поэтому мы предложили YandexGPT 2 сдать ЕГЭ по литературе», — пояснил технический директор «Поиска» «Яндекса» Алексей Гусаков.
Для эксперимента специалисты «Яндекса» получили варианты ЕГЭ по литературе, которые были использованы при проведении тренировочных экзаменов в 2021–2023 годах, и убедились, что применявшаяся для обучения YandexGPT база данных не содержит ответов на них.
«Яндекс» представил YandexGPT 2 в начале сентября. Это улучшенная версия нейросети YandexGPT — она способна решать больше различных типов задач, также было улучшено качество ее ответов.
Изображение: «Яндекс»
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Тренды «Пухосос купить»: как россияне поверили в фейк, а бренды — заработали на меме 11 июня 2026, 19:59
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Тренды Загородный рынок — 2026: тренды, цены и возможности для покупателей и инвесторов 03 июня 2026, 12:16
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Технологии UMO впервые возглавил рынок электромобилей в России — на бренд пришлось 35% продаж в мае 2026-го 19 июня 2026, 14:42
-
Бизнес Покупательская способность сократилась — без льготной ипотеки россияне могут позволить себе лишь 15 кв. м жилья 19 июня 2026, 21:30
-
Маркетплейсы Яндекс Маркет снизил комиссию для продавцов одежды и обуви — ставка упала более чем втрое 19 июня 2026, 20:45
-
Россия В России стартовали продажи автомобилей Volga — цены начинаются от 2,75 млн рублей 19 июня 2026, 16:05
-
Искусственный интеллект Алиса AI — с характером: Яндекс интегрировал в нейросеть ИИ-персонажей с разной манерой общения 19 июня 2026, 11:10
-
Маркетплейсы Wildberries может открыть премиальный ПВЗ в торговом центре — пункт выдачи будет похож на полноценный магазин 19 июня 2026, 19:15
-
Реклама Т-Банк будет использовать банковские данные клиентов при показе рекламы — юристы говорят о правовых рисках 10 июня 2026, 14:00
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
