YandexGPT 2 сдала ЕГЭ по литературе и приблизилась к среднему баллу российских школьников
Усредненная оценка составила 55 баллов по итогам сдачи нескольких вариантов
Языковая модель YandexGPT 2 решила несколько вариантов ЕГЭ по литературе. Нейросеть приблизились к среднему баллу по этому предмету среди российских школьников (составлял 64 по итогам 2022 года), говорится в сообщении «Яндекса».
Усредненная оценка YandexGPT 2 составила 55 баллов. Таким образом, нейросеть преодолела минимальный порог, который необходим для поступления в вуз, — 40 баллов.
Отмечается, что это первый случай в России, когда генеративная нейросеть сдала единый госэкзамен, выполнив все его задания, включая творческое.
Сочинение YandexCPT 2
В «Яндексе» добавили, что пройти ЕГЭ по литературе — сложная задача для нейросети, так как знания проверяются сразу с нескольких сторон: есть задания для оценки эрудиции, стиля письма и творческих способностей.
«Стандартным тестом для оценки эрудиции языковых моделей в мире считается MMLU: он включает вопросы разной степени сложности из 57 областей знания. Так можно объективно сравнить несколько нейросетей, но нельзя оценить качество их ответов на открытые или творческие вопросы. Именно поэтому мы предложили YandexGPT 2 сдать ЕГЭ по литературе», — пояснил технический директор «Поиска» «Яндекса» Алексей Гусаков.
Для эксперимента специалисты «Яндекса» получили варианты ЕГЭ по литературе, которые были использованы при проведении тренировочных экзаменов в 2021–2023 годах, и убедились, что применявшаяся для обучения YandexGPT база данных не содержит ответов на них.
«Яндекс» представил YandexGPT 2 в начале сентября. Это улучшенная версия нейросети YandexGPT — она способна решать больше различных типов задач, также было улучшено качество ее ответов.
Изображение: «Яндекс»
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Тренды «Пухосос купить»: как россияне поверили в фейк, а бренды — заработали на меме 11 июня 2026, 19:59
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Бизнес Где в Москве искать «пухососов»: Яндекс Go превратил все такси на карте города в роботов из мема 11 июня 2026, 16:04
-
Банки ЦБ предложил втрое увеличить требования к минимальному капиталу банков — новые правила могут заработать с 2028 года 12 июня 2026, 19:00
-
Бизнес Кнопка «Войти через Google» — уже нарушение: юристы разъяснили закон о запрете авторизации через зарубежные сервисы 12 июня 2026, 16:00
-
Банки 19 июня ЦБ проведёт заседание по ключевой ставке: аналитики ожидают дальнейшего снижения — до 14% 12 июня 2026, 10:00
-
Туризм Россияне готовы путешествовать по стране, но не знают, куда ехать: главной проблемой оказался дефицит информации 11 июня 2026, 15:54
-
Реклама Т-Банк будет использовать банковские данные клиентов при показе рекламы — юристы говорят о правовых рисках 10 июня 2026, 14:00
-
Технологии Видеоигры стали второй по величине категорией UGC-контента на RUTUBE —на платформе работает 50 тыс. игровых каналов 08 июня 2026, 13:00
-
Технологии Яндекс Карты добавили 120 тыс. отметок о доступности мест маломобильным людям: данные обновляет ИИ — автоматически 05 июня 2026, 20:42
