ИИ переоценил логику человека: нейросети привлекли к эксперименту — в игре они ждали от людей большего и ошибались
ChatGPT-4o и Claude-Sonnet-4 переоценивают способности людей
ИИ выбирает «слишком умные» стратегии
Суть эксперимента в исследовании НИУ ВШЭ проста: в игре «Угадай число» участники называют число от 0 до 100, а выигрывает тот, кто назвал значение ближе к половине или трети среднего результата всех игроков. Чтобы победить, нужно не только выбрать число, но и понять, как будут действовать остальные.
Учёные НИУ ВШЭ привлекли к игре нейросети ChatGPT-4o и Claude-Sonnet-4. Им давали правила игры и описания участников: от первокурсников-экономистов до специалистов по теории игр. Каждую модель просили объяснить, почему она выбрала именно это число.
Во всех сериях эксперимента НИУ ВШЭ нейросети ChatGPT-4o и Claude-Sonnet-4 предполагали, что люди будут играть логичнее, чем это было в реальных замерах. Поэтому ИИ часто уходил в более «глубокие» стратегии и выбирал меньшие числа — в теории выигрышные, но никак не соответствующие поведению живых игроков.
Модели подстраиваются под разные группы
Несмотря на ошибки, аналитики НИУ ВШЭ отметили, что ИИ демонстрировал способность менять стратегию под профиль соперников. В партиях со специалистами по теории игр модели выбирали числа, близкие к нулю, — такие ответы обычно выигрывают у профессионалов, которые много рассуждают.
В играх с первокурсниками-экономистами ChatGPT-4o и Claude-Sonnet-4 выбирали заметно более высокие значения: такие варианты соответствовало ожиданию, что неопытные игроки не проводят глубокий стратегический анализ. ИИ также реагировал на заданный возраст, опыт и даже эмоциональное состояние участников, если оно описывалось в условиях — например, злость или грусть.
Гибкость, по выводам авторов исследования НИУ ВШЭ, показывает элементы стратегического мышления: модели ChatGPT-4o и Claude-Sonnet-4 не повторяют один шаблон, а меняют логику под ситуацию.
Игры вдвоём оказались проблемой
При этом ИИ не справился с более простой задачей — определением наилучшей стратегии в игре с двумя участниками. Исследователи НИУ ВШЭ отмечают, что нейросети не смогли выбрать оптимальный вариант, хотя ситуация с двумя игроками проще массовой игры.
Заведующий Научно-учебной лабораторией исследований спорта факультета экономических наук НИУ ВШЭ Дмитрий Дагаев по итогам исследования подчеркнул, что сегодня ИИ-модели уже берут на себя многие операции, которые раньше выполняли люди. По его словам, это повышает эффективность, но не отменяет необходимости контролировать, как именно алгоритмы принимают решения. В ситуациях, где требуется выбор стратегии или оценка поведения других участников, важно быть уверенными, что модель действует так, как действовал бы человек, и не уходит в нереалистичные рассуждения.
Контекст
По данным исследователей НИУ ВШЭ, экономисты давно используют игру «Угадай число» как модель реальных рынков: предсказать других участников — главная часть игры. Сейчас ИИ-модели, такие как ChatGPT-4o и Claude-Sonnet-4, тестируют не только на людях, но и на нейросетевых алгоритмах — чтобы понять, насколько ИИ умеет думать «как человек». Но, судя по результатам эксперимента НИУ ВШЭ, ИИ-модели пока уверены, что мы умнее, чем есть на самом деле.
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Технологии Прощание с эпохой Кука и ставка на агентов: конференция Apple WWDC 2026 12 июня 2026, 15:35
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Тренды Загородный рынок — 2026: тренды, цены и возможности для покупателей и инвесторов 03 июня 2026, 12:16
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Искусственный интеллект Разработчик DeepSeek увеличил свою оценку до $50 млрд — стартап стал самым дорогим ИИ-проектом в Китае 16 июня 2026, 16:00
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
-
IT Разработчик облачных сервисов Cloud.ru готовится к первому размещению облигаций — его объём оценивают в 10 млрд ₽ 16 июня 2026, 14:11
-
Россия 77% россиян покупают локальные бренды: часто товары местных производителей выбирает молодёжь — для самовыражения 16 июня 2026, 11:40
-
Россия 2ГИС запустил «Ленту друзей» — теперь пользователи могут увидеть отзывы и рекомендации мест от знакомых 16 июня 2026, 15:00
-
Искусственный интеллект 93% россиян используют ИИ в рабочей переписке: чаще всего — для формулировки аргументов при конфликтах 15 июня 2026, 20:00
-
Маркетплейсы Ozon погасил 7,4 млн акций, выпущенных для мотивации сотрудников — компания устранила размытие капитала 16 июня 2026, 19:00
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01