ИИ переоценил логику человека: нейросети привлекли к эксперименту — в игре они ждали от людей большего и ошибались
ChatGPT-4o и Claude-Sonnet-4 переоценивают способности людей
ИИ выбирает «слишком умные» стратегии
Суть эксперимента в исследовании НИУ ВШЭ проста: в игре «Угадай число» участники называют число от 0 до 100, а выигрывает тот, кто назвал значение ближе к половине или трети среднего результата всех игроков. Чтобы победить, нужно не только выбрать число, но и понять, как будут действовать остальные.
Учёные НИУ ВШЭ привлекли к игре нейросети ChatGPT-4o и Claude-Sonnet-4. Им давали правила игры и описания участников: от первокурсников-экономистов до специалистов по теории игр. Каждую модель просили объяснить, почему она выбрала именно это число.
Во всех сериях эксперимента НИУ ВШЭ нейросети ChatGPT-4o и Claude-Sonnet-4 предполагали, что люди будут играть логичнее, чем это было в реальных замерах. Поэтому ИИ часто уходил в более «глубокие» стратегии и выбирал меньшие числа — в теории выигрышные, но никак не соответствующие поведению живых игроков.
Модели подстраиваются под разные группы
Несмотря на ошибки, аналитики НИУ ВШЭ отметили, что ИИ демонстрировал способность менять стратегию под профиль соперников. В партиях со специалистами по теории игр модели выбирали числа, близкие к нулю, — такие ответы обычно выигрывают у профессионалов, которые много рассуждают.
В играх с первокурсниками-экономистами ChatGPT-4o и Claude-Sonnet-4 выбирали заметно более высокие значения: такие варианты соответствовало ожиданию, что неопытные игроки не проводят глубокий стратегический анализ. ИИ также реагировал на заданный возраст, опыт и даже эмоциональное состояние участников, если оно описывалось в условиях — например, злость или грусть.
Гибкость, по выводам авторов исследования НИУ ВШЭ, показывает элементы стратегического мышления: модели ChatGPT-4o и Claude-Sonnet-4 не повторяют один шаблон, а меняют логику под ситуацию.
Игры вдвоём оказались проблемой
При этом ИИ не справился с более простой задачей — определением наилучшей стратегии в игре с двумя участниками. Исследователи НИУ ВШЭ отмечают, что нейросети не смогли выбрать оптимальный вариант, хотя ситуация с двумя игроками проще массовой игры.
Заведующий Научно-учебной лабораторией исследований спорта факультета экономических наук НИУ ВШЭ Дмитрий Дагаев по итогам исследования подчеркнул, что сегодня ИИ-модели уже берут на себя многие операции, которые раньше выполняли люди. По его словам, это повышает эффективность, но не отменяет необходимости контролировать, как именно алгоритмы принимают решения. В ситуациях, где требуется выбор стратегии или оценка поведения других участников, важно быть уверенными, что модель действует так, как действовал бы человек, и не уходит в нереалистичные рассуждения.
Контекст
По данным исследователей НИУ ВШЭ, экономисты давно используют игру «Угадай число» как модель реальных рынков: предсказать других участников — главная часть игры. Сейчас ИИ-модели, такие как ChatGPT-4o и Claude-Sonnet-4, тестируют не только на людях, но и на нейросетевых алгоритмах — чтобы понять, насколько ИИ умеет думать «как человек». Но, судя по результатам эксперимента НИУ ВШЭ, ИИ-модели пока уверены, что мы умнее, чем есть на самом деле.
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Командировки в 2026 году: как экономить на деловых поездках, не жертвуя комфортом сотрудников 13 мая 2026, 10:00
-
Бизнес «Малый бизнес драйвит всё»: как компании из Архангельска растут на терпении, связях и самоиронии 25 мая 2026, 18:03
-
Маркетинг Диджитал-маркетинг: что это такое и как работает в 2026 году 23 мая 2026, 19:00
-
Искусственный интеллект Yandex B2B Tech запустит ИИ-сервис VibeCraft: он сможет создавать сайты и приложения по описанию пользователя 27 мая 2026, 11:34
-
Искусственный интеллект Российские поисковики не пойдут по пути Google: ссылочная выдача сохранится — её не заменят ответы ИИ 26 мая 2026, 19:00
-
Банки Сбер запустил сервис для безопасной покупки авто с пробегом — но пока купить машину можно только в кредит 27 мая 2026, 19:15
-
Искусственный интеллект В России продали 200 тыс. машин LADA с ИИ-ассистентом Алисой: частые запросы — построить маршрут и включить музыку 27 мая 2026, 18:45
-
Тренды ИИ вытесняет «белых воротничков»: конкуренция за рабочие места у топ-менеджеров оказалась выше, чем у сварщиков 27 мая 2026, 18:00
-
Россия В работе «Яндекс Диска» произошёл сбой 27 мая — пользователи не могут загрузить и скачать файлы 27 мая 2026, 16:12
-
IT Выручка российского ИТ-рынка впервые за несколько лет снизилась — сектор потерял 60 млрд ₽ за 2025 год 25 мая 2026, 19:30
-
IT «Теперь все ищут не единорогов, а рабочих лошадок»: IT-рынок вошёл в зрелую стадию — инвестиции стали прагматичнее 21 мая 2026, 12:00