52% ответов ChatGPT по программированию неверны — исследование
Но многие пользователи этого не замечают
В последние годы программисты стали чаще обращаться за помощью к чат-ботам, таким как ChatGPT от OpenAI. Это нанесло удар по Q&A-сервису Stack Overflow, который в прошлом году был вынужден уволить почти 30% персонала.
Однако, согласно исследованию Университета Пердью, представленному на конференции Computer-Human Interaction, ChatGPT — не самый лучший помощник. Выяснилось, что более половины его ответов по программированию неверны.
Ученые взяли более 517 вопросов со Stack Overflow, задали их ChatGPT и проанализировали его ответы. Вот что они обнаружили.
- 52% ответов содержат дезинформацию.
- 77% более многословны по сравнению с человеческими ответами.
- 78% в той или иной степени не соответствуют человеческим ответам.
Исследователи также опросили 12 программистов и выяснили, что те предпочитают ChatGPT в 35% случаев и не замечают ошибок в его ответах в 39% случаев. Возможная причина — стиль общения чат-бота.
В результате лингвистического анализа 2 тыс. случайно выбранных ответов ChatGPT выяснилось, что они «более формальные и аналитические», а также отражают «менее негативные настроения».
Читайте по теме:
92% владельцев компаний положительно оценивают применение ИИ для выполнения рабочих задач
Почему чат-боты выдумывают факты и как с этим бороться
«Последующие полуструктурированные интервью показали, что вежливый язык, четко сформулированные ответы как из учебников, а также полнота — одни из основных причин, по которым ответы ChatGPT кажутся более убедительными, поэтому участники ослабили бдительность и упустили из виду дезинформацию», — пишут исследователи.
Результаты показывают, что у ChatGPT по-прежнему есть серьезные недостатки. Однако это слабое утешение для людей, уволенных из Stack Overflow, а также программистов, которым приходится исправлять в коде ошибки, сделанные ИИ.
Фото на обложке: wutzkohphoto /
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Искусственный интеллект В Санкт-Петербурге стартовал ПМЭФ–2026: форум посетят представители более 130 стран, в программе — более 150 сессий 03 июня 2026, 11:21
-
Деньги Создание сети 5G обойдётся российским операторам в 335 млрд ₽ — первые сети должны заработать в 2027 году 03 июня 2026, 14:30
-
Технологии Яндекс Пэй разрешил подтверждать подозрительные переводы через доверенное лицо — для защиты от мошенников 02 июня 2026, 19:30
-
Стартапы В Москве прошёл фестиваль Startup Village — стартапы заключили 50 соглашений о запуске проектов в РФ и за рубежом 02 июня 2026, 19:00
-
Технологии 84% российских приложений содержат критические уязвимости — проблемы всё чаще возникают из-за некорректного ИИ-кода 02 июня 2026, 17:10
-
Искусственный интеллект Яндекс запустил в Алисе AI новые детские режимы — нейросеть может оживить рисунок и проверить домашнее задание 01 июня 2026, 19:00
-
Россия В Минфине подтвердили планы по поэтапному повышению НДС на зарубежные товары: с 5% в 2027 году до 20% — к 2030-му 03 июня 2026, 16:24
-
Бизнес МТС впервые с 2009 года привлекла кредит от российских банков — сумма займа может достичь 70 млрд ₽ 02 июня 2026, 15:40