52% ответов ChatGPT по программированию неверны — исследование
Но многие пользователи этого не замечают
В последние годы программисты стали чаще обращаться за помощью к чат-ботам, таким как ChatGPT от OpenAI. Это нанесло удар по Q&A-сервису Stack Overflow, который в прошлом году был вынужден уволить почти 30% персонала.
Однако, согласно исследованию Университета Пердью, представленному на конференции Computer-Human Interaction, ChatGPT — не самый лучший помощник. Выяснилось, что более половины его ответов по программированию неверны.
Ученые взяли более 517 вопросов со Stack Overflow, задали их ChatGPT и проанализировали его ответы. Вот что они обнаружили.
- 52% ответов содержат дезинформацию.
- 77% более многословны по сравнению с человеческими ответами.
- 78% в той или иной степени не соответствуют человеческим ответам.
Исследователи также опросили 12 программистов и выяснили, что те предпочитают ChatGPT в 35% случаев и не замечают ошибок в его ответах в 39% случаев. Возможная причина — стиль общения чат-бота.
В результате лингвистического анализа 2 тыс. случайно выбранных ответов ChatGPT выяснилось, что они «более формальные и аналитические», а также отражают «менее негативные настроения».
Читайте по теме:
92% владельцев компаний положительно оценивают применение ИИ для выполнения рабочих задач
Почему чат-боты выдумывают факты и как с этим бороться
«Последующие полуструктурированные интервью показали, что вежливый язык, четко сформулированные ответы как из учебников, а также полнота — одни из основных причин, по которым ответы ChatGPT кажутся более убедительными, поэтому участники ослабили бдительность и упустили из виду дезинформацию», — пишут исследователи.
Результаты показывают, что у ChatGPT по-прежнему есть серьезные недостатки. Однако это слабое утешение для людей, уволенных из Stack Overflow, а также программистов, которым приходится исправлять в коде ошибки, сделанные ИИ.
Фото на обложке: wutzkohphoto /
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Бизнес Анна Симакова: «В кризис выживают крупные структуры» 20 февраля 2026, 10:06
-
Бизнес «Точно розовый?»: как Eburet из табурета-трансформера вырос в B2B-бренд, который заходит на рынок в 50 млрд ₽ 11 февраля 2026, 19:48
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Бизнес Сергей Косинский: «Мне достался Франкенштейн, из которого попросили сделать нормального человека» 02 февраля 2026, 19:51
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Искусственный интеллект Ozon запустил ИИ-ассистента для продавцов — подобные инструменты уже развивают Яндекс Маркет и Wildberries 30 апреля 2026, 18:30
-
Искусственный интеллект 2 из 3 россиян планируют автопутешествие по России на майские: каждый четвёртый организует поездку с помощью ИИ 30 апреля 2026, 11:00
-
IT Почти 80% ИТ-специалистов в России развивают свои проекты — но только 3% полностью ушли из найма 30 апреля 2026, 19:30
-
Банки Банки в России будут реже выдавать кредиты рискованным заёмщикам: причина — рост просрочек по ипотеке 30 апреля 2026, 17:30
-
Банки Состояние неопределённости и флоатеры вместо фикса: участники Альфа-Саммита — о рынке капитала в 2026 году 30 апреля 2026, 14:40
-
Тренды Россияне тратят на зарубежный люкс в среднем 53 700 ₽ — чаще всего покупают Gucci и Louis Vuitton 30 апреля 2026, 13:05
-
Банки В I квартале 2026 года чистая прибыль «Дом.РФ» выросла на 83% — финансовые показатели превзошли прогнозы компании 30 апреля 2026, 11:45
-
Банки В Москве проходит Альфа-Саммит — топ-менеджеры обсуждают ключевые вызовы бизнеса и экономики 28 апреля 2026, 10:00