52% ответов ChatGPT по программированию неверны — исследование
Но многие пользователи этого не замечают
В последние годы программисты стали чаще обращаться за помощью к чат-ботам, таким как ChatGPT от OpenAI. Это нанесло удар по Q&A-сервису Stack Overflow, который в прошлом году был вынужден уволить почти 30% персонала.
Однако, согласно исследованию Университета Пердью, представленному на конференции Computer-Human Interaction, ChatGPT — не самый лучший помощник. Выяснилось, что более половины его ответов по программированию неверны.
Ученые взяли более 517 вопросов со Stack Overflow, задали их ChatGPT и проанализировали его ответы. Вот что они обнаружили.
- 52% ответов содержат дезинформацию.
- 77% более многословны по сравнению с человеческими ответами.
- 78% в той или иной степени не соответствуют человеческим ответам.
Исследователи также опросили 12 программистов и выяснили, что те предпочитают ChatGPT в 35% случаев и не замечают ошибок в его ответах в 39% случаев. Возможная причина — стиль общения чат-бота.
В результате лингвистического анализа 2 тыс. случайно выбранных ответов ChatGPT выяснилось, что они «более формальные и аналитические», а также отражают «менее негативные настроения».
Читайте по теме:
92% владельцев компаний положительно оценивают применение ИИ для выполнения рабочих задач
Почему чат-боты выдумывают факты и как с этим бороться
«Последующие полуструктурированные интервью показали, что вежливый язык, четко сформулированные ответы как из учебников, а также полнота — одни из основных причин, по которым ответы ChatGPT кажутся более убедительными, поэтому участники ослабили бдительность и упустили из виду дезинформацию», — пишут исследователи.
Результаты показывают, что у ChatGPT по-прежнему есть серьезные недостатки. Однако это слабое утешение для людей, уволенных из Stack Overflow, а также программистов, которым приходится исправлять в коде ошибки, сделанные ИИ.
Фото на обложке: wutzkohphoto /
-
Партнёрский материал Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 26 июня 2026, 09:44
-
Бизнес Не из гаража, а почти из холодильника: история Geely 01 июля 2026, 14:58
-
Искусственный интеллект «Мы знаем 50 миллионов книг через их описания, а не содержание»: зачем Ленинке искусственный интеллект 26 июня 2026, 11:00
-
Бизнес 8 сервисов для продуктивности, которые рекомендуют топ-менеджеры 25 июня 2026, 22:36
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Технологии Прощание с эпохой Кука и ставка на агентов: конференция Apple WWDC 2026 12 июня 2026, 15:35
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Тренды Можно ли купить GTA 6 в России 02 июля 2026, 21:45
-
Искусственный интеллект В работе DeepSeek произошёл сбой — нейросеть не работает из-за «перегруженного сервера» 02 июля 2026, 12:37
-
Технологии Яндекс обновил приложение «Разговор» для людей с особенностями слуха и речи — теперь оно работает офлайн 02 июля 2026, 18:30
-
Технологии Apple выпустит 10 млн складных iPhone Ultra: ожидаемая стоимость устройства — $2500 02 июля 2026, 17:34
-
Искусственный интеллект Новая глава Яндекса: компания объединяет команды вокруг Алисы AI и назначает руководителя глобального Поиска 02 июля 2026, 14:29
-
Технологии VK и Яндекс обсуждают партнёрство в облачных технологиях — сделка даст компаниям статус крупнейшего игрока на рынке 01 июля 2026, 20:30
-
Технологии VK внедряет нейропоиск Discovery AI в Видео, Дзен и Mail — ИИ поможет искать пару и подбирать контент под интересы 01 июля 2026, 17:30
-
Искусственный интеллект Яндекс представил новую модель прогнозирования конверсий — система оценивает весь путь клиента до покупки 30 июня 2026, 11:00
-
Искусственный интеллект Яндекс представил платформу для создания ИИ-агентов — в чате с Алисой AI уже можно заказать такси или доставку 29 июня 2026, 14:48