Почему чат-боты выдумывают факты и как с этим бороться
Доверять, но проверять
Недавно американского адвоката привлекли к ответственности за то, что он использовал в суде цитаты из несуществующих дел — их ему предоставил ChatGPT. При этом, по словам адвоката, бот заверял, что эти дела все-таки реальны.
Это не уникальный случай — нейросети склонны к галлюцинациям, то есть выдумыванию и искажению фактов. Рассказываем, почему это происходит.
Галлюцинации ИИ возникают, когда он выдает ответ, который максимально близок к истине по имеющимся у него данным. Это происходит довольно часто.
«Галлюцинации начинаются, когда есть пробел в знаниях, и система выбирает наиболее статистически верную информацию», — рассказывает Пьер Харен, CEO и фаундер Causality Link.
Причины могут быть разными, но чаще всего это происходит, если бот обучался на относительно небольшой выборке и его не научили говорить, что он не знает ответа.
По словам Харена, ИИ «говорит то, что сильно отличается от реальности», но не знает об этом (и, соответственно, не лжет). «Возникает вопрос: в чем правда для мозга ChatGPT? Есть ли способ, с помощью которого система узнает, что отклоняется от истины?», — размышляет он.
Арвинд Джейн, CEO Glean, отмечает: важно помнить о том, что наиболее вероятный ответ не всегда является правильным.
К чему это может привести?
Во-первых, к распространению дезинформации, поскольку такие ответы кажутся реалистичными, хотя являются ложными.
Кроме того, может возникнуть эффект домино, если бот предоставляет неверную информацию по теме, которая несет за собой высокие риски. Поэтому эксперты рекомендует не использовать технологию, когда ошибки недопустимы.
«Думаю, сейчас создатели больших языковых моделей не обрадуются, если с помощью их системы кто-то будет управлять атомной электростанцией», — говорит Харен.
Читайте по теме:
Для обучения ИИ используют продукты интеллектуальной собственности. Законно ли это?
«Robotник» копирайтера: какие задачи можно доверить ChatGPT, а что лучше сделать самому
Однако бот может быть ненадежен и в других ситуациях. Так, если организация задействует предоставленную им дезинформацию в рекламной кампании, то рискует своей репутацией. Проблемы также могут возникнуть, если ИИ дает неправильный финансовый совет.
В целом, галлюцинации ИИ показывают, что технологию необходимо разрабатывать и развертывать ответственно, учитывая вопросы, связанные с этикой и безопасностью.
Какие меры можно предпринять?
«Как убедиться, что этот ответ верен? — говорит Клифф Юркевич, вице-президент по стратегии Phenom. — Этот вопрос остается за людьми. Но сейчас технологические компании вводят гарантии, чтобы прозрачно объяснить эти отношения».
Если замедлить развитие ИИ, можно принять меры, которые помогут использовать технологию безопасно. Джейн считает, что это особенно важно, поскольку когда модель выдает правильные ответы в большинстве случаев, люди начинают верить ей всегда.
«Когда модели правы, люди им доверяют, — говорит Джейн. — В этом и проблема ИИ. Как сделать так, чтобы люди не были слишком доверчивы?».
Первый шаг — сделать так, чтобы модели предоставляли источники, из которых взяли информацию.
Юркевич рассказывает: «Мой 7-летний ребенок может быстро справиться с задачей по математике, но ему нужно показать процесс решения. Откуда такой результат? Генеративный ИИ не должен стать исключением. Мы должны применять к нему те же стандарты, что и к людям».
По мнению экспертов, хороший девиз — доверять и проверять. Отсутствие второго может привести к распространению дезинформации.
«Если мы не будем проверять, то допустим нечто вроде эффекта Манделы, — говорит Юркевич. — Это будет казаться правдой, просто потому что никто не проверил, и все это говорят и повторяют».
Другой способ — попросить ИИ сообщать, когда он не знает ответа. По словам Смита, большие языковые модели стараются предоставить хоть какой-то результат, поскольку в противном случае не получают баллы.
«Нужно четко указать, что отсутствие ответа приемлемо, если информация не найдена в обучающих данных и в предоставленном контексте», — говорит Смит.
Кроме того, должна быть возможность сообщать о галлюцинациях и ошибках. Такой механизм реализован в ChatGPT: пользователь может поставить «палец вниз» рядом с ответом и написать, как его улучшить.
Обложка сгенерирована нейросетью Midjourney
-
Партнёрский материал Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 26 июня 2026, 09:44
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Тренды Главные мемы 2026 года и их значение 26 июня 2026, 21:10
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Искусственный интеллект «Мы знаем 50 миллионов книг через их описания, а не содержание»: зачем Ленинке искусственный интеллект 26 июня 2026, 11:00
-
Бизнес 8 сервисов для продуктивности, которые рекомендуют топ-менеджеры 25 июня 2026, 22:36
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Технологии BMW представила обновлённый автомобиль X5 — в линейке бренда впервые появился электрокроссовер 30 июня 2026, 19:52
-
IT Только 3% компаний перешли на отечественное оборудование — каждая третья всё ещё использует зарубежные решения 30 июня 2026, 17:30
-
Искусственный интеллект Яндекс представил новую модель прогнозирования конверсий — система оценивает весь путь клиента до покупки 30 июня 2026, 11:00
-
Искусственный интеллект Яндекс представил платформу для создания ИИ-агентов — в чате с Алисой AI уже можно заказать такси или доставку 29 июня 2026, 14:48
-
Бизнес В России могут ввести сбор за показ иностранных фильмов — деньги направят на поддержку отечественного кино 30 июня 2026, 21:03
-
Банки ВТБ представил стратегию развития до 2029 года — банк делает ставку на сотрудничество с Wildberries и ИИ-технологии 30 июня 2026, 19:30
-
Деньги «Вкусно — и точка» добавила возможность округлять сумму заказа — собранные средства направят на благотворительность 30 июня 2026, 17:00
-
Россия «Все сервисы работают в штатном режиме»: в Яндексе сообщили об устранении сбоя 30 июня 30 июня 2026, 15:05