Почему чат-боты выдумывают факты и как с этим бороться
Доверять, но проверять
Недавно американского адвоката привлекли к ответственности за то, что он использовал в суде цитаты из несуществующих дел — их ему предоставил ChatGPT. При этом, по словам адвоката, бот заверял, что эти дела все-таки реальны.
Это не уникальный случай — нейросети склонны к галлюцинациям, то есть выдумыванию и искажению фактов. Рассказываем, почему это происходит.
Галлюцинации ИИ возникают, когда он выдает ответ, который максимально близок к истине по имеющимся у него данным. Это происходит довольно часто.
«Галлюцинации начинаются, когда есть пробел в знаниях, и система выбирает наиболее статистически верную информацию», — рассказывает Пьер Харен, CEO и фаундер Causality Link.
Причины могут быть разными, но чаще всего это происходит, если бот обучался на относительно небольшой выборке и его не научили говорить, что он не знает ответа.
По словам Харена, ИИ «говорит то, что сильно отличается от реальности», но не знает об этом (и, соответственно, не лжет). «Возникает вопрос: в чем правда для мозга ChatGPT? Есть ли способ, с помощью которого система узнает, что отклоняется от истины?», — размышляет он.
Арвинд Джейн, CEO Glean, отмечает: важно помнить о том, что наиболее вероятный ответ не всегда является правильным.
К чему это может привести?
Во-первых, к распространению дезинформации, поскольку такие ответы кажутся реалистичными, хотя являются ложными.
Кроме того, может возникнуть эффект домино, если бот предоставляет неверную информацию по теме, которая несет за собой высокие риски. Поэтому эксперты рекомендует не использовать технологию, когда ошибки недопустимы.
«Думаю, сейчас создатели больших языковых моделей не обрадуются, если с помощью их системы кто-то будет управлять атомной электростанцией», — говорит Харен.
Читайте по теме:
Для обучения ИИ используют продукты интеллектуальной собственности. Законно ли это?
«Robotник» копирайтера: какие задачи можно доверить ChatGPT, а что лучше сделать самому
Однако бот может быть ненадежен и в других ситуациях. Так, если организация задействует предоставленную им дезинформацию в рекламной кампании, то рискует своей репутацией. Проблемы также могут возникнуть, если ИИ дает неправильный финансовый совет.
В целом, галлюцинации ИИ показывают, что технологию необходимо разрабатывать и развертывать ответственно, учитывая вопросы, связанные с этикой и безопасностью.
Какие меры можно предпринять?
«Как убедиться, что этот ответ верен? — говорит Клифф Юркевич, вице-президент по стратегии Phenom. — Этот вопрос остается за людьми. Но сейчас технологические компании вводят гарантии, чтобы прозрачно объяснить эти отношения».
Если замедлить развитие ИИ, можно принять меры, которые помогут использовать технологию безопасно. Джейн считает, что это особенно важно, поскольку когда модель выдает правильные ответы в большинстве случаев, люди начинают верить ей всегда.
«Когда модели правы, люди им доверяют, — говорит Джейн. — В этом и проблема ИИ. Как сделать так, чтобы люди не были слишком доверчивы?».
Первый шаг — сделать так, чтобы модели предоставляли источники, из которых взяли информацию.
Юркевич рассказывает: «Мой 7-летний ребенок может быстро справиться с задачей по математике, но ему нужно показать процесс решения. Откуда такой результат? Генеративный ИИ не должен стать исключением. Мы должны применять к нему те же стандарты, что и к людям».
По мнению экспертов, хороший девиз — доверять и проверять. Отсутствие второго может привести к распространению дезинформации.
«Если мы не будем проверять, то допустим нечто вроде эффекта Манделы, — говорит Юркевич. — Это будет казаться правдой, просто потому что никто не проверил, и все это говорят и повторяют».
Другой способ — попросить ИИ сообщать, когда он не знает ответа. По словам Смита, большие языковые модели стараются предоставить хоть какой-то результат, поскольку в противном случае не получают баллы.
«Нужно четко указать, что отсутствие ответа приемлемо, если информация не найдена в обучающих данных и в предоставленном контексте», — говорит Смит.
Кроме того, должна быть возможность сообщать о галлюцинациях и ошибках. Такой механизм реализован в ChatGPT: пользователь может поставить «палец вниз» рядом с ответом и написать, как его улучшить.
Обложка сгенерирована нейросетью Midjourney
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Технологии Отечественным компаниям предложили строить ЦОДы в Белоруссии — в России не хватает энергомощностей для дата-центров 29 мая 2026, 14:20
-
Бизнес SpaceX снизила оценку до $1,8 трлн — даже с такой капитализацией корпорация войдёт в топ-10 публичных компаний 29 мая 2026, 20:00
-
Россия Каждый второй россиянин испытывает стресс, когда разряжается телефон: главный страх — пропустить важную информацию 29 мая 2026, 19:45
-
Россия В Авито теперь можно оформить автокредит для покупки машин у частных продавцов — сервис уже доступен в 8 городах РФ 29 мая 2026, 19:00
-
Искусственный интеллект Яндекс Карты обновили пешие маршруты: ИИ построит безопасный, красивый и удобный для пользователя путь 29 мая 2026, 15:30
-
Маркетплейсы Wildberries запустит продажи товаров из Индии и Южной Кореи — в компании видят тренд «на всё корейское» 29 мая 2026, 21:00
-
Маркетплейсы Россияне смогут жаловаться на Ozon и Wildberries через Госуслуги: доступные темы обращений — проблемы с возвратами 29 мая 2026, 18:26
-
Бизнес «Аэрофлот» рекомендовал выплатить дивиденды за 2025 год в размере 21 млрд ₽ — это 100% скорректированной прибыли 29 мая 2026, 16:20