Колонки 14 июля 2023

Ключ к разговору: как эффективно общаться с ChatGPT с помощью промтов

Колонки 14 июля 2023

Антон Сипачев

Руководитель отдела разработки Just AI

Алина Алещенко

С недавних пор нейросети, а в особенности, ChatGPT, стали многозадачными ИИ-помощниками, доступными любому пользователю. Но для того, чтобы получить точный ответ, необходимо дать нейросети как можно больше вводных, то есть написать качественную подсказку или промт. Чем детальнее подсказки, тем с более конкретной информацией работает нейросеть. LLM (Large Language Model) типа GPT-3 представляют собой наборы огромного количество данных, и без подробных подсказок нейронная сеть может с трудом понять нюансы вопроса и выдать неправильный или не относящийся к делу ответ, то есть начать галлюцинировать.

Умение писать правильные промты напрямую определяет способность извлекать ценность от работы с нейросетями. В этом материале Антон Сипачев, руководитель отдела разработки Just AI, рассказал о методах написания промта для получения от ИИ-модели качественной информации, а также предотвращения галлюцинаций.

Подписаться на RB.RU в Telegram

Сначала обозначу ограничения ChatGPT:

Он не знает ничего, что произошло после 2021 года, так как обучается на огромной базе данных с обновленными данными до 2021 года. Для того, чтобы нейросеть получала данные из интернета в реальном времени, можно установить расширение Bing AI на базе ChatGPT в браузере Microsoft Edge.
ChatGPT обучался на данных многих языков, но количество англоязычного текста в обучающих материалах намного больше. Для получения более качественных ответов лучше вести диалог на английском, а потом переводить ответ с помощью переводчика.
ChatGPT имеет лимит на количество токенов (слов или символов) в одном запросе или ответе. Он зависит от используемой версии: 4000 токенов для ChatGPT-3.5 и 8000 токенов для ChatGPT-4.
Если во время диалога с ИИ вы обменялись слишком большим объемом знаний, лучше начать новый чат, чтобы последующие ответы не были повреждены.
Большую часть времени ChatGPT загружен из-за большого количества трафика, придется подождать, чтобы получить ответ. Если времени на ожидание нет, то можете подключить премиальную подписку.

Техника shot prompting

Промты для ИИ отличаются по сложности: от фразы или вопроса до текста, состоящего из нескольких абзацев. Чем меньше усилий вы вкладываете в формулировку подсказки СhatGPT, тем меньше усилий в нее вкладывает ИИ. «Нулевые» подсказки часто приводят к неудовлетворительным результатам, потому что ИИ приходится принимать слишком много решений.

Zero shot prompting — такую подсказку ИИ использует в качестве механизма автозаполнения, то есть модели предоставляется полная свобода действий. Четкого структурированного ответа в таком случае ждать не стоит.

One shot prompting — вы даете ИИ пример желаемого результата. Одноразовая подсказка используется для создания текста на естественном языке с ограниченным объемом входных данных, таких как один пример или шаблон. Такой тип подсказок полезен, если вам нужен определенный формат ответа.

Читайте по теме: Сможет ли GPT заменить менеджера проектов — эксперимент

Few shots prompting — это метод, при котором модели дается небольшое количество примеров, обычно от двух до пяти, чтобы быстро адаптироваться к новым примерам ранее увиденных объектов.

Промтинг от галлюцинаций

Одной из самых больших проблем систем генеративного ИИ — галлюцинации. Этот термин используется для явления, когда нейросеть выдает результаты, которые не соответствуют реальности, каким-либо данным или другому идентифицируемому шаблону. Чаще всего ИИ начинает галлюцинировать, когда ему не хватает информации для ответа на ваш запрос.

Какие еще причины стоят за галлюцинациями ИИ?

Вероятностный характер. Генеративные модели, такие как GPT, основаны на вероятностных методах, которые предсказывают следующий токен, то есть слово или символ в последовательности с учетом контекста. Они оценивают вероятность появления каждого слова и отбирают следующее на основе этих вероятностей.

Этот процесс выборки иногда может приводить к непредсказуемым и неправдоподобным выводам, поскольку модель может выбирать менее вероятные слова или фразы, что в итоге приводит к галлюцинации. ChatGPT не обучен говорить: «Я не знаю», когда ему не хватает информации. Вместо этого он выдает наиболее вероятный ответ.

Отсутствие достоверной информации. Большинство языковых моделей, которые мы используем, не имеют возможности сверять факты в своих выходных данных с проверенным источником в режиме реального времени, поскольку у них нет доступа в интернет. Это затрудняет модели проверку информации на соответствие действительности.

Комплексность модели. Современные генеративные модели, такие как GPT-3, имеют миллиарды параметров, которые делают их способными фиксировать сложные закономерности в данных. Однако эта сложность также может привести к переоснащению и запоминанию нерелевантных или ложных паттернов, вызывая галлюцинации в генерируемых ответах.

ИИ может создавать убедительные и реалистичные галлюцинации, которые могут ввести людей в заблуждение и привести к распространению ложной информации.

Основные методы противодействия галлюцинациям системы связаны с инженерией подсказок — назначение ИИ роли, предоставление контекста и ограничений, указание Tone of voice и т. д. Однако для решения комплексных задач таких методов может быть недостаточно. Тогда можно прибегать к более сложной структуре подсказок, например, дереву мыслей (ToTTree of Thoughts).

Рабочий метод: древо мыслей (ToT)

Метод ToT работает следующим образом: исходная задача декомпозируется на компоненты, которые система сама раскрывает и анализирует, то есть модель разбивает процесс решения проблемы на серию более мелких шагов или «мыслей», что делает их более управляемым.

Работа над каждым компонентом — промежуточный шаг для решения первоначальной комплексной проблемы. Этот подход позволяет нейросети рассматривать несколько разных путей рассуждений или подходов к решению задачи.

Примером может служить промт, в которой три эксперта рассуждают о вопросе, делятся своими мыслями и находят наиболее оптимальный вариант. Активировать метод ToT лучше на английском языке. Вопрос: «С чего начать создание стартапа на базе ИИ?».

Кажется, что процесс рассуждения модели начинается как обычно, но по ходу размышления модель взвешивает все за и против каждого своего утверждения и предоставляет дополнительную информацию, отталкиваясь от своих же наработок.

Далее в разговор вступает второй эксперт, который, также отталкиваясь от рассуждений предыдущего, продолжает отвечать на главный вопрос.

Рассуждения продолжатся до тех пор, пока модель не найдет самый оптимальный вариант для финального ответа.

После рассмотрения вопроса со всех сторон и детального обсуждения каждого шага модель приходит к общему выводу, который помогает финализировать полученную в ходе размышления информацию. Структура дерева мыслей предназначена для расширения возможностей и решения проблем языковых моделей за счет обеспечения более гибкого и стратегического принятия решений.

Фото на обложке и иллюстрации предсотавлены автором

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

ВОЗМОЖНОСТИ

18 мая 2024

ЛЕТС ХАК

19 мая 2024

5G Умный город

19 мая 2024

Питч-сессия стартапов от «Ростелекома»

Все ВОЗМОЖНОСТИ

Истории

Ключ к разговору: как эффективно общаться с ChatGPT с помощью промтов

Техника shot prompting

Промтинг от галлюцинаций

Рабочий метод: древо мыслей (ToT)

Материалы по теме

ВОЗМОЖНОСТИ

Популярное

4 распространенные ошибки в резюме, которые мешают получить работу

Топ лучших смартфонов 2024 года

11 приложений для поиска секс-партнера

«Дзен» начал тестировать монетизацию контента авторов по подписке

Не работает Telegram? 12 способов устранить проблемы с приложением