Разрабатывающая чат-бота ChatGPT компания представила поискового робота GPTBot, который собирает информацию со всего интернета для тренировки новых языковых моделей компании.
ИИ-разработчик OpenAI запустил GPTBot — новый инструмент для сканирования веб-страниц, который может быть использован для улучшения будущих моделей ChatGPT. По словам компании, использование поискового робота повысит точность ответов и расширит возможности искусственного интеллекта.
Поисковой робот — это тип бота, который перебирает контент всех веб-сайтов в Интернете, структурирует его и затем заносит в свою базу. Такими инструментами обычно пользуются поисковики вроде Google и Яндекс.
По словам OpenAI, GPTBot будет собирать лишь общедоступные данные, фильтруя источники, которые собирают личную информацию или нарушают правила сервиса. Помимо этого, у бота не будет доступа к платному контенту.
Для тех, кто не хочет использовать свой сайт для тренировки будущих версий чат-бота ChatGPT, OpenAI представила инструкцию, которая призвана огородить контент от поискового робота. Для этого достаточно добавить в код сайта строки: «User-agent: GPTBot» и «Disallow: /».
Фото на обложке: Viralyft /
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 OpenAI будет использовать контент Reddit для обучения чат-ботов
- 2 Как изменится ChatGPT после выхода новой модели GPT-4o
- 3 Все, что вы хотели знать про судьбоносный для Generative AI судебный иск
- 4 Что будет с поисковыми системами через 5 лет и как seo-специалистам справиться с переменами
- 5 Искусственный интеллект vs SEO: кто кого?
ВОЗМОЖНОСТИ
18 мая 2024
19 мая 2024
19 мая 2024