Разрабатывающая чат-бота ChatGPT компания представила поискового робота GPTBot, который собирает информацию со всего интернета для тренировки новых языковых моделей компании.
ИИ-разработчик OpenAI запустил GPTBot — новый инструмент для сканирования веб-страниц, который может быть использован для улучшения будущих моделей ChatGPT. По словам компании, использование поискового робота повысит точность ответов и расширит возможности искусственного интеллекта.
Поисковой робот — это тип бота, который перебирает контент всех веб-сайтов в Интернете, структурирует его и затем заносит в свою базу. Такими инструментами обычно пользуются поисковики вроде Google и Яндекс.
По словам OpenAI, GPTBot будет собирать лишь общедоступные данные, фильтруя источники, которые собирают личную информацию или нарушают правила сервиса. Помимо этого, у бота не будет доступа к платному контенту.
Для тех, кто не хочет использовать свой сайт для тренировки будущих версий чат-бота ChatGPT, OpenAI представила инструкцию, которая призвана огородить контент от поискового робота. Для этого достаточно добавить в код сайта строки: «User-agent: GPTBot» и «Disallow: /».
Фото на обложке: Viralyft /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 OpenAI начала тестировать GPT-5 на части корпоративных клиентов
- 2 OpenAI ведет разработку GPT-5 — Сэм Альтман
- 3 OpenAI пока не начала обучение GPT-5
- 4 OpenAI оформила кредитную линию на $4 млрд в дополнение к инвестициям в $6,6 млрд
- 5 OpenAI получила оценку в $157 млрд по итогам инвестиционного раунда на $6,6 млрд
ВОЗМОЖНОСТИ
07 октября 2024
10 октября 2024
10 октября 2024