Top.Mail.Ru
Новости

ИИ начал «чувствовать» нехватку данных, ограничения ужесточаются

Новости
Николай Тихонов
Николай Тихонов

Бывший новостной редактор

Николай Тихонов

Развитие индустрии ИИ столкнулось с очередным препятствием: начинается сокращение доступности данных, об этом пишет New York Times.

ИИ начал «чувствовать» нехватку данных, ограничения ужесточаются
  1. Новости

MIT под руководством Data Provenance Initiative было проведено исследование и выяснилось, что многие ключевые веб-источники стали ограничивать использование своих данных, это плохо влияет на обучение мощных систем.

Было проанализировано 14 000 доменов, которые используются в трех основных наборах данных для обучения ИИ. По результатам — был обнаружен значительный «зарождающийся кризис согласия». Известно, что за год примерно 5% всех данных и 25% данных самого высокого качества ограничиваются протоколом «исключения роботов» (Robots Exclusion Protocol) — этот инструмент владельцы сайтов используют для блокировки автоматических сборщиков данных.

А еще выяснилось, что почти 45% данных в наборе данных C4 отныне ограничиваются условиями обслуживания веб-сайтов.

Известно, что новые ограничения коснутся не только компаний, которые разрабатывают ИИ, но и исследователей, ученых и некоммерческие организации, использующие веб-данные.

Ранее мы писали о том, что такое «ИИ-пиар» и почему это стало проблемой.

Фото на обложке: chathuraanuradha / pixabay.com

Освободите время и зарабатывайте больше с помощью ИИ! Пройдите курс и получите в подарок лучшие промты для решения бизнес-задач.

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

FutureFood
Кто производит «альтернативную» еду
Карта