ИИ начал «чувствовать» нехватку данных, ограничения ужесточаются
Веб-источники минимизируют использование своих данных
Развитие индустрии ИИ столкнулось с очередным препятствием: начинается сокращение доступности данных, об этом пишет New York Times.
MIT под руководством Data Provenance Initiative было проведено исследование и выяснилось, что многие ключевые веб-источники стали ограничивать использование своих данных, это плохо влияет на обучение мощных систем.
Было проанализировано 14 000 доменов, которые используются в трех основных наборах данных для обучения ИИ. По результатам — был обнаружен значительный «зарождающийся кризис согласия». Известно, что за год примерно 5% всех данных и 25% данных самого высокого качества ограничиваются протоколом «исключения роботов» (Robots Exclusion Protocol) — этот инструмент владельцы сайтов используют для блокировки автоматических сборщиков данных.
А еще выяснилось, что почти 45% данных в наборе данных C4 отныне ограничиваются условиями обслуживания веб-сайтов.
Известно, что новые ограничения коснутся не только компаний, которые разрабатывают ИИ, но и исследователей, ученых и некоммерческие организации, использующие веб-данные.
Ранее мы писали о том, что такое «ИИ-пиар» и почему это стало проблемой.
Фото на обложке: chathuraanuradha /
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес «Малый бизнес драйвит всё»: как компании из Архангельска растут на терпении, связях и самоиронии 25 мая 2026, 18:03
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Технологии Отечественным компаниям предложили строить ЦОДы в Белоруссии — в России не хватает энергомощностей для дата-центров 29 мая 2026, 14:20
-
Бизнес SpaceX снизила оценку до $1,8 трлн — даже с такой капитализацией корпорация войдёт в топ-10 публичных компаний 29 мая 2026, 20:00
-
Россия Каждый второй россиянин испытывает стресс, когда разряжается телефон: главный страх — пропустить важную информацию 29 мая 2026, 19:45
-
Россия В Авито теперь можно оформить автокредит для покупки машин у частных продавцов — сервис уже доступен в 8 городах РФ 29 мая 2026, 19:00
-
Искусственный интеллект Яндекс Карты обновили пешие маршруты: ИИ построит безопасный, красивый и удобный для пользователя путь 29 мая 2026, 15:30
-
Искусственный интеллект Anthropic стала самым дорогим ИИ-стартапом в мире: оценка компании выросла до $965 млрд — и обогнала OpenAI 29 мая 2026, 13:57
-
Искусственный интеллект VK обновила алгоритмы рекомендаций: теперь посты чаще показывают пользователям — просмотры выросли в 5 раз 28 мая 2026, 13:36
-
Бизнес В 2026 году в России не открылось ни одного иностранного магазина — компании останавливает сложная логистика 29 мая 2026, 20:30