ИИ начал «чувствовать» нехватку данных, ограничения ужесточаются
Веб-источники минимизируют использование своих данных
Развитие индустрии ИИ столкнулось с очередным препятствием: начинается сокращение доступности данных, об этом пишет New York Times.
MIT под руководством Data Provenance Initiative было проведено исследование и выяснилось, что многие ключевые веб-источники стали ограничивать использование своих данных, это плохо влияет на обучение мощных систем.
Было проанализировано 14 000 доменов, которые используются в трех основных наборах данных для обучения ИИ. По результатам — был обнаружен значительный «зарождающийся кризис согласия». Известно, что за год примерно 5% всех данных и 25% данных самого высокого качества ограничиваются протоколом «исключения роботов» (Robots Exclusion Protocol) — этот инструмент владельцы сайтов используют для блокировки автоматических сборщиков данных.
А еще выяснилось, что почти 45% данных в наборе данных C4 отныне ограничиваются условиями обслуживания веб-сайтов.
Известно, что новые ограничения коснутся не только компаний, которые разрабатывают ИИ, но и исследователей, ученых и некоммерческие организации, использующие веб-данные.
Ранее мы писали о том, что такое «ИИ-пиар» и почему это стало проблемой.
Фото на обложке: chathuraanuradha /
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Искусственный интеллект ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — это уже базовый минимум индустрии 08 февраля 2026, 08:00
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Банки Как усилить рост бизнеса и получать пассивный доход: обзор партнёрской программы Альфа-Банка 16 апреля 2026, 14:00
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Искусственный интеллект Ozon запустил ИИ-ассистента для продавцов — подобные инструменты уже развивают Яндекс Маркет и Wildberries 30 апреля 2026, 18:30
-
Искусственный интеллект Преподаватели научились готовить ИИ-контент для уроков за 4 минуты — спрос на обучение с нейросетями вырос на 63% 01 мая 2026, 16:00
-
Деньги В России начнут регулировать рынок криптовалют — эксперты предупреждают, что законопроект не избавит от серых схем 01 мая 2026, 19:00
-
Тренды Эксперты опровергли падение цен в новостройках на 30%: рынок недвижимости в стагнации — но не более 01 мая 2026, 13:00
-
Бизнес Выручка онлайн-кинотеатров в 2025 году выросла почти на 40% — подписки остаются главным источником дохода 01 мая 2026, 10:00
-
Карьера 89% россиян не против переработок за дополнительную плату: каждый третий готов работать сверхурочно ради идеи 30 апреля 2026, 20:00
-
Банки Состояние неопределённости и флоатеры вместо фикса: участники Альфа-Саммита — о рынке капитала в 2026 году 30 апреля 2026, 14:40
-
Банки В Москве проходит Альфа-Саммит — топ-менеджеры обсуждают ключевые вызовы бизнеса и экономики 28 апреля 2026, 10:00