Отечественных разработчиков ИИ хотят обязать раскрывать, на каких данных они обучают и тестируют свои модели, сообщают «Ведомости». Инициативу обсуждают представители отрасли, ИТ-компании и регуляторы в рамках подготовки закона об искусственном интеллекте. В случае принятия документа компании должны будут раскрывать происхождение данных, объём их использования и цели применения.

Минцифры обсуждает создание общего реестра для ИИ

По информации «Ведомостей», в одной из версий законопроекта Минцифры предлагало ввести обязательную отчётность для разработчиков ИИ. Компании должны были бы детально описывать наборы данных, на которых обучаются нейросети: название массива, дату создания, формат и объём. Также предполагалось раскрывать источник данных и цель их использования. Сейчас обсуждаются механизмы сбора информации — рассматривается создание либо единого реестра российских ИИ-решений, либо отдельного реестра наборов данных.

При этом представитель министерства подтвердил «Ведомостям», что в текущей версии документа таких требований нет. Законопроект носит рамочный характер, а конкретные механизмы регулирования пока находятся в стадии обсуждения и окончательно не закреплены.

Какую нейросеть считать российской — решит новый законопроект

Правительство разрабатывает правила регулирования искусственного интеллекта. В частности, планируется определить критерии, по которым нейросеть будет считаться «российской». Также прорабатываются вопросы авторских прав, маркировки ИИ-контента и ответственности разработчиков. В аппарате вице-премьера Дмитрия Григоренко ранее подчёркивали в беседе с «Ведомостями», что главная задача инициативы — сохранить гибкость регулирования и не допустить использования ИИ в незаконных целях.

Ранее Минцифры также заявляло о планах создать реестр доверенного ИИ для критической инфраструктуры, однако судьба этой инициативы остаётся неопределённой, пишут «Ведомости».

Бизнес предупреждает: маркировка ИИ-данных может стать формальной нагрузкой

Представитель Альянса в сфере развития ИИ, куда входят крупнейшие IT-компании России, указал на проблему избыточной формализации требований. По его словам, детальное описание огромных массивов данных либо потребует значительных затрат, либо превратится в формальную отчётность без практической пользы.

Эксперты Cloud.ru в разговоре с «Ведомостями» отметили, что инициатива способна повысить доверие к моделям и стандартизировать отчётность, однако создаст дополнительную нагрузку на разработчиков. Особенно ощутимой она станет, если закон потребует регулярного обновления отчётности. При этом, по их оценке, темпы технологического развития будут опережать законодательные изменения, что может замедлить вывод сервисов на рынок.

Раскрытие данных для ИИ сформирует новый рынок и затронет OpenAI, Microsoft и Perplexity

Как сообщают «Ведомости», раскрытие источников данных для обучения моделей может стать мощным толчком к развитию полноценного рынка данных. Сегодня разработчики часто берут открытые массивы без явного согласия правообладателей — это создает правовую неопределённость и риски. Если же такие требования закрепят законодательно, участникам рынка придётся активнее заключать лицензионные договоры и выстраивать прозрачные отношения с поставщиками контента.

Если новые правила коснутся всех публичных сервисов, формально требования могут затронуть не только российских игроков, но и крупные международные компании — например, OpenAI, Microsoft и Perplexity AI. При этом эксперты полагают, что некоторые зарубежные разработчики могут отказаться раскрывать информацию о своих данных.