Как не позволить ИИ использовать ваши селфи для обучения
Намеренные искажения и «искаженные примеры»
Мало кто задумывается, как различные корпорации используют наши данные в своих целях. Системы распознавания лиц и алгоритмы обучаются на фотографиях без нашего согласия. Однако новые инструменты могут помешать этому. Вот некоторые из них.
Компания Clearview предоставила правоохранительным органам США инструмент распознавания лиц, обученный на общедоступных фотографиях миллионов людей. Но, вероятно, это было только начало. Любой, у кого есть базовые навыки программирования, может разработать ПО для распознавания лиц. Это означает, что сейчас существует больше возможностей для злоупотребления технологиями, чем когда-либо.
Ряд исследователей выступают против и разрабатывают инструменты, которые смогут помешать обучению ИИ на личных данных пользователей. Две последних разработки были представлены на ICLR, ведущей конференции по искусственному интеллекту.
«Мне не нравится, что мои данные используют другие люди», — замечает Эмили Венгер из Чикагского университета, которая вместе со своими коллегами разработала Fawkes. Это один из первых инструментов такого рода.
Часто пользователи намеренно искажают данные или удаляют их, чтобы затруднить работу моделям машинного обучения. Но чтобы оказать ощутимое влияние, потребуется участие сотен тысяч людей. Однако новые инструменты могут самостоятельно вносить искажения в фотографии.
«Этот инструмент может использоваться человеком в качестве ключа для блокировки данных», — говорит Сара Эрфани из Мельбурнского университета в Австралии.
«Это новая технология для защиты цифровых прав людей в эпоху искусственного интеллекта», — добавляет Эрфани.
Большинство инструментов, включая Fawkes, используют один и тот же базовый подход. Они вносят мелкие изменения в изображение, которые трудно заметить человеческим глазом. Благодаря этому ИИ неверно идентифицирует объекты на фотографии. Этот метод очень близок к разновидности состязательной атаки, когда небольшие изменения входных данных влияют на работу моделей глубокого обучения.
Инструмент Fawkes делает именно это. Загрузите в программу селфи, и она добавит пиксельные искажения, которые не позволят современным системам распознавания лиц идентифицировать, кто находится на фотографиях. При этом изменения останутся незаметными для человеческого глаза.
Венгер и ее коллеги протестировали свою разработку на нескольких широко используемых коммерческих системах распознавания лиц, включая Amazon AWS Rekognition, Microsoft Azure и Face ++, разработанную китайской компанией Megvii Technology. Небольшой эксперимент с 50 изображениями доказал 100% эффективность Fawkes. Системы распознавания не смогли определить, что находится на измененных фотографиях, при том, что первоначальные изображения были идентифицированы верно.
Fawkes насчитывает уже около 500 тысяч загрузок. Один пользователь также создал онлайн-версию инструмента, что сделало его еще более доступным. По словам Венгера, мобильного приложения еще нет, но ничто не мешает его разработать, так как код программы открыт.
Фото: Unsplash
Fawkes не позволяет новым системам распознавать лица на фотографиях, но он не влияет на те ИИ, которые уже были обучены на незащищенных изображениях. Однако технология все время улучшается. Венгер считает, что новый инструмент LowKey, разработанный Валерией Черепановой и ее коллегами из Университета Мэриленда, может решить эту проблему.
LowKey расширяет возможности Fawkes. Работа программы построена на более эффективном виде состязательной атаки, которая также обманывает предварительно обученные коммерческие модели. Как и Fawkes, LowKey также доступен в интернете.
Вместе с Дэниелом Ма из Университета Дикина и исследователями из Университета Мельбурна и Пекинского университета, Эрфани разработала способ превращать изображения в «искаженные примеры», которые фактически заставляют ИИ полностью игнорировать селфи.
«Fawkes заставляет системы распознавания лиц ошибаться, анализируя ваши фото, а этот инструмент не позволяет ИИ ничего узнавать о вас», — говорит Венгер.
В отличие от Fawkes и его последователей, «искаженные примеры» не основаны на состязательных атаках. Вместо того, чтобы вносить искажения в изображение, которые заставляют ИИ совершать ошибку, инструмент Дэниела Ма добавляет крошечные изменения, которые заставляют ИИ игнорировать его во время обучения. То есть модель впоследствии даст оценку фотографии совершенно случайным образом.
«Искаженные примеры» могут оказаться более эффективными, чем состязательные атаки, поскольку ИИ нельзя натренировать обходить их. Чем больше искаженных примеров видит алгоритм, тем лучше он их распознает. Но поскольку инструмент Эрфани в первую очередь препятствуют обучению, ИИ не сможет распознать изображения.
Изображения из интернета (верхний ряд) и «искаженные примеры» (нижний ряд)
Фото: Сара Эрфани, Дэниел Ма и коллеги
Команда Венгер недавно заметила, что некоторые изображения больше не могут обходить систему распознавания лиц Microsoft Azure. «Она внезапно стала устойчива к искаженным фотографиям, — говорит исследователь. — Мы не знаем, что случилось».
Возможно, Microsoft изменила алгоритм или ИИ. Либо же система, обученная на основе измененных фотографий, научилась их обходить. Недавно разработчики Fawkes выпустили обновление для своего инструмента, которое снова не позволяет Azure распознавать фотографии. «Это похоже на игру в кошки-мышки, — добавляет Венгер. — Такие компании, как Clearview, извлекают выгоду из того, что они считают свободно доступными данными, и используют их для любых целей».
Урегулирование данного вопроса может помочь в долгосрочной перспективе, но это не помешает организациям использовать различные лазейки. «Всегда будет разрыв между тем, что приемлемо с юридической точки зрения, и тем, чего на самом деле хотят люди, — рассуждает она. — Инструменты вроде Fawkes восполняют этот пробел».
Фото на обложке: kwanchaidp /
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Искусственный интеллект В России продали 200 тыс. машин LADA с ИИ-ассистентом Алисой: частые запросы — построить маршрут и включить музыку 27 мая 2026, 18:45
-
Россия В работе «Яндекс Диска» произошёл сбой 27 мая — пользователи не могут загрузить и скачать файлы 27 мая 2026, 16:12
-
Искусственный интеллект Yandex B2B Tech запустит ИИ-сервис VibeCraft: он сможет создавать сайты и приложения по описанию пользователя 27 мая 2026, 11:34
-
Искусственный интеллект Российские поисковики не пойдут по пути Google: ссылочная выдача сохранится — её не заменят ответы ИИ 26 мая 2026, 19:00
-
Банки Сбер запустил сервис для безопасной покупки авто с пробегом — но пока купить машину можно только в кредит 27 мая 2026, 19:15
-
Тренды ИИ вытесняет «белых воротничков»: конкуренция за рабочие места у топ-менеджеров оказалась выше, чем у сварщиков 27 мая 2026, 18:00
-
Россия Понятие каршеринга хотят закрепить в законодательстве — это унифицирует правила парковки и проверки прав в регионах 26 мая 2026, 14:40
-
Реклама 76% медиаресурсов не смогут работать без рекламных доходов — большинство россиян не готовы платить за контент 26 мая 2026, 12:00

