Истории

Сервисы распознавания лиц могут использовать ваше селфи в маске для обучения алгоритмов

Истории
Александра Степанова
Александра Степанова

Редактор

Александра Степанова

Ваши селфи в маске видят не только друзья и родственники — многочисленные исследователи могут использовать их для улучшения алгоритмов распознавания лиц. В открытых наборах данных портал CNET обнаружил тысячи таких снимков, большинство из которых были взяты прямо из Instagram.

Сервисы распознавания лиц могут использовать ваше селфи в маске для обучения алгоритмов

Пандемия COVID-19 заставила миллионы людей надеть медицинские маски. Это стало настоящим вызовом для сервисов распознавания лиц: маска закрывает большую часть лица, что затрудняет работу алгоритмов. Будущее многомиллионной индустрии зависит от того, смогут ли технологии идентифицировать лица в этих условиях. Чтобы справиться с проблемой, разработчикам нужно больше фотографий людей в масках. 

В апреле исследователи опубликовали на Github базу данных COVID19 Mask Image Dataset, содержащую более 1200 изображений людей в масках. Все снимки были получены из Instagram. Месяцем ранее китайские исследователи представили базу данных из 5000 фотографий людей в масках, собранных в интернете.

Создатели апрельской базы данных использовали свой стартап в сфере искусственного интеллекта Workaround для сбора информации и выявления изображений людей в масках.

«Нас вдохновляют инициативы компаний, которые делают что-то бесплатно, чтобы помочь окружающим. Мы использовали не частные изображения, а фото из Instagram, доступные любому пользователю. Это просто подбор подходящих данных», — заявила CEO компании Вафаа Арбаш.

Сервисы распознавания лиц давно используют фотографии, размещенные в общественном доступе. При этом исследователи не спрашивают у изображенных на снимках людей, согласны ли они предоставлять свои данные для обучения алгоритмов. Защитники гражданских свобод заявляют, что эта технология ставит под угрозу конфиденциальность и свободу слова, и напоминают, что законов, предотвращающих злоупотребление средствами наблюдения, практически не существует.

Clearview AI, скандальная компания по распознаванию лиц, собрала в своей базе данных более 3 млрд изображений из социальных сетей, ссылаясь на Первую поправку. 

Жители более чем половины штатов США обязаны носить медицинские маски в общественных местах для предотвращения распространения COVID-19. Но маска влияет не только на скорость распространения инфекции, но и на развитие технологий по распознаванию лиц. Большая часть поверхности лица, которую обычно анализирует технология, теперь скрыта маской.

Фото: Sergey Tinyakov/Shutterstock

Некоторые сервисы по распознаванию лиц попросили своих сотрудников присылать селфи в масках, а также начали добавлять маски поверх уже имеющихся у них изображений. Национальный институт стандартов и технологий США также планирует добавлять маски к существующим фотографиям для тестирования алгоритмов распознавания лиц.

При этом круг людей, у которых можно попросить селфи, ограничен сотрудниками компании, а фотографии с искусственно добавленной маской менее эффективны для обучения алгоритмов по сравнению с обычными изображениями. Кроме того, сервисы распознавания лиц нуждаются в более разнообразном наборе картинок, чтобы алгоритмы могли лучше распознавать людей разного пола и возраста, с разным цветом кожи и в разных масках. 

По словам Арбаш, сотрудники Workaround собрали более 3000 фотографий в Instagram по хэштегам, связанным с масками. Для использования в публичной базе данных компании были отобраны 1200 из них. Среди размещенных компанией изображений были и детские фотографии — Арбаш отметила, что они могли попасть в базу данных по ошибке.

Сотрудники стартапа не спрашивали у людей, изображенных на фотографиях, разрешения на использование их данных. По словам Арбаш, если пользователи не хотят в этом участвовать, они могут ограничить доступ к своим страницам в соцсетях. При этом она подтвердила, что люди со снимков не знают, что попали в базу данных.

«Мы не зарабатываем на этом деньги, это некоммерческий проект, — подчеркнула Арбаш. — Нашим намерением было помочь специалистам, работающим с данными и машинным обучением, справиться с возникшей проблемой для обеспечения общественной безопасности».

В какой-то момент срок действия ссылок на изображения из Instagram истек. Пользователи базы данных стали интересоваться, как получить доступ к фотографиям. Арбаш заявила, что если проект окажется востребованным, компания может получить больше снимков людей в масках. 

«Мы не разрешаем третьим лицам собирать или использовать фотографии, размещенные нашими пользователями, без их согласия. Мы продолжаем расследовать этот факт», — говорится в заявлении Facebook.

Real World Masked Face Dataset называет себя крупнейшей базой изображений людей в медицинских масках (специалисты компании собрали более 5000 изображений 525 человек в масках). Сбором данных занимались китайские ученые из Университета Уханя — города, где началась вспышка коронавируса.

В опубликованном 23 марта документе сообщается, что собранные фотографии — это изображения публичных лиц, собранные «по всему интернету». Получить более подробные комментарии от исследователей не удалось.

Практика использования фотографий из соцсетей для обучения алгоритмов распознавания лиц не нова. Нынешняя ситуация связана с COVID-19. В условиях пандемии сервисам нужно быстро научиться распознавать лица в масках для обеспечения общественной безопасности. Однако эта необходимость наталкивается на этическую проблему использования кадров без согласия изображенных на них людей.

«Люди могут быть против попадания их изображений в базы данных, которые в дальнейшем будут использованы правительствами иностранных автократических государств, например Китая, — считает Джейк Лаперук, старший юридический советник Constitution Project. — Даже если люди не рассчитывают на полную приватность, размещая свои фотографии в социальных сетях, у них определенно есть свои представления о том, как можно или нельзя использовать эти изображения».

Источник.

Фото на обложке: Svitlo Production/Shutterstock

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Технологии для отслеживания контактов: какие страны используют их в борьбе с коронавирусом
  2. 2 «Мы не делаем "Большого Брата"». Основатель VisionLabs о развитии компании, конкуренции и технологии распознавания лиц
  3. 3 Биометрия vs медицинские маски: как борьба с эпидемией помогает развитию технологий
  4. 4 Битва между прогрессом и этикой. Что ждет технологию распознавания лиц — мнения предпринимателей

Актуальные материалы —
в Telegram-канале @Rusbase