Компания Google выложила в открытый доступ на портале GitHub код своей нейросети «Show and Tell», которая может делать осмысленные подписи к изображениям.
Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки. Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.
Сообщается, что нейросеть была разработана с помощью среды машинного обучения TensorFlow, код которой Google также открыла ранее для всех желающих.
«Show and Tell» распознает различные объекты на изображении, присваивает им названия и делает к ним подписи, рассказывая о том, что на той или иной картинке изображено.
Для этого нейросеть обучали не только распознаванию изображений, но и «пониманию» связей между различными словами английского языка, то есть контекста. По этой причине нейросеть не просто перечисляет объекты на изображении в случайном порядке, а составляет осмысленные предложения.
Слева – описанные людьми изображения, которые показывали нейросети для ее обучения. Справа – результат работы уже самой нейросети / (c) TechCrunch/Google
Точность алгоритма, по данным Google, составляет 93,9%. Прошлые версии этой нейросети добивались результатов только в 89,6–91,8%, отмечает TechCrunch.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Старт работы на Яндекс Маркете»
- 1 Полезные функции Google Фото, о которых вы могли не знать
- 2 Покушение на Трампа и глобальный сбой Windows: Google назвал топ поисковых запросов за 2024 год
- 3 Квантовый компьютер Google решил за пять минут задачу, на которую требуется 10 септиллионов лет
- 4 Приложение «Газпромбанка» пропало из Google Play
ВОЗМОЖНОСТИ
14 декабря 2024
15 декабря 2024
16 декабря 2024
18 декабря 2024