Олег Овечкин

Google открыл доступ к своей описывающей фотографии нейросети

Компания Google выложила в открытый доступ на портале GitHub код своей нейросети «Show and Tell», которая может делать осмысленные подписи к изображениям.


Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки.

Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.

Сообщается, что нейросеть была разработана с помощью среды машинного обучения TensorFlow, код которой Google также открыла ранее для всех желающих.

«Show and Tell» распознает различные объекты на изображении, присваивает им названия и делает к ним подписи, рассказывая о том, что на той или иной картинке изображено.

Для этого нейросеть обучали не только распознаванию изображений, но и «пониманию» связей между различными словами английского языка, то есть контекста. По этой причине нейросеть не просто перечисляет объекты на изображении в случайном порядке, а составляет осмысленные предложения.

Слева – описанные людьми изображения, которые показывали нейросети для ее обучения. Справа – результат работы уже самой нейросети / (c) TechCrunch/Google

Точность алгоритма, по данным Google, составляет 93,9%. Прошлые версии этой нейросети добивались результатов только в 89,6–91,8%, отмечает TechCrunch.  


comments powered by Disqus

Подпишитесь на рассылку RUSBASE

Мы будем вам писать только тогда, когда это действительно очень важно