Google открыл доступ к своей описывающей фотографии нейросети
Компания Google выложила в открытый доступ на портале GitHub код своей нейросети «Show and Tell», которая может делать осмысленные подписи к изображениям.
Материал относится к рубрике «Технологии, которые меняют ваш бизнес». В ней мы популярно рассказываем о технологиях, которые перестраивают существующие бизнес-процессы и создают новые рынки. Партнер рубрики — корпорация EMC, которая помогает компаниям эффективно использовать возможности ИТ-инфраструктуры для цифровой трансформации бизнеса.
Сообщается, что нейросеть была разработана с помощью среды машинного обучения TensorFlow, код которой Google также открыла ранее для всех желающих.
«Show and Tell» распознает различные объекты на изображении, присваивает им названия и делает к ним подписи, рассказывая о том, что на той или иной картинке изображено.
Для этого нейросеть обучали не только распознаванию изображений, но и «пониманию» связей между различными словами английского языка, то есть контекста. По этой причине нейросеть не просто перечисляет объекты на изображении в случайном порядке, а составляет осмысленные предложения.
Слева – описанные людьми изображения, которые показывали нейросети для ее обучения. Справа – результат работы уже самой нейросети / (c) TechCrunch/Google
Точность алгоритма, по данным Google, составляет 93,9%. Прошлые версии этой нейросети добивались результатов только в 89,6–91,8%, отмечает TechCrunch.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как попасть в топ поисковой выдачи Ozon»
- 1 ИИ-модель Gemini заменит Google Assistant на большинстве устройств в 2025 году Исключение сделают для старых моделей смартфонов 14 марта 22:00
- 2 Google открыла бесплатный доступ к функции Deep research в ИИ Gemini Раньше пользоваться ей могли только обладатели платной подписки 14 марта 19:20
- 3 Google DeepMind представила новые ИИ-модели для робототехники Они должны помочь роботам выполнять более широкий спектр задач 12 марта 21:22
- 4 Google выпустила ИИ-модель Gemma 3 для разработчиков В компании утверждают, что она превосходит нейросети DeepSeek и OpenAI 12 марта 19:12