В России представили первую мультимодальную модель ИИ OmniFusion 1.1
У модели –– открытый исходный код, ее можно использовать в коммерческих целях
В России представили первую мультимодальную модель ИИ, Институт искусственного интеллекта AIRI разработал OmniFusion 1.1 и открыл исходный код к ней. Языковую модель, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, можно использовать в том числе в коммерческих целях. Об этом рассказали в пресс-службе AIRI.
OmniFusion представляет собой мультимодальную модель искусственного интеллекта. Она предназначена для расширения возможностей привычных систем обработки языка за счет изображений, а в будущем –– аудио, 3D- и видеоматериалов.
Специфика мультимодальной OmniFusion 1.1
В основе архитектуры модели — метод совмещения заранее обученной большой LLM и специальных визуальных энкодеров, которые кодируют информацию на изображении в числовой вектор. Он называется эмбеддинг.
Иностранными аналогами OmniFusion являются такие продукты, как LLaVA, Gemini, GPT4-Vision и китайские Qwen, DeepSeek и LVIS.
Возможности OmniFusion 1.1
Модель распознает и описывает изображение. Так, пользователь может, например, загрузить фото, а система выдаст рецепт изображенного на нем блюда. Также можно проанализировать карту помещений или узнать, как собрать устройство по фото его отдельных комплектующих.
Также стандартно модель распознает текст. При этом она умеет решать логические задачи. С помощью модели можно решить математический пример, написанный на доске, или распознать формулу и получить их представления в формате LaTeX.
Как обучали OmniFusion 1.1
Качество модели оценивали в разных вариантах ее архитектуры при помощи восьми бенчмарков (специализированные тексты для анализа эффективности AI-моделей в ответах на визуальные вопросы).
Тесты показали, что OmniFusion показывает результаты в основных бенчмарках, не уступающие зарубежным конкурентам.
Открытый исходный код модели опубликован на платформе Github.
Фото на обложке: Natali _ Mis /
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес «Малый бизнес драйвит всё»: как компании из Архангельска растут на терпении, связях и самоиронии 25 мая 2026, 18:03
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Россия Запрет рекламы в Telegram: что важно знать маркетологам и бизнесу 23 мая 2026, 09:00
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Технологии Отечественным компаниям предложили строить ЦОДы в Белоруссии — в России не хватает энергомощностей для дата-центров 29 мая 2026, 14:20
-
Россия Каждый второй россиянин испытывает стресс, когда разряжается телефон: главный страх — пропустить важную информацию 29 мая 2026, 19:45
-
Технологии Минцифры даст отсрочку по импортозамещению — участники особо значимых проектов перейдут на российское ПО к 2036-му 29 мая 2026, 19:30
-
Россия В Авито теперь можно оформить автокредит для покупки машин у частных продавцов — сервис уже доступен в 8 городах РФ 29 мая 2026, 19:00
-
Искусственный интеллект Яндекс Карты обновили пешие маршруты: ИИ построит безопасный, красивый и удобный для пользователя путь 29 мая 2026, 15:30
-
Искусственный интеллект VK обновила алгоритмы рекомендаций: теперь посты чаще показывают пользователям — просмотры выросли в 5 раз 28 мая 2026, 13:36
-
Бизнес В 2026 году в России не открылось ни одного иностранного магазина — компании останавливает сложная логистика 29 мая 2026, 20:30
-
Маркетплейсы Россияне смогут жаловаться на Ozon и Wildberries через Госуслуги: доступные темы обращений — проблемы с возвратами 29 мая 2026, 18:26
