В России представили первую мультимодальную модель ИИ OmniFusion 1.1
У модели –– открытый исходный код, ее можно использовать в коммерческих целях
В России представили первую мультимодальную модель ИИ, Институт искусственного интеллекта AIRI разработал OmniFusion 1.1 и открыл исходный код к ней. Языковую модель, способную поддерживать визуальный диалог и отвечать на вопросы по картинкам, можно использовать в том числе в коммерческих целях. Об этом рассказали в пресс-службе AIRI.
OmniFusion представляет собой мультимодальную модель искусственного интеллекта. Она предназначена для расширения возможностей привычных систем обработки языка за счет изображений, а в будущем –– аудио, 3D- и видеоматериалов.
Специфика мультимодальной OmniFusion 1.1
В основе архитектуры модели — метод совмещения заранее обученной большой LLM и специальных визуальных энкодеров, которые кодируют информацию на изображении в числовой вектор. Он называется эмбеддинг.
Иностранными аналогами OmniFusion являются такие продукты, как LLaVA, Gemini, GPT4-Vision и китайские Qwen, DeepSeek и LVIS.
Возможности OmniFusion 1.1
Модель распознает и описывает изображение. Так, пользователь может, например, загрузить фото, а система выдаст рецепт изображенного на нем блюда. Также можно проанализировать карту помещений или узнать, как собрать устройство по фото его отдельных комплектующих.
Также стандартно модель распознает текст. При этом она умеет решать логические задачи. С помощью модели можно решить математический пример, написанный на доске, или распознать формулу и получить их представления в формате LaTeX.
Как обучали OmniFusion 1.1
Качество модели оценивали в разных вариантах ее архитектуры при помощи восьми бенчмарков (специализированные тексты для анализа эффективности AI-моделей в ответах на визуальные вопросы).
Тесты показали, что OmniFusion показывает результаты в основных бенчмарках, не уступающие зарубежным конкурентам.
Открытый исходный код модели опубликован на платформе Github.
Фото на обложке: Natali _ Mis /
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Искусственный интеллект ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — это уже базовый минимум индустрии 08 февраля 2026, 08:00
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Тренды Будущее под камерами: шесть сценариев, как видеонаблюдение перепишет реальность к 2036 году 19 января 2026, 10:57
-
Искусственный интеллект Ozon запустил ИИ-ассистента для продавцов — подобные инструменты уже развивают Яндекс Маркет и Wildberries 30 апреля 2026, 18:30
-
Деньги В России начнут регулировать рынок криптовалют — эксперты предупреждают, что законопроект не избавит от серых схем 01 мая 2026, 19:00
-
Искусственный интеллект Преподаватели научились готовить ИИ-контент для уроков за 4 минуты — спрос на обучение с нейросетями вырос на 63% 01 мая 2026, 16:00
-
Тренды Эксперты опровергли падение цен в новостройках на 30%: рынок недвижимости в стагнации — но не более 01 мая 2026, 13:00
-
Бизнес Выручка онлайн-кинотеатров в 2025 году выросла почти на 40% — подписки остаются главным источником дохода 01 мая 2026, 10:00
-
Карьера 89% россиян не против переработок за дополнительную плату: каждый третий готов работать сверхурочно ради идеи 30 апреля 2026, 20:00
-
Банки Состояние неопределённости и флоатеры вместо фикса: участники Альфа-Саммита — о рынке капитала в 2026 году 30 апреля 2026, 14:40
-
Банки В Москве проходит Альфа-Саммит — топ-менеджеры обсуждают ключевые вызовы бизнеса и экономики 28 апреля 2026, 10:00
