xAI Илона Маска представила мультимодальную модель Grok-1.5V
Это инструмент компьютерного зрения, интерпретирующий данные диаграмм, фотоматериалов
Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.
Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.
В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.
Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.
Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.
Фото на обложке: Unsplash
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Искусственный интеллект ИИ-сленг в 2026 году: датасет, лосс, RAG и ещё 50 терминов — это уже базовый минимум индустрии 08 февраля 2026, 08:00
-
Маркетинг Как брендам достучаться до зумеров: почему старые инструменты больше не работают и что делать 12 апреля 2026, 22:11
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Тренды Будущее под камерами: шесть сценариев, как видеонаблюдение перепишет реальность к 2036 году 19 января 2026, 10:57
-
Кибербезопасность Кибербезопасность в России в 2026-м: актуальные тренды, угрозы и методы защиты 01 января 2026, 00:30
-
Деньги Самый дорогой футбольный клуб в 2026 году: почему он зарабатывает больше, чем 50 команд вместе 01 мая 2026, 13:58
-
Искусственный интеллект Ozon запустил ИИ-ассистента для продавцов — подобные инструменты уже развивают Яндекс Маркет и Wildberries 30 апреля 2026, 18:30
-
Искусственный интеллект Яндекс опубликовал финансовые итоги за I квартал 2026 года: выручка выросла на 22% — до 372,7 млрд ₽ 28 апреля 2026, 11:10
-
Искусственный интеллект Преподаватели научились готовить ИИ-контент для уроков за 4 минуты — спрос на обучение с нейросетями вырос на 63% 01 мая 2026, 16:00
-
Бизнес Выручка онлайн-кинотеатров в 2025 году выросла почти на 40% — подписки остаются главным источником дохода 01 мая 2026, 10:00
-
Россия В России растёт спрос на временный Wi-Fi для мероприятий — бизнес может заработать 4,5 млрд ₽ на сбоях интернета 30 апреля 2026, 15:30
-
Банки Состояние неопределённости и флоатеры вместо фикса: участники Альфа-Саммита — о рынке капитала в 2026 году 30 апреля 2026, 14:40
-
Реклама В Яндексе доля рекламных бюджетов под управлением ИИ достигла 85% — нейросети генерируют почти каждый третий баннер 28 апреля 2026, 18:21
-
Банки В Москве проходит Альфа-Саммит — топ-менеджеры обсуждают ключевые вызовы бизнеса и экономики 28 апреля 2026, 10:00