Top.Mail.Ru

xAI Илона Маска представила мультимодальную модель Grok-1.5V

Новости
Новости
Екатерина Алипова
Екатерина Алипова

Редактор выходного дня RB.RU

Екатерина Алипова

Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.

xAI Илона Маска представила мультимодальную модель Grok-1.5V
  1. Новости

Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.

В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.

Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.

Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.

Фото на обложке: Unsplash

RB.RU рекомендует лучших поставщиков цифровых решений для вашего бизнеса — по ссылке

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

ТЕГИ
RB в Telegram
Больше полезного контента в Telegram
Подписывайтесь!

Материалы по теме