xAI Илона Маска представила мультимодальную модель Grok-1.5V
Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.
Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.
В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.
Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.
Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.
Фото на обложке: Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как открыть микромаркет»
- 1 Руководство DeepSeek ограничивает зарубежные поездки персонала В особенности в США — на фоне рекомендаций властей, которые борются с «утечкой мозгов» 16 марта 15:17
- 2 «Сбер» выпустил обновленную линейку моделей ИИ GigaChat 2.0 В компании утверждают, что модель является сильнейшим русскоязычным ИИ 13 марта 17:00
- 3 Почему ИИ в России развивается медленно И как ускорить процесс 12 марта 13:00
- 4 Microsoft разработала собственные модели ИИ — MAI Эксперты видят в этом первый шаг к «расставанию» с OpenAI 08 марта 18:30