Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.
Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.
В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.
Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.
Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.
Фото на обложке: Unsplash
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Все, что вы хотели знать про судьбоносный для Generative AI судебный иск
- 2 Что будет с поисковыми системами через 5 лет и как seo-специалистам справиться с переменами
- 3 Искусственный интеллект vs SEO: кто кого?
- 4 Нейросеть ChatGPT: новый бесплатный чат-бот с искусственным интеллектом
- 5 Tesla сократила почти всю команду сети зарядок Supercharger
ВОЗМОЖНОСТИ
02 мая 2024
05 мая 2024