xAI Илона Маска представила мультимодальную модель Grok-1.5V
Это инструмент компьютерного зрения, интерпретирующий данные диаграмм, фотоматериалов
Конкурент OpenAI — компания xAI Илона Маска — представила свою первую мультимодальную модель Grok-1.5 Vision (или Grok-1.5V). Инструмент способен обрабатывать данные, отображаемые в рисунках внутри документов, диаграммах, таблицах, скриншотах и фотографиях. Вскоре решение станет доступно для тестирования среди профессионалов рынка и текущих пользователей Grok.
Презентация состоялась через несколько недель после того, как xAI представила обновленную модель чат-бота Grok-1.5. И это еще один шаг компании Маска, которая в качестве ключевой цели заявила создание «полезного общедоступного ИИ», напоминает VentureBeat.
В качестве примеры работы Grok-1.5V компания приводит несколько действий от преобразования наброска блок-схемы в код Python или преобразования таблицы в файл фрмата CSVдо создания сказки на ночь по мотивам детского рисунка или объяснения мема.
Представители xAI уверяют, что эта мультимодальная модель выделяется на фоне аналогов (GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5) и превосходит конкурентов в анализе окружающего пространства.
Преимущество достигается за счет технологии RealWorldQA (лицензия Creative Commons), обученной на 700+ изображений, которые сопровождались вопросами и ответами по каждому предмету.
Фото на обложке: Unsplash
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Технологии Прощание с эпохой Кука и ставка на агентов: конференция Apple WWDC 2026 12 июня 2026, 15:35
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Искусственный интеллект 93% россиян используют ИИ в рабочей переписке: чаще всего — для формулировки аргументов при конфликтах 15 июня 2026, 20:00
-
Тренды Россияне назвали профессии с неоправданно высокими зарплатами в 2026 году — лидируют политики и курьеры 15 июня 2026, 19:04
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01
-
Маркетплейсы Оборот «М.Видео» за начало 2026-го превысил результат за весь прошлый год — выручка маркетплейса выросла в 4 раза 15 июня 2026, 17:40
-
Россия Самозанятые получили возможность создавать публичные каналы в MAX — до этого функция была доступна юрлицам и ИП 15 июня 2026, 18:10
-
Технологии Яндекс Карты добавили 120 тыс. отметок о доступности мест маломобильным людям: данные обновляет ИИ — автоматически 05 июня 2026, 20:42
-
Искусственный интеллект OpenAI подала конфиденциальную заявку на IPO — компания может выйти на биржу уже в сентябре 09 июня 2026, 13:15
-
Бизнес «Золотое яблоко» проведёт повторный выпуск ЦФА — объём размещения составит 1,5 млрд ₽ 08 июня 2026, 15:30