В ChatGPT появилась новая модель для генерации изображений — Images 2.0 умеет создавать сложные диаграммы и графики
При этом нейросеть выдаёт до восьми изображений за раз
OpenAI добавила в ChatGPT новый режим работы Images 2.0 для создания научных графиков, схем и детализированных изображений, сообщается в пресс-релизе компании. В отличие от прошлых версий, Images 2.0 работает в режиме «размышления» — тратит дополнительное время на анализ запроса и поиск информации в интернете. Модель уже доступна в ChatGPT, ИИ-агенте для программирования Codex и через API.
Images 2.0 генерирует изображения с иероглифами
Разработчики повысили реалистичность и точность сгенерированных изображений. Так, Images 2.0 может создавать картинки с разрешением до 2K, отображать мелкие элементы вроде текста и иконок, а также соблюдать жёсткие стилистические ограничения.
Особый акцент сделан на мультиязычность. Если раньше модель хорошо работала только с латиницей и английским, то теперь она может генерировать иероглифы и сложные шрифты. Инструмент научился создавать схемы, плакаты и комиксы на японском, корейском, китайском, хинди и бенгальском языках.
Руководитель продуктовой команды Адель Ли ChatGPT Images 2.0 отметила, что Images 2.0 будет полезен для преподавателей и учёных, для которых особенно важно создавать детализированные учебные материалы.
В режиме «размышления» модель создаёт изображение в несколько этапов
Ключевое нововведение — режим «размышления» (thinking), доступный платным пользователям чат-бота. В нём модель тратит больше времени на анализ, ищет в интернете актуальные данные для картинок и генерирует до восьми изображений за один раз. Например, нейросеть может нарисовать страницу комикса или эскиз комнаты с несколькими вариантами дизайна.
Когда пользователь просит изобразить недавно произошедшее событие, которого нет в обучающей выборке, нейросеть ищет подходящие картинки в интернете и использует их как референс.
В компании признают: ошибки возможны — в мелких деталях и сложных схемах
Images 2.0 допускает ошибки в создании схем для объёмных моделей, подчёркивается в пресс-релизе. Так, нейросеть пока некачественно генерирует инструкции по сборке кубика Рубика или оригами.
Кроме того, модель плохо работает с мелкими элементами, вроде песчинок на пляже или крупы. Схемы и диаграммы со множеством стрелок и подписей также требуют исправлений от пользователя. Разработчики подчеркнули, что устранят недочеты в будущих версиях модели.
Контекст
В апреле 2025 года Midjourney выпустила модель V7, которая исправляет ошибки в анатомии человека — в новой версии у людей нормальное количество пальцев и естественные пропорции тела.
Google встроила генератор Nano Banana в Gemini. Пользователи могут создавать картинки прямо в чате, а затем редактировать их голосовыми командами — например, убрать объект или изменить цвет фона. Благодаря этой функции аудитория Gemini выросла с 450 до 650 млн пользователей к октябрю 2025 года.
Meta* в свою очередь разрабатывает модель Mango, которая будет генерировать и изображения, и короткие видеоролики. Релиз намечен на первую половину 2026 года.
*компания Meta признана экстремистской и запрещена на территории РФ
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Искусственный интеллект Нам не нужен свой OpenAI: где России искать эффект от ИИ и что для этого делать 19 мая 2026, 11:00
-
Бизнес Куда идут деньги инвесторов и почему российскому бизнесу стало сложнее их привлекать 12 мая 2026, 15:22
-
Искусственный интеллект Google внедрил ИИ в поисковую строку — это одно из самых масштабных обновлений компании за последние 25 лет 20 мая 2026, 19:45
-
Искусственный интеллект Греф заявил о планах Сбера перейти на китайские чипы для GigaChat: ранее компания использовала микросхемы от Nvidia 20 мая 2026, 19:00
-
Искусственный интеллект Google представила новые умные очки — устройства получат аудиоуправление на базе ИИ Gemini 20 мая 2026, 16:15
-
Искусственный интеллект Яндекс открыл интернет-магазинам доступ к продажам через Алису AI — клиенты смогут оформлять покупки в один клик 20 мая 2026, 17:00
-
Банки ЦБ ужесточит регулирование кредитных рисков для всех банков — лимит на одного заёмщика снизят до 25% капитала 20 мая 2026, 21:00
-
Бизнес Поездки на самокатах в майские праздники выросли на 47–87% — сервисы адаптировались к отключениям интернета 20 мая 2026, 17:45
-
Бизнес VK опубликовала финансовые результаты за I квартал 2026 года — чистый долг компании сократился на 20 млрд ₽ 21 мая 2026, 11:20
-
Искусственный интеллект Как ИИ используют для создания новых продуктов и ингредиентов: в Москве пройдёт Deep Food Tech — 2026 14 мая 2026, 17:31