В ChatGPT появилась новая модель для генерации изображений — Images 2.0 умеет создавать сложные диаграммы и графики
При этом нейросеть выдаёт до восьми изображений за раз
OpenAI добавила в ChatGPT новый режим работы Images 2.0 для создания научных графиков, схем и детализированных изображений, сообщается в пресс-релизе компании. В отличие от прошлых версий, Images 2.0 работает в режиме «размышления» — тратит дополнительное время на анализ запроса и поиск информации в интернете. Модель уже доступна в ChatGPT, ИИ-агенте для программирования Codex и через API.
Images 2.0 генерирует изображения с иероглифами
Разработчики повысили реалистичность и точность сгенерированных изображений. Так, Images 2.0 может создавать картинки с разрешением до 2K, отображать мелкие элементы вроде текста и иконок, а также соблюдать жёсткие стилистические ограничения.
Особый акцент сделан на мультиязычность. Если раньше модель хорошо работала только с латиницей и английским, то теперь она может генерировать иероглифы и сложные шрифты. Инструмент научился создавать схемы, плакаты и комиксы на японском, корейском, китайском, хинди и бенгальском языках.
Руководитель продуктовой команды Адель Ли ChatGPT Images 2.0 отметила, что Images 2.0 будет полезен для преподавателей и учёных, для которых особенно важно создавать детализированные учебные материалы.
В режиме «размышления» модель создаёт изображение в несколько этапов
Ключевое нововведение — режим «размышления» (thinking), доступный платным пользователям чат-бота. В нём модель тратит больше времени на анализ, ищет в интернете актуальные данные для картинок и генерирует до восьми изображений за один раз. Например, нейросеть может нарисовать страницу комикса или эскиз комнаты с несколькими вариантами дизайна.
Когда пользователь просит изобразить недавно произошедшее событие, которого нет в обучающей выборке, нейросеть ищет подходящие картинки в интернете и использует их как референс.
В компании признают: ошибки возможны — в мелких деталях и сложных схемах
Images 2.0 допускает ошибки в создании схем для объёмных моделей, подчёркивается в пресс-релизе. Так, нейросеть пока некачественно генерирует инструкции по сборке кубика Рубика или оригами.
Кроме того, модель плохо работает с мелкими элементами, вроде песчинок на пляже или крупы. Схемы и диаграммы со множеством стрелок и подписей также требуют исправлений от пользователя. Разработчики подчеркнули, что устранят недочеты в будущих версиях модели.
Контекст
В апреле 2025 года Midjourney выпустила модель V7, которая исправляет ошибки в анатомии человека — в новой версии у людей нормальное количество пальцев и естественные пропорции тела.
Google встроила генератор Nano Banana в Gemini. Пользователи могут создавать картинки прямо в чате, а затем редактировать их голосовыми командами — например, убрать объект или изменить цвет фона. Благодаря этой функции аудитория Gemini выросла с 450 до 650 млн пользователей к октябрю 2025 года.
Meta* в свою очередь разрабатывает модель Mango, которая будет генерировать и изображения, и короткие видеоролики. Релиз намечен на первую половину 2026 года.
*компания Meta признана экстремистской и запрещена на территории РФ
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Бизнес Российский медтех: замедление телемедицины, рост ИИ и рывок устройств 18 февраля 2026, 16:47
-
Искусственный интеллект Экономика суверенитета: как финансовый сектор, промышленность и ретейл монетизируют новые технологии 28 апреля 2026, 17:00
-
Бизнес Командировки в 2026 году: как экономить на деловых поездках, не жертвуя комфортом сотрудников 13 мая 2026, 10:00
-
Бизнес Куда идут деньги инвесторов и почему российскому бизнесу стало сложнее их привлекать 12 мая 2026, 15:22
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Деньги Налоговый вычет через личный кабинет в 2026 году: пошаговая инструкция 24 апреля 2026, 21:57
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Бизнес Anthropic и OpenAI запретили вторичную торговлю акциями — неодобренные компаниями сделки признают недействительными 13 мая 2026, 21:05
-
Бизнес В России хотят создать «защитные зоны» вокруг дата-центров — строительство жилых домов на их территории ограничат 13 мая 2026, 20:30
-
Искусственный интеллект В России хотят внедрить ИИ в сферу строительства и ЖКХ: нейросети будут обрабатывать документы и обращения граждан 14 мая 2026, 13:00
-
Искусственный интеллект Duolingo отказалась от повсеместного использования ИИ — нейросети не сравнятся с лучшими дизайнерами компании 14 мая 2026, 11:00
-
Бизнес Nebius увеличила выручку почти в 8 раз — компания Аркадия Воложа заработала $399 млн за 2025 год 13 мая 2026, 23:03
-
Технологии «Моторика» запускает мобильные кабинеты протезирования — врачи смогут изготавливать изделия в отдалённых регионах 13 мая 2026, 20:11
-
Искусственный интеллект Российские ведомства планируют использовать для работы зарубежный ИИ: в топе по популярности — Qwen и модели Meta* 13 мая 2026, 19:50
-
Деньги Прогрессивная шкала НДФЛ принесла в бюджет 52 млрд ₽ за три месяца — более половины суммы заплатили москвичи 14 мая 2026, 12:00