OpenAI представила новую модель для генерации изображений GPT Image 1.5

GPT‑Image‑1.5

OpenAI выкатила обновленную версию ChatGPT Images на базе новой модели GPT Image 1.5. Это та же генерация картинок в ChatGPT, но умнее, быстрее и с новым интерфейсом под работу с изображениями.​

Новая версия ChatGPT Images

Теперь в основе ChatGPT Images стоит флагманская модель генерации картинок GPT‑Image‑1.5. Она старается выдавать именно то, что человек себе представляет — не важно, создаешь сцену с нуля, или правишь загруженную фотку. 

Модель точнее попадает в запрос, аккуратно редактирует, не смазывая важные детали, и может рисовать до четырёх раз быстрее прошлой версии, так что ждать меньше.​

Вместе с этим появился обновленный раздел «Изображения» в ChatGPT.

Это отдельное пространство прямо в интерфейсе: тут можно генерировать картинки, выбирать готовые стили и подсказки, и в целом проще пробовать идеи, не ковыряясь в промптах вручную. Модель уже раскатывают всем пользователям ChatGPT, а в API она доступна под именем GPT‑Image‑1.5. Корпоративные клиенты и бизнес‑аккаунты тоже её получат, но чуть позже.​

Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

Как GPT‑1.5 редактирует изображения

Главный упор GPT‑Image‑1.5 — на точную правку без разрушения исходной сцены. Если ты просишь изменить конкретную деталь, модель меняет только её: держит свет, композицию и внешность людей одинаковыми между исходником, результатом и следующими итерациями. Это помогает делать более полезные правки фото, реалистичные примерки одежды и причёсок, накладывать стилевые фильтры или делать концептуальные переработки, но так, чтобы исходная картинка всё равно читалась.​

За счёт этого ChatGPT в таком режиме работает как мини‑студия. Можно и просто подчистить кадр, и полностью переосмыслить сцену, не боясь, что модель внезапно «сломает» лица или свет. При этом GPT‑Image‑1.5 уверенно держит разные типы редактирования: добавление объектов, удаление, комбинирование элементов, смешение стилей и перестановку частей картинки, при этом «фирменный» вид изображения сохраняется.​

Творческие трансформации и следование инструкциям

Творческие трансформации и следование инструкциям

Креативная часть модели раскрывается в задачах, где нужно не только чуть поправить картинку, а добавлять текст, менять макет, перестраивать сцену под идею. Она подходит и под простые запросы вроде «сделай постер», и под сложные композиции, где много объектов и логики, а пробовать всё это можно через предустановленные стили и идеи в разделе «Изображения ChatGPT» — без обязательного ручного промпта.​

По сравнению с GPT Image 1.0 модель лучше держится за инструкцию. Это видно на запросах с длинным списком условий — вроде сетки 6×6 с четким набором объектов в каждой ячейке: греческая буква, игрушки, техника, символы, числа и так далее. GPT‑Image‑1.5 лучше соблюдает структуру, не путает порядок и связи между элементами, так что сложные сцены выглядят ближе к тому, что описано в тексте.​

Текст на картинках и сложные примеры

Текст на картинках и сложные примеры

Отдельно улучшили рендеринг текста: модель стала лучше справляться с мелким и плотным текстом, что важно для инфографики, плакатов или условной «газетной полосы» с форматированием, заголовками и таблицами. В примерах OpenAI показывает, как модель держит разметку с заголовками, датами, таблицей бенчмарков и длинным текстом статьи без развала структуры.​

Аналогично обновили промпт с газетой, где предлагается нарисовать вертикальную статью с текстом про GPT‑5.2 и таблицей показателей — модель должна сохранить формат и цифры. Теперь туда можно подставить новый текст про GPT‑Image‑1.5, и система всё так же аккуратно верстает статью в картинке, не ломая макет.​

Новое пространство для творчества

Новое пространство для творчества

В ChatGPT появился отдельный раздел «Изображения» в боковой панели — и в веб‑версии, и в мобильном приложении. Там собраны предустановленные фильтры и популярные подсказки, которые регулярно обновляют под новые тренды, так что можно не придумывать запрос с нуля, а выбрать готовый паттерн.​

Есть ещё одна полезная штука: можно один раз загрузить свое фото, чтобы модель запомнила внешность, и потом использовать её в новых проектах без постоянного поиска снимков в галерее. В итоге картинки можно гнать сериями — от легкой правки до полного переразбора сцены — а генерация стала до четырёх раз быстрее, плюс можно запускать новые запросы, пока старые ещё в работе.​

Качество, ограничения и реализм

Качество, ограничения и реализм

GPT‑Image‑1.5 подтянула еще и «тонкие» параметры качества: как отрабатываются мелкие детали, насколько естественно смотрятся сцены, как модель ведет себя на множестве лиц в кадре. В примерах показывают сложные сюжеты вроде Лондона 1970‑х с толпой людей и автобусом с рекламой, где надо одновременно удержать фотореализм, логотипы и текст на борту.​

При этом OpenAI честно признаёт, что модель всё ещё не идеальна: в сложных инфографиках и научных сюжетах остаются неточности, а многоязычный текст рендерится с ограничениями. Но в сравнении с первой версией видно заметный прогресс: графика стала понятнее, подписи читаются лучше, а риск «обрезать» важные куски ниже.​

Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии