Гайд по генерации картинок в ChatGPT

Нейросети уже не кажутся чем-то невероятным, как раньше. Они стали такой же обычной частью жизни, как смартфон или ноутбук. Многие каждый день обращаются к ChatGPT — то помочь с идеей для поста в соцсетях, то найти ответ на вопрос, который лень гуглить вручную. Недавно в Chat GPT 4o обновили модель и внедрили в нее генерацию изображений. Да, Chat gpt умел генерировать картинки и раньше, но для этого он использовал отдельную модель Dall-E 3. А теперь, генератор является частью модели.
Например, если вы попросите нарисовать меню для кафе с описанием блюд, модель не только текст придумает, но и оформит всё так, будто над этим трудился дизайнер: подберет шрифты, цвета и даже добавит логотип без искажений 25. А ещё можно загрузить своё фото и сказать: «Добавь закат на фон» или «Убери этот столб с края» — нейросьетка поймёт и сделает.
Самое интересное, что GPT-4o справляется даже со сложными задачами. Если попросить нарисовать сцену с десятком объектов — например, рыцаря на коне, дракона, замок на горе и летящих птиц — модель не перепутает детали, в отличие от других ИИ, которые часто «теряются» после пятого элемента. Правда, иногда картинки генерируются чуть дольше, но результат того стоит.
Пока функция доступна в основном по платной подписке, но разработчики обещают скоро открыть доступ и для корпоративных клиентов, а также выпустить API. Кстати, OpenAI позаботились о безопасности: все изображения помечаются метаданными, чтобы было понятно, что их создал ИИ, а ещё блокируют попытки сделать что-то вредное или нарушающее правила.
В этой статье подробно рассмотрим что нового и как это работает.
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!

Как получить доступ к Chat GPT 4o?
Самый очевидный способ — перейти на сайт Chat GPT и описать в промте, что вы хотите увидеть в результате. Если нужно подправить фото — загружаете его и объясняете, что поменять: «Сделай фон темнее» или «Добавь ярких красок».
Ссылка: ChatGPT
Важно! Для использования вам потребуется впн, а для оплаты подписки карта иностранного банка или специальные сервисы.
Примеры генерации картинок в GPT 4o
Раньше картинки в ChatGPT получались странными. Помните те квадратные изображения от DALL-E 3, где детали порой напоминали сюрреалистичный коллаж? То ваза с цветами оказывалась размером с дом, то лица людей выглядели будто склеенными из разных фото. Но с выходом GPT-4o всё изменилось: теперь можно не только задать, например, «вертикальную иллюстрацию для стори с кофейней и уютным диваном у окна», но и получить результат, где пропорции — как в реальной жизни, а тени и текстуры выглядят почти натурально.

Посмотрите, как чётко проработаны мелочи — кажется, будто это реальная фотография. Посмотрите на задний план, люди там не превратились в размытые пятна, а выглядят вполне естественно, как будто их и правда сняли камерой, а не «дорисовали» для заполнения пространства.
Попробуйте увеличить картинку — увидите, что даже второстепенные детали вроде складок на одежде, пусть они в расфокусе, но они не сливаются в кашу. Это особенно круто, когда нужно, например, подготовить визуал для поста или презентации: не придётся тратить время на ручную правку.
GPT-4o против Flux 1.1 Pro Ultra
Для того чтобы сравнить эти модели, мы задали промпт:


Оба изображения получились великолепно.
Доступ к API
Мы понимаем, как многим из вас не терпится подключить новые возможности GPT-4o к своим проектам через API. Пока, к сожалению, доступ к генерации изображений через API закрыт — но это ненадолго.
Почему так? Скорее всего, команда OpenAI действует по принципу «семь раз отмерь»: сначала тестирует фишку в основном интерфейсе ChatGPT, собирает фидбек, настраивает серверы под нагрузкой, а уже потом откроет для разработчиков. Такой подход помогает избежать сбоев, когда функцией начнут пользоваться массово.
Следите за анонсами — как только API станет доступен, мы сразу же расскажем, как его подключить и на что обратить внимание
Безопасность
Каждое изображение от GPT-4o содержит данные C2PA — как штрих-код на товаре. Специальные сервисы помогут вам проверить, сделана ли картинка ИИ. Но есть нюанс: эту отметку можно стереть обычным редактированием. Так что если где-то увидите слишком идеальное фото — сохраняйте скепсис.

OpenAI учит нейросеть говорить «нет» на запросы вроде «создай фейковое фото знаменитости» или «нарисуй что-то опасное». Особенно строго система относится к изображениям реальных людей — например, нельзя сгенерировать фото человека в компрометирующей позе. Для защиты детей работает фильтр: загружаете фото — алгоритм ставит метку «безопасно», «проверь ещё раз» или «заблокировано».
Сэм Альтман, глава OpenAI, называет это балансом между свободой творчества и безопасностью. Компания даёт инструменты, но просит пользователей не забывать о здравом смысле — технологии пока не умеют отличать шутку от злого умысла.
Больше инструкций, реальных кейсов и примеров из практики по AI для бизнеса, работы и жизни в Telegram-канале, подпишитесь!