GPT Image 1.5: гайд по промтам, чтобы картинки получались с первого раза

С генерацией картинок часто встречается следующее: вы в голове видите результат, а у нейросети получается "похоже, но не то". GPT Image 1.5 сильно уменьшает этот разрыв (особенно, по сравнению с предшественницей), если давать ей не вдохновение, а нормальное ТЗ: что должно получиться, как это устроено, и что трогать нельзя.

И давайте сразу условимся - тут мы не сравниваем результаты с Nano Banano PRO (это мы уже сделали в другой статье), а учимся работать именно с моделью от Open AI

Если картинка нужна с нуля - используйте генерацию (text -> image). Если у вас уже есть исходник и надо поменять конкретное - редактирование (text + image -> image). В API это отдельные эндпоинты у Image API.

Рабочая формула простая: сначала что делаем и зачем, потом что должно быть в кадре, потом ограничения.

Три правила, которые чаще всего спасают:

Описывайте результат как готовый артефакт: "постер", "скрин UI", "карточка товара", "инфографика". Это переключает модель в правильный режим.
Если важна компоновка, говорите про позицию: "заголовок сверху", "слева пустое место под текст", "объект по центру".
Для правок повторяйте, что нельзя менять. И прямо пишите "измени только X, все остальное сохрани".

Это структура, композиция, ограничения и итерации маленькими шагами.

🔥🔥🔥Кстати, все работы с изображениями я уже давно провожу на платформе SYNTX AI. А по промокоду NEIROSKUF, вы заберете горячую скидку в 15% на любой тариф. Реально - все нейросети в одном интерфейсе, рекомендую!

Скопируйте и заполните:

Задача: (что делаем и где это будет использоваться) Формат: (постер A4, баннер 1:1, сторис 9:16, UI-экран, фото товара) Сюжет: (где и что происходит) Главный объект: (кто или что в центре) Детали: (материалы, возраст, состояние, мелкие особенности) Композиция: (крупность, ракурс, что где расположено) Свет: (дневной, студийный, контровой, пасмурный) Стиль: (фотореализм, 3D-рендер, вектор, акварель) Текст в кадре: (точные строки, где стоят, цвет, размер) Ограничения: (без водяных знаков, без логотипов, без лишнего текста, без лишних объектов)

Используйте, когда нужна нормальная обложка 1200x630 и вы не хотите, чтобы модель додумала лишние слова.

Сделай обложку 1200x630 для статьи про промтинг изображений. Стиль: простая современная 2D-иллюстрация, чистые формы, без 3D, без фотореализма. Фон: светлый однотонный, легкая текстура бумаги. Композиция: - Слева блок текста, выровнять по левому краю, 2 строки заголовка + 1 строка подзаголовка. - Справа иллюстрация: ноутбук на столе, рядом лист с заметками и маленькая лампа, без брендов. Текст на изображении (строго дословно, без добавлений, без замены букв): Заголовок: "Промты для картинок" Подзаголовок: "8 шаблонов без магии" Низ мелко: "vc.ru/neyroskuf" Типографика: гротеск, жирный заголовок, хороший контраст, чтобы читалось на телефоне. Ограничения: никакого другого текста, без водяных знаков, без логотипов.

Это задача, где ценится повторяемость: один персонаж, одинаковая толщина контура, одинаковая палитра.

Сгенерируй 8 отдельных стикеров (n=8), каждый на прозрачном фоне (PNG). Размер: 1024x1024 каждый. Персонаж: круглый сурикат в зеленом худи, простая мульт-форма, большие глаза. Стиль: 2D, толстый контур одной толщины, мягкие тени, без мелких деталей. Эмоции по очереди: 1) радость 2) злость 3) усталость 4) удивление 5) "ок" жест рукой 6) "нет" жест рукой 7) смущение 8) "погнали" (энергичный жест вперед) Ограничения: без текста, без логотипов, без водяных знаков, фон строго прозрачный.

Паттерны часто получаются со швом. Слово "tileable" и явный запрет на рамки решают половину проблем.

Сделай бесшовный тайловый паттерн (seamless, tileable) для фона сайта. Формат: квадрат 1024x1024. Мотив: маленькие пиктограммы про работу за компьютером (клавиатура, кружка, стикер, курсор, окно браузера). Стиль: минимализм, 2 цвета + фон, одинаковая толщина линий, без градиентов. Плотность: средняя, чтобы паттерн не рябил на экране. Ограничения: - бесшовность обязательна, никаких видимых границ тайла - никакого текста, цифр и логотипов - без водяных знаков

Когда просите набор иконок, модель иногда делает разный стиль. Тут помогают сетка и фиксированная толщина линий.

Сделай лист с 12 иконками в одной картинке. Формат: 1536x1024, белый фон. Сетка: 4 колонки x 3 ряда, одинаковые отступы. Стиль: монохромные линейные иконки, толщина линии одинаковая, скругленные углы. Темы иконок (слева направо, сверху вниз): скорость, безопасность, интеграции, поддержка 24/7, аналитика, командная работа, автоматизация, уведомления, доступ с телефона, облако, настройки, экспорт. Ограничения: без текста, без цифр, без рамок вокруг иконок, без водяных знаков.

Это частая задача под обложки, презентации и превью.

Расширь изображение до широкого формата 1536x1024. Сохрани центральный объект 1 в 1: форму, цвет, резкость, выражение лица (если есть), одежду, детали. Дорисуй слева и справа естественное продолжение сцены, как будто это тот же кадр той же камерой. Ограничения: - не добавляй новых людей, животных, надписей - не меняй цветокор и освещение в существующей части кадра - без логотипов и водяных знаков

Подходит для конспектов, досок, чеков, черновиков.

Сделай из этого фото аккуратный скан. Сделай: - выровнять перспективу, чтобы лист стал прямоугольным - убрать тени и желтизну, выровнять белый фон - повысить читаемость текста, но не менять ни одну букву и цифру - слегка убрать шум, сохранить естественную резкость Ограничения: ничего не дорисовывать, не добавлять новый текст, без водяных знаков.

Это спасает фото картины в раме, витрины, экрана под углом.

Иногда нужно выложить фото, но скрыть лишнее: номера, лица на заднем плане, бейджи.

Сделай изображение пригодным для публикации: скрыть персональные данные. Скрыть: - лица людей на заднем плане сделать неузнаваемыми (мягкое размытие) - номера на машинах (если есть) сделать нечитаемыми - бейджи и фамилии (если есть) сделать нечитаемыми Сохранить: композицию, свет, цвет, резкость, все остальное без изменений. Ограничения: не добавляй новый текст, не меняй главные объекты, без водяных знаков.

Сценарий: есть портрет человека (Image 1) и картинка-референс стиля (Image 2). Нужно сохранить человека, но привести фото к нужной стилистике, как будто это одна съемка.

Изображение 1 - фото человека, это я (нужно сохранить мою узнаваемость). Изображение 2 - референс (нужен внешний вид/вид существа/стиль и детали). Задача: превратить человека с изображения 1 в персонажа в стиле изображения 2, так чтобы это оставался я. Сохранить (identity + сцена): - мою идентичность и узнаваемость: форма и пропорции лица, расстояния между глазами, форма носа, губ, подбородка, скул - выражение лица, направление взгляда, поворот головы - позу, пропорции тела, ракурс, перспективу, кадрирование - фон и все объекты на фоне без изменений - исходный характер освещения (направление света), резкость Применить от изображения 2: - тип персонажа и ключевые признаки (кожа/шерсть/чешуя/металл, уши/рога/клыки/глаза, и т.д.) - материалы и фактуры, цветовую палитру, степень детализации - общий стиль рендера (фотореализм, кино-грим, 3D, иллюстрация) Правила совмещения: - черты лица и пропорции берутся из изображения 1, а "видовые" элементы накладываются поверх (уши, кожа, глаза, зубы), не меняя мою геометрию лица - результат должен выглядеть как одна и та же сцена и один кадр, а не как новый портрет Запрещено: - менять мою форму лица или делать "другого человека" - менять фон, одежду и аксессуары (если референс не требует точной замены) - добавлять текст, логотипы, водяные знаки

Сценарий: Image 1 - человек, Image 2..N - аксессуары (очки, часы, шапка, шарф, сумка). Важно, чтобы посадка, перекрытия и тени выглядели как в реальном фото.

Изображение 1 - человек. Изображения 2-5 - аксессуары (каждый предмет отдельно). Надень аксессуары 2-5 на человека из изображения 1 так, чтобы выглядело как реальное фото. Сохрани без изменений: - лицо, прическу, позу, телосложение - фон и освещение исходного кадра - существующую одежду человека (если аксессуар ее перекрывает, это нормально) Требования к реалистичности: - правильный масштаб каждого аксессуара относительно головы и рук - естественные контактные тени и отражения - корректные перекрытия: волосы поверх дужек очков, рука поверх ремешка часов, шарф поверх куртки - материал должен выглядеть как материал оригинала (металл, кожа, ткань) Ограничения: - не меняй выражение лица, цвет кожи и возраст - не добавляй новые предметы - без текста и водяных знаков

Это лучше делать генерацией с нуля, чтобы получить аккуратную схему и читаемые подписи. Важно сразу попросить "оригинальная иллюстрация, не копия из мануала", иначе можно случайно приблизиться к чьей-то конкретной схеме.

Создай оригинальную техническую иллюстрацию автомобиля в стиле BMW (спортивный седан), вид сбоку в разрезе (cutaway). Важно: это должна быть новая схема, не копия и не перерисовка существующего чертежа или страницы мануала. Формат: 1600x900, белый фон, черные линии, легкая серо-голубая подложка узлов, стиль "инженерный чертеж". Композиция: машина занимает 80% ширины, слева моторный отсек, по центру салон, сзади багажник и задняя подвеска. Добавь выноски с номерами и подписи на русском крупным шрифтом, чтобы читалось на телефоне. Сделай 14-18 пометок. Для каждой: - название детали - коротко "для чего" (5-9 слов) Обязательные узлы для пометок: двигатель, турбина (если есть), интеркулер (если есть), радиатор и вентилятор, воздушный фильтр и впуск, коробка передач, кардан/привод (по типу компоновки), дифференциал, подвеска передняя и задняя, тормозной диск и суппорт, рулевая рейка, топливный бак, аккумулятор, блок управления (ECU), выхлопная система. Ограничения: - без логотипов BMW и без названий моделей - без мелкого текста и водяных знаков

Это не новые запросы, а то, чем удобно "дотягивать" картинку, когда почти попали.

"Оставь композицию прежней. Исправь только [X]. Все остальное не меняй."
"Сделай меньше деталей в фоне. Главный объект не трогай."
"Увеличь пустое место слева примерно на 15%, чтобы там помещался текст. Ничего больше не меняй."
"Сохрани стиль и палитру. Убери любые мелкие надписи и случайные символы."

GPT Image 1.5 доступна в Image API, там же можно задавать размер, качество, формат, прозрачный фон и количество картинок.

Генерация:

import base64 from openai import OpenAI client = OpenAI() result = client.images.generate( model="gpt-image-1.5", prompt=""" Сделай бесшовный тайловый паттерн (seamless, tileable) 1024x1024. Минималистичные пиктограммы про работу за компьютером, 2 цвета + фон. Без текста, без логотипов, без водяных знаков, без видимых границ тайла. """, size="1024x1024", quality="high", output_format="png", ) img_b64 = result.data[0].b64_json with open("pattern.png", "wb") as f: f.write(base64.b64decode(img_b64))

Редактирование:

import base64 from openai import OpenAI client = OpenAI() with open("input.jpg", "rb") as f: result = client.images.edit( model="gpt-image-1.5", image=[f], prompt=""" Расширь изображение до 1536x1024. Сохрани центральный объект 1 в 1. Дорисуй только края сцены естественно. Без текста, без логотипов, без водяных знаков. """, size="1536x1024", quality="high", ) img_b64 = result.data[0].b64_json with open("out.png", "wb") as f: f.write(base64.b64decode(img_b64))