Как написать промпт для создания изображения в Stable Diffusion 3.5 — руководство от Stability AI

Компания советует использовать термины из кино и структурировать запрос.

Stability AI предлагает начать запрос со стиля изображения, затем описать действие, композицию (крупный или общий план), освещение, технические параметры кадра, текст вывесок или плашек и в конце добавить негативный промпт при необходимости.

  • Стиль. Можно задать технику живописи (например, масляная живопись или сюрреализм), попросить сгенерировать цифровой рисунок или фотографию.
Заданы стили: экспрессионизм, линейный чёрно-белый рисунок, воксельная графика соответственно. Источник здесь и далее: Stability AI
Заданы стили: экспрессионизм, линейный чёрно-белый рисунок, воксельная графика соответственно. Источник здесь и далее: Stability AI
  • Субъект и действие. Если на изображении есть субъект, сначала нужно обозначить его, а затем что он делает.
Пример промпта: «Общий план пожилой пары, которая держится за руки на тихом пляже на закате, глядя на волны».
Пример промпта: «Общий план пожилой пары, которая держится за руки на тихом пляже на закате, глядя на волны».
  • Свет. Для его описания можно использовать такие термины из фотографии, как подсветка (backlight) и контровой свет (hard rim light).
Пример промпта: «Мягкий, рассеянный, туманный свет. Глубокие, угрюмые тени. Под деревом стоит автомобиль, ржавый и заброшенный, фары светятся жёлтым светом».
Пример промпта: «Мягкий, рассеянный, туманный свет. Глубокие, угрюмые тени. Под деревом стоит автомобиль, ржавый и заброшенный, фары светятся жёлтым светом».
  • Технические параметры. Чтобы результат соответствовал ожиданиям, можно использовать кинематографические термины: «вид с высоты птичьего полёта» (bird’s eye view), «крупный план» (close-up), «съёмка с крана» (crane shot), «широкоугольная съёмка» (wide-angle shot), «объектив "рыбий глаз"» (fish-eye lens).
Генерации по запросам: съёмка сбоку, вид с высоты птичьего полёта, съёмка с пролетающего дрона.
Генерации по запросам: съёмка сбоку, вид с высоты птичьего полёта, съёмка с пролетающего дрона.
  • Текст. Текст нужно писать в кавычках, без сокращений.
Пример промпта: «На столе стоит большой кроссовок, красные шнурки болтаются над синим тканевым верхом и белой подошвой. Поперёк зелёными буквами нацарапаны слова "Спорт — это весело"».
Пример промпта: «На столе стоит большой кроссовок, красные шнурки болтаются над синим тканевым верхом и белой подошвой. Поперёк зелёными буквами нацарапаны слова "Спорт — это весело"».
  • Негативный промпт. В этом случае сначала надо написать Positive, поставить двоеточие и перечислить нужные элементы, а затем — Negative, двоеточие и назвать нежелательные элементы или цвета.
Пример промпта: «Позитивный: фотопортрет в стиле магического реализма, мягкий приглушённый свет, женщина-брюнетка 30 с небольшим лет, hipster fashion, откровенная, стильная. Негативный: сглаживание, неон, 3D-рендер».
Пример промпта: «Позитивный: фотопортрет в стиле магического реализма, мягкий приглушённый свет, женщина-брюнетка 30 с небольшим лет, hipster fashion, откровенная, стильная. Негативный: сглаживание, неон, 3D-рендер».
Промпт: «Стилизованный 3D-рендер милого маленького робота, сидящего со щенком на диване, окруженного разноцветными стикерами».
Промпт: «Стилизованный 3D-рендер милого маленького робота, сидящего со щенком на диване, окруженного разноцветными стикерами».

22 октября 2024 года Stability AI выпустила новое семейство моделей для генерации изображений Stable Diffusion 3.5. Нейросеть доступна на HuggingFace. В некоммерческих целях использовать итоговые изображения можно бесплатно.

66
22
11
5 комментариев

О неплохо, вообще Stable Diffusion 3.5 порадовал со своим последним обновлением, сейчас немного экспериментирую.

Лучше как всегда подождать месяц-другой когда появятся кастомные датасеты

Женщина лежит на траве

Спасибо! Захотелось срочно применить🤭 бегу пробовать