Декомпозиция и анализ фото для генераций: ChatGPT + Midjourney + Stable Diffusion.

Показываю на примере, как я использую ChatGPT для анализа и декомпозиции «визуала» (графики, фотографий, стилей и т.д). Для последующих генераций в Midjourney и других ИИ сервисах.

"AI Fashion Girl" with <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fstability.ai%2F&postId=1461162" rel="nofollow noreferrer noopener" target="_blank">Stable Diffusion</a>
"AI Fashion Girl" with Stable Diffusion

Промпт для ChatGPT:

Это был мой «промпт» (запрос) конкретно для этой фотографии, вы же можете скорректировать и адаптировать запрос под себя, указав свои детали и параметры для анализа вашего референсного изображения.

В конце статьи я добавил возможные варианты. Главное — понимание самого процесса! 😉


Очень внимательно проанализируйте фотографию: внешность в деталях, лицо, глаза, нос, скулы, губы, брови, ресницы, овал лица, шея, уши, возраст, волосы, прическа, макияж, национальность, эмоции, выражение лица, взгляд, амтосфера, настроение, используемая камера, фильтры, цвет, фокус камеры, стиль съемки, угол камеры, тип камеры, источники света, освещение, обстановка и фон, местоположение, общий стиль, кадр, соотношение сторон и другие возможные детали которые я мог пропустить. Создай на его основе промпт для midjorney, не более 250 слов. Также негативный промт, из одного-двух слов разделенными запятыми.


Analyze the photo very carefully: appearance in detail, face, eyes, nose, cheekbones, lips, eyebrows, eyelashes, face oval, neck, ears, age, hair, hairstyle, makeup, nationality, emotion, facial expression, look, amtosphere, mood, camera used, filters, color, camera focus, shooting style, camera angle, camera type, light sources, lighting, setting and background, location, overall style, frame, aspect ratio and other possible details I might have missed. Create a promt for midjorney based on it, no more than 250 words. Also a negative prompt, of one or two words separated by commas.

Ответ от ChatGPT



«Портрет футуристической молодой женщины с платиновыми светлыми волосами в короткой прическе, сияющей кожей и точеными чертами лица. Ее губы накрашены смелым оранжевым цветом, а глаза накрашены тонко подобранными тенями. У нее нежные высокие скулы, четкая линия челюсти и мягкие миндалевидные глаза. Модель одета в минималистичный белый наряд с высоким воротником на фоне яркого голубого неба, что подчеркивает контраст. Освещение естественное и мягкое, отбрасывающее тонкий отблеск на ее гладкую кожу. Обстановка - современное открытое пространство с чистыми геометрическими формами. Фотореалистичный стиль, минимализм, редакционная фотография в стиле высокой моды, с мягким фокусом камеры и средним крупным планом. Естественный источник света, создающий мягкие тени. UHD, четкие детали, сбалансированные цвета, профессиональная студийная камера».

Негативный промпт

Пятна, морщины, аксессуары, искусственное освещение, тяжелые тени, беспорядок, низкое разрешение, винтажный стиль, зернистая текстура, перенасыщенные цвета, реквизит, занятый фон.



"High-fashion portrait of a futuristic young woman with platinum blonde hair in a sleek, short bob, glowing skin, and sharp facial features. Her lips are painted in bold orange, with subtle matching eyeshadow. She has delicate, high cheekbones, defined jawline, and soft almond-shaped eyes. The model is wearing a minimalistic white high-collar outfit against a vibrant blue sky background, emphasizing contrast. The lighting is natural and soft, casting a subtle glow on her smooth skin. The setting is a modern outdoor environment with clean, geometric shapes. Photorealistic style, minimalism, high-fashion editorial photography, with a soft camera focus and medium close-up shot. Natural light source, creating soft shadows. UHD, sharp details, balanced colors, professional studio camera."

Negative Prompt:

blemishes, wrinkles, accessories, artificial lighting, heavy shadows, clutter, low resolution, vintage style, grainy texture, oversaturated colors, props, busy background.


Результат: "AI Fashion Girl" with <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fstability.ai%2F&postId=1461162" rel="nofollow noreferrer noopener" target="_blank">Stable Diffusion</a>
Результат: "AI Fashion Girl" with Stable Diffusion

Подводя итог

В целом, результат получился вполне сносный. Немного докрутить и поиграть с настройками генерации (я тут сильно не заморачивался).

Общий контекст референса ChatGPT передал.
Схема рабочая! 👌😊

Бонус: дополнительные промпты от ChatGPT

  • Portrait Photo
  • Magazine Photo
  • Fashion Photography
  • 3D Graphics

Portrait Photo

Analyze the portrait photo in full detail: Focus on the model’s face, skin texture, expression, and features (eyes, lips, nose, etc.). Describe the lighting and its interaction with the model’s skin. Detail the hair, makeup, and any accessories. Assess the background and its relationship to the model. Provide insight into the overall tone, emotion, and atmosphere. Describe the angle, camera focus, and depth of field.

Magazine Photo

Examine the magazine-style image with a commercial and aesthetic lens: Focus on how the model is framed in the image, including posture, facial expression, and clothing. Assess the branding elements, fashion style, and makeup. Analyze the background, colors, lighting, and overall vibe (e.g., high fashion, minimalist, or dramatic). Pay attention to typography placement (if visible) and composition. Highlight camera angle, depth of field, and shooting style.

Fashion Photography

Analyze this fashion-focused image: Pay attention to the clothing, textures, fabric flow, and styling. Detail the pose of the model, body proportions, and any motion or movement. Describe the lighting (studio, natural, or mixed) and how it interacts with the model and outfit. Assess the background (runway, studio, outdoor) and its relationship to the fashion being showcased. Identify the mood and emotions conveyed through the model's pose and expression.

3D Graphics

Analyze the 3D-rendered model or scene: Focus on the rendering quality, realism, and textures of the model (clothing, skin, accessories). Describe the lighting used in the 3D environment (global illumination, shadows, reflections). Assess the material quality of the objects, whether they are metallic, plastic, matte, etc. Describe the environment or background and how it complements the model. Comment on camera placement, depth, and field of view.

Нейросети. ИИ для развития карьеры и бизнеса. #иирешения #AI #ChatGPT #midjourney #stablediffusion #prompt #prompts #graphicdesign

Начать дискуссию