🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).

Кото Томато Продюсьён Продакшен презентс

Разбираем сегодня странности ИИ, именно на примере генерации картинок. Хотяяяя, эта "история" работает практически везде: видео, промпт на анализ документов, запрос на уточнение информации и т.п.

🍅 Главный вопрос новичков после первых картинок

Я ввёл один и тот же промпт, а картинки каждый раз разные. Какого...?!

И тут важно заметить - ИИ НЕ ОБЯЗАН и НЕ БУДЕТ повторять результат из раза в раз, один в один. И это не баг (ошибка). Это ключевая его особенность.

🍅 Почему ИИ не "рисует" одинаково - простыми словами

Последний раз беру в кавычки "рисует", далее перестанем это делать. Руки отсохнут.

Когда нейросеть генерирует картинку, она:

  • каждый раз начинает с разного шума
  • по-разному раскрывает сцену
  • чуть меняет формы, свет, детали
  • интерпретирует описание не буквально, а с вероятностью

Проще говоря: ИИ не воспроизводит файл, а каждый раз придумывает заново на основе описания. Даже (!!!) если текст запроса не менялся. Это как-будто ты всегда смотришь на один и тот же предмет по-разному. С разным бэкграундом и чуточку в разное время. Свет упал по-другому, мозг домыслил с разницей в микропикселях и пр.

🍅Аналогия, которая всё ставит на место

Представьте, что вы говорите двум художникам:

«Товарищи, нарисуйте девушку в чёрном пальто на улице вечером».

Никто из них не нарисует одинаково. И это нормально.

ИИ - это миллионы виртуальных художников, которые каждый раз выбирают чуть другой вариант.

Смотрим на примере nano banano pro (1 и тот же запрос, с разницей в 10 секунд)

1 вариант
1 вариант
2 вариант
2 вариант

А это "быстрая" nano banano flash:

🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).

"Проблему" вы поняли.

🍅 Почему иногда результат "хуже", чем в прошлый раз

Есть несколько причин:

Случайность

Даже хороший промпт не гарантирует идеал с первого раза.

Перегруженный запрос

Чем больше требований - тем выше шанс, что ИИ "размажет/размотает" результат.

Разная интерпретация деталей

ИИ может в этот раз сильнее "услышать" свет, а не одежду. В следующий - наоборот.

Ограничения модели

Не все нейросети одинаково хорошо держат стиль и композицию. Это вы увидели на примерах выше.

🍅 Почему не стоит ждать идеальный результат сразу

Очень важный момент для психики новичка: (а она у него подвижная, знаю, видела.)

ИИ - это процесс, а не кнопка "сделай как мне надо".

Нормальный рабочий сценарий выглядит так:

  1. первый результат - ок, но что-то не то
  2. второй - уже ближе
  3. третий - именно то, что нужно

И это абсолютная норма, а не ваша ошибка. Хотя бывают и ситуации наоборот. Когда первый вариант сразил наповал, а к третьему перешли на уровень рисования гуашью в 3-м классе.

🍅 Как работать с вариативностью, а не бороться с ней

Вот что реально помогает:

Генерить несколько вариантов

Не 1, а 4–8. Поэтому я люблю модели, где нейронка "накидывает" сразу от 4-х вариантом (Reve, Grok, MidJourney, Wan. Grok - так вообще сумасшедший в этом плане - предлагает бесконечную ленту вариантом. Нет может конечно и конечную, но я еще ни разу не доскролила до подвала)

🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).

Выбирать лучший и уточнять

Не переписывать всё, а добавлять 1–2 уточнения.

Менять не всё сразу

Один параметр → смотрим результат.

Вообще ИИ гораздо лучше воспринимает итерационно. Да что греха таить, с нами с людишками это тоже работает. Толи на тебя сгрузили 30 задач и ты не знаешь куда срать кинуться, толи "накидывают" по одной. И ты как ослик бежишь за своей морковкой, от морковки к морковки.

Пробовать другую модель

Иногда дело не в промпте, а в самой нейросети. Ну не умеет она делать "красиво", ну что мучить то.... На примере той самой известной завирусившейся Снегурочки.

промпт на создание Снегурочки:

A cinematic fashion horror editorial portrait of a woman with sharp facial features, wearing an intricate couture headpiece and outfit inspired by a ghostly, ethereal aesthetic. Flowing white fabrics, lace textures, pearls and delicate ornamental details frame her face. Pale skin with subtle cracked makeup effects, intense gaze, dramatic shadows. Dark, moody background. Cinematic magazine-style photography, dramatic lighting, shallow depth of field, high-fashion horror atmosphere, highly stylized and atmospheric composition. --chaos 30 --ar 9:16 --style raw --stylize 550

РАССКАЗЫВАЮ, ЕЕ ДЕЛАЛИ В MidJourney. Не надо пытаться повторять в другом месте, получите это:

Вот такая "красавица" получилась по мнению GigaChat. Не будем его осуждать за мнение и чувство "прекрасного" у всех разное, знаете ли.
Вот такая "красавица" получилась по мнению GigaChat. Не будем его осуждать за мнение и чувство "прекрасного" у всех разное, знаете ли.

А все потому, что "способности" делать так красиво, дороХо, боХато - есть на данный момент только у MidJourney.

🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).

🍅 Важно понять одно:

Новички думают, что у "опытных" все получается сразу идеально. На самом деле у них просто:

  • больше попыток
  • меньше ожиданий
  • спокойное отношение к процессу
  • есть понимание, что все ИИ разные, как мы с вами
  • и терпение, которое досталось от мамы или папы

🍅 ДОМАШКА!!!! Возьмите один и тот же промпт и сгенерируйте:

  • 4 варианта подряд
  • в одной и той же нейросети

Посмотрите не на "идеал", а на то, что повторяется:

  • композиция
  • свет
  • настроение
  • стиль

Вы увидите: ИИ не хаотичный псих. Он вариативен. И конечно же - подберите пул нейронок под свои задачи. О том какие есть ИИ в генерации картинок с бесплатными триалами (чтоб не тратить денежку на попытки и получение опыта) писала тут.

🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).

ИИ не может угадывать ваш идеал с первого раза. Он не ломается и не "тупит". Тут скорее всего (с вероятностью до 98%) тупите вы, со своей интерпретацией задачи. Он просто каждый раз предлагает вариант.

Генерация картинок - это не контроль, а диалог. Не требуйте от ИИ точного повтора - учитесь выбирать и направлять.

Когда вы это начинаете осознавать и принимаете - работа с нейросетями становится в разы спокойнее и приятнее. Местами, очень даже веселее.

🍅 Если всё ещё непонятно - не геройствуйте, приходите к нам

Если после этого куска знаний у вас всё равно ощущение, что:

  • я вроде понял, но оно всё равно рисует не то
  • вроде написал нормально, а результат странный
  • я, кажется, делаю что-то не так
  • мои руки видимо из жопы

Сразу скажу: вы не одни. И вы НЕ "не способны" и руки можно воткнуть в желанное место.

Поэтому да: у нас есть Telegram-канал и чат, где можно:

  • скинуть свой промпт и спросить: что тут не так?
  • показать результат и сказать: мне надо по-другому, помогите расскажите, как?
  • задать любой вопрос, даже самый глупый
  • получить помощь без душнины и без умничанья

Мы там все простые и все только учимся. Да, кто-то уже умеет, но он ведет себя как адеквашка и не станет унижать и причитать.

- Не ваша Саша. Берегите себя и свою придурь. С любовью, но без терпения.

9
2 комментария