🍅 8. НЕСТАБИЛЬНАЯ СТАБИЛЬНОСТЬ. Почему по одному и тому же запросу ИИ каждый раз "рисует" по-разному (и почему это нормально).
Разбираем сегодня странности ИИ, именно на примере генерации картинок. Хотяяяя, эта "история" работает практически везде: видео, промпт на анализ документов, запрос на уточнение информации и т.п.
🍅 Главный вопрос новичков после первых картинок
Я ввёл один и тот же промпт, а картинки каждый раз разные. Какого...?!
И тут важно заметить - ИИ НЕ ОБЯЗАН и НЕ БУДЕТ повторять результат из раза в раз, один в один. И это не баг (ошибка). Это ключевая его особенность.
🍅 Почему ИИ не "рисует" одинаково - простыми словами
Последний раз беру в кавычки "рисует", далее перестанем это делать. Руки отсохнут.
Когда нейросеть генерирует картинку, она:
- каждый раз начинает с разного шума
- по-разному раскрывает сцену
- чуть меняет формы, свет, детали
- интерпретирует описание не буквально, а с вероятностью
Проще говоря: ИИ не воспроизводит файл, а каждый раз придумывает заново на основе описания. Даже (!!!) если текст запроса не менялся. Это как-будто ты всегда смотришь на один и тот же предмет по-разному. С разным бэкграундом и чуточку в разное время. Свет упал по-другому, мозг домыслил с разницей в микропикселях и пр.
🍅Аналогия, которая всё ставит на место
Представьте, что вы говорите двум художникам:
«Товарищи, нарисуйте девушку в чёрном пальто на улице вечером».
Никто из них не нарисует одинаково. И это нормально.
ИИ - это миллионы виртуальных художников, которые каждый раз выбирают чуть другой вариант.
Смотрим на примере nano banano pro (1 и тот же запрос, с разницей в 10 секунд)
А это "быстрая" nano banano flash:
"Проблему" вы поняли.
🍅 Почему иногда результат "хуже", чем в прошлый раз
Есть несколько причин:
Случайность
Даже хороший промпт не гарантирует идеал с первого раза.
Перегруженный запрос
Чем больше требований - тем выше шанс, что ИИ "размажет/размотает" результат.
Разная интерпретация деталей
ИИ может в этот раз сильнее "услышать" свет, а не одежду. В следующий - наоборот.
Ограничения модели
Не все нейросети одинаково хорошо держат стиль и композицию. Это вы увидели на примерах выше.
🍅 Почему не стоит ждать идеальный результат сразу
Очень важный момент для психики новичка: (а она у него подвижная, знаю, видела.)
ИИ - это процесс, а не кнопка "сделай как мне надо".
Нормальный рабочий сценарий выглядит так:
- первый результат - ок, но что-то не то
- второй - уже ближе
- третий - именно то, что нужно
И это абсолютная норма, а не ваша ошибка. Хотя бывают и ситуации наоборот. Когда первый вариант сразил наповал, а к третьему перешли на уровень рисования гуашью в 3-м классе.
🍅 Как работать с вариативностью, а не бороться с ней
Вот что реально помогает:
Генерить несколько вариантов
Не 1, а 4–8. Поэтому я люблю модели, где нейронка "накидывает" сразу от 4-х вариантом (Reve, Grok, MidJourney, Wan. Grok - так вообще сумасшедший в этом плане - предлагает бесконечную ленту вариантом. Нет может конечно и конечную, но я еще ни разу не доскролила до подвала)
Выбирать лучший и уточнять
Не переписывать всё, а добавлять 1–2 уточнения.
Менять не всё сразу
Один параметр → смотрим результат.
Вообще ИИ гораздо лучше воспринимает итерационно. Да что греха таить, с нами с людишками это тоже работает. Толи на тебя сгрузили 30 задач и ты не знаешь куда срать кинуться, толи "накидывают" по одной. И ты как ослик бежишь за своей морковкой, от морковки к морковки.
Пробовать другую модель
Иногда дело не в промпте, а в самой нейросети. Ну не умеет она делать "красиво", ну что мучить то.... На примере той самой известной завирусившейся Снегурочки.
промпт на создание Снегурочки:
РАССКАЗЫВАЮ, ЕЕ ДЕЛАЛИ В MidJourney. Не надо пытаться повторять в другом месте, получите это:
А все потому, что "способности" делать так красиво, дороХо, боХато - есть на данный момент только у MidJourney.
🍅 Важно понять одно:
Новички думают, что у "опытных" все получается сразу идеально. На самом деле у них просто:
- больше попыток
- меньше ожиданий
- спокойное отношение к процессу
- есть понимание, что все ИИ разные, как мы с вами
- и терпение, которое досталось от мамы или папы
🍅 ДОМАШКА!!!! Возьмите один и тот же промпт и сгенерируйте:
- 4 варианта подряд
- в одной и той же нейросети
Посмотрите не на "идеал", а на то, что повторяется:
- композиция
- свет
- настроение
- стиль
Вы увидите: ИИ не хаотичный псих. Он вариативен. И конечно же - подберите пул нейронок под свои задачи. О том какие есть ИИ в генерации картинок с бесплатными триалами (чтоб не тратить денежку на попытки и получение опыта) писала тут.
ИИ не может угадывать ваш идеал с первого раза. Он не ломается и не "тупит". Тут скорее всего (с вероятностью до 98%) тупите вы, со своей интерпретацией задачи. Он просто каждый раз предлагает вариант.
Генерация картинок - это не контроль, а диалог. Не требуйте от ИИ точного повтора - учитесь выбирать и направлять.
Когда вы это начинаете осознавать и принимаете - работа с нейросетями становится в разы спокойнее и приятнее. Местами, очень даже веселее.
🍅 Если всё ещё непонятно - не геройствуйте, приходите к нам
Если после этого куска знаний у вас всё равно ощущение, что:
- я вроде понял, но оно всё равно рисует не то
- вроде написал нормально, а результат странный
- я, кажется, делаю что-то не так
- мои руки видимо из жопы
Сразу скажу: вы не одни. И вы НЕ "не способны" и руки можно воткнуть в желанное место.
Поэтому да: у нас есть Telegram-канал и чат, где можно:
- скинуть свой промпт и спросить: что тут не так?
- показать результат и сказать: мне надо по-другому, помогите расскажите, как?
- задать любой вопрос, даже самый глупый
- получить помощь без душнины и без умничанья
Мы там все простые и все только учимся. Да, кто-то уже умеет, но он ведет себя как адеквашка и не станет унижать и причитать.
- Не ваша Саша. Берегите себя и свою придурь. С любовью, но без терпения.