да, в дифьюжене есть не только положительный промт, но и отрицательный. Таким образом можно объяснить нейросети, что нужно брать для генерации, а что категорически нельзя. Как раз таки далли, миджорней и прочие популярные онлайн-сервисы прописывают негативный промт самостоятельно, исходя из заданного запроса, либо имеют заранее предустановленные значения. Вот так выглядят поля положительных и отрицательных промтов сверху в stable diffusion:
Да, всё верно) Каждая генерация сохраняется в папке на компьютере и содержит в себе все настройки промта, так что все этапы легко откатить. Ну а если что-то не правильно нарисовала, то можно всегда просто перегенерить ещё раз. Где-то пальцы поправить, где-то детали дорисовать, а в финале всё это так же можно проапскейлить до 4к разрешения.
Вот вам ещё для полного крышесноса пример аккуратного поэтапного преобразования из исходной картинки в желаемую композицию для поста
Как я уже поменял выше: Что dall-e, что midjourney, что Kandinsky - Всё это крайне урезанные в функционале "вылизанные" модели, которые выдают стабильно хороший, но крайне однообразный результат, нацеленный на массового потребителя.
Поищите на ютубе канал "XpucT" - Российский разраб, который крайне доходчиво, переводя с программистского на человеческий, объясняет все возможные аспекты stable diffusion. Все ссылки даёт бесплатно, все дельные обновления сразу обозревает и вообще весьма увлекательно вещает)
Stable diffusion многих по-началу отпугивает своей сложностью в установке и использовании, но за часами бесконечных загрузок и настроек скрывается безграничный потенциал, полное отсутствие лимитов и цензуры, и главное - автономность.
Что dall-e, что midjourney, что Kandinsky - Всё это крайне урезанные в функционале "вылизанные" модели, которые выдают стабильно хороший, но крайне однообразный результат, нацеленный на массового потребителя.
Вот к примеру возможности апскейла в стейбл диффюжн)
Можно его ещё прямо в стейбеле проапскейлить до разрешения 4000х4000
Ну и попугайчики
чебурнатор от stable diffusion, кстати:
Всё-таки у stable diffusion пока что нет конкурентов. Можно и на компьютер установить (если не менее 8гб видеопамяти), можно пользоваться онлайн через google collab - и всё это абсолютно бесплатно. На хороших моделях пальцы и прочая сложная анатомия получается в разу лучше даже чем на midjourney v5. Так же изначально в оболочке automatic1111 есть и inpaint (лучший аналог этого пресловутого ластика от кандинского) и image to image и все возможные апскейлеры, и это я ещё не вспоминаю про безграничные возможности с плагинами от controlnet (так же бесплатными).
Фото с трампом, что я кидал в разрешении 4000х4000 весит 676 КБ. Стандартные фото в разрешении 1280х1280 - 129КББ Черновые в 640х640 - 91КБ