https://t.me/+QKrZga1jaOc0NTVi Stable Diffusion: полезные расширения, красивые модели, токены и инструменты.
Хорошо, вот с камерой. Без повышения весов токенов, тот же промпт.
Из веб-версий могу порекомендовать только Midjourney и новой SDXL. Остальные рисуют скверно и странно их вообще обсуждать.
Тестировал Бинг. Всё очень плохо, на уровне кандинских и прочих "шедеврумов". Годится только для составления подборок уровня "Как нейросеть видит пельмени" и совершенно не пригодно для рисования чего-то серьёзного.
На пацанов?
a boy, (shabby:1.4) clothes - в дизайнерских шмотках
a boy, old (tattered:1.3) clothes - в джинсовой рванине
Ну вот вам рисунок на Stable Diffusion описанный самым естественным языком из возможных. Камера, которой девочка что-то фотографирует, присутствовала не на всех рисунках. Но при повышении силы токена была на каждом.
Скорость рисования... секунды 3 на мощной видеокарте, 10-15 на средненькой и несколько минут если рисовать вообще без видеокарты, только на центральном процессоре.
Промпт: Behind a pair of oversized glasses, this girl's hazel eyes survey the world around her. She wears a beanie on her head, shielding her curly locks from the sun's rays, as she clicks her camera to capture every moment.
Нарисовал на кастомной модели Stable Diffusion мальчика в драной одежде. Заняло 10 минут, из которых 9,5 подбирал в мультитране подходящее слово для рваной одежды (old tattered clothes).
Если рисовать rag clothes, то одёжа получается слишком нарядной, а в каких-то случаях чуть ли не дизайнерской.
В этом и кроется ваша ключевая ошибка: попытка нарисовать что-то по одному и тому же промпту, не учитывая особенности работы каждой конкретной модели.
Для иллюстрации прицепил к сообщению рисунки из Midjourney, ровно по тому же промпту, по которому нарисованы две предыдущие девушки. Разница колоссальная, так как не были учтены особенности составления промтов.
Stable Diffusion позволяет рисовать на тысячах моделей (civitai.com), от фотореалистичных до стилизованных под рисунки. Но вы почему-то рисовали на дефолтной 1.5, и даже не использовали негативный промпт.
Я тестировал большинство моделей из вашей подборки. Midjourney на первом месте, качество работ на недостижимом уровне, а сама модель опережает любых конкурентов на годы. Кастомные модели Stable Diffusion на втором месте, качество и разнообразие на очень высоком уровне. Остальные выдают одинаково плохие результаты.
Вы явно делали что-то очень неправильное, раз Stable Diffusion показала худшие результаты в рисовании лиц. Вот пара работ, выполненных на среднем уровне и с ошибками.
Если немного постараться, то на Stable Diffusion можно достичь полной фотореалистичности.
Уже давно есть площадки с огромным оборотом, которые позволяют продать виртуальное оружие за реальные деньги.
Самая популярная площадка берёт 10% комиссию (или 5%, если вы платите абонентскую плату) от стоимости оружия.
У SDXL всего два варианта: веб-версия на сайте проекта (лучший вариант, т.к. он гибче и имеет больше настроек) или официальный сервер в дискорде. Кто все остальные - не знаю, самозванцы какие-то.
Ещё можете попробовать https://pixai.art, если вам так критичны веб-версии. Под капотом тот же самый Stable Diffusion, несколько сотен моделей (в основном аниме), умеет в редактор поз и ещё много во что.
Даже этот сервис лучше шедеврумов бинга.