Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься

Привет, хочу поделиться историей о том, как я делал свой недавний проект — стоковый набор иллюстраций с использованием Stable Diffusion.

Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься

Я решил сделать пак на тему хеллоуина в пластилиновом стиле. По умолчанию модель SDXL умеет его, но стиль мне не очень нравился, поэтому я решил прибегнуть к тренировке модели LORA. Если кратко, то это обучение части нейросети на своем датасете для достижения нужного результата при генерации объекта.

Вот пример того, как SD генерит без тренировки
Вот пример того, как SD генерит без тренировки
Тот же промт, тот же сид, но со своей LORA
Тот же промт, тот же сид, но со своей LORA

Тренировка

Собрав датасет, я настроил и запустил тренировку через kohya-ss. Стоит сделать отступление, тренировка — очень ресурсоемкий процесс который требователен к железу. Я сознательно пропущу этот момент, потому что это тема для отдельного поста.

На видеокарте rtx4090 тренировка заняла около 8 часов (в датасете было >100 картинок). Запустить обучение SDXL на видеокарте с объемом памяти менее 12 ГБ возможно, но это не очень хорошая идея — отразится на качестве. Итогом тренировки стал файл LORA-модели, который мы будем использовать в генерациях.

Генерация в ComfyUI — стиль получился стабильный
Генерация в ComfyUI — стиль получился стабильный

Промты

Я использовал ChatGPT для генерации списка объектов на тему хэллоуина. Промт получился такого формата и мне было необходимо заменять лишь ключевое слово с названием объекта в нем. Я просто попросил чатбот и он сгененрировал мне список промтов.

(single:1.3) orange scary halloween pumpkin, (white background:1.1), soft light, (plasticine style:0.9) (single:1.3) scary halloween witch, (white background:1.1), soft light, (plasticine style:0.9) (single:1.3) scary halloween skull, (white background:1.1), soft light, (plasticine style:0.9)

В ComfyUI я собрал нодовую комбинацию, которая достает из текстового файла по одной строчке и использует в качестве промта для генерации.

Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься

Я сгененрировал больше 500 изображений и отобрал из них около сотни. Итогом работы стал вот такой набор:

Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься
Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься
Как сделать набор иллюстраций с помощью Stable Diffusion, и почему этим не стоит заниматься

Почему не стоит этого делать

За почти месяц после публикации на площадках этот набор принес мне $4. Я в очередной раз убедился что рынок стоковых иллюстраций умирает. Уже почти год виден стремительный тренд вниз в объеме продаж, не только у меня, но и у многих коллег и самих площадок. Причина очевидна — генеративные нейросети. Это не хорошо и не плохо — это реальность.

UPD: До появления нейросетей такой набор делался бы ни один месяц. Доходы при этом были в разы выше. Суть данного материала, рассказать о личном опыте и взгляде на изменившийся рынок.

Бум нейронок, важная веха такая же как сами компьютеры и появление интеренета и победить их классическими способами создания графики уже не получится.
Больше инфы и другие мои модели в ТГ канале.

22
8 комментариев

Круто

Ответить

А когда это 4 $ перестали быть деньгами? Деньги есть деньги , даже такие крохи стоят того! Вы что , решили что сразу станете миллионерами? Успех любит упорных. Если ничего не делать , ничего и не получиться.

Ответить

Многие ежедневно буквально умирают всего за несколько сотен долларов в месяц... Специфика работы скажем так , много опасных сфер деятельности. А вы , буквально рискуете только временем , сидите дома , в тепле , уюте и полной безопасности... я считаю 4 бакса в месяц того стоят..
Расскажите пожалуйста , на какие площадки вы размещаете свои работы? Как получаете деньги? Как происходят выплаты на ваш счёт??? Нам всем очень интерессно!!!

Ответить

Ваш комментарий касается важной темы — соотношения рисков и доходов в различных сферах работы. Вы правы, многие профессии связаны с опасностями и физическими рисками, в то время как работа, подобная моей, основана на интеллектуальной деятельности и выполняется в безопасной среде. Хорошо, что у каждого человека есть выбор куда инвестировать время и в какой сфере развивать свои навыки)

Что касается остального, если я увижу интерес к этой теме — обязательно расскажу.

Ответить

По поиску от Google Lens можно найти места размещений и сбыта ваших материалов , такие источники как :
Dribble , Titan UI , FreePick , IconScout , Design Bundles...
На весь ответ , меньше 2-ух минут ...

Ответить

Ищу креативного дизайнера на проработку дизайн шаблонов для продажи в офлайне ресторанам нового сервиса по модели saas

Ответить