Мастер-класс с «Дизайн-выходных»: MidJourney в коммерческих проектах с нуля

В дизайн-студии 65pixels мы уже давно работаем с ИИ для решения задач клиентов и продвижения социальных сетей. Мы верим, что за искусственным интеллектом будущее, поэтому делимся наработками с комьюнити в этой статье.

Так, 10 марта дизайнеры студии Алина Дмитриева и Олег Емшанов выступили на «Дизайн-выходных» в Суздале с тренингом «Как подружиться с нейросетью».

«Дизайн-выходные» — это некоммерческая конференция, которая проходит несколько раз в год в разных городах России: молодые специалисты из креативных агентств и IT-гигантов обсуждают новости индустрии, современные технологии и практики, делятся опытом.

На воркшопе мы рассказали про возможности нейросетей, научились составлять запросы для MidJourney, сгенерировали «коллаборацию» McDonald’s и Balenciaga, переодели Шрека. Нам показалось несправедливым ограничиться одним выступлением, поэтому раскроем все секреты в этой статье.

Что умеют нейросети

Сейчас нейросетей более 500. Например, среди них есть генераторы картинок: MidJourney, Stable Diffusion и DALL-E — и генераторы текстов: Chat GPT, Я.Автопоэт и Балабоба. Но этим функционал искусственного интеллекта не ограничивается.

Нейросети также умеют распознавать устную речь и черты лица, классифицировать объекты на изображении, находить раковые опухоли на рентгенах и писать треки про котиков в стиле Эминема, подражая его голосу.

Как дизайнеры мы сосредоточились именно на создании изображений. Искали яркую и быструю замену стокам, и нашли её в лице MidJourney.

Почему MidJourney

Мы выбрали MJ как самую простую в использовании нейросеть: короткие команды упрощают работу, а результат из 4 картинок генерируется за 30 секунд. Ещё нам важно, что этот сервис не требует сложной установки. Общение с ИИ происходит через чат-бота в Discord.

Однако у MJ есть и минусы. Четвёртая версия игнорирует некоторые слова из запроса, не справляется с генерацией надписей и футболистов, не очень умело «рисует» кисти рук. Ещё она иногда создаёт предметы, оторванные от реальности: например, две ручки у чашки или четыре камеры у айфона.

Недавно вышла пятая версия и подобных артефактов стало существенно меньше, однако данная функция доступна только по подписке. Об этом расскажем дальше в статье, а подробнее о способностях нейросетей и устройстве MJ написали в предыдущем материале.

Как составить промпт

Промпт — это запрос на генерацию картинки. Он содержит описание из ключевых слов. Чем точнее вы изложите идею, тем ближе к задуманному будет результат. C MidJourney мы общались на английском. Всё потому, что от языка зависит то, на каком конкретно материале будет обучаться нейросеть, поэтому от запросов на русском часто веет советской тематикой, даже когда это совсем не к месту.

А ещё нейросеть — это машина, и общаются с ней командами. Так, промпт должен следовать за командой /imagine, что переводится как «представь». Запрос может состоять из слов, фраз и даже emoji.

/imagine collaboration between McDonalds and Balenciaga

Короткие промпты приводят к тому, что нейросеть будет опираться на собственный узнаваемый «авторский» стиль, что не всегда кстати. Слишком длинные запросы будут приводить к нежелательным предметам на изображении или, наоборот, к игнорированию нейросетью части описания. Но всё же главное — это не количество символов, а содержание.

/imagine reusable coffeecup for Mcdonalds in minimalistic design

Старайтесь описывать основные идеи. Используйте для этого самые точные и конкретные синонимы. Например, «big» стоит заменить на «gigantic», «enormous», или «immense» в зависимости от ситуации. Отсекайте всё лишнее. MidJourney не понимает человеческую речь и описание видит скорее как набор тегов. Старайтесь избегать сложных грамматических конструкций.

Учитывая всё сказанное, попробуйте сопоставить запросы и результаты. Оставьте свой вариант в комментариях.

Подумайте о деталях, которые вы хотите видеть. Всё, что остаётся неописанным, будет определено случайно и может сильно вас удивить. Неопределённость отлично подходит для поиска идей, тем не менее постарайтесь ёмко описать всё, что хотите видеть на картинке.

  • Объект: человек, животное, персонаж, локация или предмет
  • Материал: фото, живопись, иллюстрация, скульптура или набросок.
  • Окружение: в здании или на улице, в Нарнии, под водой, в мегаполисе
  • Освещение: мягкое, яркое, студийное, неоновое или закатное
  • Цвета: яркие, приглушённые, насыщенные, монохроматические, черно-белые или пастельные
  • Настроение: меланхоличное, спокойное, радостное или энергичное
  • Композиция: портрет, близкий план, средний план, с высоты птичьего полета

Кейс и практика

Давайте смоделируем кейс и тз. Представим, что мы делаем дизайн-сервис, который помогает с упаковкой абсолютно любого бизнеса в инновационные IT-решения. Неважно, что ты делаешь: печёшь пирожки, крутишь шаурму, занимаешься доставкой — сегодня любой бизнес можно оцифровать.

Будущее уже тут — и это тот самый случай, когда киберпанковые иллюстрации нейросети подходят. Для этого примера попробуем сгенерировать баннер для салона красоты.

/imagine the bridal morning in cyberpunk style, wedding, neon glow, cinematic scene, vaporwave vibe, --ar 16:9

Небольшой секрет: именно для иллюстраций больше всего подходят длинные подробные промпты. Но далеко не всегда длиннее значит лучше.

Для того, чтобы результат получился более предсказуемым, можно использовать помощники по составлению запросов для MJ: Promt Helper. Это сторонний сервис, где можно написать запрос + выбрать стилистику изображения, цвета, свет и другое — просто путём нажатия кнопки. Останется только скопировать и вставить в строку чат-бота нейросети.

Команды и настройки

Запрос состоит не только из описания, но и из ссылок на референсы, весов, коротких команд и стоп-слов. Об этом мы узнали благодаря Алексею Бычкову. В этой части статьи результаты генерации позаимствованы из его figma-инструкции по MJ.

Помимо команды /imagine, к основным относятся ещё 3: /settings для вызова настроек, /info — для вывода информации о подписке и оставшихся генерациях и /blend — для «смешения» картинок.

В настройках можно выбрать параметры: версию модели, скорость и качество генерации, размер изображения или один из режимов стилизации. Также их можно скорректировать, добавив короткие команды. Их ставят в конец промпта через запятую. Для этого нужно после двух дефисов «--» добавить соответствующий параметр, например, «--q2». Обо всём по порядку:

С каждой новой версией MidJourney результат становится всё точнее и реалистичнее. С моделью 3-ей версии нейросеть выдаёт более художественные изображения с пастозными мазками и минимумом деталей. Узнаваемый стиль этой модели положил начало популярности MidJourney.

У 4-ой версии получаются более детальные изображения, но их всё ещё сложно перепутать с реальностью. Результаты «--v4» выглядят как рекламная ретушь или цифровая живопись, написанная cg-художником в фотошопе.

Пока мы работали над этой статьёй, вышла 5-ая версия. У неё новая архитектура и технологии стилизации, поэтому теперь ИИ умеет создавать изображения, неотличимые от фотографий. Нейросеть стала лучше генерировать руки и сложные позы. Даже пальцев почти всегда пять. Правда, данный параметр недоступен без подписки.

Если фотореализм вам не подходит, всегда можно выбрать Niji Mode. Он предназначен для создания иллюстраций в стиле flat, аниме и комиксов. Данная модель обучалась исключительно на изображениях данного направления.

Также настраивается детализация. Обманчивое слово «Качество» влияет не на количество пикселей, а на резкость фона, обилие второстепенных объектов и сложность текстур. Чем выше «резкость», тем дольше генерируется изображение.

Параметр «Стилизация» позволяет нейросети немного отойти от описания пользователя. Чем выше данный показатель, тем более привлекательными и композиционно совместимыми будут объекты на изображении, но тем дальше оно будет от изначального запроса. Данный параметр помогает на этапе поиска идей и создания мудбордов.

Данная настройка помогает выбрать каким образом нейросеть будет заполнять недостающие пиксели при увеличении изображения для создания законченной работы. Выбирая «light», надо понимать, что несмотря на идеальное сходство с прототипом, итоговое изображение будет слегка размытым, шумным и не детализированным. «Regular» совсем немного отличается от изначальной генерации, поэтому данная настройка оптимальна. «Beta» позволяет получить наиболее детальную картинку, однако иногда на месте деталей можно обнаружить несуразные артефакты.

Полный список команд можно найти в документации нейросети.

Также одной из возможностей MidJourney является использование референсов, т.е. картинок на которые будет опираться нейросеть при рисовании. Референс можно приложить двумя способами: найти изображение в интернете и вытянуть из неё url-адрес или закинуть в чат MJ изображение, чтобы открыть его в новой вкладке, где можно скопировать адрес из браузера. Этой части промпта тоже можно добавить вес.

/imagine brand reusable water bottles for Mcdonalds https://i.pinimg.com/564x/1c/c2/2d/1cc22d59aa2605caba3e19f9f8e10f81.jpg::4

Правила пользования

Для того чтобы долго и успешно использовать AI, нужно соблюдать внутренние правила сервиса. Например, в нейросети есть цензура. Так как у проекта по умолчанию открытое комьюнити, искусственный интеллект не генерирует контент, запрещённый возрастным рейтингом PG-13: контент для взрослых, отделённые части тела, половые органы, запрещённые вещества, кровь и насилие.

Для этого у MidJourney есть лист слов, которые ведут к автоматическому бану. Например, запрещены слово «вакцина» и смайлик 🍑. Список постоянно пополняется, поэтому рекомендуем периодически гуглить бан-листы и стараться избегать указанных тематик. Если же нейросеть всё же сгенерировала что-то вызывающее, то любой пользователь может подать жалобу.

Что по законам?

Также важно соблюдать законы об авторском праве. Пользовательская лицензия сервиса предполагает, что если изображение сгенерировано во время действия подписки, то вы являетесь полноправным владельцем картинки. Если же подписки у вас нет, то всё принадлежит создателям нейросети. Распространять изображения с пробного периода можно по лицензии CC-BY-NC, то есть с указанием авторства нейросети в некоммерческих целях.

Тем не менее по российскому законодательству результаты генерации пока не защищаются авторским правом. Это означает, что вы можете использовать изображение, как захотите, но то же вправе сделать любой другой пользователь.

Вывод

По нашему мнению, нейросеть не враг иллюстраторам и дизайнерам. Её работы — отличный источник вдохновения. ИИ редко выдаёт законченный результат, который можно тут же использовать.

Но это не значит, что MidJourney не применима в коммерческих проектах. При правильных настройках стилизации она хороша для поиска идей. Но чаще уже придуманный концепт после генерации нужно будет просто переработать в макет или сколлажировать в итоговую иллюстрацию. В результате отпадают проблемы с качеством реализации и авторским правом, а работа ускоряется в несколько раз.

Например, в начале статьи вы видели реальную работу для наших заказчиков с иллюстрациями AI. Доминанта в дизайне упаковки крафтового пива — это коллаборация дизайнеров студии и искусственного интеллекта. Если бы не MJ, пришлось бы делегировать задачи иллюстраторам. Также с помощью ИИ мы генерируем графику для наших социальных сетей.

0
Комментарии
-3 комментариев
Раскрывать всегда