7 простых способов получить качественную картинку в Midjourney

Всем привет, меня зовут Андрей Цыган - я предприниматель, исследователь, спикер. Иногда, ну бывает такое, у меня появляются вроде здравые мысли, которыми я хочу поделиться с обществом - через пост в соц. сетях, видео, или публичное выступление. Мысль мы обычно заворачиваем в текст - тут отлично справляется современная парочка "Чип и Дейл" - естественный мозг и ChatGPT.

Но люди, на то они и люди, по разному воспринимают разные каналы поступления информации, так сказать на вход естественной нейронной сети разные веса на разный канал - кто то лучше читает, кто то слушает, а кому-то важен образ, чтобы лучше усвоить мысль.

Меня больше в статье не будет, честно!
Меня больше в статье не будет, честно!

Вот про картинки для образности мысли мы сегодня и поговорим. Они могут использоваться как обложка к посту или лонгриду, или я чаще использую в презентации. Я хорошо помню ту боль и страдания поиска нужной картинки, в достойном качестве, нужных пропорций чтобы подчеркнуть мысль. Иногда на это уходило времени больше, чем на текст и буллеты презентации. Вот пример какие сейчас у меня, без дизайнера, получаются презентации

После появления генераторов изображений я активно начал их использовать для этих целей. Прошёл несколько курсов по Midjourney и выработал для себя 7 простых вариантов получения нужной картинки.

Мои методы - это про соотношение времени/качества картинки

Это конечно не варианты для выставки работ, создания нейрокартины, элемента брендинга - но предпринимателям не всегда нужен такой перфекционизм.

1. Пишем простой промт

Всё гениальное - просто) Сам Midjourney пишет - не усложняйте. Промты размером в томик "Войны и Мир" он полностью не читает.

Важно помнить - что мы должны описывать не процесс, чувства персонажей - а описывать конечную картину. Представьте что она у вас есть - и просто опишите её. Для начала я всегда начинаю с этого метода, в 70% я получаю результат и пошёл дальше.

Товарищ Midjourney понимает только английский язык, поэтому, если с ним "на Вы" - идём в Deepl . Посмотрим пример - мне в подводке нужно было рассказать про карго-культ и нужны атмосферные картинки

Бесплатный и мощный переводчик
Бесплатный и мощный переводчик

Далее просто копируем английский текст в MJ и получаем картинку:

Парни слева сверху - "бухгалтера завода после прослушивания лекции по ИИ"
Парни слева сверху - "бухгалтера завода после прослушивания лекции по ИИ"

Что можно ещё добавить:

  • Соотношения сторон. Понимая применение картинки мы будем знать размер. Midjourney оперирует не пикселями, а соотношением. Если нужно перевести, можно использовать калькулятор. К примеру, слайд - 16:9, сторис - 9:16, пост в инстаграм* - 1:1. Когда делаю презентацию, я сначала прописываю текст, а потом "на глаз" сколько осталось места.
    В Midjourney это задаётся параметром --ar 16:9 (вставить свои цифры)
Весь слайд 16:9. Мне нужна картинка занимающая пример треть по ширине,и полную высоту. В таком случае я ставлю 5:9 или 6:9
Весь слайд 16:9. Мне нужна картинка занимающая пример треть по ширине,и полную высоту. В таком случае я ставлю 5:9 или 6:9
  • Фон и цвета. Перед началом презентации я понимаю, какой буду использовать фон и основной цвет, очень классно смотрятся картинки которые сочетаются с цветами заголовка.
    И тогда добавляем после нашего промта цвет фона и цвет линий: белый фон и оранжевые цвета/чёрный фон и красные цвета
Совсем несложно, на слайд лучше смотрится когда и люди и заголовок в одном цвете
Совсем несложно, на слайд лучше смотрится когда и люди и заголовок в одном цвете
  • Требуется именно фото. Иногда по простому описанию MJ может делать иллюстрации. Есть множество способов намекнуть MJ что мы хотим именно фото - я использую в начале промта Photo of "ваш запрос". Ниже пример один и тот же запрос - иллюстрация и фото
  • Используем разные версии. В MJ сейчас порядка 10 рабочих версий, и номер версии не значит что она именно хуже - она рисует по другому. И иногда даже более старые версии могут рисовать лучше.
    Для этого используем функцию "перебора" и вставляем такую конструкцию. Предварительно отключите в настройках "style raw"

--v {4 {--style {4a, 4b, 4c}}, 5{a, b,.1,.1 --style raw,.2,.2 --style raw}}

Мы получаем сразу 9 генераций по одному промту в разных стилях. Иногда в предыдущих версиях может быть более интересный результат. Версии подписаны под картинкой:

2. Референс картинка

Если первый способ нас не удовлетворил во всех вариациях, или вы видите что совсем не в ту сторону думает MJ - есть способ направить его на путь истинный - показать фото или картинку как мы хотим.

Я хотел получить тех самых бабушек возле подъезда. Но по простому промту MJ мне выдавал их возле деревенского домика (по его мнению все бабушки в СССР жили только в избе)

Бабушки в верхнем левом углу отлично бы подошли для "Твинс Пикс: Неизданное"
Бабушки в верхнем левом углу отлично бы подошли для "Твинс Пикс: Неизданное"

Но есть простой способ - находим в нете картинку, благо по запросу "бабушки возле подъезда" мы получаем обилие ностальгических снимков. Далее копируем URL на неё и вставляем в начало промта (это важно, картинка должна идти первой). Получается так:
https://s.mj.run/qkbMDN9l_Ek Russian grandmothers near the Soviet entrance hall
И тут мы получаем уже падабайку:

От одного взгляда мороз по коже,сразу думаешь где нашкодил
От одного взгляда мороз по коже,сразу думаешь где нашкодил

Так можно обходить и некоторые темы с национальностями, их MJ не любит, только через референс я смог сделать цыган с медведями в танце.

3. Промты по изображению

Уже достаточно давно по меркам нейросетей MJ ввёл функцию /describe - по ней он даёт 4 промта, как он увидел то что на картинке. Я подробнее её тестировал и описывал тут.

Полезная функция когда вы понимаете образ, который легко найти в интернете. Я этот метод часто использую когда нужно нарисовать здание, улицы, город и т.д.

Современное офисное здание
Современное офисное здание

И у нас есть чудесная функция "Imagine all" - мы сразу получаем 4х4 генерации.

4. Просим помощи у брата - ChatGPT

Промт - это текст, текст - это ChatGPT. В целом логика такая)
ChatGPT не знает всех тонкостей и новых функций MJ но он полезен чтобы описать сцену достаточно подробно. Вот он то пишет те самые длиииииинные промты.

Есть несколько методов написания промтов через ChatGPT - длинный и более верный, и короткий - для нас

  • Длинный. Так как ChatGPT не знает тонкостей MJ мы должны его дообучить. Мы даём ему описание, все функции в текстовом формате, показываем примеры промтов. Потом, надеемся и молимся Сэму Альтману, ждём чего-нить годного.
  • Короткий. Используем базы плагинов или разрешения куда это уже вшито. Я использую AIPRM - это расширение для Chrome,в котором вы можете выбрать из пользовательской базы промт и просто ввести свою тему.
    У вас появляется такое окно, и в нём выбираем:
    Topic - Generative AI
    Activity - Midjourney
    Ouput - English
    И далее вводим описание что вам нужно.

Так выглядит ChatGPT с установленным плагином AIPRM
Так выглядит ChatGPT с установленным плагином AIPRM

Мне нужно было завтрак в стиле Алисы в стране чудес, вот что он мне выдал

Create an image that depicts a scene from "Alice Through the Looking Glass" where Alice and several other characters are having breakfast in a mirrored room. The characters should be dressed in formal business attire, such as suits, dresses, and blazers. The setting should convey an elegant and sophisticated atmosphere, with a table adorned with a variety of breakfast items like pastries, fruits, and hot beverages. The characters can be engaged in conversation, enjoying their meal, or simply engaged in their own activities. The mirror should reflect the characters and the room, adding a sense of depth and surrealism to the image. The lighting should be soft and warm, casting gentle shadows and highlighting the details of the characters' expressions and clothing, white background

И на выходе я получил в нужных пропорциях картинку, которая меня устроила более чем.

Вуаля! Я бы устал описывать так подробно сцены, а братец ChatGPT молодец!
Вуаля! Я бы устал описывать так подробно сцены, а братец ChatGPT молодец!

5. "Пиши, сокращай. Как создавать сильный промт" в версии Midjourney

А теперь повернём ситуацию с ансамблем нейронок-хорошек в другую сторону. Свежая функция Midjourney /shortnen - она анализирует ваш промт, показывает слова которые ей побоку, и предлагает 5, с её точки зрения, годных промта.

Покажем MJ версию промта от старшего брата.

Он указывает вес каждого слова, как он будет их воспринимать
Он указывает вес каждого слова, как он будет их воспринимать

Он даёт 5 промтов, от более длинного, к более короткому.
НО! Он игнорирует соотношение сторон из начального промта, просто стоит это не забывать, и при генерации в каждый дописать.

Вот что вышло у MJ по промтам "проверенных лично":

Замысел от начального промта немного ушёл, но вполне годные и интересные картинки, учитывая что за раз мы получаем 4*5 = 20 вариантов!

6. Добавляем стили

Midjourney обучен на миллионах фотографий и изображений разных стилей, и они были размечены разными тегами. Точной документации нету про все стили, но есть прекрасные люди которые исследуют и публикуют найденные стили. Низкий Вам поклон!

Один из примеров обширной библиотеки стилей:

В библиотеке более 2000+ стилей
В библиотеке более 2000+ стилей

Как это работает?

  1. Смотрим базу и выбираем стиль, который нам понравился.
  2. Нажимаем на название стиля под изображением, он сразу копируется в буфер обмена
  3. Добавляем в конце промта этот стиль. Формат: (ваш промт),стиль --параметры
  4. Наслаждаемся!

Стилей огромное количество, очень много связаны с художниками, известными творческими стилями. Есть отдельная вкладка где именно стили исполнения.

Мой совет - один раз, с чашечкой кофе, или лучше бутылочкой вина - пройдитесь по всем стилям, выберите пару десятков что вам нравится и их используйте. В этом обилии красивых фото можно потеряться)

Вот несколько моих любимых

Просто добавлена временная метка - 1950
Просто добавлена временная метка - 1950
Knolling - прям лента инстаграма* 3 года назад)
Knolling - прям лента инстаграма* 3 года назад)
Lego style - реанимация дохлой лошади
Lego style - реанимация дохлой лошади

7. Ищем вдохновения в сообществе

По правилам Midjourney, если вы используете подписку за 30 USD - то все ваши работы публичные. И на них можно взглянуть "одним глазком".

Вот тут публикуются все работы.

Как мы можем это использовать во благо человечества?

  • Найти идею. Меня пригласили на вебинар с названием "toolbox маркетолога" - и с ходу что то не было идей какую сделать картинку для анонса. И я просто ввёл "toolbox" и сразу нашёл несколько направлений и идей что можно сделать.
    По каждой картинке вам показывает промт, и все характеристики
Можно взять промт и его переработать, любым методом выше. Можно даже его же использовать - это генеративный ИИ - у вас получится иная картинка.
Можно взять промт и его переработать, любым методом выше. Можно даже его же использовать - это генеративный ИИ - у вас получится иная картинка.
  • Смотрим похожие работы. Если пролистать ниже, то MJ показывает похожие работы - главное уметь остановиться) Находим что ещё понравилось и снова в круг сансары
Глаза разбегаются от крутых работ!
Глаза разбегаются от крутых работ!
  • Анализируем свою работу. После Upscale у вас появляется кнопочка WEB и она ведет вас на вашу публичную работу, где ниже будут подобраны референсы, как выше.
  • Вдохновляемся. Один из важных аспектов генерации изображений - это насмотренность. 5-10 минут в день можно созерцать чудесные творения - анализировать промт, сохранять в фавориты.

Надеюсь мои советы помогут кому-то сэкономить пару часов времени на действительно важные дела.

Меня зовут Андрей Цыган, я предприниматель и исследователь. Уже более 5ти лет плотно занимаюсь вопросами построения бизнес-процессов, автоматизации и цифровой трансформации бизнеса.

Мои бизнесы:

  • Помогаем получить международные сертификаты,такие как ISO, CE в любой точке мира и на любую продукцию - "Изи-Штандарт"
  • Автоматизируем процессы на базе amoCRM и BPM-платформы Sensei - Pushka Lab

В последнее время активно исследую возможности и полезность нейросетей для бизнеса.

Часто выступаю на тему ИИ и нейросетей - стараюсь пояснить фундаментальные вопросы и принципы работы простым языком. Выступления появляются тут.
Меня всегда можно найти в FB* или Insta*

Напишите в комментариях - какие ещё способы упросить жизнь в MJ вы используете, буду благодарен!

*Meta, которой принадлежит Instagram и Facebook, признана в России экстремистской организацией

88
10 комментариев

Я недавно сгенерил первую картинку, только хотел изучить подробнее возможности, а тут такой гайд) Спасибо!

1

для генерация произведения нужно много параметров, тестов
но не всегда такое нужно
часто нужно хорошая картинка в нужном размере и по нужной теме
и нужна она...быстро)

ну я сказал бы не столько гайд, сколько лайфхаки

Полезно) спасибо за материал!

1

Андрей, а если свое фото ему показать, он сделает фото с нужном антураже? Пробовал, но какие фото не показывал, я на себя только отдаленно там похож)

1

Не идеально, есть бот в MJ он получше делает, но тоже не гарантия результата. Хотя иногда у меня MJ выдавал очень хорошие фотосеты)

Основные советы:
1. Фото одинаковой пропорции с выходным фото
2. Уберите всё ненужное с фото
3. Попробуйте несколько фотографий показывать
4. Сначала сгенерируйте конечную картинку,а потом смешайте 2: ваше фото,и свежесгенерированную

Андрей, спасибо большое за статью!