Мульти-промпт теперь не нужен. MidJourney V6

Мульти-промпт теперь не нужен. MidJourney V6

Здравия желаю, дамы и господа👋! Давайте кратко изложу о чем будет статья.

Уже какое то время пользователям MidJourney доступна новая версия V6. Она стала во многом лучше предыдущей. Изменения так же затронули текстовую часть нейросети. MJ стала ещё лучше понимать текст, поэтому методология написания промптов тоже подверглась изменениям. Я обнаружил, как мне кажется, очень интересную особенность, которой хочу поделиться!

Для тех, кто не любит долго читать скажу сразу — мульти-промпт в том виде, в котором его привыкли видеть, больше не существует. Им можно больше не пользоваться. Расходимся!

Тем, кому интересны подробности, добро пожаловать!

Предупреждаю, будет душно🤓!

Содержание

Что такое «мульти-промпт»?

Для начала, для тех, кто не в курсе, поясню о чем пойдет речь.

«Промпт» (рус. «Подсказка») — термин, который используют люди, пользующиеся разными нейросетями, работающими по схеме «текст в текст»/«текст в изображение»/«текст в музыку», обозначающий текстовую информацию, которую пользователь подает на вход. Это подсказка для нейросети, которая говорит ей, в каком направлении генерировать тот или иной контент на выход.

«Мульти-промпт» — термин, который используют разработчики MidJourney. Так именуется подход к написанию промпта. Он позволяет обратить внимание нейросети на конкретные части промпта. Я, наверно, не совру, если скажу, что этот подход, буквально, разделяет промпт на 2 или более промптов, которые MJ старается генерировать, не смешивая их друг с другом.

Классически пример с официальной документации MidJourney. Слева — «космический корабль», обычный промпт, справа — «космос» и «корабль», мульти-промпт.
Классически пример с официальной документации MidJourney. Слева — «космический корабль», обычный промпт, справа — «космос» и «корабль», мульти-промпт.

Как работает мульти-промпт?

Чтобы пользовать им надо написать текст, из которого будет генерироваться изображение. Когда станет ясно, какие части надо генерировать отдельно, разделить их с помощью двойного двоеточия «::». С этого момента слова из первой части промпта будут стараться не влиять на вторую часть и наоборот.

Есть еще несколько тонкостей работы с мульти-промптом, но для этой статьи того, что есть достаточно.

Мульти-промпт и MidJourney V5.2

Рассмотрим, как она должна работать на примере предыдущей версии V5.2.

Попытка создать концепт старинного корабля бороздящего космос, как в примере из документации.

<i>space ship --v 5.2 --ar 16:9</i>
space ship --v 5.2 --ar 16:9
<i>space:: ship:: --v 5.2 --ar 16:9</i>
space:: ship:: --v 5.2 --ar 16:9

Простой промпт — «космический корабль». Мульти-промпт — «космос» и «корабль». Так я воспринимаю эту информацию. Во втором случае космос и корабль обрабатываются отдельно друг от друга.

Еще пара примеров.

Пример 1. Попробуем «шоколад» и «молоко» по отдельности:

Промпт слева: chocolate milk --v 5.2; промпт справа: chocolate:: milk:: --v 5.2

Пример 2. Теперь «стекло» и «пушка»:

Промпт слева: glass gun --v 5.2; промпт справа: glass:: gun:: --v 5.2

Тут на правом изображении видимо не хватило точности. Вместо того, чтобы нарисовать предмет из стекла, в ход пошли очки. Ну да ладно, картину это не портит!

В версии V5.2 все работает так как написано в документации MidJourney. Я этим часто пользовался. Сообщество разработало несколько стратегий, связанных с мульти-промптом. Однако все течет, все меняется. Меняется и MidJourney. Теперь рассмотрим, как это работает в версии V6.

Чтобы лучше понимать как это работает, я придумал для себя забавную аналогию:

Допустим у меня есть промпт, как в примере c космосом и кораблем, где есть две четко видимые части, которые описывают разные его аспекты:

1. простой промпт — цельный амлет из двух яиц, белки и желтки перемешаны;

2. промпт с двойным двоеточием — яичница, сделанная из двух яиц и разделенная лопаткой на две отдельные части, теперь это уже две яичницы, которые мы сервируем по-разному.

SparksAI

Мульти-промпт и MidJourney V6

Я бы сказал, что в шестой версии мульти-промпт совсем не работает, однако признаки жизни все таки есть. Давайте разбираться!

Для эксперимента я делал всё то же самое, что и на версии V5.2. Использовал те же промпты, так что их можно сравнить между собой. Начну с космоса и корабля.

<i>space ship --v6</i>
space ship --v6

«Комический корабль» как он есть. Не дать не взять. Идем дальше.

space:: ship:: --v6

«Я не могу. Я очень сильно пытаюсь, но не до конца понимаю, что надо делать!» — говорит нам MidJourney. Кое-где даже получилась задумка, но в основном нейросеть пытается делать космический корабль. Отмечу, что «космосу» тут уделено больше внимания.

<i>chocolate milk --v6</i>
chocolate milk --v6

Тут все нормально. Придраться не к чему.

chocolate:: milk:: --v6

Снова можно увидеть, что MidJourney испытывает трудности. Шоколад стал появляться, где то есть белая молочная субстанция. Однако тут нет того, что нам нужно — «шоколад« и "молоко» отрисованные отдельно на одном изображении. Нет такого же четкого разделения как было на версии V5.2. Зато есть попытки сдвинуть акцент на шоколад. У меня вырастает вопрос: «Как пользоваться теперь этим приёмом?». Так как я не понимаю пока механики, то и не понимаю как этим управлять. Но не стоит расстраиваться, опыты покажут истину!

<i>glass gun --v6</i>
glass gun --v6

Снова великолепная работа от нашего любимчика! Красота🔥!

glass gun --v6

Последний пример со стеклом и пушкой. Рисует либо одно либо другое, а сразу два объекта сгенерировать на изображении не получается.

Выход есть!

Волноваться не стоит! Несмотря на то, что происходят такие вещи, желаемого добиться достаточно просто. Позвольте пояснить👇!

Проверив информацию по документации и другим источникам, поговорив с разными людьми было принято решение построить гипотезу и придерживаться её. Гипотеза такая: так как версия MidJourney V6 подняла свой уровень владения и понимания текста, надо менять общий подход к написанию промпта. Так и происходит. На данный момент уже вышло несколько статей на эту тему. Если коротко, составление промптов упростилось. Теперь рекомендуется убрать из промпта структуры, которые слишком усложняют его. Простое, но точное написание промпта теперь оптимальный вариант. Звучит прогрессивно! Как-будто к этому и стремились!

Как в версии V6 без мульти-промпта добиться тех же результатов?

Как я уже сказал, все достаточно просто. Четко выразить свою мысль в промпте — достаточно. На тех же испытуемых покажу как это работает.

«Космос» и «корабль».

<i>medieval sailing ship sailing space --v6</i>
medieval sailing ship sailing space --v6

Все просто! «Средневековый парусный корабль бороздит космос». Советская классика помогла😏. Слова «средневековый» и «парусный» нужны для того, чтобы не дать нейросети придать кораблю футуристичные черты.

«Шоколад» и «молоко».

everything around here is made of chocolate and milk --v6

Промпт предполагает, что кроме шоколада и молока могут быть и промежуточные варианты. Но я удивлен, что получилось так мого удачных генераций. Сделал с первого раза, даже уточнять или писать параметр --no не пришлось.

"Стекло" и "пушка".

<i>the glass object is on the table with the gun --v6</i>
the glass object is on the table with the gun --v6

При такой постановке промпта всегда будет получаться какое-нибудь оружие и стакан/ваза и т. п. Чтобы получились другие стеклянные предметы надо написать другие слова. А вот какой надо составить промпт, чтобы была «какая то пушка» и «какой то стеклянный предмет», т. е., чтобы при каждой генерации были разные по форме предметы, — вопрос! Я пока еще не сообразил. Буду рад вашим предложениям😁!

Как видите, страшного ничего не случилось. Думаю, что не так много людей пользовалось мульти-промптом, а те, кто пользовался, немного потеряли. Как будто ситуация, когда нейросеть просто понимает то, что ты говоришь, и есть то, к чему стремились разработчики, а мульти-шмульти-промпты это «костыль» с помощью которого заставили работать то, что до этого времени работать не должно было. Все движется, меняется и развивается. Привычные вещи уходят или меняют форму. В такие времена живём!

Заключение

Всей этой писанине нужен какой то итог. Попробуем, значит, подытожить.

Имея такие инструменты на руках, мне сложно представить ситуацию, в которой может понадобится тот самый мульти-шмульти-промпт. Однако, если такое с вами произошло и вы не нашли другого выхода, то смело пользуйтесь предыдущими версиями. Там это до сих пор работает и, как я понимаю, никто убирать это не собирается. Например, версия V5.2 практически ничем не уступает V6, так что ничего не потеряете.

Ну а всех остальных направляю на путь изучения новых принципов построения промптов. Учимся формировать в голове точную мысль, которая как можно ближе описывает то, какого результата вы хотите достичь. Мусор и структуры, которые искусственно усложняют текст выкидываем.

Держим в голове, что MidJourney теперь лучше понимает то, что мы пишем. Нейросеть с каждой версией все лучше и лучше вникает в то, как мы передаём свои мысли. И раз такое дело, то в ближайшем будущем ждём что то вроде ChatMidJourney, который сможет поддерживать общение и составит конкуренцию ChatGPT😄.

А вы как считаете?

Это моя пилотная статья. Уж как получилась. Буду стараться лучше писать и доносить до вас информацию, делать качественный и содержательный контент🤓!

Всех обнимаю! Дальше больше!

77
7 комментариев

помечайте как реклама, достали эти статьи
Перейдешь попользоваться, так платить надо

1
Ответить

Полезная статья, о том как работают платные инструменты тоже нужно рассказывать, ведь у кого-то они оплачены и изменяются Например у меня годовая годовая подписка

1
Ответить

Здравия желаю! Благодарю за обратную связь! Приятно, что кто то решился это прочитать)
Прошу вас уточнить, что вы имели ввиду! Если про рекламу в статье, то поясню, что единственная реклама, которая была добавлена лично мной, это реклама меня самого (телеграм-канал, например). Всё, что вылезает в самой статье во время просмотра это интеграция сайта vc.ru и я на это не влияю.
Еще, возможно, это происходит из-за того, что я не оплатил продвижение🤔. Когда-нибудь разберусь как это работает😎!

Ответить