Как улучшить промпты для Midjourney с помощью команды /shorten

Как улучшить промпты для Midjourney с помощью команды /shorten

Midjourney известна своими детализированными и реалистичными изображениями. Однако бывает непросто заставить модель Midjourney создать именно ту сцену, которую вы задумали, когда вводили промпт.

Например, для заглавного изображения этой статьи я попросил изобразить деревенские ножницы, разрезающие ленту. Однако все, что я получил, - это изображения ножниц, парящих где-то рядом с лентой.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.


☝️Это только часть функций, доступных в SYNTX!

Команда /shorten - полезный инструмент для анализа промпта. Она дает нам представление о том, как алгоритм Midjourney интерпретирует промпт, и предлагает более короткие промпты, которые могут лучше подойти для создания необходимого изображения.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

В этой статье вы узнаете, как работает команда /shorten в боте Midjourney в Discord и расскажу вам, как сделать:

  • Улучшение сложной сцены путем анализа промпта с помощью /shorten
  • Сокращение длины промпта на 80%.

Команда /shorten в действии

Бот Midjourney разбивает промпт на более мелкие единицы - токены, состоящие из слов или коротких фраз. Затем он создает образ на основе ассоциаций этих токенов с обучающими данными.

Вопреки интуиции, короткий и лаконичный промпт может работать лучше, чем длинный. Разработчики Midjourney объясняют, что поэтический язык и чрезмерное описание могут привести к появлению на изображении неожиданных объектов.

Пользователи задают промпт в чате Discord с ключевым словом /imagine, и алгоритм генерирует сетку из четырех вариантов изображений. Они могут быть доработаны с помощью вариаций, тонкого и творческого масштабирования и раскрашивания.

Как и /imagine, /shorten можно использовать в любом канале бота Midjourney в Discord. Это результат анализа промпта для моего изображения в начале статьи:

Как улучшить промпты для Midjourney с помощью команды /shorten

У пользователя есть две дополнительные опции:

  1. Создать изображение на основе одного из пяти сокращенных промптов, нажав соответствующую кнопку
  2. Нажать кнопку " Show Details", чтобы отобразить значение, присвоенное каждому токену.

В последнем случае бот Midjourney возвращает вес, который он присвоил каждому токену. Токены с большим весом считаются более важными.

a long (0.02) pink (1.00) floating (0.09) ribbon (0.17) with words (0.02) written (0.01) on it in black (0.19) typescript (0.04). light (0.09) blue (0.41) background (0.08). pair (0.05) of rustic (0.21) scissors (0.79) cuts (0.01) through (0.00) the ribbon (0.06).

Очевидно, что алгоритм делает акцент на компонентах изображения, их цвете и стиле. Композиция кажется менее важной, как и описание написанных на ленте слов.

Семейная сцена

Далее я использую команду /shorten для создания семейной сцены. Из сетки из четырех сгенерированных изображений я всегда выбирал то, которое лучше всего соответствовало заданному промпту.

Я попросил Midjourney создать уютную семейную сцену, включая подробное описание членов семьи и домашних животных в сцене, их занятий и места на изображении. Я также указал, что стиль изображения должен быть фотореалистичным.

Как улучшить промпты для Midjourney с помощью команды /shorten

Сгенерированная сцена содержит все объекты, которые я запросил, но композиция не такая, как ожидалось. Например, на полу лежат две кошки породы табби, а не одна на кухонном столе. На полу лежат игрушки, но дети с ними не играют. Но что меня действительно смутило, так это то, что нижняя половина окна отсутствует.

Используя /shorten, бот Midjourney выдал мне следующий анализ моего первоначального промпта. Бот выделяет наиболее важные слова жирным шрифтом.

A photorealistic (1.00), peaceful (0.04) sunny (0.17) morning (0.11) family (0.40) scene (0.09) featuring (0.03) a woman (0.10) standing (0.06) in the kitchen (0.06) preparing (0.07) a smoothie (0.22), two (0.09) children (0.09) playing (0.05) on the floor (0.08) with toy (0.10) cars (0.11). A tabby (0.10) cat (0.03), a coffee (0.02) mug (0.02), and a fruit (0.06) bowl (0.01) sit (0.03) on the kitchen (0.02) counter (0.02). On the wall (0.03) hangs (0.01) a calendar (0.03). The window (0.04) is wide (0.00) open (0.02), curtains (0.06) are moving (0.00) in the wind (0.01).

Анализ показывает, что важными считаются люди и домашние животные. Но наиболее значимой частью промпта является обстановка: photorealistic, sunny, morning, family... Интересно, что цвет шерсти "tabby" считается гораздо более важным, чем сама кошка - может быть, это намек на то, что "cat" автоматически подразумевается, когда мы просим объект "tabby"?

Бот также предложил пять сокращенных промптов, которые в соответствии с его восприятием промпта отражают самое главное и не содержат отвлекающих деталей.

На следующей подборке показаны изображения, созданные для каждого из сокращенных промптов, начиная от "photorealistic, sunny morning family scene, woman standing in the kitchen preparing a smoothie, two children, floor with toy cars. A tabby, fruit, curtains" до "photorealistic, sunny, family, smoothie".

Как улучшить промпты для Midjourney с помощью команды /shorten

Ни один из сокращенных промптов не показался мне особенно близким к той сцене, которую я хотел создать. Пытаясь заставить алгоритм больше внимания уделять композиции и меньше - стилю, я решил создать следующий адаптированный промпт.

В нем больше не требуется фотореалистичное изображение, но впервые кошка табби и другие предметы размещены не на полу, а на столешнице. Для меня это было важнее, чем стиль.

Как улучшить промпты для Midjourney с помощью команды /shorten

Сократите поэтический язык

Для следующего примера я прибег к помощи ChatGPT, чтобы создать поэтичный и яркий промпт:

In the soft, golden light of a kitchen window, a gleaming porcelain bowl brims with a vibrant array of succulent fruits, juicy oranges, plump grapes, ripe strawberries, and fragrant kiwis, creating a tantalizing display of freshness and color.

Бот Midjourney сократил его до

morning, kitchen window, porcelain bowl, oranges, grapes, kiwis

На следующем изображении показано сравнение двух промптов. Сокращенный промпт, в котором из 38 слов осталось только 8, позволяет точно воссоздать сцену.

Как улучшить промпты для Midjourney с помощью команды /shorten

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! Под капотом - GPT4o/Gemini/Claude, MidJourney, DALL-E 3 и Ideogram, LUMA, Runway, Suno, Редактор с 12 различными ИИ-инструментами для ретуши фото.


☝️Это только часть функций, доступных в SYNTX!

В первом, сложном примере с промптом команда /shorten и сокращенные ботом Midjourney промпты не решили моих проблем напрямую.

Взаимодействие с /shorten позволило мне лучше понять алгоритм. Зная, какой вес он придает каждому токену, я смог убрать слова, которые, по моему мнению, были излишне подчеркнуты, и улучшить промпт.

Например, я бы не догадался, что алгоритм придаст такое значение словам "photorealistic" и "smoothie". В процессе создания изображения я понял, что они не были важны для того, чтобы сгенерировать сцену.

Во второй, более простой сцене, использование /shorten помогло мне уменьшить количество лишних слов в исходном промпте. С помощью более короткого промпта сохранились ключевые компоненты композиции.

Я рассматриваю команду /shorten как способ общения с ботом Midjourney. В конце концов, он не объясняет нам, как именно он сгенерировал то или иное изображение. Зная вес каждого токена, пользователь может начать изменять промпт, пока сгенерированная сцена не будет соответствовать его первоначальной идее.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Источник статьи на английском - здесь

4040
11
13 комментариев

Давно пользуюсь миджем, но про такую команду узнал впервые

2
Ответить

Я тоже. Бездумно сокращать не вариант, но посмотреть веса слов в промпте можно - это топ.

2
Ответить

Я знаю давно про нее, но лучшее на нее не полагаться, а то насокращает...

1
Ответить

Да, не все знают про нее

Ответить

Спасибо за целую кучу статей про Миджорниум и не только! Пока только осваиваю Миджорниум, поэтому в начале пути. А можно ли статью про все команды миджорниума?

2
Ответить

Спасибо, что читаете! Уже есть такая статья в блоге

Ответить

Интересненько

1
Ответить