Овладейте магией Midjourney: подробное руководство от текстовых подсказок до визуальных эффектов ИИ

«Хорошие художники копируют; великие художники воруют». Это известное изречение, приписываемое Пабло Пикассо, бросило вызов традиционному пониманию творчества и искусства. В контексте Midjourney мы могли бы перефразировать это: «Хорошие художники воображают, великие художники генерируют». Сегодня Midjourney дает возможность каждому стать не просто хорошим, а великим художником, который создает что-то уникальное, что-то свое. Как? Создавая искусство из текста. Теперь вы можете задаться вопросом: «Подождите, как текст может стать искусством?» Давайте рассмотрим этот увлекательный процесс шаг за шагом.

Все начинается с подсказки, простого описания, а оттуда все берет ИИ. Вот один из примеров моей подсказки. У меня их много 😉

<i>Подсказка: Pixar scene representing AI boosting creativity: a whimsical workshop with AI tools manifested as glowing, mystical artifacts -- q 2 -- style raw -- version 5.1 -- s 750</i>
Подсказка: Pixar scene representing AI boosting creativity: a whimsical workshop with AI tools manifested as glowing, mystical artifacts -- q 2 -- style raw -- version 5.1 -- s 750

Теперь вы можете задаться вопросом: «Как ИИ может понимать мои подсказки?». Используя передовые алгоритмы машинного обучения, искусственный интеллект Midjourney не просто читает ваши подсказки — он их понимает. Он распознает элементы, которые вы описали, и то, как они сочетаются друг с другом, что позволяет создавать согласованные, увлекательные изображения, соответствующие вашему видению.

Давайте разберемся в концепции и технологиях Midjourney 👩‍💻🤖.

1. Midjourney использует модель большого языка (LLM, похожую на ChatGPT) для чтения и интерпретации ваших текстовых подсказок. Он понимает основные концепции, объекты, сцены и стили, которые вы описали. Выступая в роли универсального переводчика, он интерпретирует ваши слова и переводит их в уникальное «концептуальное семя» — код, заключающий в себе суть вашего описания. Он кодирует это «значение» в скрытый (латентный) вектор , который вы можете представить как числовую версию подсказки. Этот вектор действует как начальное «концептуальное семя» для процесса генерации изображения. Это исходный материал для ваших работ, очень похожий на мысленный набросок, который художник создал бы, услышав вашу идею 🧠✏.

2. Затем генератор изображений использует этот вектор в качестве входных данных, чтобы попытаться создать первоначальный эскиз вашей идеи с низким разрешением. Скрытый вектор подается в вариационный автоэнкодер , который производит выборку из вектора для создания начального изображения сетки с низким разрешением. Это изображение пытается визуально представить значение подсказки на основе кодировки LLM. Это действует как отправная точка 🎨🔍.

<i>Начальная сетка эскиза для визуального представления значения подсказки на основе кодировки LLM.</i>
Начальная сетка эскиза для визуального представления значения подсказки на основе кодировки LLM.

3. Затем запускается процесс обработки изображения, в котором используются две техники:

  • «Состязательный» метод (генеративно-состязательная сеть) , в котором конкурируют две сети (генератор и дискриминатор) — одна создает изображения, а другая их оценивает — гарантирует, что уточненное изображение точно соответствует вашей исходной подсказке 🔄. Генератор: начинает со случайного шума и пытается создать «фальшивые» данные, которые выглядят реальными. Учится, адаптируясь к обратной связи от Дискриминатора. Дискриминатор: решает, являются ли данные реальными или «фальшивыми». Становится лучше по мере улучшения Генератора.
  • Техника « диффузии » добавляет все больше и больше деталей к эскизу с низким разрешением, приближая его к реалистичной фотографии.

4. Вместе эти методы повторяются миллионы раз, постепенно улучшая изображение до тех пор, пока оно не станет близко представлять «смысл», закодированный языковой моделью.

5. В результате получается фотореалистичное изображение с высоким разрешением, которое (надеюсь!) совпадает с тем, что вы описали в исходной текстовой подсказке.

В конце вы получите это.

<i>Будет ли наше будущее таким?</i>
Будет ли наше будущее таким?

Короче говоря, это сложное взаимодействие между:

  • Языковая модель, которая «понимает» ваш текст 📖🤖
  • Генераторы изображений, которые используют это понимание для создания начального эскиза 🎨💡
  • Методы уточнения, которые улучшают этот набросок до тех пор, пока он не будет полностью соответствовать желаемому результату 🔄✨

Именно сочетание этих методов, а также огромные объемы данных и вычислительная мощность позволяют Midjourney творить свое «волшебство», превращая ваши слова в потрясающие визуальные реальности 🌟.

Уф, надеюсь, это было не слишком сложно 😂

Теперь, когда вы понимаете концепции Midjourney, давайте попробуем.

Начните с основ 🔢

Обширные подсказки, такие как «заколдованный лес»🌳 познакомят вас с уникальным стилем Midjourney. Добавьте --q 2 для дополнительной наглядности!📏

Опишите подробнее 🎨

Чем больше деталей вы включите, тем более «точными» будут ваши изображения! Попробуйте «flying taxis zip past neon skyscrapers at sunset»👽🚗💡

Экспериментируйте со стилями🖌

Midjourney предлагает различные параметры стиля и версии, которые могут кардинально повлиять на настроение и эстетику конечного изображения. Например, --style cute --niji 5 можно создать причудливую сцену в стиле Studio Ghibli, а --style expressive --niji 5 может привести к более авангардному импрессионистическому произведению.

Овладейте магией Midjourney: подробное руководство от текстовых подсказок до визуальных эффектов ИИ

Перейти в HD или вернуться домой:

Кто не любит четкое, детальное изображение? С параметром Midjourney --quality вы можете решить, насколько детализированным вы хотите сделать свой финальный шедевр. Включите его --quality 2 или --q 2 для какого-нибудь действия в ультра-HD.

<i>Подсказка: A peaceful village comes to life at dusk, lamplight glowing in the windows as the moon rises over a nearby mountain. Serene Ghibli atmosphere  --q 2 --s 750 --v 5.1 --style raw</i>
Подсказка: A peaceful village comes to life at dusk, lamplight glowing in the windows as the moon rises over a nearby mountain. Serene Ghibli atmosphere  --q 2 --s 750 --v 5.1 --style raw

Вау, Удивительно!!! 🤩🤩🤩 Сенсей Миядзаки был бы впечатлен.

Подсказки, связанные с последовательностью 📝

Создайте визуальную историю 📚, объединив связанные описания. Посмотрите, как развиваются ваши идеи в путешествии Midjourney!

Узнайте от сообщества:

Сообщество Midjourney – это яркое пространство, где создатели экспериментируют и делятся своими творениями. Это кладезь вдохновения и практических идей, поэтому не стесняйтесь учиться и взаимодействовать с другими исследователями Midjourney.

И наконец…

Итерировать, Итерировать, Итерировать! 🤓💭

Настройте свои подсказки на основе творений Midjourney. Взаимное сотрудничество порождает новые идеи и даже лучшие изображения!

Итак, у вас есть это! Основы, которые помогут вывести вашу игру Midjourney Prompt 🕹 на новый уровень.

Эффективное управление процессом создания подсказки может существенно повлиять на качество и точность получаемых изображений.

Наслаждайтесь подсказками ;)

  • Версия 1 : Оригинальный алгоритм Midjourney, известный созданием довольно абстрактных изображений.
  • Версия 2 : улучшенная версия исходного алгоритма, дающая более определенные результаты.
  • Версия 3 : еще более усовершенствованная версия, создающая более четкие изображения с лучшим распознаванием объектов.
  • Версия 4 : Значительная переработка с новой архитектурой искусственного интеллекта, превосходной согласованностью изображений и знанием существ, мест и объектов.
  • Niji : специализируется на аниме и иллюстративном стиле, отлично подходит для динамичных и ориентированных на персонажей кадров. Можно настроить с помощью параметров стиля.
  • MJ Test : тестовая версия алгоритма Midjourney, используемая в экспериментальных целях.
  • MJ Photo Test : еще одна тестовая модель, в основном используемая для создания фотографий.
  • Версия 5 : Создает больше фотографий, может потребоваться больше запросов для желаемой эстетики.
  • Версия 5.1 : Последняя модель с яркой эстетикой, создающая четкие изображения и поддерживающая расширенные функции, такие как повторяющиеся узоры.

Вам понравилась моя статья? Подпишись, тут о нейросетях и ИИ 😉
Забирай Полное руководство по MidJourney V5.1 (с изображениями и подсказками!)

До встречи!

1414
5 комментариев

Подобных статей на VC очень много

1
Ответить

Благодарю за комент 😉 новая статья уже в профиле)

Ответить

Теги слетели, два минуса ставятся вплотную без пробела, а не как у вас, что говорит о низком уровне понимания предметной области. Ну и да, таких статей, пересказывающих официальный гайд (он короче), уже и без этой воды — море.

1
Ответить

Поправил теги, благодарю 😇

Ответить

Респект за комент 😉 новая статья уже в профиле)

Ответить