GPT-4 + MJ5 = TOP

Забудьте про фотошоп, графический планшет, дорогую камеру и рассеиватель света — эти два инструмента создадут нереальные шедевры фото и цифрового искусства всего за 5 минут. Прочитайте статью до конца и узнайте, как вы можете стать иллюстратором или фотографом без специальных навыков, просто совмещая работу GPT-4 и Midjourney 5.

О том, как обойти блокировку ChatGPT и Midjourney я уже рассказывал в одном из своих видео, посмотрите этот короткий гайд, если ещё не пользовались этими нейросетями.

Итак, чтобы у вас всегда получались изображения в высоком качестве, с хорошей детализацией и в нужном стиле, обучите чат-бота GPT-4 создавать подсказки для Midjourney 5. Всё это не займёт у вас много времени, скорее, сэкономит пару часов на продумывание точных промптов.

Для этого нужно рассказать GPT-4 обо всех технических особенностях другой нейросети. Подходящую информацию можно найти в интернете или на сайте Midjourney, но я решил сократить время ваших поисков и собрал все нужные запросы к GPT-4 в одном документе. Полная версия будет доступна в моём Телеграм-канале по ссылке в описании, а пока я продемонстрирую каждый шаг на пути к созданию классных изображений.

Шаг 1. Знакомим GPT-4 с Midjourney 5

Из готовой библиотеки промптов берём первый запрос, который на русском звучит как «Привет, сегодня мы создадим изображения с помощью Diffusion модели. Я дам тебе некоторую информацию об этом, ок?»

GPT-4 + MJ5 = TOP

Чат-бот ответит, что понял ваши намерения и готов помочь вам. Теперь постепенно объясняем нейросети принципы работы Midjourney.

У чат-бота есть ограничения по объёму информации, которую он может воспринимать, поэтому не отправляйте ему сразу все сведения, которые найдёте в интернете или возьмёте из моего Телеграм-канала.

Предлагайте информацию частями, а в конце каждого своего запроса пишите «But wait i have more information. Just answer with OKAY» («Подожди, у меня есть ещё информация. Просто ответь ОКЕЙ») — для нейросети эта команда будет означать, что ей не нужно генерировать ответ прямо сейчас, её задача — собрать ваши сведения и дождаться новой команды.

Итак, в первую очередь рассказываем в целом о MJ и принципе работы диффузионных моделей:

GPT-4 + MJ5 = TOP

Этот совет может показаться вредным, но вам не обязательно переводить текст, который вы отправите GPT-4. Информация, скопированная с сайта Midjourney идеально подойдёт для того, чтобы объяснить принципы работы этой нейросети чат-боту GPT-4. Когда вы загрузите текст, дождитесь ответа ChatGPT, бот скажет вам, что всё понял и готов помочь с новым запросом.

Теперь расскажем GPT-4 о последнем обновлении Midjourney — нашумевшей пятой версии, которая отличается от предыдущих более высоким качеством, глубокой детализацией, разнообразным соотношением сторон в получаемых изображениях, а также другими возможностями.

В этом запросе рассказываем об основных нововведениях в обновлении нейросети. GPT-4 охотно переваривает большой кусок информации и соглашается дальше запоминать новые сведения:

GPT-4 + MJ5 = TOP
GPT-4 + MJ5 = TOP

Когда запрос будет выполнен, начинаем подробнее рассказывать об отдельных функциях Midjourney. Например, предлагаем чат-боту запомнить информацию о соотношении сторон, стилизации и других фичах, влияющих на генерацию в обновлённой нейросети. Чат-бот запоминает всё, что мы пишем и покорно соглашается коротким ответом OKAY:

GPT-4 + MJ5 = TOP

Поздравляю, первый этап обучения GPT-4 пройдён, а значит, через пару минут вы начнёте создавать собственные впечатляющие изображения.

Шаг 2. Показываем примеры

Чтобы GPT-4 создавала подходящие промпты для Midjourney самостоятельно, ей нужно показать несколько примеров. Найти такие примеры можно на сайте нейросети или на сервере в Дискорде.

Вам нужно перейти к строке поиска в правом верхнем углу и написать ключевые слова на английском языке. У меня есть несколько лайфхаков, как найти подходящий промпт для реалистичной и детализированной фотографии:

Используйте ключевые слова с корнем photo — photography, photorealistic, portrait photo и т.д. Так вы получите не просто цифровой арт или реалистичную 3D модель, а настоящее фото:

GPT-4 + MJ5 = TOP

С помощью слов camera и названий фотоаппаратов Nikon, Canon, Sony, Fujifilm и других вы найдёте изображения, которые будут соответствовать параметрам той или иной техники. Можете сами добавлять модель фотоаппарата в будущие промпты или посмотреть, какие предпочитают другие пользователи:

GPT-4 + MJ5 = TOP

В качестве ключевых слов также подойдут hyper realistic photo, surrealistic photo, cinematic и т.д.:

GPT-4 + MJ5 = TOP

Подсказки также можно искать по ключевым словам, описывающим положения объекта: full body photo portrait, close up photo, bird's eye view photo и т.д.

GPT-4 + MJ5 = TOP

В целом, чтобы получать чёткий результат, вы должны отправить GPT-4 10-15 разных промптов, найденных на сайте или в дискорде Midjourney. Как я уже говорил, всё это я сделал за вас, вам нужно будет только перейти в мой Телеграм и забрать документ с подробными инструкциями.

Отправляйте запросы в нейросеть по частям, все 10-15 промптов чат-бот не обработает в одном запросе. Я трижды присылал по 5 разных подсказок, при этом задал вопрос, точно ли GPT-4 понимает принцип работы Midjourney.

Когда все промпты будут «съедены» нейросетью, вы сможете начать генерировать собственные подсказки для Midjourney. Скажу честно, некоторые запросы приходилось генерировать заново, чтобы вышло более точно. Иногда ChatGPT не перечисляет параметры в запросе, как это делают все пользователи Midjourney, а рассказывает, каким бы чат-бот сделал сеттинг фото и на что его снял. В общем, пытается отвечать как живой человек. Это не критично, вы можете убрать лишние слова из запроса. Главное, чтобы готовый промпт содержал параметры света, размер кадра, модель фотоаппарата, выдержку и прочие технические характеристики готового фото:

GPT-4 + MJ5 = TOP
GPT-4 + MJ5 = TOP
GPT-4 + MJ5 = TOP

Шаг 3. Генерируем изображения в Midjourney

Для эксперимента я решил создать три разных изображения с животными, человеком и пейзажем. Общий промпт для GPT-4, на основе которого нейросеть выдаст готовую подсказку для Midjourney, будет звучать примерно так:

«Отлично. Теперь я хочу, чтобы ты действовал в роли профессионального фотографа. Ты будешь использовать яркие описания при создании моих фото-подсказок, включая настройки камеры. Первая подсказка, которую я хочу, чтобы ты создал, это фотография [ОБЪЕКТ]. Вдохновись примерами подсказок выше, но не копируй их, а используй тот же формат».

GPT-4 + MJ5 = TOP

И для начала я добавил в промпт объект — японских карпов, плавающих в чистом пруду с водяными лилиями. Чат-бот подготовил для Midjourney промпт по моему запросу:

GPT-4 + MJ5 = TOP

Я скопировал запрос из GPT-4 и добавил к нему в конце --v5 — это необходимо, чтобы изображения генерировались именно в пятой версии нейросети. В остальном текст промпта прекрасно подошёл для Midjourney, нейросеть показала реалистичный, детализированный и яркий результат:

GPT-4 + MJ5 = TOP

К слову, красочное описание японских карпов — полностью заслуга ChatGPT.

После этого я захотел посмотреть, насколько хорошим получится фото человека, созданное по сути двумя нейросетями. Попросил у ChatGPT создать промпт для генерации образа Киану Ривза, который изображает древнего воина:

GPT-4 + MJ5 = TOP

Неожиданно, но умный чат-бот очень подробно описал положение воина на фото, фон и прочие детали, которые я сам изначально не закладывал в промпт. И вы только посмотрите, какую яркую фотосессию Midjourney устроила успешному актёру — фото вышло в высоком разрешении, Киану узнаваем, доспехи сияют на солнце ярче некуда:

GPT-4 + MJ5 = TOP

Наконец, пребывая в приятном весеннем настроении, я захотел почувствовать вайбы старых добрых мультфильмов Хаяо Миядзаки и сгенерировать пейзаж в стиле известного режиссёра. Мой запрос был предельно простым — маленькая светлая деревня в стиле Хаяо Миядзаки. Вот как понял меня чат-бот:

GPT-4 + MJ5 = TOP

Конечно, в конце ответа ChatGPT добавил собственное мнение о том, как он бы расположил кадр, и это не совсем похоже на стандартный промпт для Midjourney, но я решил рискнуть, потому что в целом чат-бот указал объект, параметры камеры, расположение кадра, а значит, изображение должно получится таким, каким я его задумал сам:

GPT-4 + MJ5 = TOP

Итак, в том, что GPT-4 и Midjourney 5 составляют отличный дуэт, сомнений нет. Вы обучаете одну нейросеть, и она составляет промпты для другой, что занимает у вас не больше 5 минут. Зачем это нужно вам? Если вы занимаетесь иллюстрацией, дизайном, маркетингом или фотографируете, это предельно сэкономит ваше время и ресурсы.

Midjourney создаёт реалистичные и объёмные фотографии, а вы можете использовать их для выполнения заказов на фриланс-биржах, в собственном бизнесе, для создания референсов, ведения соцсетей и прочих целях. Остаётся только немного включить фантазию и не забыть перейти в мой Телеграм-канал, чтобы сохранить себе простой гайд по совместной работе в GPT-4 и Midjourney 5.

2222
4 комментария

И где в тг подробный гайд? Что-то я не могу найти:)

1

Мне в этой логике нравится сберовский гигачат, объединили нейронки по генерации текста и картинок. Как я понимаю OpenAI в своей части тоже к этому прийдет

Значит фотографы и графически дизайнеры теряют свою пользу, а вот работники с нейросетями наоборот будут пользоваться популярностью

Что-то я не нашла ссылку на телеграм