Обзор одного из самых полных наборов API методов к Midjourney

Midjourney предоставляет мощнейшие возможности генерации изображений (и не только генерации). Маркетологи, дизайнеры, веб-разработчики, контент-мейкеры, арбитражники — на мой взгляд, за последний год кардинально изменили свой подход к работе, получив возможность генерировать изображения здесь и сейчас, на лету, не нанимая и не ожидая, пока человек подготовит им арт.

Как это было в 2017? У нас всегда был дизайнер на короткой руке. Нарисовать баннер, логотип/маскота для сайта или иллюстрацию чтобы разбавить статью графикой — это занимало от двух часов плюс денежные траты.

Сейчас все изменилось на столько, что маркетологи требуют в своих дашбордах, предоставляющих возможности распостить объявление в ads. vk сразу в 20-30-40 кабинетов, предоставить им возможность налету пригенерить к объявлению несколько вариантов баннеров. Подредактировать, заменить условную кружку в руке, например, на телефон. Такие возможности дает Midjourney.

Чтобы получить доступ к этой графической ИИ модели необходимо иметь дискорд аккаунт, залогиниться под ним на официальном сайте midjourney.com, купить там подписку на свой аккаунт, найти в дискорде бота Midjourney Bot, и наконец написать ему команду для генерации изображения.

Когда это нужно автоматизировать — оказывается, что просто API от Midjourney нет. Но есть некоторое количество сторонних реализаций.

Про одну из них и хочу рассказать. UserAPI. ai реализует следующий набор методов:

Imagine — метод создаст 4 варианта изображения по вашему текстовому описанию. Как говорится, начните работу с нажатия этой кнопки 🙂

Describe — вернет вам 4 описания, соответствующие вашему изображению. Грубо говоря, если затем сгенерировать по этим описаниям изображения через Imagine — то они будут сильно похожи на ваш оригинал

Upscale — метод вырежет одно из 4 изображений, созданных методом Imagine. И вернет ссылку на это единственное изображение в лучшем качестве

Upsample — позволяет значительно улучшить качество изображения (Subtle) или улучшить качество изображения, добавив больше деталей (Creative)

Variation — позволяет создать 4 новых изображения, взяв в качестве примера одно из изображений, полученных с помощью метода Imagine

Inpaint — этот метод встречается очень редко в сторонних реализациях. Он позволяет изменить выбранную область изображения. Например, на изображении на диване лежит собака, а вам надо чтобы лежала кошка — выделяем собаку, отдаем текстовое описание что должно быть вместо собаки, и получаем диван с кошкой 🙂

Blend — принимает до 5 изображений, в результате возвращает вам 4 изображения, которые являются смесью оригинальных изображений

Reroll — этот метод перерисует 4 изображения из Imagine заново: просто сделает еще 4 вариации по первоначальному запросу

Zoom — просто будто отодвинет камеру дальше, расширит угол обзора, и мы получим дорисованное окружение у первоначальной картинки

Pan — расширит изображение в указанную сторону (up, down, left, right)

Info — это вспомогательный метод для автоматизации/интеграции в сервисы, который позволяет получить информацию о Midjourney подписке, как долго она еще будет активна, сколько часов купленных вами мощностей у Midjourney осталось

Prefer - переключает режим вашего аккаунта в режим remix или наоборот. А сам режим remix позволяет вносить изменения в запрос при использовании метода Variation или Reroll

Также есть два вспомогательных метода, которые так же крайне полезны при интеграции:

Status — этот метод возвращает результат генерации изображения (ниже покажу, как его применять)

Discord account info — метод возвращает информацию о вашем аккаунте (статус, активен или нет, состояние remix on/off)

Сейчас я бы хотел привести пример как использовать метод Midjourney /imagine с помощью утилиты curl для генерации изображения через userapi

1. Поставить задачу на генерацию изображения:

curl -X POST https://api.userapi.ai/midjourney/v2/imagine \ -H "Content-Type: application/json" \ -H "api-key: 3fb0b6d9-6e1b-4bb7-993f-f79e9f1717e7" \ -d '{ "prompt": "nice 52 old woman in the pink hat" }'

Строит лишь упомянуть, что параметр api-key вы получите в панели userapi после добавления вашего аккаунта. В результате выполнения запроса, получаем hash:

{ "hash":"cecb48b8-7edd-4c42-b63a-fc6afd755979" }

По нему теперь можно будет получить прогресс генерации картинки и результат.

2. Получить статус задачи и финальный результат:

curl -X GET \ -H "Content-Type: application/json" \ -H "api-key: 3fb0b6d9-6e1b-4bd7-993f-f79e9f1717e7" \ "https://api.userapi.ai/midjourney/v2/status?hash=cecb48b8-7edd-4c42-b63a-fc6afd755979"

В результате выполнения команды /status мы получаем результат генерации (или промежуточный прогресс, если успеем) :

{ "account_hash":"d2a06436-1976-433d-b24b-409103061630", "hash":"cecb48b8-7edd-4c42-b63a-fc6afd755979", "webhook_url":null, "webhook_type":null, "prompt":"nice 52 old woman in the pink hat", "type":"imagine", "progress":100, // вот тут показывается прогресс генерации "status":"done", "result":{ "url":"https://cdn.discordapp.com/attachments/example.png", "proxy_url":"https://cdn.discordapp.com/attachments/example.png", "filename":"example.png", "content_type":"image/png", "width":2048,"height":2048, "size":7277491}, "next_actions":[ {"type":"upscale","choices":[1,2,3,4]},{"type":"reroll"},{"type":"variation","choices":[1,2,3,4]}], "status_reason":null, "prefilter_result":[], "created_at":"2024-03-25T10:18:55Z" }

Как же выглядит 52-х летняя прекрасная женщина? 🙂 Мне не понравилось, может попробуете сами. А вот как выглядит прекрасный кот:

Обзор одного из самых полных наборов API методов к Midjourney

На мой взгляд Midjourney еще не оценен полностью. Это мощнейший инструмент, где результат сильно зависит от запроса и, конечно же, он не для генерации котиков, а userapi.ai поможет с легкой интеграцией