Обзор одного из самых полных наборов API методов к Midjourney
Midjourney предоставляет мощнейшие возможности генерации изображений (и не только генерации). Маркетологи, дизайнеры, веб-разработчики, контент-мейкеры, арбитражники — на мой взгляд, за последний год кардинально изменили свой подход к работе, получив возможность генерировать изображения здесь и сейчас, на лету, не нанимая и не ожидая, пока человек подготовит им арт.
Как это было в 2017? У нас всегда был дизайнер на короткой руке. Нарисовать баннер, логотип/маскота для сайта или иллюстрацию чтобы разбавить статью графикой — это занимало от двух часов плюс денежные траты.
Сейчас все изменилось на столько, что маркетологи требуют в своих дашбордах, предоставляющих возможности распостить объявление в ads. vk сразу в 20-30-40 кабинетов, предоставить им возможность налету пригенерить к объявлению несколько вариантов баннеров. Подредактировать, заменить условную кружку в руке, например, на телефон. Такие возможности дает Midjourney.
Чтобы получить доступ к этой графической ИИ модели необходимо иметь дискорд аккаунт, залогиниться под ним на официальном сайте midjourney.com, купить там подписку на свой аккаунт, найти в дискорде бота Midjourney Bot, и наконец написать ему команду для генерации изображения.
Когда это нужно автоматизировать — оказывается, что просто API от Midjourney нет. Но есть некоторое количество сторонних реализаций.
Про одну из них и хочу рассказать. UserAPI. ai реализует следующий набор методов:
Imagine — метод создаст 4 варианта изображения по вашему текстовому описанию. Как говорится, начните работу с нажатия этой кнопки 🙂
Describe — вернет вам 4 описания, соответствующие вашему изображению. Грубо говоря, если затем сгенерировать по этим описаниям изображения через Imagine — то они будут сильно похожи на ваш оригинал
Upscale — метод вырежет одно из 4 изображений, созданных методом Imagine. И вернет ссылку на это единственное изображение в лучшем качестве
Upsample — позволяет значительно улучшить качество изображения (Subtle) или улучшить качество изображения, добавив больше деталей (Creative)
Variation — позволяет создать 4 новых изображения, взяв в качестве примера одно из изображений, полученных с помощью метода Imagine
Inpaint — этот метод встречается очень редко в сторонних реализациях. Он позволяет изменить выбранную область изображения. Например, на изображении на диване лежит собака, а вам надо чтобы лежала кошка — выделяем собаку, отдаем текстовое описание что должно быть вместо собаки, и получаем диван с кошкой 🙂
Blend — принимает до 5 изображений, в результате возвращает вам 4 изображения, которые являются смесью оригинальных изображений
Reroll — этот метод перерисует 4 изображения из Imagine заново: просто сделает еще 4 вариации по первоначальному запросу
Zoom — просто будто отодвинет камеру дальше, расширит угол обзора, и мы получим дорисованное окружение у первоначальной картинки
Pan — расширит изображение в указанную сторону (up, down, left, right)
Info — это вспомогательный метод для автоматизации/интеграции в сервисы, который позволяет получить информацию о Midjourney подписке, как долго она еще будет активна, сколько часов купленных вами мощностей у Midjourney осталось
Prefer - переключает режим вашего аккаунта в режим remix или наоборот. А сам режим remix позволяет вносить изменения в запрос при использовании метода Variation или Reroll
Также есть два вспомогательных метода, которые так же крайне полезны при интеграции:
Status — этот метод возвращает результат генерации изображения (ниже покажу, как его применять)
Discord account info — метод возвращает информацию о вашем аккаунте (статус, активен или нет, состояние remix on/off)
Сейчас я бы хотел привести пример как использовать метод Midjourney /imagine с помощью утилиты curl для генерации изображения через userapi
1. Поставить задачу на генерацию изображения:
Строит лишь упомянуть, что параметр api-key вы получите в панели userapi после добавления вашего аккаунта. В результате выполнения запроса, получаем hash:
По нему теперь можно будет получить прогресс генерации картинки и результат.
2. Получить статус задачи и финальный результат:
В результате выполнения команды /status мы получаем результат генерации (или промежуточный прогресс, если успеем) :
Как же выглядит 52-х летняя прекрасная женщина? 🙂 Мне не понравилось, может попробуете сами. А вот как выглядит прекрасный кот:
На мой взгляд Midjourney еще не оценен полностью. Это мощнейший инструмент, где результат сильно зависит от запроса и, конечно же, он не для генерации котиков, а userapi.ai поможет с легкой интеграцией