Что умеет генератор изображений Midjourney и как он работает. Как пользоваться в России
Насмотрелись мы уже этих подборок изображений. А теперь разберемся, что он умеет по-делу, как работает и как им пользоваться в России.
Как работает Midjourney?
В случае большинства генераторов изображений создатели написали массу информации о том, как они работают, а также опубликовали их исходный код — но это не относится к Midjourney. Команда, стоящая за ним, раньше вообще молчала о его предыстории и обучении. Я нашел интервью с основателем, так то некоторая информация все же есть.
Но сразу ясно, что наиболее вероятно, что Midjourney использует систему, аналогичную Dall-E и Stable Diffusion, а эти обе компании подробно объяснили свои методы обучения.
Их модели были обучены на сопоставлении изображений и текста, который используется для их описания. Так же в некоторых старых материалах Midjourney пишет, что, как и ее конкуренты, она ищет в интернете изображения и текст для их описания, используя миллионы опубликованных изображений для обучения.
Это просто компиляция данных из интернета. Мы используем открытые наборы данных, которые публикуются, и тренируемся на них, пишут в MJ.
Более подробно про принцип генератора изображений, на примере Dall-E, я написал тут
Процесс генерации изображения с помощью Midjorney:
А вот фрагмент из самого нового интервью с генеральным директором Midjorney, где он наконец поясняет, как работает mj. Ну в итоге все так, как мы предполагали:
Это просто большой фрагмент данных из интернета. Мы используем открытые наборы данных, которые публикуются, и тренируемся на них. И я бы сказал, что это то, что делают 100% людей. Мы не были привередливы при выборе стратегии обучения сети. Наука быстро развивается с точки зрения того, сколько данных вам действительно нужно для обучения модели. Потребуется несколько лет, чтобы во всем разобраться, и к тому времени могут появиться модели, которые можно будет тренировать практически без внешних данных. На самом деле никто не знает, что они могут сделать и как будут развиватся.
Как пользоваться Midjorney?
Глюки
Что-то может пойти не так с изображением, ведь модель не идеальна. Например, могут возникнуть проблемы с созданием рук (особенно пальцев) или других сложных объектов, а фоны часто могут быть размытыми или спутанными, но это проблемы, которые вы найдете сейчас в любой из подобных моделей.
Сгенерировали, вроде хорошие картинки:
Но если увеличить и посмотреть на пальцы…
К счастью, такое сейчас существенно реже встречается. И вообще mj априори выводит часто крупные планы лиц, где не видно рук. Может потому, что сами понимают, что с пальцами еще не решили вопрос?
Еще вариант изменения при увеличении. Дарт Вейдер в Макдоналдс.
Увеличили вторую картинку:
Вроде все ок, но обратите на задний план…
Пример генерации в Midjorney
Делаем иллюстрации для статьи в Midjorney
Потестируем на Владимире Ленине. Не знаю почему. Видимо, потому-что он круто получился (на главном фото статьи).
Нам нужно написать статью о Ленине и оформить ее качественными иллюстрациями, да еще и уникальными, чтобы лучше индексироваться поисковиками.
Вводим простой запрос: Ленин ребенок (нужно вводить на английском!)
Сразу получаем хорошие варианты, а если не понравилось, можно добавить ключевых слов и более детально прописать задание к нейросети.
Очень удобно, что при генерации выводится сразу 4 варианта, в отличии от Dall-e и Stable Diffusion. При использовании платной версии это почти в 4 раза экономит наши деньги.
Дальше: Юный Ленин
События разгораются и Ленин уже во время революции 1917 года:
Довольно концептуальные варианты получились, мне больше всего понравился 4 вариант. Но все же он выглядит, будто Ленин смотрит на неестественно огромную стаю черных ворон, подлетающую к толпе людей вокруг него.
Не буду мучать вас всей историей жизни его: старый Ленин.
Мне кажется, получился недостаточно старым. Иногда при генерации картинок в какой-то их части может быть подобие кривого текста. Это как-раз потому, что генерация идет с помощью диффузии кучи фоток и нейросеть решает, что брать от какой фотки. Тут она решила оставить текст, хоть и исказив его — это все же недоработка нейросети.
И вообще — с текстами сеть не работает нормально, имеется ввиду, что не создает картинки с нормальным текстом. Для Midjorney текст — это тоже изображение и в нем нет логики, как таковой.
Очень старый Ленин:
Ну и по итогу каждой генерации, мы можем выбрать одну, которая нам понравилась.
На примере фоток очень старого Ленина: мне понравилась третья картинка и я жму U3.
Получилась хорошая картинка. Если же приглядеться, вы заметите, что она отличается от первоначальной. Это происходит потому, что нейросеть для увеличения изображения так же применяет диффузию и подбор из кучи картинок.
Параметры в Midjorney
Есть такая штука, как параметры.
mj автоматом выдает квадратные картинки, если вам нужны другие пропорции в конце запроса припишите, к примеру: --ar 4:3
А если делать отметку --version 5, то нейросетью вообще преображается и делает фотографии! А есть фотомодель --testp
Что нельзя в Midjourney?
В нейросети есть запрещенные слова: все что связано с насилием, жаргоном, ущемлением меньшинств. Если писать подобные слова в запросах, MJ блокирует промпт, либо аккаунт на время, либо на всегда.
Как зайти в Midjourney?
Вариант 1
1. Нужно зарегистрироваться в Discord и подключиться через него в MJ
2. После этого мы уже видим свой аккаунт на сайте MJ.
3. С апреля 2023 они, к сожалению, отключили бесплатную версию. Жмем Purchase Plan и выбираем, какой хотим.
4. Российские карты, конечно же не принимаются. Тут уже сами выбирайте методы, как вам оплатить. Гуглите, так как такие вещи в VC нельзя писать=)
Вариант 2
У нас один из проектов: доступ в midjourney через telegram
Иногда ответы не выдает, так как вручную настроена переправка изображений из Discord, но генерирует быстро, 1-3 минуты. Обычно, в подобных проектах ставят slow версию, а это 30-40 минут)))
Если будете пользоваться, обязательно почитайте инструкцию, там все по-делу написано. В ней указаны еще дополнительные параметры для генераций.
Еще подборка картинок из Midjourney
PS. лайк, пожалуйста, он помогает продвижению статьи, а значит дает мотивацию писать дальше
Ну и как положено на VC, канал телеграм))) Канал и чатик
Туда выкладываю статьи VC и то, что нет в VC. Мысли, идеи, опыт.
В закрепленных канале всегда телеграм боты Kolersky для доступа в ChatGPT, GPT-4 без VPN, а так же генераторы изображений Midjourney, Dall-e, Stable Diffusion (проект KolerskyAI).
Охуенно понятно стало..
Это как нарисовать сову.
Как работает MidJourney.
1. Берём данные для обучения из открытых источников
2. Рисуем картинку
Автор, ты любитель кликбейтных заголовков?
Для кликбейта не хватает слова миллиард. Ну хотя бы миллион
Вот вот!
Если ты не знаешь как работает MidJourney, то будь добр, не пиши об этом, делая вид, будто ты знаешь как он работает.
Умнее выглядеть будешь
Ну он же не Блиновская! За это и посадить сегодня могут.
Российские карты, конечно же не принимаются. Тут уже сами выбирайте методы, как вам оплатить. Гуглите=)
спасибо, познавательно
не ну а что вы думали, что вам всё разжуют и в клювик поставят ? Нужно быть более самостоятельными!
- " как пользоваться в России? "
- " никак, уезжайте ! "
А смысл тогда писать статью на эту тему? Ради рекламы очередного телеграмм бота?
На виси куда ни плюнь - это будет реклама телеграм канала или бота
А с меня ржали, когда у меня была страничка в ВК, на которой пизженные инфографику выкладывал и переводил документацию некоторых сервисов и программ и никак не рекламировал) а народ как-то сам шел и находил контент
Статья пустышка.
Это все просто реклама бота в телеграм, по совершенно завышенной цене, чем у конкурентов. Есть боты, где за 299₽ в месяц либо за1500₽ в год, можно получить доступ сразу и ко всему и к ChatGPT и Midjourney, при чем все работает в одном боте, а не раздельно.
Генерирует очень быстро. Может подписчиков меньше чем у других, но тут шустро генерирует
Что умеет MJ - тема не раскрыта, как он работает - не раскрыта, как пользоваться - не раскрыта. Автору минус, очень слабо.
Что мешает читать руководство пользователя от разработчиков
Ничего. Также как ничего не мешает оставлять свои комментарии)
Вот и читайте руководство пользователя, а автору сего талмута просто минус, это просто очередной спам каналом телеги
Ну теперь-то ясно почему статуя Венера Милосская без рук ;)
Проблема с пальцами практически решена, корявые хрени получаются крайне редко. По крайне мере в 5 версии
Нахуй - это туда (с) Смысл композиции по версии Chat WTF
Чтобы посмотреть сиарого Ленина, надо посетить Мавзолей. Ленин, кстаи, умер в 53 года, толком не успев побыть старым.
И был он Николаем,о котором мало что известно.
В Дискорте тебя еще могут сразу забанить, они вообще любят дежурно банить новорегов. Поэтому не удивляйтесь, если что, просто стоит выделить немного времени на бодания с техподдержкой.
Русских там не любят и деньги их кровавые не принимают. Принимают только кровавые деньги от других стран. Хотя дают немного времени поработать бесплатно. Если хочется подписку, можно купить на плати.ру виртуальную предоплаченную карту USA определенного номинала.
Как работать - можно посмотреть на Пикабу, там много интересных подробных статей:
https://pikabu.ru/story/kak_polzovatsya_neyrosetyu_midjourney_instruktsiya_nastroyki_i_parametryi_9966183
https://pikabu.ru/story/midjourney_kak_polzovatsya_besplatno_podrobnyiy_gayd_9879410
https://pikabu.ru/story/instruktsiya_po_midjourney_dlya_tupyikh_9394656
https://pikabu.ru/story/midjourney_poshagovyiy_gayd_dlya_absolyutnyikh_novichkov_9875060
Я лично понял одно: ничто не спасает от того, что при точном описании вы получите полное не то. Плюс полученный результат все равно придется допиливать фотошопом и планшетом. Не ждите чудес. Еще интересен вопрос авторского права на подобные изображения - ну если вы хотите их использовать в коммерческих целях. Тут стоит задуматься и почитать условия использования:
https://pravo.ru/story/244721/
Дебилов там не любят, вроде вас, а не русских и их "кровавые" деньги.
Да, дебилов нигде не любят, потому они и бегают по Интернетам, на мои комментарии каким-то выхрюкиванием отвечают. Весна, обострения, куда деваться.
Комментарий удален модератором
Комментарий удален модератором
Комментарий удален модератором
"как пользоваться в России" - в заголовке лишнее, ибо все равно идет отсылка к поисковику. Все, что описано - приминимо равноценно и к другим странам. Поэтому остался неприятный осадок.
Если хотите сэкономить время за 600 рублей и быстро разобраться в промптах к MJ уровнем выше 100500 рецептов, рекомендую марафончик Церебро в вк
Вспомнился текст откуда-то с просторов для КДПВ: «Эй, врача сюда, врача – позовите Ильича! Пусть он вешает буржуев, инфернально хохоча».
все, что он умеет последний месяц - псиать, что бесплатно сегодня какртинку никак не сделать - занят сильно, приходите завтра
Затерявшиеся в веках
Midjourney без иностранной карты есть у нас в тг. Так же есть ChatGPT, GPT-4, Dall-e, Stable Diffusion.
В закрепленных в канале:
https://t.me/kolerskych/
Сам бот Midjourney:
http://t.me/Kolersky_Midjorney_Bot
Другие нейросети: https://kolersky.com/kolerskyai
Был апрель 2023 года, и вы только сейчас решили записать что умеет Midjourney
А я и сам удивлен. На VC только подборки фоток из мж выкладывают )