{"id":14283,"url":"\/distributions\/14283\/click?bit=1&hash=8766cc03cba44a6d934ee26f882971a64223452448548d2fc3a5f37339e77cfa","title":"\u0412\u0438\u0434\u0435\u043b\u0438 \u0432 \u0421\u043e\u0447\u0438 \u0443\u0436\u0435 \u0432\u0441\u0451? \u0412\u043e\u0442 \u043d\u0435\u043e\u0431\u044b\u0447\u043d\u0430\u044f \u0438\u0434\u0435\u044f \u0434\u043b\u044f \u043e\u0442\u0434\u044b\u0445\u0430 \u043d\u0430 \u043a\u0443\u0440\u043e\u0440\u0442\u0435 ","buttonText":"","imageUuid":""}

Версии или модели Midjourney

Почему «модель», а не версия?

Версия программы — это эволюция её кода. Разработчики улучшают работу, добавляют функции или обновляют дизайн. Иногда полностью переписывают код. Если говорить об искусственном интеллекте, то «модель» — это эволюция не столько кода, сколько подхода к обучению. Это приводит к появлению новой модели поведения ИИ.

Разница между третьей и четвёртой версией Midjourney настолько велика, что это уже сложно назвать эволюцией кода. Я бы сказал, что v4 — это новый разум. Он обучался с помощью других методов и обладает другими навыками. И хотя он выполняет те же самые задачи, выполняет он их по-другому.

Как выбрать модель Midjourney

Можно выбрать нужную модель через настройки или указав в конце запроса параметр, например, --niji или --v 1.

Сравниваем модели

Я коротко опишу каждую модель, но чтобы наглядно показать разницу между ними, возьму три запроса — материальный, абстрактный и фантастический — и попрошу каждую из моделей нарисовать эти сюжеты.

  • Материальный: рыжий кот преследует мышь
  • Абстрактный: искусственный интеллект обдумывает миллионы идей
  • Фантастический: космический корабль будущего на орбите Юпитера

В запросах не будет фрагментов и параметров, поскольку многие из них поддерживаются исключительно в четвёртой версии и в Niji. Все семь версий поддерживают соотношение сторон 2:3, поэтому я буду использовать его.

Midjourney v1

--version 1 --v 1

Эта модель была основной в течение двух месяцев с февраля по апрель 2022 года. Создаёт очень абстрактную и не слишком внятную картинку.

Midjourney v2

--version 2 --v 2

Эта модель была основной почти четыре месяца — с апреля по июль 2022 года. Разработчики описали её тремя словами: креативная, цветастая, живописная. Изображения этой модели лучше соответствуют текстовому запросу, чем у v1.

Midjourney v3

--version 3 --v 3

Была основной моделью с июля по ноябрь 2022 года. Именно эта модель вышла в первое публичное тестирование, получила первых платных подписчиков и сделала команду Midjourney известной всему миру.

Модель создаёт необычные композиции и неплохо соответствует текстовому запросу. В этой версии появилась возможность сохранять процесс генерации в видео.

Midjourney v4

--version 4 --v 4

Текущая версия Midjourney выпущена в ноябре 2022 года.

У этой модели полностью изменилась архитектура и расширилась база для обучения. В отличие от предыдущих версий, v4 обладает представлением о том, как выглядят самые разные существа и локации, умеет создавать очень подробные изображения и показывать взаимодействие между разными объектами в кадре. Умеет точно соответствовать текстовым описаниям. В этой версии впервые появилась возможность генерировать результаты на основе других изображений.

Niji

--niji

Niji — это коллаборация между командами Midjourney и Spellbrush, модель, которая сфокусирована на изображениях в стиле манги и аниме. Обученная на японской иллюстрации, эта версия «понимает» эстетику аниме и создаёт динамичные композиции, где в центре внимания находится персонаж.

Как одна из «веток» v4, Niji умеет работать с фрагментами и изображениями в запросах.

Test и Test Photorealistic

--test --testp

Кроме стабильных моделей, разработчики выпускают «временные» версии, предназначенные для тестирования сообществом. Текущие тестовые модели называются Test и Test Photorealistic. Команда Midjourney не описывает их в подробностях: модели постоянно дорабатываются. Это не делает их менее интересными, по крайней мере, для тех, кто любит эксперименты.

Модель Test — более «художественная» с высоким соответствием текстовому запросу. Модель Test Photorealistic генерирует фотографичные результаты. У обеих есть параметр --creative, который делает изображения в сетке более разнообразными.

Возможности тестовых моделей «урезаны»: они не умеют использовать картинки в качестве эталона, не умеют делить запрос на фрагменты и генерируют только два изображения в сетке (или одно, если соотношение сторон отличается от квадрата).

Midjourney v5

Если очень грубо посмотреть на продолжительность жизни предыдущих моделей, то казалось, что Midjourney v4 просуществует около 200-210 дней. Но разработчики планируют выпустить v5 уже на этой неделе!

Уже сейчас для всех платных подписок доступны несколько тестирований, например, https://www.midjourney.com/rate/pairs/v5-two-similar/, где вам нужно выбрать то изображение, которое вам больше нравится: оба изображения созданы пятой моделью.

Платные подписчики могут воспользоваться пятой моделью, для этого её нужно выбрать в настройках, либо добавить к запросу параметр "--v 5".

Обратите внимание, что пятая модель находится в работе и ещё будет меняться.

А лучшее обучение — это практика, поэтому каждый день мы тренируемся на котиках. Смотреть на это можно в нашем кошачьем канале. Всем добра и валерьяны за наш счёт!

Дальше можно почитать

Связанные статьи

Источники

0
Комментарии
-3 комментариев
Раскрывать всегда