{"id":14276,"url":"\/distributions\/14276\/click?bit=1&hash=721b78297d313f451e61a17537482715c74771bae8c8ce438ed30c5ac3bb4196","title":"\u0418\u043d\u0432\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0432\u0430\u0440 \u0438\u043b\u0438 \u0443\u0441\u043b\u0443\u0433\u0443 \u0431\u0435\u0437 \u0431\u0438\u0440\u0436\u0438","buttonText":"","imageUuid":""}

Тест-драйв обновления Midjourney (V5.1 + RAW)

Очень много промптов.

Сначала база: что пишут сами разработчики про новый режим?

  • V5.1 более своенравна (как V4). Мне вообще очень понравилось слово, которое они подобрали для описания отличия: opinionated. Чаще всего оно применяется к самоуверенным и упрямым людям и я до сих затрудняюсь дать ему правильный перевод в этом контексте. V5.1 хорошо понимает короткие промпты.
  • RAW — более нейтральна, чудить не будет (unopinionated). А также: более точное следование текстовым промптам, меньше нежелательных артефактов, улучшенная резкость.
  • А также: более точное следование текстовым промптам, меньше нежелательных артефактов, улучшенная резкость.

Значит, творческая мощь V4 доступна с качеством V5? Сейчас посмотрим.

В обзор я вставляю первые генерации, получившиеся по запросу, без рероллов.

1.1. Простой промпт

Начнём с максимально лаконичного промпта:

cat watching the aquarium

То, что без особых уточнений по обычному приземленному промпту генерирует V5, может сойти за простую фотографию на телефон.
Сразу видно, что даже без запроса в духе "professional hq photography" V5.1 выдает сочную, местами даже слишком сказочную картинку, особенно по цветам. 

Похоже, чтобы получить имитацию будничного фото на телефон, в новых версиях придётся принудительно прописывать "cheap camera phone photo" или что-то вроде того.

RAW — пока похоже на V5, но с большей резкостью и цветокоррекцией получше. Коты какие-то одинаковые. И аквариумы победнее. Первый кот так вообще смотрит в бездну, а она — на него.

1.2. Подробный промпт

Дополним:

siamese cat is watching big beautiful backlit aquarium with jellyfishes, late evening, neon lighting, ultra wide shot, dreamy, modern interior, professional photography, Hasselblad X1D

Здесь между V5 и V5.1 я даже не вижу особых отличий.
Разве что в V5.1 свет получше.
RAW, ну зачем ты пугаешь кота?

Медуз нигде нет, wide shot тоже. Я не любитель длинных запросов, и тут результат явно будет лучше, если что-то выкинуть, но это уже другая история.

2.1. Сюр!

А теперь то, ради чего мы здесь собрались:

capybara secret society cult performs a mysterious ritual

V5, как обычно, пытается в реализм. В данном случае это даже очаровательно (посмотрите на культистов с ушками, верхняя правая) и немного жутко.
Ооо да. Без уточнения своенравная V5.1 генерирует и фотографию, и иллюстрацию. Выглядит здорово, хоть и местами не так фотореалистично, как...
RAW! Не считая косяков, по своей сути это именно то, что нужно многим — абсурд, не переходящий в иллюстративность.

2.2. Сюр x2

Секта капибар — слишком просто. Нужно повысить градус безумия.

photography of a mouse pilot piloting a plane made of cheese high in the sky

Специально добавляю photography, потому что иллюстрацию V5 худо-бедно нарисует, но с фотореалистичностью подобных запросов обычно всё сложно.

Управлять самолетом без штурвала — высший пилотаж, как и серфить на сырной доске, но оставим без комментариев техническую сторону. Четвертая мышь выглядит вполне реалистично и у неё лучший головной убор.
Давайте не заметим эту цветокоррекцию, т.к. я не прописала освещение для чистоты эксперимента, и посмотрим на очаровательный костюм внизу слева. Как для короткого промпта — найс.
Отсутствующий штурвал подчеркивает близость RAW к V5. Конструкция самолета тоже под вопросом. Но сырные ушки!!!

Кстати, вот мы и поймали MJ на том, что она не знает, какие зубы у грызунов.

3.1. Иллюстрация

Интересно, чем будет отличаться простой запрос с иллюстрацией:

waterfall, illustration

Четыре вотермарки из четырех! Унылый результат. Но это не удивительно: без указания художников/стилей/подробностей V5 не особо проявляет художественные способности.
Очень даже ничего! V5.1 исполняет главную мечту заказчика и без уточнения запроса предлагает совершенно разные стили. Попадается мини-вотермарка, но это ничто по сравнению с соседями сверху и снизу.
RAW... Здесь плохо видно — но водяные знаки здесь на всех картинках, кроме нижней левой. Видимо, такова участь слишком простых запросов на иллюстративные примитивные темы. Если не придираться к артефактам, стили мне тоже так себе.

Если результаты — не совпадение (время покажет), и как минимум в V5.1 практически нет водяных знаков — это успех!

3.2. Чуть-чуть более подробная иллюстрация

waterfall, tigers are chilling in the water, modern realistic illustration

Почему тиграм сегодня так плохо — загадка. Может из-за внедрения изменений временно падает качество генераций, и я даже не буду расписывать, что тут не так.
Интересная цветовая палитра, но анатомия хромает, как и большинство тигров. По прежнему, чем меньше объектов, пусть и одинаковых — тем лучше.
Очень странные дела происходят с общей формой левых иллюстраций. Да и в целом не особо выразительно.

4. В стиле…

А если в стиле Ван Гога?

waterfall, by Van Gogh

Здесь, как говорится, на вкус и цвет. Все варианты получились хорошими. V5 наиболее похоже на живопись.
На грани с иллюстрацией, ядрёные цвета и эпичный масштаб. Но и в запросе не было "oil panting", поэтому без претензий.
Снова нечто среднее. Пластика воды мне больше всего понравилась именно в RAW.

5. Фотографии людей

professional portrait photography

Привет, восковая кожа и близкое фокусное расстояние.
Надо же! Я вижу поры. И фотографии действительно вполне professional без указания объективов и т.д.
Нижняя левая близка к уровню V5.1, композиционно — грустно. Остальные чуть менее восковые, чем V5, а верхнюю правую неожиданно зашакалило до уровня V4.

6. Макро

Нам обещали улучшенную резкость: проверим на макро-съемке.

snowflake, macro photography

Макро V5 вполне аутентично и без излишней цветокоррекции, но не везде симметричная и симпатичная форма.

V5.1 не очень приятно удивляет странной текстурой снежинок, и цветовые фильтры лютые. Проскакивает артефакт в виде небольшой вотермарки.
А вот RAW меня порадовал: более ровные формы, прозрачность, свет (особенно верхняя правая).

7. Архитектура

apple shaped house, professional architecture photography

Яблочно, но неказисто.
Получше композиция кадра, радуют формы, но фильтры немного портят всю малину.
Хорошие цвета и ракурсы, одно плохо — это не яблоко.

8. Еда

С генерациями суши всегда было не гладко.

sushi rolls set, professional food photography

V5 показывает нам классическую картину кривоватых роллов с щедрой начинкой и кучей красной икры. В этот раз еще и поверхность не самая чистая.

Икры с начинкой всё еще много, зато сами роллы стали ровнее. До понимания принципа обматывания рыбой MJ ещё далеко. А композиция выглядит очень круто (для минималистов).

Форма роллов из V5.1, а стиль фотографии и богатое убранство — из V5.

Мои скоропалительные выводы:

V5.1 рисует хороший свет и одинаково хорошо показывает себя в генерации фотографий и иллюстраций, в том числе выходящими за рамки здравого смысла. Любит добавлять чрезмерной красочности, сказочности, всей этой атмосферности. На фотографиях к месту и не очень добавляет фильтры, поэтому нужно уделять внимание описанию освещения, либо прописывать --no color grading (осторожно, может выдать ч/б).

V5.1 RAW похож на старую добрую V5, качество получше, композиции удачнее, иногда даже более реалистично при генерациях фотографий, чем V5.1, согласен генерировать ересь. Но артефакты проскакивают почаще, в креатив по собственной инициативе — не очень может.

Как включать:

Выбрать в /settings "MJ version 5.1" и опционально "RAW mode", либо дописывать ручками --v 5.1, --style raw.

Спасибо всем, кто дочитал! Буду рада видеть вас на своём канале ;)

0
4 комментария
Альберт Булавин

Капибары это не сюр!

Ответить
Развернуть ветку
Не фотограф

Жду SD 3, что то известно?

Ответить
Развернуть ветку
Camilla Farennikova
Автор

Я пока только в MJ

Ответить
Развернуть ветку
Павел Иванов

5/10

Ответить
Развернуть ветку
1 комментарий
Раскрывать всегда