Midjourney V6 - Стоило ли ждать?

Midjourney закончили с обучением новой модели и представили свету V6.

Midjourney V6 - Стоило ли ждать?

Опираясь на заявления разработчиков с приходом новой версии мы получаем:

  • Улучшенное восприятие человеческого языка
  • Улучшенная генерация рук, глаз
  • Максимальный размер генерации до 2048х2048
  • Генерации 3D сцен
  • Генерация НОРМАЛЬНОГО ТЕКСТА, а не краказябр

И улучшение самой модели, как таковой.

Сначала о плохом: Поигравшись на протяжении часа меня начинают терзать смутные сомнения по поводу "Улучшенной генерации рук, глаз".

Изображение не сжато, не подвергалось обработке после генерации.
Изображение не сжато, не подвергалось обработке после генерации.
Ключица сломана, плечо слишком длинное.
Ключица сломана, плечо слишком длинное.

Раз через раз всплывали очень неприятные косяки, на достаточно простых промптах. В моем случае нейронка наделила георинь генераций косоглазием и аномальной анатомией. Ощущения были будто на 5.2 накинули LoRa и представили как абсолютно новую модель. Ну... На то она и "Beta"

Как оказалось - не все так плохо. Разработчики проделали колоссальную работу и изменения в положительную сторону видны невооруженным взглядом:

Портрет красивой худой девушки-подростка, цвет волос черный, белая футболка оверсайз и черные шорты, в спальне с неоновыми фиолетовыми огнями.
Портрет красивой худой девушки-подростка, цвет волос черный, белая футболка оверсайз и черные шорты, в спальне с неоновыми фиолетовыми огнями.

Заметно подросло качество, улучшена детализация, восприятие анатомии.
И наконец, Midjourney научилась писать нормальный текст! Ура!

Зимняя ночная улица, украшенная новогодними украшениями, надпись выложенная гирляндами  "LetAi - Manuals"
Зимняя ночная улица, украшенная новогодними украшениями, надпись выложенная гирляндами  "LetAi - Manuals"
Грустная девушка с чистыми белыми волосами и голубыми глазами сидит на кровати, макияж egirl, место съемки спальня
Грустная девушка с чистыми белыми волосами и голубыми глазами сидит на кровати, макияж egirl, место съемки спальня

Генерировал через бота LetAi. Он воспринимает промпты на русском и имеет полный функционал Midjourney.
У редактора группы LetAi есть фишка - он пишет различные гайды и разборы промптов MJ, и тестирует все генерации на промпте "Кот и огурцы". Вот и сравнение "огурцового кота", на всех ключевых моделях:

Midjourney V6 - Стоило ли ждать?

Вывод какой? V6 получилась отличной моделью, но ей нужно время чтобы поправить косяки с анатомией, лицами, качеством(местами) и (возможно) улучшить текст. Пользуйтесь нейросетями! Всем добра.

11
Начать дискуссию