Midjourney V6 - Стоило ли ждать?
Midjourney закончили с обучением новой модели и представили свету V6.
Опираясь на заявления разработчиков с приходом новой версии мы получаем:
- Улучшенное восприятие человеческого языка
- Улучшенная генерация рук, глаз
- Максимальный размер генерации до 2048х2048
- Генерации 3D сцен
- Генерация НОРМАЛЬНОГО ТЕКСТА, а не краказябр
И улучшение самой модели, как таковой.
Сначала о плохом: Поигравшись на протяжении часа меня начинают терзать смутные сомнения по поводу "Улучшенной генерации рук, глаз".
Раз через раз всплывали очень неприятные косяки, на достаточно простых промптах. В моем случае нейронка наделила георинь генераций косоглазием и аномальной анатомией. Ощущения были будто на 5.2 накинули LoRa и представили как абсолютно новую модель. Ну... На то она и "Beta"
Как оказалось - не все так плохо. Разработчики проделали колоссальную работу и изменения в положительную сторону видны невооруженным взглядом:
Заметно подросло качество, улучшена детализация, восприятие анатомии.
И наконец, Midjourney научилась писать нормальный текст! Ура!
Генерировал через бота LetAi. Он воспринимает промпты на русском и имеет полный функционал Midjourney.
У редактора группы LetAi есть фишка - он пишет различные гайды и разборы промптов MJ, и тестирует все генерации на промпте "Кот и огурцы". Вот и сравнение "огурцового кота", на всех ключевых моделях:
Вывод какой? V6 получилась отличной моделью, но ей нужно время чтобы поправить косяки с анатомией, лицами, качеством(местами) и (возможно) улучшить текст. Пользуйтесь нейросетями! Всем добра.