Убийца Midjourney? SDXL 0.9 vs Midjourney

Компания Stability AI представила обновлённую версию нейросети для генерации изображений по текстовому описанию Stable Diffusion — она получила название SDXL 0.9.

По сравнению с предшествующей новая версия обещает создание более качественных и детализированных фотореалистичных картинок.

«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.
«Инопланетяне гуляют среди нас в Лас-Вегасе, найденная плёночная фотография». Слева — работа Stable Diffusion XL, справа — SDXL 0.9.

Разработчик охарактеризовал новую модель искусственного интеллекта как «прорыв в творческих вариантах применения генеративного ИИ изображений».

«Волк в Национальном парке Йосемити, документальная съёмка природы»
«Волк в Национальном парке Йосемити, документальная съёмка природы»

В этой статье я постараюсь разобраться, так ли хороша эта нейросеть, а также сравню её в некоторых аспектах с Midjourney, которая пока считается лучшей.

«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»
«Рука с маникюром держит кофе навынос, рассвет в пастельных тонах, пляж, Instagram* и плёночная фотография»

Доступность и цена

У Midjourney есть некоторые ограничения, связанные с популярностью платформы.

Чтобы сохранять работоспособность серверов, разработчики предоставляют бесплатный доступ, ограниченный 25 операциями или попытками. В этот лимит включаются любые команды, которые требуют использования нейронных сетей, включая повторную генерацию той же картинки с другим результатом и функцию увеличения изображения.

Если вы используете сервис Midjourney, то имейте в виду, что каждое действие, которое вы выполняете, расходует одну из ваших попыток. Например, нажатие кнопок V, U и круг также будет уменьшать количество ваших попыток.

Если вы хотите воспользоваться платными возможностями Midjourney, то цены на подписку следующие: базовый план (200 GPU-минут в месяц) стоит 10 долларов в месяц (~600 рублей), стандартный план (15 GPU-часов в месяц) стоит 30 долларов в месяц (~1800 рублей), а корпоративный план (120 GPU-часов в год) стоит 600 долларов в год (~35 600 рублей).

"GPU-минуты/часы" - это количество действий, которые можно выполнить в рамках выбранного тарифа. Например, лимит в 200 GPU-минут в месяц на базовом плане подписки означает, что вы можете сгенерировать до 200 изображений в месяц. Если вам нужны дополнительные попытки, вы можете их докупить за 4 доллара (~240 рублей) за один GPU-час, что составляет примерно 60 команд генерации или масштабирования изображения.

Стандартный план за 30 долларов в месяц предоставляет пользователю 15 GPU-часов (900 GPU-минут) в месяц - это очень много возможностей для создания изображений.

Что насчёт SDXL 0.9? Доступ к модели можно получить через ClipDrop уже сегодня. Пока идёт бета-тест и все работает бесплатно. Но к концу бета-теста, когда разработчики исправят все баги и неточности, доступ скорее всего станет платным. Но пока не будем гадать наперед.

Качество генерируемых картинок

Я ввел запрос man (ссылку на нейросеть оставлю в конце статьи) и вот какие 4 варианта мне выдала SDXL 0.9.

По моему личному мнению, качество изображения ничуть не уступает Midjourney, а иногда даже качественнее.

Midjourney 5.2
Midjourney 5.2
SDXL 0.9
SDXL 0.9

Посмотрите на два изображения птицы выше. На генерации ниже — результат работы SDXL 0.9. Выше — новая версия Midjourney 5.2.

Создание изображения происходило на базе одного и того же промта:

an painting by the artist of the dream world, in the style of hybrid creature compositions, intricate psychedelic landscapes, hyper-realistic bird studies, colorful moebius, weirdcore, pink and cyan, cybermysticpunk

С ходу в глаза бросается объемность, тени и детализация от SDXL 0.9. Пока что Stable Diffusion выглядят поувереннее.

И да: нейросеть Stable Diffusion научили генерировать нормальные человеческие пальцы. Во всех сервисах для генерации изображений с этим были большие проблемы.

SDXL 0.9 предлагает огромное количество разных стилей: фотореалистичный, аниме стиль, диджитал-арты, иллюстрация и многое другое. Сравнение стилей между собой можете посмотреть ниже

Удобство

Не скажу, что Midjourney неудобен, но чтобы начать им пользоваться, нужно сделать определенные манипуляции. Со SDXL 0.9 все намного проще: зашёл на сайт, пишешь свой запрос и получаешь результат.

Итог

SDXL 0.9 не уступает Midjourney ни по каким показателям, изображения генерирует очень даже хорошо. А ведь нейросеть находится на этапе бета-теста, поэтому у нее есть все шансы стать ещё лучше.

Напомню, что выход SDXL 1.0 с открытым исходным кодом намечен на середину июля.

Канал с качественными промтами:

Попробовать Midjourney бесплатно:

2727
18 комментариев

Куда промт вводить?

1
Ответить

Все это лпп чистой воды. Недавно пыталась нагенерить картинок как раз и с помощью этой сетки тоже. Выходит лютое, ущербное говно.
Я честно не знаю как люди умудряются через нейросети получать удобоваримые картинки и потом гордо их предъявлять. Наверное только на платных аккаунтах работает, а если делаешь бесплатно, то фиг тебе, а не картинка. Если честно, то хоть что-то приемлемое выдал только кандинский, это хотя бы был не кринж. Либо они справляются только с очень простыми запросами типа "фиолетовая кошка" "красивая девушка", "стакан на фоне моря" а если запрос усложнить, то сеть не понимает даже близко что ты от нее хочешь.

Чтобы не быть голословной - попробуйте у нее допроситься простой штуки (и если получится приведите пример запроса) - "жених и невеста в шлемах на мотоцикле". Лично у меня получались одни уроды. Либо на мотоцикле кто-то один, либо в шлеме кто-то один (при чем неважно как построен запрос), либо ног нет, рук тоже... Понятия жених и невеста (хоть на каком языке) они(нейросетки) тоже почему-то выкупают через раз, далли мне предложил пару в доспехах, весьма симпатичную хотя бы, но почему эльфы на мотоцикле я так и не поняла)) Короче, простейшая казалось бы история, в которой я меняла запрос и так и сяк и по итогу плюнула так и не получив внятного результата.

Если бы знала, что увижу тут рекламу, то сохранила бы весь тот кошмар который мне пришлось увидеть.

Ответить
1
Ответить

Не знаю, эльфов нет. Поза и ракурс могла быть и получше но в целом приемлемый результат можно выбить

1
Ответить
Ответить

Я отвечу песней Жених и невеста в шлемах на мотоциклах https://mangatv.shop/story/64ada8c111f4e7f9d5a142ba

Ответить