Убийца Midjourney? SDXL 0.9 vs Midjourney
Компания Stability AI представила обновлённую версию нейросети для генерации изображений по текстовому описанию Stable Diffusion — она получила название SDXL 0.9.
По сравнению с предшествующей новая версия обещает создание более качественных и детализированных фотореалистичных картинок.
Разработчик охарактеризовал новую модель искусственного интеллекта как «прорыв в творческих вариантах применения генеративного ИИ изображений».
В этой статье я постараюсь разобраться, так ли хороша эта нейросеть, а также сравню её в некоторых аспектах с Midjourney, которая пока считается лучшей.
Доступность и цена
У Midjourney есть некоторые ограничения, связанные с популярностью платформы.
Чтобы сохранять работоспособность серверов, разработчики предоставляют бесплатный доступ, ограниченный 25 операциями или попытками. В этот лимит включаются любые команды, которые требуют использования нейронных сетей, включая повторную генерацию той же картинки с другим результатом и функцию увеличения изображения.
Если вы используете сервис Midjourney, то имейте в виду, что каждое действие, которое вы выполняете, расходует одну из ваших попыток. Например, нажатие кнопок V, U и круг также будет уменьшать количество ваших попыток.
Если вы хотите воспользоваться платными возможностями Midjourney, то цены на подписку следующие: базовый план (200 GPU-минут в месяц) стоит 10 долларов в месяц (~600 рублей), стандартный план (15 GPU-часов в месяц) стоит 30 долларов в месяц (~1800 рублей), а корпоративный план (120 GPU-часов в год) стоит 600 долларов в год (~35 600 рублей).
"GPU-минуты/часы" - это количество действий, которые можно выполнить в рамках выбранного тарифа. Например, лимит в 200 GPU-минут в месяц на базовом плане подписки означает, что вы можете сгенерировать до 200 изображений в месяц. Если вам нужны дополнительные попытки, вы можете их докупить за 4 доллара (~240 рублей) за один GPU-час, что составляет примерно 60 команд генерации или масштабирования изображения.
Стандартный план за 30 долларов в месяц предоставляет пользователю 15 GPU-часов (900 GPU-минут) в месяц - это очень много возможностей для создания изображений.
Что насчёт SDXL 0.9? Доступ к модели можно получить через ClipDrop уже сегодня. Пока идёт бета-тест и все работает бесплатно. Но к концу бета-теста, когда разработчики исправят все баги и неточности, доступ скорее всего станет платным. Но пока не будем гадать наперед.
Качество генерируемых картинок
Я ввел запрос man (ссылку на нейросеть оставлю в конце статьи) и вот какие 4 варианта мне выдала SDXL 0.9.
По моему личному мнению, качество изображения ничуть не уступает Midjourney, а иногда даже качественнее.
Посмотрите на два изображения птицы выше. На генерации ниже — результат работы SDXL 0.9. Выше — новая версия Midjourney 5.2.
Создание изображения происходило на базе одного и того же промта:
an painting by the artist of the dream world, in the style of hybrid creature compositions, intricate psychedelic landscapes, hyper-realistic bird studies, colorful moebius, weirdcore, pink and cyan, cybermysticpunk
С ходу в глаза бросается объемность, тени и детализация от SDXL 0.9. Пока что Stable Diffusion выглядят поувереннее.
И да: нейросеть Stable Diffusion научили генерировать нормальные человеческие пальцы. Во всех сервисах для генерации изображений с этим были большие проблемы.
SDXL 0.9 предлагает огромное количество разных стилей: фотореалистичный, аниме стиль, диджитал-арты, иллюстрация и многое другое. Сравнение стилей между собой можете посмотреть ниже
Удобство
Не скажу, что Midjourney неудобен, но чтобы начать им пользоваться, нужно сделать определенные манипуляции. Со SDXL 0.9 все намного проще: зашёл на сайт, пишешь свой запрос и получаешь результат.
Итог
SDXL 0.9 не уступает Midjourney ни по каким показателям, изображения генерирует очень даже хорошо. А ведь нейросеть находится на этапе бета-теста, поэтому у нее есть все шансы стать ещё лучше.
Напомню, что выход SDXL 1.0 с открытым исходным кодом намечен на середину июля.
Канал с качественными промтами:
Попробовать Midjourney бесплатно:
Куда промт вводить?
Если Миджорни, то можно сюда: https://t.me/mjro_bot
SDXL сюда: https://clipdrop.co/stable-diffusion
Добавьте в саму статью, пожалуйста. Я понимаю, что ТГ-канал и бот, это святое, но вы обещали в конце статьи ссылку на нейросеть и статья о SDXL именно. За статью большое спасибо)
спасибо
Все это лпп чистой воды. Недавно пыталась нагенерить картинок как раз и с помощью этой сетки тоже. Выходит лютое, ущербное говно.
Я честно не знаю как люди умудряются через нейросети получать удобоваримые картинки и потом гордо их предъявлять. Наверное только на платных аккаунтах работает, а если делаешь бесплатно, то фиг тебе, а не картинка. Если честно, то хоть что-то приемлемое выдал только кандинский, это хотя бы был не кринж. Либо они справляются только с очень простыми запросами типа "фиолетовая кошка" "красивая девушка", "стакан на фоне моря" а если запрос усложнить, то сеть не понимает даже близко что ты от нее хочешь.
Чтобы не быть голословной - попробуйте у нее допроситься простой штуки (и если получится приведите пример запроса) - "жених и невеста в шлемах на мотоцикле". Лично у меня получались одни уроды. Либо на мотоцикле кто-то один, либо в шлеме кто-то один (при чем неважно как построен запрос), либо ног нет, рук тоже... Понятия жених и невеста (хоть на каком языке) они(нейросетки) тоже почему-то выкупают через раз, далли мне предложил пару в доспехах, весьма симпатичную хотя бы, но почему эльфы на мотоцикле я так и не поняла)) Короче, простейшая казалось бы история, в которой я меняла запрос и так и сяк и по итогу плюнула так и не получив внятного результата.
Если бы знала, что увижу тут рекламу, то сохранила бы весь тот кошмар который мне пришлось увидеть.
Не знаю, эльфов нет. Поза и ракурс могла быть и получше но в целом приемлемый результат можно выбить
Мотоцикл наверное с коляской или заднее сиденье трёхместное в ширину...
Ну и размер колёс у мотика мотороллерный, плюс на переднем колесе кожух какой-то остался.
Ещё шлемафон у девушки космический, да и у парня тоже с особенностями.
В целом норм, если не приглядываться.
Люди вроде хорошо получаются, но на руки у SD конечно лучше не смотреть. Вот почему мотоцикл какой-то весь поломанный? Радиатор, переднее колесо.. хмм.. с ними что-то не так.
У девушки "шлем" защищает только от удара в шлем партнёра при поцелуе, а у партнёра гугл-очки одеты наверное поверх шлема из 60-х
...следующего века
У партнёра ещё и фата к шлему приделана
Я отвечу песней Жених и невеста в шлемах на мотоциклах https://mangatv.shop/story/64ada8c111f4e7f9d5a142ba
Битва нейросетей. Начало.
А у Midjorney разве остался бесплатный доступ?
По-моему нет. По крайней мере бесплатно сгенерировать не вышло) когда оплатили, все заработало)
Ого, картинки и правда получились класс, ничем не хуже миджорни
Впечатляющие результаты! Обязательно попробую) спасибо
Если бы .....=(