Dall-E 3 VS MidJourney 5.2 VS Stable Diffusion XL - одинаковые промты, разные результаты
Dall-E 3 - новейший и недавно выпущенный генератор изображений от компании OpenAI, который благодаря своим впечатляющим возможностям набирает обороты в области ИИ. Это значительное улучшение по сравнению с предыдущей версией Dall-E, с лучшей согласованностью и качеством изображения.
Но как Dall-E 3 выглядит в сравнении со своими ближайшими конкурентами - MidJourney 5.2 и Stable Diffusion XL?
В этой статье я сравню эти три модели, используя шесть различных промтов, чтобы выяснить, какая из них дает лучшие результаты.
1. Когерентность (согласованность)
Когерентность - одна из самых ярких особенностей Dall-E 3. В Dall-E 3 она реализована на все сто процентов, до мельчайших деталей. Остальные? Они немного забыли про настроение вечеринки (забыли про колпак и меч).
2. Сюрреалистический пейзаж
В данном случае я хотел посмотреть, смогут ли эти модели искусственного интеллекта немного пофантазировать и внести разнообразие. Все дело в том, чтобы превратить безумие в "вау, как красиво".
По тому, как они получились, я бы сказал, что Dall-E 3 по-прежнему выглядит лучше всех из трех. Задавая сочетание узнаваемых элементов в непривычном виде, можно оценить, насколько хорошо каждый ИИ понимает и строит сцены с нуля.
3. Историческая фантастика
Так, результат MidJourney выглядит наиболее круто в этом примере, но в него не удалось включить древнеегипетского фараона. В этом раунде побеждает Dall-E 3.
В этом промте я хотел объединить разные временные периоды и проверить, насколько ИИ владеет исторической достоверностью, чтобы не допустить анахронизма. Хороший генератор изображений должен обеспечить сочетание, которое при этом будет выглядеть правдоподобно.
4. Передача эмоций
Это был тест на то, "можете ли вы вообще понимать чувства?". Ведь иногда дело не только во внешнем виде, но и в настроении. В этом раунде победил Stable Diffusion XL.
Этот промт проверяет способность ИИ передавать эмоции с помощью мимики и символических элементов, позволяя понять нюансы человеческих эмоций.
5. Дизайн существ
Dall-E 3 был близок к победе, но трофей достался MidJourney. Птица была эпической, шторм был диким - это было целое настроение!
Этот промт требует творческого подхода к созданию несуществующих вещей, проверяя границы воображения ИИ. Кроме того, в задании используются элементы окружающей среды и погоды, добавляются слои сложности, и можно увидеть, как ИИ генерирует специальные эффекты (например, молнию).
6. Архитектурный дизайн
В этой номинации победили все, но мне больше нравится вариант, созданный Dall-E2. Мягкие тона и симметрия элементов создают впечатление классного места, в котором хотелось бы жить.
Как получить доступ к Dall E-3
Dall-E 3 теперь является частью ChatGPT и доступен только платным пользователям. Вы также можете использовать Dall-E 3 бесплатно в чате Bing, но я не знаю, как долго он будет бесплатным.
Как получить доступ к MidJourney 5.2
Единственным способом использования MidJourney в настоящее время является канал Discord. Щелкните на этой ссылке, чтобы присоединиться к каналу и начать создавать свои собственные образы AI.
Как получить доступ к Stable Diffusion XL
Существует несколько способов использования Stable Diffusion XL, включая HuggingFace, ClipDrop и настройку на своем компьютере. Я рекомендую использовать Playground.AI для бесплатного использования SDXL.
Я впечатлен качеством изображений, создаваемых этими тремя генераторами AI-изображений, но у каждого из них есть свои сильные и слабые стороны.
MidJourney по-прежнему остается королем визуальной эстетики, создавая изображения, которые часто бывают потрясающими и креативными. Однако он может быть менее последовательным в плане согласованности, а также иногда создавать нереалистичные или нелепые изображения.
Dall-E 3 лучше, чем MidJourney, в плане согласованности, но его образы могут быть менее привлекательными. Dall-E 3 также лучше выполняет инструкции и генерирует изображения, соответствующие конкретным описаниям.
SDXL - хороший универсальный генератор AI-образов, но он отстает от MidJourney и Dall-E 3 как по визуальной эстетике, так и по согласованности.
В целом, я думаю, что выбор лучшего генератора AI-изображений будет зависеть от ваших конкретных потребностей.
Если вы не заметили, компания Adobe только что выпустила обновление своего собственного генератора AI-изображений под названием Firefly 2.0.
Чтобы не пропустить мои новые статьи, не забудьте подписаться на мой ТГ-канал о нейросетях.
Оригинал на английском языке
Комментарий удален модератором
Это уже вопрос удобства и привычки, а также целей.
Комментарий недоступен
Это да, у каждого варианта свои плюсы и минусы, но выбирать вам.
Интересно было бы узнать? Нейросети разные, промты в принципе одинаковые а по результатам генерации разное качество изображения. Я вот думаю, что если качество примерно одинаковое, то зачем платить больше или вообще платить, если можно пользоваться бесплатными нейросетями.
Согласен. Главное - чтобы затраты на сервисы себя оправдывали.
Соглашусь частично) Каждый кому интересна данная тема, есть время и возможности найдет оптимальный вариант именно "под себя"... Ведь как говорила злодейка: Что норма для паука, хаос для мухи ;)
На Discord-е я уже давно пользуюсь, за еще две ссылочки большой респект. Вот уж действительно, где можно попробовать сравнить. Ну а так мне как то все таки больше MidJourney заходит, но теперь уже есть сомнения.
Для сравнения всегда лучше попробовать разные варианты.
Автор в стейбле рукожоп. Сгенерировал по точно таким же промптам в SD XL 1.0. Даже negative не писал:
Это да, видимо, не в stable он спец.
Это все умножает статью на ноль) Пост не о том насколько хороша нейронка, а насколько и в чем плох автор.
Очень похвально, что ради этого комментария вы зарегались на VC. Только делать это было необязательно- автору можно написать напрямую- в конце статьи есть ссылка на оригинал статьи на английском. Правда, я очень сомневаюсь, что знание английского у вас присутствует.
Вместо того что бы язвить в комментариях лучше бы проверяли статьи, которые выкладываете. Насчет знания английского - посмеялся, вы оригинал прогнали через deepl и теперь кичитесь чем. Умением нажимать горячие клавиши ctrl+c ctrl+v?)
И правда. Это ведь некачественный машинный перевод. Читать невозможно, только картинки смотреть.
Я бы не сказал, что качество уж прямо кардинально отличается. Судя по снимкам, имеет место быть качественный рост в пользу MidJourney. Но это вовсе не повод отказываться от аналогов, тем более если пользуешься ими уже довольно продолжительно время. Но ознакомиться с инструментом, безусловно стоит.
Это да, все нейросети генерируют вполне качественные изображения.
Очень бы хотела попробовать бесплатно пользоваться, скажите пожалуйста подробнее как можно зайти на этот чат где есть возможность пользоваться этими вариантами?
В конце статьи есть ссылки на сервисы.
На мой взгляд лучшим генератором из вышеописанных является Dall-E 3. По крайней мере для меня.
А есть и поклонники SD.
В прямом сравнении MidJourney выглядит везде приторно-сказочным и выдаёт одну стилистику. Такая предсказуемость больше подойдёт при больших объёмах. Dall-E 3 и Stable XL более разнообразны по стилю, но мне кажется, лучше попадают в промт. Хотя динозавр в цветочек даже при потере египтянина просто шикарен!
В чем-то Вы правы. Но здесь, как говорится, на любителя.
Да,согласен то один лучше то другой, скорее всего MidJourney больше всего понравился!
Комментарий удален модератором
Скорее всего, все впереди.
MidJourney конечно выдает совершенного другого качества картинку! Я в восторге! Хотя Dall E-3 тоже имеет свою стилистику, и например в некоторых темах у него картинки значительно интереснее остальных!
Комментарий удален автором поста