{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Dall-E 3 VS MidJourney 5.2 VS Stable Diffusion XL - одинаковые промты, разные результаты

Еще больше полезностей - в моем хобби-блоге про нейросети в Телеграм.

Dall-E 3 - новейший и недавно выпущенный генератор изображений от компании OpenAI, который благодаря своим впечатляющим возможностям набирает обороты в области ИИ. Это значительное улучшение по сравнению с предыдущей версией Dall-E, с лучшей согласованностью и качеством изображения.

Но как Dall-E 3 выглядит в сравнении со своими ближайшими конкурентами - MidJourney 5.2 и Stable Diffusion XL?

В этой статье я сравню эти три модели, используя шесть различных промтов, чтобы выяснить, какая из них дает лучшие результаты.

1. Когерентность (согласованность)

Промт: An astronaut riding a steel horse on the moon. The astronaut is wearing a medieval armor with a party hat and a green sword.

Когерентность - одна из самых ярких особенностей Dall-E 3. В Dall-E 3 она реализована на все сто процентов, до мельчайших деталей. Остальные? Они немного забыли про настроение вечеринки (забыли про колпак и меч).

2. Сюрреалистический пейзаж

Промт: A dreamy landscape where clouds are made of cotton candy and rivers flow with liquid gold

В данном случае я хотел посмотреть, смогут ли эти модели искусственного интеллекта немного пофантазировать и внести разнообразие. Все дело в том, чтобы превратить безумие в "вау, как красиво".

По тому, как они получились, я бы сказал, что Dall-E 3 по-прежнему выглядит лучше всех из трех. Задавая сочетание узнаваемых элементов в непривычном виде, можно оценить, насколько хорошо каждый ИИ понимает и строит сцены с нуля.

3. Историческая фантастика

Промт: Ancient Egyptian pharaoh using a modern smartphone while riding a dinosaur.

Так, результат MidJourney выглядит наиболее круто в этом примере, но в него не удалось включить древнеегипетского фараона. В этом раунде побеждает Dall-E 3.

В этом промте я хотел объединить разные временные периоды и проверить, насколько ИИ владеет исторической достоверностью, чтобы не допустить анахронизма. Хороший генератор изображений должен обеспечить сочетание, которое при этом будет выглядеть правдоподобно.

4. Передача эмоций

Промт: A portrait of a woman holding a wilted rose, her expression one of profound sadness and longing.

Это был тест на то, "можете ли вы вообще понимать чувства?". Ведь иногда дело не только во внешнем виде, но и в настроении. В этом раунде победил Stable Diffusion XL.

Этот промт проверяет способность ИИ передавать эмоции с помощью мимики и символических элементов, позволяя понять нюансы человеческих эмоций.

5. Дизайн существ

Промт: An image of a ‘thunderbird,’ a mythical creature that controls storms, depicted in its natural habitat during a fierce thunderstorm

Dall-E 3 был близок к победе, но трофей достался MidJourney. Птица была эпической, шторм был диким - это было целое настроение!

Этот промт требует творческого подхода к созданию несуществующих вещей, проверяя границы воображения ИИ. Кроме того, в задании используются элементы окружающей среды и погоды, добавляются слои сложности, и можно увидеть, как ИИ генерирует специальные эффекты (например, молнию).

6. Архитектурный дизайн

Промт: Design an eco-friendly futuristic city floating on the ocean, with advanced technology and harmony between nature and artificial structures

В этой номинации победили все, но мне больше нравится вариант, созданный Dall-E2. Мягкие тона и симметрия элементов создают впечатление классного места, в котором хотелось бы жить.

Как получить доступ к Dall E-3

Dall-E 3 теперь является частью ChatGPT и доступен только платным пользователям. Вы также можете использовать Dall-E 3 бесплатно в чате Bing, но я не знаю, как долго он будет бесплатным.

Как получить доступ к MidJourney 5.2

Единственным способом использования MidJourney в настоящее время является канал Discord. Щелкните на этой ссылке, чтобы присоединиться к каналу и начать создавать свои собственные образы AI.

Как получить доступ к Stable Diffusion XL

Существует несколько способов использования Stable Diffusion XL, включая HuggingFace, ClipDrop и настройку на своем компьютере. Я рекомендую использовать Playground.AI для бесплатного использования SDXL.

Я впечатлен качеством изображений, создаваемых этими тремя генераторами AI-изображений, но у каждого из них есть свои сильные и слабые стороны.

MidJourney по-прежнему остается королем визуальной эстетики, создавая изображения, которые часто бывают потрясающими и креативными. Однако он может быть менее последовательным в плане согласованности, а также иногда создавать нереалистичные или нелепые изображения.

Dall-E 3 лучше, чем MidJourney, в плане согласованности, но его образы могут быть менее привлекательными. Dall-E 3 также лучше выполняет инструкции и генерирует изображения, соответствующие конкретным описаниям.

SDXL - хороший универсальный генератор AI-образов, но он отстает от MidJourney и Dall-E 3 как по визуальной эстетике, так и по согласованности.

В целом, я думаю, что выбор лучшего генератора AI-изображений будет зависеть от ваших конкретных потребностей.

Если вы не заметили, компания Adobe только что выпустила обновление своего собственного генератора AI-изображений под названием Firefly 2.0.

Чтобы не пропустить мои новые статьи, не забудьте подписаться на мой ТГ-канал о нейросетях.

Оригинал на английском языке

Adobe Firefly 2.0 - лучше ли он, чем Dall-E 3?
0
25 комментариев
Написать комментарий...

Комментарий удален модератором

Развернуть ветку
Neuromarket (Алексей)
Автор

Это уже вопрос удобства и привычки, а также целей.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Это да, у каждого варианта свои плюсы и минусы, но выбирать вам.

Ответить
Развернуть ветку
Алексей Зубцов

Интересно было бы узнать? Нейросети разные, промты в принципе одинаковые а по результатам генерации разное качество изображения. Я вот думаю, что если качество примерно одинаковое, то зачем платить больше или вообще платить, если можно пользоваться бесплатными нейросетями.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Согласен. Главное - чтобы затраты на сервисы себя оправдывали.

Ответить
Развернуть ветку
Vlad III Tepes

Соглашусь частично) Каждый кому интересна данная тема, есть время и возможности найдет оптимальный вариант именно "под себя"... Ведь как говорила злодейка: Что норма для паука, хаос для мухи ;)

Ответить
Развернуть ветку
Артём Козачев

На Discord-е я уже давно пользуюсь, за еще две ссылочки большой респект. Вот уж действительно, где можно попробовать сравнить. Ну а так мне как то все таки больше MidJourney заходит, но теперь уже есть сомнения.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Для сравнения всегда лучше попробовать разные варианты.

Ответить
Развернуть ветку
Павел Кононенко

Автор в стейбле рукожоп. Сгенерировал по точно таким же промптам в SD XL 1.0. Даже negative не писал:

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Это да, видимо, не в stable он спец.

Ответить
Развернуть ветку
NeuroUser89

Это все умножает статью на ноль) Пост не о том насколько хороша нейронка, а насколько и в чем плох автор.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Очень похвально, что ради этого комментария вы зарегались на VC. Только делать это было необязательно- автору можно написать напрямую- в конце статьи есть ссылка на оригинал статьи на английском. Правда, я очень сомневаюсь, что знание английского у вас присутствует.

Ответить
Развернуть ветку
NeuroUser89

Вместо того что бы язвить в комментариях лучше бы проверяли статьи, которые выкладываете. Насчет знания английского - посмеялся, вы оригинал прогнали через deepl и теперь кичитесь чем. Умением нажимать горячие клавиши ctrl+c ctrl+v?)

Ответить
Развернуть ветку
Павел Кононенко

И правда. Это ведь некачественный машинный перевод. Читать невозможно, только картинки смотреть.

Ответить
Развернуть ветку
Владислав Тулеев

Я бы не сказал, что качество уж прямо кардинально отличается. Судя по снимкам, имеет место быть качественный рост в пользу MidJourney. Но это вовсе не повод отказываться от аналогов, тем более если пользуешься ими уже довольно продолжительно время. Но ознакомиться с инструментом, безусловно стоит.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

Это да, все нейросети генерируют вполне качественные изображения.

Ответить
Развернуть ветку
Юля

Очень бы хотела попробовать бесплатно пользоваться, скажите пожалуйста подробнее как можно зайти на этот чат где есть возможность пользоваться этими вариантами?

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

В конце статьи есть ссылки на сервисы.

Ответить
Развернуть ветку
Игорь Гугало

На мой взгляд лучшим генератором из вышеописанных является Dall-E 3. По крайней мере для меня.

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

А есть и поклонники SD.

Ответить
Развернуть ветку
Ольга

В прямом сравнении MidJourney выглядит везде приторно-сказочным и выдаёт одну стилистику. Такая предсказуемость больше подойдёт при больших объёмах. Dall-E 3 и Stable XL более разнообразны по стилю, но мне кажется, лучше попадают в промт. Хотя динозавр в цветочек даже при потере египтянина просто шикарен!

Ответить
Развернуть ветку
Neuromarket (Алексей)
Автор

В чем-то Вы правы. Но здесь, как говорится, на любителя.

Ответить
Развернуть ветку
Aleksey Bakun

Да,согласен то один лучше то другой, скорее всего MidJourney больше всего понравился!

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Neuromarket (Алексей)
Автор

Скорее всего, все впереди.

Ответить
Развернуть ветку
Olga Chu

MidJourney конечно выдает совершенного другого качества картинку! Я в восторге! Хотя Dall E-3 тоже имеет свою стилистику, и например в некоторых темах у него картинки значительно интереснее остальных!

Ответить
Развернуть ветку

Комментарий удален автором поста

Развернуть ветку
22 комментария
Раскрывать всегда