Cравнения ИИ в 2024 году: Midjourney vs Flux vs DALL-E vs Adobe Firefly vs Stable Diffusion - Продолжение

Недавно мы опубликовали статью про сравнение генерации изображений в категории "Абстрактная художественная иллюстрация" с использованием ведущих ИИ-моделей: Dall-E 3, Adobe Firefly 3, Midjourney 6.1, Stable Diffusion XL, Stable Diffusion 3, Flux.1 [dev].

Сегодня делимся с вами результатами в других категориях: векторная графика, иллюстративная фотография, портретная фотография, фэнтэзи фотография, дизайн интерьера, графический дизайн логотипа, WEB-дизайн, дизайн упаковки.

Категория: Векторная графика

Запрос:

flat vector illustration of a man sitting at a desk with his laptop, puppy, isolated on a white background, simple, minimalistic, closeup

Результаты:

В целом, все инструменты демонстрируют отличную способность реализовать промпт, при этом Dall-E 3, Stable Diffusion XL и Stable Diffusion 3 особенно близки к деталям запроса. Остальные инструменты также дают высококачественные результаты с небольшими различиями в интерпретации минимализма и дизайна фона.

Категория: Иллюстративная фотография

Запрос:

photo of a frail old man with clenched fist yelling wearing glasses and an old faded pinkish shirt with a tie around his neck and looking at a threatening storm cloud, cinematic, detailed, atmospheric, dramatic light

В целом, большинство инструментов демонстрируют впечатляющую способность реализовывать сложные подсказки, особенно отличился Midjourney 6.1. Adobe Firefly 3, кажется, немного отстает от остальных в этом конкретном сценарии.

Категория: Портретная фотография

Запрос:

portrait photo of a 40 year old business woman, streets of munich

Лучшие результаты показали Midjourney 6.1 и Stable Diffusion XL, за ними следуют Stable Diffusion 3 и Flux.1 [dev]. Этим инструментам удается создать реалистичные портреты и в то же время передать атмосферу Мюнхена. В данном конкретном сценарии Dall-E 3 и Adobe Firefly 3 с трудом обеспечивают стабильные и качественные результаты, отвечающие всем аспектам задания.

Категория: Фэнтэзи фотография

Запрос:

photo of a sea monster drinking a soda with a drinking straw, underwater, deep sea, fantasy, abstract

Все инструменты предлагают интересные интерпретации фэнтэзийного задания, и каждый из них демонстрирует свои сильные стороны. Dall-E 3 выделяется своей особенно абстрактной и красочной интерпретацией. Stable Diffusion XL и Stable Diffusion 3 находят хороший баланс между фантазией и реализмом. Midjourney 6.1 отличается высоким эстетическим качеством, а Flux.1 [dev], несмотря на хорошую реализацию, несколько теряет в фотореалистичности. При этом Adobe Firefly 3 испытывает наибольшие трудности с тем, чтобы одинаково убедительно реализовать все аспекты подсказки.

Категория: Дизайн интерьера

Запрос:

photo of a dining room with large doors and modern swedish furniture, decorated in a bright warm and earthy color scheme, hygge style

Midjourney 6.1 демонстрирует лучшие общие характеристики в этой категории. Он убеждает отличным балансом между эстетическим дизайном и вниманием к деталям в представлении мебели. Flux.1 [dev] следует на втором месте с хорошей детализацией и последовательным дизайном. Dall-E 3, Adobe Firefly 3, Stable Diffusion XL и Stable Diffusion 3 находятся на одном уровне, причем два последних отстают из-за ошибок в деталях при представлении мебели, несмотря на визуально привлекательный дизайн.

Категория: Графический дизайн логотипа

Запрос:

Coffee logo, featuring a mushroom cloud coming out of a cup, the cloud looks like brains, full colour print, vintage colours, 1960s

Dall-E 3 обеспечивает наилучшую общую производительность в точности реализации всех аспектов промпта. Stable Diffusion 3 и Flux.1 [dev] идут следом с очень сильными интерпретациями. Adobe Firefly 3 и Stable Diffusion XL показывают хорошие результаты, но имеют небольшие недостатки в представлении атомного гриба или мозгоподобной структуры. Midjourney 6.1 испытывает наибольшие трудности с правильной реализацией аспекта атомного гриба, хотя винтажный стиль хорошо передан.

Категория: WEB-дизайн

Запрос:

a beautiful website landing page for a tech company, modern, minimalistic, blue and orange color scheme, ui, ux, ui/ux

Учитывая профессиональные стандарты веб-дизайна, все эти сгенерированные ИИ проекты фактически не пригодны для прямого использования. Flux.1 [dev] немного выделяется тем, что выдает результаты, которые, по крайней мере, могут послужить отправной точкой для дальнейшего мозгового штурма. Важно подчеркнуть, что в настоящее время эти инструменты могут использоваться в лучшем случае для формирования идей на ранних стадиях разработки концепции.

Категория: Дизайн упаковки

Запрос:

a realistic standup pouch product photo mockup decorated with coffee beans and Coffee-leaves with the words "SCHWARZER KAFFEE JUNGE" featured prominently, scifi, on the moon, space, stars, night

Midjourney 6.1 демонстрирует наилучший общий результат. Он предлагает лучший баланс между правильным воспроизведением текста, интеграцией научно-фантастических элементов и изображением кофейных зерен и листьев. Далее следуют Stable Diffusion 3 и Flux.1 [dev], у которых есть сильные стороны в воспроизведении текста и научно-фантастической тематике, но слабые в представлении листьев кофе. Dall-E 3 и Stable Diffusion XL отстают из-за плохого воспроизведения текста, а Adobe Firefly 3 демонстрирует слабые результаты практически во всех аспектах.

Заключение

В нашем Телеграмм канале мы проводили голосование за лучший результат в каждой категории. И вот его итоги:

Cравнения ИИ в 2024 году: Midjourney vs Flux vs DALL-E vs Adobe Firefly vs Stable Diffusion - Продолжение

С одной стороны, неожиданно, потому что Flux - самая молодая модель из всех участников нашего сравнения. С другой стороны, индустрия ИИ имеет настолько высокую конкуренцию и развивается супер стремительно, что надо быть готовым к тому, что в любой момент может появиться новичок и сразу стать лидером (потому что будет более обученным, в том числе на опыте предшественников). Такой вот ИИ, обучаемость - его ключевая характеристика!

Не является рекламой. Все данные взяты в открытом доступе. Все выводы и соображения, содержащиеся в посте, являются мнением авторов блога.

33
1 комментарий

Такая интересная статья. Такая работа. И нет просмотров и комментариев.

2