Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Для создания хороших образов с помощью DALL-E 3 не нужно быть экспертом в области создания промтов.

Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

В начале октября Dall-E 3, модель преобразования текста в изображение, разработанная компанией OpenAI, стала доступна пользователям ChatGPT Plus. Это означает, что вам не нужно оплачивать дополнительные подписки, такие как Midjourney или LeonardoAI, чтобы генерировать изображения, а можно делать это внутри ChatGPT!

Генерация изображений с помощью Dall-E 3 несколько отличается от других инструментов искусственного интеллекта. Такие инструменты, как Midjourney, заставляют нас учиться промтам для получения хороших изображений, но с Dall-E 3 нам не нужно так много промтов для получения хороших изображений. Фактически, нам нужно только быстро описать, что мы хотим, и Dall-E 3 создаст для вас промт.

Давайте посмотрим, чем Dall-E 3 отличается от других инструментов и не пора ли отказаться от подписки на Midjourney.

Как использовать DALL-E 3 в ChatGPT

Получить доступ к Dall-E 3 можно разными способами, но единственный способ получить Dall-E 3 в ChatGPT - это подписка ChatGPT Plus. Если вы являетесь подписчиком ChatGPT Plus, то увидите Dall-E 3 в GPT-4.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Включите Dall-E 3, чтобы начать создавать изображения с помощью ChatGPT.
Сначала я попрошу ChatGPT создать образ собаки-супергероя. Промт будет довольно простым.

a dog that is a superhero

После нажатия клавиши Enter будут сгенерированы 4 промта и изображения.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Итак, Dall-E 3 делает промт за нас. Круто, не правда ли?

Вот 4 изображения, которые я получил.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Мне нравится первый вариант. Если щелкнуть на нем, то изображение станет более подробным, а справа появится промт, созданный для этого изображения.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Самое замечательное в ChatGPT с Dall-E 3 то, что создать новое изображение (или изменить существующее) так же просто, как и продолжить общение с ChatGPT. В отличие от других инструментов, вам не нужно копировать/вставлять исходный промт и редактировать его, чтобы получить новое изображение или добавить объекты.

Допустим, я хочу получить изображение, на котором моя собака-супергерой летит. Вот промт, который я использовал.

make dog #1 flying like a superhero

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Я ожидал получить ту же собаку, что и на предыдущем изображении, но получил летающую собаку в красном плаще.
Чтобы продемонстрировать возможности Dall-E 3 и ChatGPT, я назову эту собаку Максом и попрошу ChatGPT сгенерировать дом Макса.

Let’s say this dog’s name is Max. Generate an image of Max’s house

Этот промт выдал большие дома и крошечный домик для собаки, поэтому пришлось использовать второй промт, чтобы получить результаты, приведенные ниже.

generate only the dog’s house

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Несмотря на то, что первый промт работал плохо, для его исправления нам не пришлось создавать промт с нуля, а лишь указать ChatGPT, что именно мы хотим изменить.

Вот еще один пример. Допустим, мне нравится дом № 1, и я хочу, чтобы на этом изображении была моя собака-супергерой.

can you put Max the superhero dog in picture #1?

ChatGPT и Dall-E 3 понимают меня так, как не понимает ни один другой инструмент искусственного интеллекта.

Единственная проблема заключается в том, что нет единообразия персонажей в изображениях, но когда-нибудь это можно будет исправить. Кроме того, я обнаружил еще одну проблему: Dall-E 3 отказывается генерировать изображения из-за авторских прав. Например, он отказался генерировать изображение Золушки, поэтому для обложки этой статьи мне пришлось довольствоваться "сказочной принцессой".

Что мне больше всего нравится в Dall-E 3, так это то, что можно генерировать изображения и изменять их, используя простой английский язык. Dall-E 3 кажется очень хорошим инструментом для тех, кто хочет генерировать AI-изображения без необходимости изучать написание промтов.

Но лучше ли он, чем Midjourney?

DALL-E 3 против Midjourney

Давайте сравним эти инструменты искусственного интеллекта, используя одни и те же промты. Я выскажу свое мнение о результатах, полученных с помощью обоих инструментов, а вы сможете оценить изображения самостоятельно.

DALL-E 3 против Midjourney: Понимание промтов

Dalle 3 известен своей способностью понимать промты, даже с минимальным количеством текста, по сравнению с Midjourney. Я решил проверить это, предоставив один и тот же промт этим двум инструментам ИИ (спойлер: разница существенна).

Промт: “An elegant woman in a white dress with red embroidery and heels, with a husky on a leash walking in the central park of Manhattan”

Вот что я получил с помощью Dall-E 3.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Вот что у меня получилось в Midjourney.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Как видите, Dall-E 3 гораздо лучше понял мой промт и выдал более соответствующие ему изображения. Даже после третьей попытки с Midjourney мне не удалось получить красную вышивку, более того, я получил несколько неточных рисунков, как показано на третьем изображении, где хаски оказался отдельно от своего поводка.

DALL-E 3 против Midjourney: Качество и реалистичность изображений

Это, пожалуй, следующий, но не менее важный фактор, который необходимо учитывать при выборе AI-инструмента. Как я уже упоминал в одной из своих предыдущих статей, в последнем обновлении v5.2 компания Midjourney значительно улучшила качество своих изображений. Теперь изображения выглядят невероятно реалистично, и их трудно отличить от реальных фотографий.

Теперь давайте посмотрим, какого качества изображения можно добиться с помощью Dall-E 3.

Промт: “Portrait of a girl and a bearded man on Miami Beach at sunset”

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Мне очень нравятся эти снимки. Dalle 3 четко передал суть фотографии с океаном, зданиями Майми, пальмами и даже людьми. Но если говорить о качестве и реалистичности, то я считаю Midjourney победителем.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Допустим, нам нужно сделать коммерческое изображение.

Промт: “Raspberry pancake”

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

И вот что у меня получилось в Midjourney.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Оба инструмента генерируют хорошие изображения, но при ближайшем рассмотрении видно, что изображения Midjourney имеют более высокое качество и более реалистичны.

DALL-E против Midjourney: Насыщенность цвета

Думаю, вы заметили на предыдущих изображениях, что Dall-E 3 имеет различия в насыщенности цветов и контрастности по сравнению с Midjourney, причем последняя имеет преимущество.

Промт: “Cat in an astronaut costume in space with flowers”

Вот что я получил с помощью Dall-E 3.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

А теперь изображения Midjourney.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

В данном случае Midjourney создал очень реалистичные изображения, в то время как Dall-E 3 - карикатурные.

DALL-E 3 против Midjourney: Стили

Это очень важный аспект изображения. Давайте посмотрим, какие изображения получаются при использовании обоих инструментов с точки зрения стиля.

Промт: “Oil painting of a small house in the Alpine mountains”

Вот что я получил с помощью Dall-E 3.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Я получил только 2 изображения, и они скорее мультяшные, чем нарисованные маслом.

Вот что я получил с Midjourney.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Midjourney (в очередной раз) позволил получить более качественные изображения, и я искренне рад полученным результатам.

DALL-E 3 против Midjourney: Рисование знаменитостей

Наконец, я хочу посмотреть, насколько далеко заходит политика авторского права в Dall-E 3, попросив его сгенерировать изображения с некоторыми знаменитостями.

Промт: “Angelina Jolie cuts down trees, photo from the 80s”

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Dall-E 3 прекрасно понял промт, но нарисовал... не Анджелину Джоли.

Теперь вы можете генерировать изображения в ChatGPT с помощью DALL-E 3. Сравнение DALL-E 3 с Midjourney

Midjourney имеет базовое представление о том, кто такая Анджелина Джоли, но не совсем понимает концепцию моего промта.
В целом Dall-E 3 очень отзывчив на промты и достаточно удобен в использовании. Однако если мы обратим внимание на реалистичность, насыщенность цветов, качество и прорисовку людей, животных и еды, то Midjourney будет явным победителем.

Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.

Оригинал на английском - здесь.

3030
31 комментарий

Действительно, результаты удивляют, в хорошем смысле)

2
Ответить

Но все равно до МЖ пока не дотягивают.

2
Ответить
Комментарий удалён автором поста

Ничего крутого не увидел. Как это через скайп? Может, с ботом в телеграме перепутали?

1
Ответить

Изображение очень впечатляют, это реально то что я искала. Спасибо вам, что вы даёте нам эту информацию, буду пользоваться, спасибо.

1
Ответить

Как по мне, так и миджорни рисует еще так себе, а про dalle я вообще молчу. Карикатуры, да и только. Разве что бесплатно. Кто им пользуется, интересно?

Ответить

Результат просто потрясающий! Я давно искала что-то подобное! Спасибо большое!

1
Ответить