Сравнение ИИ для генерации изображений Midjourney, Stable Diffusion, Dalle-3

В этой статье мы рассмотрим сравнение ИИ (нейросетей) для генерации изображений: Stable Diffusion, Midjourney и Dalle-3. Сравним аналоги и разберемся, какая нейросеть лучше подходит для тех или иных задач, ведь у каждой из них есть свои уникальные особенности. Аналоги Midjourney, Dalle, Stable Diffusion.

Сравнение нейросетей
Сравнение нейросетей

Сравнение разных ии для генерации изображений

Я пользуюсь разными нейронными сетями для работы с текстом, изображениями, видео, аудио…

Протестировал несколько сервисов и остановился на телеграмм боте, в котором есть возможность взаимодействовать с самыми популярными нейронками.

Начнём с самой простой (по моему мнению) нейросети для создания изображений — "DALLE — 3"

Основные характеристики и возможности Далли — 3

  • Dalle редко создает изображения рук людей, на которых присутствует больше пяти пальцев (эта проблема, характерная для других нейронных сетей, была успешно решена)

  • Почти нет вероятности возникновения дополнительных конечностей в процессе генерации

  • Далли обладает способностью встраивать текст на изображения, соответствующий контексту (на данный момент поддерживается только английский язык)
  • Имеет обширные знания о множестве персонажей, которые не доступны в других нейросетях

  • Запросы можно писать простым языком без использования сложных терминов или дополнительных параметров
  • Функция автодополнения промптов, которая облегчает задачу для начинающих пользователей

  • Возможность скрещивать разных персонажей и предметов в одном изображении

Как пользоваться нейросетью DALLE 3 на русском языке онлайн в боте Telegram

Чтобы бесплатно создать изображение в Далли, заходим в телеграм бота (без регистрации) и в меню нажимаем «DALLE-3» в режиме «Multi-image»

На данный момент меню бота выглядит немного по-другому, если возникнут трудности, напишите мне в лс.
Меню бота в тг
Меню бота в тг

Сравним сгенерированные изображения в разных нейросетях по запросам с человеком и мультяшных персонажем.

промпт 1: "Дональд Дак держит в руках золотую монету"

промпт 2: "Девушка сидит на траве на фоне гор"

Применение стилей в DALLE — 3

Давайте рассмотрим несколько вариантов создания изображения с помощью dalle в различных стилях, используя тот же самый промпт. Для этого перейдем на вкладку «Стили»

Стили для Dalle - 3
Стили для Dalle - 3

Я выбрал следующие стили для данного изображения: "Steampunk", "Logo", "Horror", "Space", "NeonPunk"

Для фотографии с девушкой применим другие стили: "Anime2, "Gothic", "ComicBook", "Futuristic", "Fashion"

Нейронная сеть успешно справилась с поставленной задачей и создала изображения в соответствии с выбранными стилями.

Совмещение персонажей в DALLE — 3

Промпт: "Комбинация дональда дака и стрекозы"

Как я и говорил, Далли неплохо «скрещивает» персонажей, а так же людей, различные предметы...

Как написать текст на изображениях в Dalle-3

На данный момент вставить текст на картинках можно только на английском языке.

Промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"

Текст на картинке с помощью ИИ
Текст на картинке с помощью ИИ

Не всегда с первого раза получается нужный результат, иногда следует повторить генерацию.

Так же в боте доступны расширенные функции для Далли. Об этом я подробно описывал в данной статье

Сравнение midjourney с другими нейросетями для генерации изображений

Рассмотрим аналог dalle. Одну из самых популярных нейронных сетей: "Midjourney"

В основном использование миджорни доступно через Discord. Однако для многих пользователей это не удобно из-за определённых минусов, например, ограничение в приеме платежей с некоторых карт, подключение VPN и пр.

Подобных проблем нет при работе с нейросетью через бота в мессенджере Telegram. Доступна последняя версия midjourney v. 6 со всеми основными функциями и расширенными возможностями.

Как пользоваться нейросетью миджорни онлайн в телеграм боте на русском языке

В меню бота выбираем нейросеть "midjourney" и можем так же отправлять запросы для получения генераций, использовать стили, применять настройки и дополнительные опции.

Миджорни в телеграм боте
Миджорни в телеграм боте

Проведём сравнение midjourney с другими нейросетями для генерации изображений

Создадим картинки в миджрони с таким же запросом, который писали в далли.

Промпт 1: "Дональд Дак держит в руках золотую монету"

промпт 2: "Девушка сидит на траве на фоне гор"

Так же в этой нейросети можем применять различные стили (более 40).

Заходим во вкладку «Стили» и, для сравнения, выберем такие же, которые использовали в dalle.

Как мы видим, на изображениях появились характерные черты от миджорни.

Как написать текст на изображениях в midjourney

Данная нейронка также умеет встраивать текст на картинках.

Пишем аналогичный промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"

Миджорни рисует текст на картинках
Миджорни рисует текст на картинках

А вот что у меня получилось при скрещивании персонажей)

С этой задачей Далли справилась получше.

Промпт: "Комбинация дональда дака и стрекозы"

Сравнение ИИ для генерации изображений Midjourney, Stable Diffusion, Dalle-3

Так же в Миджорни есть множество дополнительных функций, настроек, определённых команд.

Возможность сделать вариации персонажа, дорисовать окружение, увеличить размер изображения с переработкой деталей и пр.

На данном этапе углубляться в расширенные опции не будем, всё таки это тема для отдельной статьи.

Самое интересное, что в боте нейросети могут взаимодействовать между собой

После создания изображения в миджорни и далли мы можем воспользоваться функцией «Inpaint» от «Stable Diffusion» и дополнительно отредактировать картинку: удалить ненужный объект, заменить фон, перерисовать определённую деталь, вставить другое лицо на фото и пр.

Дополнительные функции в миджорни
Дополнительные функции в миджорни

На эту тему есть отдельная статья, рекомендую ознакомиться.

Рассмотрим следующий аналог — "Stable Diffusion"

Как пользоваться нейросетью Stable Diffusion онлайн на русском языке в телеграм боте

Переключаемся в меню бота на следующую нейросеть и сравним генерации изображений с далли и миджорни.

Меню бота с нейросетями
Меню бота с нейросетями

Отправляем такие же запросы: "Дональд Дак держит в руках золотую монету" и "Девушка сидит на траве на фоне гор"

Посмотрим как это нейросеть рисует в других стилях, которые мы применяли ранее.

Таким образом мы можем отправить один промт в разные нейронки на одной платформе, сравнить результат ИИ и выбрать тот, который нас больше устроит.

Stable Diffusion с написанием текста на данный момент изображения не генерирует, а вот со скрещиванием персонажей справляется.

Для этого нам нужно прописать следующим промпт: [дональд дак:стрекоза:0.5] таким образом нейросеть будет рисовать сначала первого персонажа на 50% затем дорисовывать второго.

Сравнение ИИ для генерации изображений Midjourney, Stable Diffusion, Dalle-3

В нейросети «Stable Diffusion» существует множество преимуществ: выбор моделей, сэмплеров, размер картинок, конструктор изображений, возможность заменять лицо на фото, использование функции «LoRa» и многое другое.

Вот подробная инструкция по генерации картинок в «Stable Diffusion».

Так же есть статья по созданию изображения с любым лицом и замене лица на фото с помощью «Stable Diffusion»

В данном боте есть возможность бесплатно протестировать некоторые функции, так как каждый лень начисляется несколько баллов для генераций.

Если вам интересна тема нейросетей, рекомендую начать проходить пошаговое обучение и применять полученные навыки для решения определённых задач в вашей сфере деятельности.

1010
7 комментариев

Ну midjourney самые приятные картинги генерит.

2

Каждая нейросеть имеет свои преимущества, и здорово видеть, как они справляются с различными задачами, хоть это иногда и пугает, так как развиваются они конечно, со скоростью света

1

Отличный обзор и навигация по нейросетям 👍

1

нейронки развиваются, занятно наблюдать за этим. спасибо за обзор

1

почему утри с крыльями стрекозы так реалистично смотрятся? Нейросети конечно показывают нам ,что нет пределов в воплощении идеи-это очень круто

1

sd без ограничений и меньшая зависимость от "дяди". Просто научиться пользоваться.

1