Сравнение ИИ для генерации изображений Midjourney, Stable Diffusion, Dalle-3
В этой статье мы рассмотрим сравнение ИИ (нейросетей) для генерации изображений: Stable Diffusion, Midjourney и Dalle-3. Сравним аналоги и разберемся, какая нейросеть лучше подходит для тех или иных задач, ведь у каждой из них есть свои уникальные особенности. Аналоги Midjourney, Dalle, Stable Diffusion.
Сравнение разных ии для генерации изображений
Я пользуюсь разными нейронными сетями для работы с текстом, изображениями, видео, аудио…
Протестировал несколько сервисов и остановился на телеграмм боте, в котором есть возможность взаимодействовать с самыми популярными нейронками.
Начнём с самой простой (по моему мнению) нейросети для создания изображений — "DALLE — 3"
Основные характеристики и возможности Далли — 3
Dalle редко создает изображения рук людей, на которых присутствует больше пяти пальцев (эта проблема, характерная для других нейронных сетей, была успешно решена)
Почти нет вероятности возникновения дополнительных конечностей в процессе генерации
- Далли обладает способностью встраивать текст на изображения, соответствующий контексту (на данный момент поддерживается только английский язык)
Имеет обширные знания о множестве персонажей, которые не доступны в других нейросетях
- Запросы можно писать простым языком без использования сложных терминов или дополнительных параметров
Функция автодополнения промптов, которая облегчает задачу для начинающих пользователей
- Возможность скрещивать разных персонажей и предметов в одном изображении
Как пользоваться нейросетью DALLE 3 на русском языке онлайн в боте Telegram
Чтобы бесплатно создать изображение в Далли, заходим в телеграм бота (без регистрации) и в меню нажимаем «DALLE-3» в режиме «Multi-image»
На данный момент меню бота выглядит немного по-другому, если возникнут трудности, напишите мне в лс.
Сравним сгенерированные изображения в разных нейросетях по запросам с человеком и мультяшных персонажем.
промпт 1: "Дональд Дак держит в руках золотую монету"
промпт 2: "Девушка сидит на траве на фоне гор"
Применение стилей в DALLE — 3
Давайте рассмотрим несколько вариантов создания изображения с помощью dalle в различных стилях, используя тот же самый промпт. Для этого перейдем на вкладку «Стили»
Я выбрал следующие стили для данного изображения: "Steampunk", "Logo", "Horror", "Space", "NeonPunk"
Для фотографии с девушкой применим другие стили: "Anime2, "Gothic", "ComicBook", "Futuristic", "Fashion"
Нейронная сеть успешно справилась с поставленной задачей и создала изображения в соответствии с выбранными стилями.
Совмещение персонажей в DALLE — 3
Промпт: "Комбинация дональда дака и стрекозы"
Как я и говорил, Далли неплохо «скрещивает» персонажей, а так же людей, различные предметы...
Как написать текст на изображениях в Dalle-3
На данный момент вставить текст на картинках можно только на английском языке.
Промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"
Не всегда с первого раза получается нужный результат, иногда следует повторить генерацию.
Так же в боте доступны расширенные функции для Далли. Об этом я подробно описывал в данной статье
Сравнение midjourney с другими нейросетями для генерации изображений
Рассмотрим аналог dalle. Одну из самых популярных нейронных сетей: "Midjourney"
В основном использование миджорни доступно через Discord. Однако для многих пользователей это не удобно из-за определённых минусов, например, ограничение в приеме платежей с некоторых карт, подключение VPN и пр.
Подобных проблем нет при работе с нейросетью через бота в мессенджере Telegram. Доступна последняя версия midjourney v. 6 со всеми основными функциями и расширенными возможностями.
Как пользоваться нейросетью миджорни онлайн в телеграм боте на русском языке
В меню бота выбираем нейросеть "midjourney" и можем так же отправлять запросы для получения генераций, использовать стили, применять настройки и дополнительные опции.
Проведём сравнение midjourney с другими нейросетями для генерации изображений
Создадим картинки в миджрони с таким же запросом, который писали в далли.
Промпт 1: "Дональд Дак держит в руках золотую монету"
промпт 2: "Девушка сидит на траве на фоне гор"
Так же в этой нейросети можем применять различные стили (более 40).
Заходим во вкладку «Стили» и, для сравнения, выберем такие же, которые использовали в dalle.
Как мы видим, на изображениях появились характерные черты от миджорни.
Как написать текст на изображениях в midjourney
Данная нейронка также умеет встраивать текст на картинках.
Пишем аналогичный промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"
А вот что у меня получилось при скрещивании персонажей)
С этой задачей Далли справилась получше.
Промпт: "Комбинация дональда дака и стрекозы"
Так же в Миджорни есть множество дополнительных функций, настроек, определённых команд.
Возможность сделать вариации персонажа, дорисовать окружение, увеличить размер изображения с переработкой деталей и пр.
На данном этапе углубляться в расширенные опции не будем, всё таки это тема для отдельной статьи.
Самое интересное, что в боте нейросети могут взаимодействовать между собой
После создания изображения в миджорни и далли мы можем воспользоваться функцией «Inpaint» от «Stable Diffusion» и дополнительно отредактировать картинку: удалить ненужный объект, заменить фон, перерисовать определённую деталь, вставить другое лицо на фото и пр.
На эту тему есть отдельная статья, рекомендую ознакомиться.
Рассмотрим следующий аналог — "Stable Diffusion"
Как пользоваться нейросетью Stable Diffusion онлайн на русском языке в телеграм боте
Переключаемся в меню бота на следующую нейросеть и сравним генерации изображений с далли и миджорни.
Отправляем такие же запросы: "Дональд Дак держит в руках золотую монету" и "Девушка сидит на траве на фоне гор"
Посмотрим как это нейросеть рисует в других стилях, которые мы применяли ранее.
Таким образом мы можем отправить один промт в разные нейронки на одной платформе, сравнить результат ИИ и выбрать тот, который нас больше устроит.
Stable Diffusion с написанием текста на данный момент изображения не генерирует, а вот со скрещиванием персонажей справляется.
Для этого нам нужно прописать следующим промпт: [дональд дак:стрекоза:0.5] таким образом нейросеть будет рисовать сначала первого персонажа на 50% затем дорисовывать второго.
В нейросети «Stable Diffusion» существует множество преимуществ: выбор моделей, сэмплеров, размер картинок, конструктор изображений, возможность заменять лицо на фото, использование функции «LoRa» и многое другое.
Вот подробная инструкция по генерации картинок в «Stable Diffusion».
Так же есть статья по созданию изображения с любым лицом и замене лица на фото с помощью «Stable Diffusion»
В данном боте есть возможность бесплатно протестировать некоторые функции, так как каждый лень начисляется несколько баллов для генераций.
Если вам интересна тема нейросетей, рекомендую начать проходить пошаговое обучение и применять полученные навыки для решения определённых задач в вашей сфере деятельности.
Ну midjourney самые приятные картинги генерит.
Каждая нейросеть имеет свои преимущества, и здорово видеть, как они справляются с различными задачами, хоть это иногда и пугает, так как развиваются они конечно, со скоростью света
Отличный обзор и навигация по нейросетям 👍
нейронки развиваются, занятно наблюдать за этим. спасибо за обзор
почему утри с крыльями стрекозы так реалистично смотрятся? Нейросети конечно показывают нам ,что нет пределов в воплощении идеи-это очень круто
sd без ограничений и меньшая зависимость от "дяди". Просто научиться пользоваться.
Любимо💞🌞💞