5 лучших ИИ-генераторов изображений
В настоящее время существуют сотни веб- и мобильных приложений, которые генерируют потрясающие изображения на основе простых текстовых промптов.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
В этой статье я расскажу о пяти лучших ИИ-генераторах изображений, их особенностях, преимуществах и недостатках.
1. MidJourney
MidJourney стал одним из ведущих и наиболее востребованных генераторов изображений с искусственным интеллектом за последний год.
Именно эта платформа создала вирусную фотографию Папы Римского в длинной белой куртке-пуховике, а также спорную фотографию, созданную искусственным интеллектом, которая получила премию Sony World Photography Award.
Примеры изображений
Преимущества
- Высококачественные изображения. Общая эстетика намного лучше, чем у конкурентов.
- Быстрая генерация изображений. Создание четырех вариантов изображений занимает всего одну-две минуты.
- Регулярные обновления. Команда Midjourney выпускает обновления очень часто по сравнению с конкурентами.
Недостатки
- Платный. Цены могут доходить до 80 долл. в месяц.
- Сложность в освоении. Некоторым пользователям может показаться сложной навигация и оптимизация платформы.
Ценообразование
Midjourney предлагает ограниченный бесплатный доступ при появлении новых моделей, но сгенерированные изображения по умолчанию являются общедоступными. Чтобы сохранить изображения в тайне, можно подписаться на месячный тарифный план стоимостью от 10 до 120 долларов, а при годовой подписке предоставляется скидка 20%.
2. Dall-E3
Dall-E3, экспериментальный преемник Dall-E2 от компании OpenAI, улучшен по сравнению с оригинальной моделью, и предлагает расширенные возможности, производительность и качество изображения.
Примеры изображений
Преимущества
- Удобный интерфейс.
- Совместимость с различными платформами (OpenAI Labs, Microsoft Edge, Playground AI и др.), возможность генерировать изображения в ChatGPT.
Недостатки
- Разрешение изображений ограничено квадратом.
- Изображения имеют водяные знаки.
Ценообразование
Dall-E на Microsoft Edge является бесплатным, но скорость генерации может замедлиться после нескольких генераций.
Для ускорения генерации изображений можно приобрести кредиты OpenAI по цене 15 долл. за 115 кредитов, при этом один кредит эквивалентен генерации изображения с четырьмя вариантами.
3. Stable Diffusion
Модель Stable Diffusion, созданная исследователями и инженерами компаний Stability AI, CompVis и LAION, представляет собой модель преобразования текста в изображение, получившую популярность благодаря открытому исходному коду.
Модель также приобрела популярность благодаря своим впечатляющим характеристикам, особенно последняя выпущенная модель под названием Stable Diffusion XL, которая конкурирует с такими закрытыми моделями, как Dall-E2.
Пример изображения
Преимущества
- Открытый исходный код. Это позволяет более широкому кругу разработчиков и исследователей получать доступ к модели, использовать ее и вносить в нее свой вклад, способствуя развитию.
- Локальный запуск. Генератор изображений может быть запущен на персональном компьютере без подключения к Интернету.
Недостатки
- Этические проблемы. Отсутствие ограничений на контент, генерируемый Stable Diffusion, порождает этические проблемы, такие как возможность создания неуместного или вредного контента, нарушение авторских прав или посягательство на частную жизнь.
- Не такая высокая точность, как у моделей с закрытым исходным кодом. Хотя Stable Diffusion создает замечательные изображения, он не может сравниться по качеству с моделями с закрытым исходным кодом, такими как Midjourney.
Ценообразование
Использование Stable Diffusion на локальном компьютере полностью бесплатно. Однако если вы хотите заниматься его установкой и настройкой , вы можете воспользоваться официальным веб-инструментом от Stability AI под названием DreamStudio. Стоимость DreamStudio - 10 долл. за 1 000 кредитов, что позволяет получить около 5 000 изображений при настройках по умолчанию.
4. Adobe Firely
Adobe Firefly - это генеративный искусственный интеллект, созданный компанией Adobe в рамках проекта Sensei AI и призванный составить конкуренцию таким инструментам, как Midjourney и Dall-E.
Что отличает Firefly? Он обучается на 100% легальном наборе данных, используя стоковые изображения Adobe и произведения, являющиеся общественным достоянием.
Примеры изображений
Преимущества
- Простой в использовании веб-интерфейс.
- Легально полученные наборы данных.
- Дополнительные возможности настройки изображений.
Вот как выглядят элементы управления редактированием, напоминающие, на мой взгляд, фоторедактор.
Недостатки
- Качество изображения сравнимо с Stable Diffusion, но не такое высокое, как у Midjourney.
Ценообразование
В настоящее время Adobe Firefly бесплатен для пользователей бета-версии. Если у вас есть учетная запись Adobe, вы можете присоединиться к бета-версии здесь.
Предполагается, что Adobe Firefly станет платной функцией Creative Cloud, когда качество инструмента повысится и он выйдет из стадии бета-версии.
Примечание: Adobe не разрешает использовать созданные изображения в коммерческих целях.
Пока Firefly 2.0 находится в стадии бета-версии, его можно использовать бесплатно. При регистрации вы получаете 25 бесплатных кредитов, срок действия которых истекает через месяц после их предоставления. Кредиты обнуляются каждый месяц.
Если 25 бесплатных кредитов окажется недостаточно, Adobe планирует, что пользователи смогут приобретать дополнительные кредиты для генерации изображений с приоритетной обработкой по новому плану подписки, стоимость которого составляет 4,99 долл. в месяц за 100 кредитов.
Один кредит равен одной генерации изображения. Оставшиеся кредиты можно отслеживать в раскрывающемся меню профиля.
5. Playground AI
Playground AI - это веб-приложение, позволяющее пользователям генерировать до 1 000 изображений, и делиться ими с сообществом. Это отличный вариант для тех, кто только начинает осваивать промпт инжиниринг для создания изображений.
Примеры изображений
Преимущества
- Бесплатная генерация изображений с использованием технологии Stable Diffusion.
- Пользовательская модель под названием "Playground V1" предназначена для создания изображений с широким спектром ярких цветов.
- Расширенные возможности управления редактированием, аналогичные Adobe Firefly.
- Благодаря функциям социальных сетей пользователи могут следить за другими художниками, оценивать, создавать ремиксы и делиться своими творениями.
Недостатки
- Поддержка последних моделей Stable Diffusion может быть реализована с задержкой.
- В настоящее время количество моделей AI ограничено четырьмя моделями (Playground V1, Stable Diffusion 1.5, Stable Diffusion 2.1 и Dall-E2).
Ценообразование
Вы можете использовать Playground AI бесплатно. Если вы хотите получить больше возможностей, предусмотрены тарифные планы.
4 других ИИ-генератора изображений, на которые стоит обратить внимание
Помимо перечисленных выше, я рекомендую обратить внимание на эти замечательные инструменты:
Ну вот и все. Надеюсь, вам понравился этот список, и если вы считаете, что есть еще один генератор изображенийм, который заслуживает места в пятерке лучших, пожалуйста, напишите об этом в комментариях.
Еще больше полезностей про нейросети - в моем хобби-блоге про нейросети в Телеграм.
норм обзорчик! годнота
sd тоже можно настроить на норм качество)
Согласен, только суть больше танцев с бубном ).
Dall-E3: белый мужик, и по очереди, азиатка, черная, палестинка и наконец белая, но мужик в паре с ней превращается в азиата, на которого белая смотрит в восхищении. Вместе белым нельзя! Уродцы.