10 нейросетей для создания картинок
И как их использовать из России в 2024 году.
Мы живём в удивительное время, когда любой может за несколько минут создать картинку с помощью нейросети. Специальные навыки не нужны: в качестве ТЗ подойдёт небольшой текстовый запрос-описание — промпт — или уже готовое изображение.
ИИ — инструмент не только для развлечения, но и мощный помощник для профессиональных дизайнеров. С его помощью создают баннеры, посты для соцсетей, игровых персонажей и даже целые рекламные кампании.
Как выбрать сервис и на что обратить внимание?
В этой статье — плюсы и минусы основных нейросетей для генерации изображений.
Для большей объективности у всех сервисов был один промпт:
A fierce knight rides a huge capybara with a spear in hyperrealism style (Суровый рыцарь скачет с копьем на огромной капибаре в стиле гиперреализм).
Midjourney
Язык: английский, понимает русский
Пробная версия: до 25 картинок
Платный тариф: от $10/месяц
Midjourney — один из самых популярных сервисов, который умеет генерировать реалистичные картинки по текстовому запросу. Раньше MJ была полностью платной, но сейчас у новых пользователей есть возможность «потестить» сервис и создать 25 изображений.
Нейросеть отлично справляется с редактированием как целых, так и небольших участков картинки, увеличивает разрешение, соединяет воедино несколько изображений, позволяет посмотреть результаты генераций и промпты других пользователей. А ещё по той же подписке можно использовать дочернюю нейросеть Niji Journey, которая генерирует изображения в аниме-стиле.
Плюсы:
- Работает в России без VPN, через мессенджер Discord или сайт.
- Генерирует изображения с лучшим фотореализмом на рынке.
- Использует разнообразные стили и композиции, есть дополнительные инструменты (например, повторить персонажа с картинки-референса или стиль).
Минусы:
- Оплата из РФ возможна только через кошелёк Apple ID, пополненный по номеру телефона (не для всех операторов).
- Результат будет лучше, если промпт написан на английском языке.
Dall-E 3
Язык: английский, понимает русский
Пробная версия: 2 картинки
Платный тариф: от $20/месяц
Сервис от OpenAI, создателя ChatGPT. Там же — в ChatGPT — проходит «общение» с Dall-E.
Нейросеть понимает естественную речь: в отличие от Midjourney здесь не нужно продумывать каждое слово в промпте. Достаточно лишь приблизительно описать желаемый результат, а ИИ при необходимости самостоятельно доработает изображение.
Нейросеть понимает промты с достаточно сложными концепциями и большим количеством разноплановых героев. Различает абстрактные запросы. Например, по запросу «сделай цвета мягче» сразу приглушает яркость. Как и Midjourney, позволяет редактировать выбранные участки изображения и добавлять на картинки текст. Также Dall-E по умолчанию скрывает результаты генераций из общей ленты: это удобно, если ваши задачи связаны с коммерческой тайной или вам просто не хочется делиться своими промптами.
Бесплатные генерации доступны только на сайте или через расширение Bing Creator (с учётной записью Microsoft). Детализация изображений в бесплатной версии также хуже.
В целом у Dall-E не такое большое разнообразие композиций, как у Midjourney: чтобы получить что-то интересное, нужно потратить очень много попыток генераций. Например, на натюрмортах в 90% случаев нейросеть выстраивает предметы симметрично и по центру. Количество стилей также ограничено, не всегда получается сымитировать изображение в стиле известного художника. К примеру, картинку в стиле Сальвадора Дали создать получилось, но в стиле Малевича — нет (нейросеть посчитала это нарушением авторских прав).
Загрузить картинку-референс и перенести на неё стиль или персонажа (как в Midjourney) не получится: все команды придётся прописывать вручную.
В часы высокой нагрузки на серверы Dall-E (примерно 17:00–19:00 мск) можно упереться в лимит по генерациям — нейросеть не будет принимать новые запросы несколько часов.
Кроме того, у Dall-E довольно жёсткая цензура: нейросеть не позволяет генерировать картинки, хоть сколько-нибудь связанные с насилием (даже, например, кости), а также изображения с историческими личностями и ныне живущими знаменитостями.
Плюсы:
- Работает через чат на сайте или по API в любом удобном интерфейсе.
- Понимает команды на русском.
Минусы:
- Работает только с VPN.
- Не позволяет платить российскими картами.
Leonardo AI
Язык: английский, понимает русский
Доступна бесплатно
Платный тариф: от $12/месяц
ИИ способен генерировать реалистичные изображения, эскизы, концептуальные рисунки и логотипы.
У пользователей есть бесплатный доступ к 10 моделям и 21 стилю. Интерфейс простой и понятный, готовые изображения можно редактировать с помощью разнообразных инструментов.
Нейросеть не требует больших мощностей, что делает её подходящей как профессионалам, так и новичкам.
Сейчас Leonardo доступен в браузерной и IOS версиях.
Плюсы:
- Бесплатный доступ.
- Реалистичность изображений при включении стиля в промпт.
- Работает без VPN и иностранных сим-карт.
- Понимает русский язык.
Минусы:
Gemini
Язык: английский, понимает русский
Доступна бесплатно
Нейросеть от Google, которая тоже генерирует картинки без строгих правил составления промптов.
По качеству проработки и детализации изображения от Gemini в целом уступают генерациям Midjourney и Dall-E. Как и последняя, по умолчанию центрирует предметы и располагает их симметрично.
Когда промт длинный или сложный, учитывает лишь первые несколько пунктов. Например, в нашем ИИ приняла только краткое описание героя (рыцарь) и дополнительный объект (капибара), а требования к фону или цвету брони наездника проигнорировала.
Кроме того, Gemini отказывается генерировать изображения людей с видимыми участками кожи. Разработчикам пришлось отключить эту возможность из-за расовой предвзятости нейросети. Например, в нашем случае нейросеть отказывалась изображать рыцаря без шлема.
Плюсы:
- Работает бесплатно.
- Генерирует быстрее Midjourney и Dall-E — буквально за 10 секунд.
- Понимает команды на русском языке, не нужно учить названия инструментов или специальные команды.
Минусы:
- Сервис официально недоступен в России, нужен VPN.
- Иногда отказывается генерировать изображение без причины (чего не случается у конкурентов).
- Пока генерирует только квадратные изображения.
Ideogram
Язык: английский, понимает русский
Бесплатно: до 40 картинок в день
Платный тариф: от $8/месяц
Сервис от бывших руководителей проектов по созданию ИИ в Google Brain.
Ideogram хорошо понимает сюрреалистические промпты. Например, вы попросите нейросеть: «Нарисуй существо, похожее на улитку, которое играет на скрипке». Midjourney в этом случае, скорее всего, нарисует некое антропоморфное существо (потому что играть на скрипке может только человек), но у Ideogram такой когнитивной рамки не будет.
Отлично генерирует изображения с текстом, в том числе с леттерингом или логотипами. Также неплохо имитирует фотореализм, особенно если задать освещение, модель фотоаппарата или плёнку, а также имя режиссёра или период съёмки.
Ideogram слабо детализирует средний и дальний план и не понимает сложные промпты. Пальцы, глаза, складки на одежде изображает скорее неестественно: в картинках легко распознать авторство нейросети.
Плюсы:
- Работает в России без VPN.
- Генерирует быстрее Midjourney и Dall-E.
- Открывает результаты генераций и промты других пользователей.
- Позволяет генерировать изображения с персонажами поп-культуры.
Минусы:
- Генерирует бесплатно только 40 изображений в день, некоторые функции под пейволлом.
- Бесплатные генерации менее качественные.
- Нейросеть хоть и понимает русский, но промты на этом языке выполняет в произвольном порядке.
- По умолчанию центрирует предметы и располагает их симметрично.
Если создания картинок недостаточно, попробуйте сгенерировать видео:
Firefly
Язык: английский, понимает русский
Бесплатно: 25 генеративных кредитов в месяц
Платный тариф: от $4,99/месяц за 100 генеративных кредитов
Сервис от Adobe, который лучше использовать с пакетом фирменных программ, чтобы получить больше возможностей. Например, в Adobe Illustrator можно генерировать векторную графику, а в Adobe Express — придавать визуальные эффекты тексту. Помимо прочего, ИИ умеет убирать с изображения ненужные объекты — так работает функция генеративной заливки.
Firefly позволяет расширять фон изображения по заданным параметрам и хорошо имитирует фотореализм.
Как и Dall-E, не рисует голую кожу даже на руках.
Плюсы:
- Понимает промпты на русском.
- Показывает генерации других пользователей.
- Не страдает «центризмом», как Dall-E или Ideogram.
- Редактирует части изображений.
Минусы:
- Генерирует бесплатно только 25 изображений в месяц.
- Работает только с VPN, которые выдают личные IP-адреса (чтобы другой человек не мог с него же зарегистрироваться).
DreamStudio от Stability.ai
Язык: английский, понимает русский
На старте — 25 генеративных кредитов (около 100 картинок)
Кредиты можно докупать: за $1 сервис начислит 100 кредитов. Их хватит примерно на 500 картинок.
ИИ генерирует изображения на основе фотографии или текстового описания на английском языке. Сервис поддерживает промпты на русском, но в таком случае пострадает точность результата.
Пользователь может выбирать стиль картинки, задавать пропорции и указывать количество изображений, которое получится в результате одного запроса.
Плюсы:
- Доступна бесплатно.
- Можно докупать необходимое количество кредитов.
- Много возможностей кастомизировать изображение.
- Быстрая генерация.
Минусы:
- Проблемы с пониманием русского языка.
Craiyon
Язык: английский
Доступна бесплатно
Платный тариф: от $10/месяц
Craiyon не умеет создавать изображения по картинке-референсу — пользователю доступны только текстовые запросы.
На старте можно выбрать один из трёх стилей: Art, Drawing или Photo. Также есть опция None, с ней результат будет без привязки к какому-либо стилю. Для исключения из результата нежелательных элементов возможно указать негативный промпт, где необходимо перечислить всё, чего не должно быть на картинке.
По окончании генерации доступно 9 вариантов на выбор размером 256×256 пикселей. Выбранное изображение можно улучшить с помощью Upscale до разрешения 1024×1024 пикселя.
Готовая картинка будет с водяным знаком, убрать который можно после оплаты пакета.
Плюсы:
- Доступна бесплатно.
- Понятный и простой интерфейс.
Минусы:
- Реклама и водяные знаки в бесплатной версии.
- Понимает только английский язык.
- Качество готовых картинок оставляет желать лучшего.
«Шедеврум»
Язык: русский, английский
Доступна бесплатно
Приложение от «Яндекса» на основе нейросетей YandexGPT и YandexART.
«Шедеврум» не только показывает генерации других пользователей — по сути, она представляет собой соцсеть. Там можно развивать свой блог с генерациями.
Нейросеть генерирует изображения в разных стилях и жанрах: ретро, винтаж, абстракции, графика, фэнтези, пейзаж, портрет и т. д.
Из двух генераций по одному промту «Шедеврум» позволяет сохранить только один результат.
В целом нейросеть слабо имитирует фотореализм, изображает глаза и складки на одежде неестественно (по результату легко понять, что это нейросетевая картинка).
Кроме того, «Шедеврум» запрещает упоминать в промтах фамилии и названия брендов, не генерирует изображения с религиозной атрибутикой или политической символикой. У неё в целом много ограничений, при этом они не всегда очевидны. Например, нейросеть иногда пропускает запросы с фамилиями актёров, но с фамилиями политиков запросы не выполняет.
Плюсы:
- Бесплатная.
- Работает без VPN.
- Понимает русский, английский и казахский.
Минусы:
- Генерирует изображения только в мобильном приложении.
- Плохо детализирует картинки.
- Иногда отказывается выполнять промпты без видимых причин.
Kandinsky
Язык: русский, английский
Доступна бесплатно
Сервис от «Сбера», который по реалистичности и детализации изображений сравнивают с Midjourney. ИИ создаёт картинки по промптам и изображениям, умеет миксовать их и предлагает на выбор 17 стилей.
Кстати, стили и инструменты обработки в Kandinsky заданы словами, что удобнее, чем, к примеру, вызывать те же команды специальными словами в Midjourney. Помимо этого и в ботах, и в приложении сохраняется вся история ваших генераций (на сайте — нет).
Плюсы:
- Работает бесплатно.
- Позволяет генерировать изображения на сайте, в телеграм- или VK-боте, приложении «Сбера» и через ассистентов «Салют» на «умной» технике.
- Понимает более 100 языков, но основной фокус — на русском и английском.
Минусы:
- Не позволяет посмотреть промпты других пользователей.
- Не всегда понимает сложные запросы с большим количеством персонажей и элементов.
- Не понимает «отрицательные» промпты, написанные с частицей «не» или словом «нет».
- Пальцы, глаза, складки на одежде выдают авторство нейросети.
- Kandinsky запрещает генерировать изображения, связанные с насилием, обнажёнкой, политикой, в том числе госсимволикой.
А если нужно просто улучшить уже существующее фото, посмотрите эту подборку из 9 сервисов:
Что в итоге
При выборе нейросети для генерации изображений стоит исходить не только из доступности сервиса в России, но и результата, который хотите получить. Пока с изображениями человеческих рук и глаз российские ИИ справляются не очень, поэтому поэтому «Шедеврум» и Kandinsky лучше использовать для пейзажей или натюрмортов.
Если нужен фотореализм, стоит заморочиться с доступами к зарубежным сервисам, например, Midjourney или Firefly. Для сюрреалистичных промптов подойдёт Ideogram. С Dall-E стоит работать, если ваша работа связана с коммерческой тайной и не попадает на пик серверных нагрузок.
Поделитесь в комментариях, какими нейросетями для создания изображений пользуетесь вы и почему?
Пока индустрия ИИ замерла в ожидании Midjourney V7, Google выпустил Imagen 3, и это может полностью изменить расстановку сил на рынке генерации изображений. В этой статье — детальное сравнение трех главных игроков рынка, анализ их возможностей и практические рекомендации по использованию каждого инструмента. Вы узнаете, почему Google может стать но…
В этой статье расскажу о простых и эффектных инструментах, которыми мы иногда пользуемся в студии. Они помогают ускорить работу с графикой, текстами и просто повеселиться)
Во вчерашнем видео-разборе я подробно описывал условия для падения цены к недельному уровню по волатильности $87099. Условия были выполнены, целевой уровень достигнут. Также была задета точка $89100, что является крайне негативным сигналом для покупателей. Сегодня я обновлю данные и покажу, в каком случае отскакиваем и куда. Также при каких условия…
В современном мире искусственный интеллект (ИИ) открывает потрясающие возможности для творчества и визуальной коммуникации. Нейросети для генерации изображений стали важным инструментом для художников, дизайнеров и всех, кто занимается созданием графического контента.
Василий Курбацких, член экспертного совета Think Tank НОЦ «Города будущего» Глобального университета Рыбакова и МФТИ, автор и инвестор проекта «Город Эльтаун», основатель группы компаний «Эльтаун Девелопмент», рассказывает о том, как изменить города.