7 нейросетей для создания картинок

И как их использовать из России в 2024 году.

7 нейросетей для создания картинок

Мы живём в удивительное время, когда любой может за несколько минут создать картинку с помощью нейросети. В этой статье рассмотрим плюсы и минусы основных сервисов для генерации изображений.

Катерина Слободчикова
Креатор

Midjourney

7 нейросетей для создания картинок

Одна из первых нейросетей для генерации картинок — была запущена в 2022 году. С тех пор разработчики представляют обновление каждые несколько месяцев.

Плюсы:

  • Работает в России без VPN, через мессенджер Discord или сайт.
  • Генерирует изображения с лучшим фотореализмом на рынке.
  • Использует разнообразные стили и композиции, есть дополнительные инструменты (например, повторить персонажа с картинки-референса или стиль).

Midjourney редактирует даже небольшие участки изображений (не нужно переделывать картинку полностью), увеличивает разрешение картинки, позволяет добавить на него текст. Также позволяет посмотреть результаты генераций и промты других пользователей. А ещё по той же подписке можно использовать дочернюю нейросеть Niji Journey, которая генерирует изображения в аниме-стиле.

Минусы:

  • Только платная версия (но есть разные тарифы).
  • Оплата из РФ возможна только через кошелёк Apple ID, пополненный по номеру телефона (не для всех операторов).
  • Понимает только английский и японский.

При этом нейросеть не позволяет сформулировать запрос своими словами, для этого обязательно пользоваться встроенными тегами (чтобы запомнить их, нужно время). Если пользуетесь нейросетью через сайт, то количество инструментов будет ограничено. При выполнении сложных промтов Midjourney нередко ошибается, выполняя только часть запроса.

Dall-E 3

7 нейросетей для создания картинок

Нейросеть от OpenAI, создателя ChatGPT. Упрощённую модель запустили в 2021 году, тогда она была доступна только в браузере. В сентябре 2023 года разработчики выпустили уже третье поколение нейросети.

Плюсы:

  • Работает через чат на сайте или по API в любом удобном интерфейсе.
  • Понимает команды на русском.

Нейросеть понимает промты с достаточно сложными концепциями и большим количеством разноплановых героев. Различает абстрактные запросы. Например, по запросу «‎сделай цвета мягче» сразу приглушает яркость. Как и Midjourney, позволяет редактировать выбранные участки изображения и добавлять на картинки текст (правда, пока только на английском). Также Dall-E по умолчанию скрывает результаты генераций из общей ленты: это удобно, если ваши задачи связаны с коммерческой тайной или вам просто не хочется делиться своими промтами.

Минусы:

  • Работает только с VPN.
  • Не позволяет платить российскими картами.

Бесплатные генерации доступны только на сайте или через расширение Bing Creator (с учётной записью Microsoft). Детализация изображений в бесплатной версии также хуже.

В целом у Dall-E не такое большое разнообразие композиций, как у Midjourney: чтобы получить что-то интересное, нужно потратить очень много попыток генераций. Например, на натюрмортах в 90% случаев нейросеть выстраивает предметы симметрично и по центру. Количество стилей также ограничено, не всегда получается сымитировать изображение в стиле известного художника. К примеру, картинку в стиле Сальвадора Дали создать получилось, но в стиле Малевича — нет (нейросеть посчитала это нарушением авторских прав).

Загрузить картинку-референс и перенести на неё стиль или персонажа (как в Midjourney) не получится: все команды придётся прописывать вручную.

В часы высокой нагрузки на серверы Dall-E (примерно 17:00–19:00 мск) можно упереться в лимит по генерациям — нейросеть не будет принимать новые запросы несколько часов.

Кроме того, у Dall-E довольно жёсткая цензура: нейросеть не позволяет генерировать картинки, хоть сколько-нибудь связанные с насилием (даже, например, кости), а также изображения с историческими личностями и ныне живущими знаменитостями.

Gemini

7 нейросетей для создания картинок

Нейросеть от Google. Раньше она называлась Google Bard, но в начале 2024 года её переименовали в честь языковой модели, которая лежит в основе ИИ. Нынешнее поколение нейросети — первое.

Плюсы:

  • Работает бесплатно.
  • Генерирует быстрее Midjourney и Dall-E — буквально за 10 секунд.
  • Понимает команды на русском языке, не нужно учить названия инструментов или специальные команды.

Минусы:

  • Сервис официально недоступен в России, нужен VPN.
  • Иногда отказывается генерировать изображение без причины (чего не случается у конкурентов).
  • Пока генерирует только квадратные изображения.

По качеству проработки и детализации изображения от Gemini в целом утсупают генерациям Midjourney и Dall-E. Как и последняя, по умолчанию центрирует предметы и располагает их симметрично.

Когда промт длинный или сложный, учитывает лишь первые несколько пунктов. Например, в нашем ИИ приняла только краткое описание героя (рыцарь) и дополнительный объект (капибара), а требования к фону или цвету брони наездника проигнорировала.

Кроме того, Gemini отказывается генерировать изображения людей с видимыми участками кожи. Разработчикам пришлось отключить эту возможность из-за расовой предвзятости нейросети. Например, в нашем случае нейросеть отказывалась изображать рыцаря без шлема.

Ideogram

7 нейросетей для создания картинок

Сервис от бывших руководителей проектов по созданию ИИ в Google Brain. Сервис запустили осенью 2023 года.

Плюсы:

  • Работает в России без VPN.
  • Генерирует быстрее Midjourney и Dall-E.
  • Открывает результаты генераций и промты других пользователей.
  • Позволяет генерировать изображения с персонажами поп-культуры.

Ideogram хорошо понимает сюрреалистические промты. Например, вы попросите нейросеть: «Нарисуй существо, похожее на улитку, которое играет на скрипке». Midjourney в этом случае, скорее всего, нарисует некое антропоморфное существо (потому что играть на скрипке может только человек), но у Ideogram такой когнитивной рамки не будет.

Отлично генерирует изображения с текстом, в том числе с леттерингом или логотипами. Также неплохо имитирует фотореализм, особенно если задать освещение, модель фотоаппарата или плёнку, а также имя режиссёра или период съёмки.

Минусы:

  • Генерирует бесплатно только 20 изображений в день, некоторые функции под пейволлом.
  • Бесплатные генерации менее качественные.
  • Нейросеть хоть и понимает русский, но промты на этом языке выполняет в произвольном порядке.
  • По умолчанию центрирует предметы и располагает их симметрично.

Ideogram слабо детализирует средний и дальний план и не понимает сложные, многоперсонажные промты. Пальцы, глаза, складки на одежде изображает скорее неестественно: в картинках легко распознать авторство нейросети.

Firefly

7 нейросетей для создания картинок

Сервис от Adobe, который в первом поколении можно было использовать только через Photoshop. Весной 2023 года разработчики представили вторую, автономную версию.

Плюсы:

  • Понимает промты на русском.
  • Показывает генерации других пользователей.
  • Не страдает «центризмом», как Dall-E или Ideogram.
  • Редактирует части изображений.

Также Firefly позволяет расширять фон изображения по заданным параметрам и хорошо имитирует фотореализм.

Минусы:

  • Генерирует бесплатно только 25 изображений в месяц.
  • Работает только с VPN, которые выдают личные IP-адреса (чтобы другой человек не мог с него же зарегистрироваться).

Лучше использовать Firefly с пакетом программ Adobe — так получите больше возможностей. Например, в Adobe Illustrator можно генерировать векторную графику, а в Adobe Express — придавать визуальные эффекты тексту.

Как и Dall-E, не рисует голую кожу даже на руках.

«‎Шедеврум»

7 нейросетей для создания картинок

Приложение от «Яндекса», которое компания запустила весной 2023 года. В сервис интегрированы модели YandexGPT и YandexART.

Плюсы:

  • Бесплатная.
  • Работает без VPN.
  • Понимает русский, английский и казахский.

«Шедеврум» не только показывает генерации других пользователей — по сути, она представляет собой соцсеть. Там можно развивать свой блог с генерациями.

Нейросеть генерирует изображения в разных стилях и жанрах: ретро, винтаж, абстракции, графика, фэнтези, пейзаж, портрет и т. д.

Минусы:

  • Генерирует изображения только в мобильном приложении.
  • Плохо детализирует картинки.
  • Иногда отказывается выполнять промты без видимых причин.

Из двух генераций по одному промту «Шедеврум» позволяет сохранить только один результат.

В целом нейросеть слабо имитирует фотореализм, изображает глаза и складки на одежде неестественно (по результату легко понять, что это нейросетевая картинка).

Кроме того, «Шедеврум» запрещает упоминать в промтах фамилии и названия брендов, не генерирует изображения с религиозной атрибутикой или политической символикой. У неё в целом много ограничений, при этом они не всегда очевидны. Например, нейросеть иногда пропускает запросы с фамилиями актёров, но с фамилиями политиков запросы не выполняет.

Kandinsky

7 нейросетей для создания картинок

Сервис от «Сбера», прототип которого запустили ещё осенью 2021 года. С ноября 2023 года действует модель третьего поколения, которую разработчики продолжают обновлять.

Плюсы:

  • Работает бесплатно.
  • Позволяет генерировать изображения на сайте, в телеграм- или VK-боте, приложении «Сбера» и через ассистентов «Салют» на «умной» технике.
  • Понимает более 100 языков, но основной фокус — на русском и английском.

Стили и инструменты обработки в Kandinsky заданы словами, что удобнее, чем, к примеру, вызывать те же команды специальными словами в Midjourney. Помимо этого и в ботах, и в приложении сохраняется вся история ваших генераций (на сайте — нет).

Минусы:

  • Не позволяет посмотреть промты других пользователей.
  • Не всегда понимает сложные запросы с большим количеством персонажей и элементов.
  • Пальцы, глаза, складки на одежде выдают авторство нейросети.
  • Kandinsky запрещает генерировать изображения, связанные с насилием, обнажёнкой, политикой, в том числе госсимволикой.

Что в итоге

При выборе нейросети для генерации изображений стоит исходить не только из доступности сервиса в России, но и результата, который хотите получить. Пока с изображениями человеческих рук и глаз российские ИИ справляются не очень, поэтому поэтому «Шедеврум» и Kandinsky лучше использовать для пейзажей или натюрмортов.

Если нужен фотореализм, стоит заморочиться с доступами к зарубежным сервисам, например, Midjourney или Firefly. Для сюрреалистичных промптов подойдёт Ideogram. С Dall-E стоит работать, если ваша работа связана с коммерческой тайной и не попадает на пик серверных нагрузок.

1
1
Начать дискуссию