Сервисы на основе ИИ для работы с изображениями: самый полный обзор инструментов на русском языке

Вашему вниманию наглядный тест отечественных проектов, актуальных к июню 2023 года. Попробуем разобраться, так ли хороши графические нейросети, как о них говорят. И могут ли они выполнять реальные бизнес-задачи. Что же, посмотрим.

<i>Красивые и растерянные, застенчивые и выдуманные нейросетью девушки — как же иначе</i>
Красивые и растерянные, застенчивые и выдуманные нейросетью девушки — как же иначе

Это ещё один лонгрид, поэтому без лишних слов — оглавление (время чтения: около 27 минут).

Что происходит в мире нейросетей прямо сейчас?

А ещё много суеты, сплетен и прогнозов. Сотни блогов, Telegram-каналов и сообществ с "творчеством" от нейросетей на разные темы. На каждом углу — советы о том, как быстрее начать зарабатывать. И даже курсы и вебинары для любопытствующих и бегущих впереди всех.

Но пока всё это только для личного использования. А что если начать генерировать визуальный контент для коммерческих целей? Прямо вот брать и внедрять в свой брендинг нейрологотипы, нейробаннеры и нейропрезентации?

Оставим в стороне юридические вопросы, которых, разумеется, целый вагон и маленькая тележка. Этические, которые, вообще, никуда не денутся. Рассмотрим только практическую часть.

Итак, есть ли что-то интересное на русском языке, что можно попробовать для бизнеса прямо сейчас?

Вроде как есть.

<i>Таким взглядом можно и убить</i>
Таким взглядом можно и убить

Как будем тестировать?

Понятно, как оценивать тексты. Грамотный язык, подача и наполнение. Но как оценивать визуальное "искусство"? Более субъективной вещи трудно себе и представить.

Но наша задача здесь не просто получить эстетическое удовольствие и покритиковать ИИ, но убедиться, что выполнена определённая бизнес-задача. Именно так мы и будем действовать. Дадим каждому проекту конкретное задание и посмотрим, куда это нас приведёт.

Никаких оценок именно по качеству картинок. Оценивать будем подход, быстроту исполнения и удобство использования. Ну а качество, что качество — оно для каждого своё.

Задачи, которые будем рассматривать — типичные на старте любого бизнеса. Это позиционирование, продвижение — и так далее. Потому что одно дело потешить самолюбие и обработать аватарку в стиле аниме.

Совсем другое — придумать логотип или образ для рекламы бесшумного фена. Здесь ты напрямую обращаешься к покупателям, несёшь ответственность за свой креатив. И, если вдруг накосячишь или кого-то оскорбишь — это будет стоить не малых репутационных потерь.

Короче, к сути...

<i>А таким растрогать</i>
А таким растрогать

Тест №1. Gerwin

Ура, мы зарегистрировали свой бизнес! Наша лавка древностей открыла свои двери всем желающим. Уже давно антикварные подвалы и магазины игрушек существуют раздельно. Мы нарушили эту традицию и вернули всё на свои места. Добро пожаловать в «Лавку мистера Пинкертона»!

У нас вы найдёте те самые механические игрушки, калейдоскопы, канделябры. Старинные рецепты пунша, магические книги, волшебные палочки. Одним словом — праздник для юного любителя старины и магических изобретений.

И всё бы хорошо, но пока никак не оформлен фасад нашего магазина. Только грубая дубовая дверь. И небольшая металлическая вывеска. А где же плакаты?

Посмотрим, справится ли нейросеть с такой нетривиальной задачей. С Gerwin я уже сталкивался, но то были задачи по текстам. А что насчёт изображений? Запрос будет звучать так:

Привет, уважаемая нейросеть. Нарисуй мне, пожалуйста, старинный плакат XVIII века для лавки древностей, на котором будет изображен единорог и минотавр, играющие в шахматы. Спасибо!

Попросим Gerwin создать нам вертикальное изображение в рандомном иллюстративном стиле (под каждый стиль здесь есть готовый референс, чтобы не путаться). И тыкаем: «Нарисовать».

Что примечательно: на выходе нас ждёт сразу четыре варианта плаката. Каждый из которых можно масштабировать.

Один из плакатов выглядит вот так.

<i>Плакат XVIII века по версии Gerwin</i>
Плакат XVIII века по версии Gerwin

Ух, сразу повеяло чем-то загадочным и мистическим. Чего мы и добивались. Сюрреализм точно поможет привлечь внимание. Но, для верности, сделаем несколько попыток.

<i>Вариант плаката №2</i>
Вариант плаката №2

С плакатами можно залипнуть надолго. Хоть нейросеть не всегда рисует буквальные идеи, она может додумывать то, что мы хотим увидеть. И предлагать варианты. Кстати, у Gerwin есть Youtube-канал с полезными рекомендациями для тех, кто хочет получать крутые результаты и не мучиться с запросами — советую поизучать.

Итак, многое из того, что получилось — действительно подойдёт для лавки древностей. Здесь только дело вкуса и авторских прав. А в остальном — это работает (как показала практика лучше всё-таки использовать одного мифического персонажа, а не двоих сразу — так для ИИ понятнее).

Другие варианты, сравнения ради.

Если подводить промежуточные итоги: потенциал конкретно по псевдоисторическим плакатам у нейросетей огромный. Если точного совпадения нет — можно отдать на поруки дизайнеру или художнику, он доведёт до ума: добавит надписи, подправит руки и копытца, наведёт лоска.

Можно ли использовать плакаты в чистом виде сразу для печати в типографии? В теории можно. Но на практике — стоит сперва уточнить нюансы у юриста и штатного спеца по визуальному оформлению.

Где можно применить: кафе и рестораны, книжные магазины, канцелярии, мастерские. Внешнее оформление помещений — вопрос деликатный и сложный. Но если нужны быстрые идеи, чтобы открыться и начать работать — оно того стоит.

Хорошо, а банальные логотипы можно? Давайте проверим.

А сможешь нарисовать логотип для лавки древностей, чтобы в центре была изображена шахматная фигура коня, а вокруг неё было название рукописным шрифтом «Лавка мистера Пинкертона»? Нужно выполнить в стиле XVIII века.

Выбираем формат квадратного изображения и примерно такой же рандомный стиль, как и для плакатов (хотя вы можете выбрать любой, какой нравится — здесь большой выбор стилей и художников). И получаем первую версию логотипа.

<i>Первая версия логотипа от Gerwin</i>
Первая версия логотипа от Gerwin

Как видите, работать с конкретными надписями нейросеть пока не умеет. Но даёт общую канву для доработки. Мы же можем брать изображение за основу и просто указать в ТЗ для дизайнера — что вот это базовый референс.

Подставим наше название, дорисуем фигуры, потому что они чуть размазались. Поправим по мелочи рамку и границы. А так — вполне готовый логотип для лавки древностей. И уникальный в плане самой идеи.

Но на всякий попробуем ещё пару раз. Не забывайте максимально точно указывать запрос по объектам в кадре. Хоть это не гарантирует 100% попадание — всё-таки хоть как-то приблизит вас к задумке.

Если же в Gerwin приходит не сам предприниматель и представитель бизнеса (SMMщик, пиарщик, контентщик), а дизайнер / художник — он будет здесь как рыба в воде. А скорость создания новых креативов в компании сократится в разы (в идеале именно так это и должно работать — приходит спец и в своём корпоративном тарифе на основе нейроидей создаёт нечто новое и удивительное).

В общем, схема рабочая. Идём дальше.

Тест №2. 24AI

Что будем делать с товарами? Скажем, у нас небольшой магазинчик с уходовой косметикой для бородачей: «Пена дней». Продаём эксклюзивные средства для усов и бакенбард, а ещё лезвия, щетки и туалетную воду. И нам нужен стильный и мужественный креатив для Ozon, WB и Avito.

У нас сотня товаров, столько же однотипных фотографий. Как собрать из этого что-то красивое и разное? За основу возьмём случайный кадр со случайной бритвой.

<i>Одна случайная бритва</i>
Одна случайная бритва

И загрузим её в 24AI, чтобы убрать фон и добавить новых локаций с помощью нейросети. Один и тот же объект мы можем "поместить" в самые необычные места: в кафе, на природу, на кухню, на пляж или даже в воду.

Например, в атмосферу кафе наша бритва вписалась неплохо.

<i>Одна случайная бритва, попавшая в кафе</i>
Одна случайная бритва, попавшая в кафе

А если на снегу?

Одна случайная бритва, заблудившаяся в Гималаях
Одна случайная бритва, заблудившаяся в Гималаях

А если тупо в ванной?

<i>Одна случайная бритва в родной среде обитания</i>
Одна случайная бритва в родной среде обитания

Смысл именно такой. Один и тот же товар мы можем преподносить каждый раз по-новому. Хватит креатива для всех площадок. Причём вы сразу можете скачать результат в нужном разрешении. Например, для Avito это будет 1280x960, а для Ozon и WB — 900x1200.

24AI заточен конкретно под товарный бизнес и маркетплейсы. Хотя использовать метод можно и для социальных сетей. И любых других креативов, где нужно обновить старое.

Минималистичный, быстрый и приятный на ощупь сервис. Однозначно стоит попробовать. И да, вы можете сами придумать локацию, в которую пропутешествует бритва — возможность свободного запроса тут тоже есть.

Тест №3. Turbotext

Перейдём к чему-то более творческому. Допустим, нам нужно наполнить корпоративный блог на VC путёвыми статьями со стильными фотографиями.

Ситуация такая. В нашем небольшом стартапе «Стерлядь и Ко» мы занимаемся легальной рыботорговлей.

Продаём консервы, икру, риеты и другие вкусные яства. Но пока не умеем работать с продвижением. Решаем завести блог и рассказывать о прелестях и сложностях такого бизнеса.

Естественно, нам нужны фотографии рыб. Много фотографий. Что делать? Заглянем в уже знакомый нам Turbotext и потыкаем их графическую нейросеть.

В отличии от текстов, генерировать изображения в ТТ всегда нужно было через Telegram-бота. Я знаю это, потому что сам его использую в любых непонятных ситуациях (в том числе нахожу здесь прекрасных нейродам для этих обзоров). А буквально недавно у них появилась и онлайн-версия. Так что теперь вы можете тестировать там, где нравится.

Так вот, попробуем закинуть удочку в бота и поймать что-нибудь стоящее. Для начала, конечно, запрос. Например, для статьи о разведении лосося нам нужны иллюстрации именно по лососю. Что-то вроде:

Нарисуй мне, пожалуйста, лосося в родной среде обитания, в стиле реализм, как будто это научная фотография, чтобы был яркий свет и цветное окружение из водорослей, камней, а также других морских обитателей.

Если вы раньше никогда не сталкивались с генерацией изображений, и для вас это тёмный лес — у ТТ есть инструкция с подсказками по стилям и запросам.

Первая попытка приводит нас вот к этому.

Первые версии часто получаются не очень — это нормально. Чтобы найти что-то стоящее — нужно докручивать в процессе. Здесь мы сразу видим, что не совсем подходящий формат для статей. Нужно прописать разрешение, а ещё попробовать доработать запрос по части детализации кадра. И указать, например, одну из известных подводных фотокамер, чтобы подстроиться под неё по стилю.

Нарисуй мне, пожалуйста, лосося в родной среде обитания, в стиле реализм, как будто это научная фотография, чтобы был яркий свет и цветное окружение из водорослей, камней, а также других морских обитателей, высокая детализация, Nikon Coolpix AW120, width: 800, height: 400.

Становится лучше.

<i>Лосось 2.0</i>
Лосось 2.0

Но всё ещё не то. Как-то слишком анимированно, мультяшно. Можем попробовать заменить стандартную модель генерации (по умолчанию используется v3 — для фотореализма).

Просто добавим в конце запроса параметр: «v_model: v2» (модель для кинематографических сценариев и сцен с тёмными эффектами). И пробуем снова.

<i>Лосось 3.0</i>
Лосось 3.0

Уже более-менее. На какой-то раз у вас точно получится приемлемый кадр, с которым можно работать. Но на лососе свет клином не сошёлся. Попробуем нарисовать, например, стаю осетров по тому же алгоритму, но, допустим с новой камерой.

Нарисуй мне, пожалуйста, стаю осетров, чтобы был яркий свет и цветное окружение из водорослей, камней, а также других морских обитателей, высокая детализация, Panasonic Lumix DMC-FT5, width: 800, height: 400, v_model: v2

И получаем нечто такое.

<i>Стая осетров по версии ТТ</i>
Стая осетров по версии ТТ

На всякий случай напомню, что по закону промысел осетровых запрещен. Так что в нашем случае кадры с этими прекрасными рыбами пойдут для статьи о законодательстве. И да, если сильно не присматриваться, это правда похоже на документальную съёмку.

Есть тут и другие интересные фичи, они касаются улучшения и доработки кадров, если нам нужно убрать или добавить какие-то элементы или объекты. Но основное, конечно, связано с генерацией по текстовому запросу. Смело можно пробовать.

Тест №4. Colorize.cc

Хорошо, когда в работе по продвижению бизнеса всё просто и понятно. Есть продукт, есть контент, есть продажи. Но бывают и такие задачи, которые требуют специальных методов.

Представьте такую картину. Наш фамильный цех по производству резиновых калош от ООО «Алтайский каучук» собирает архив фотографий для нового сайта. Так как история предприятия насчитывает больше 50 лет — скопилось много черно-белых фотографий: директоров, мастеров и инженеров.

Нужно собрать всё это в один цифровой архив и привести в порядок. Многие кадры со смазанными и нечёткими лицами. С различными дефектами и потёртостями. И в принципе они чёрно-белые, что нас не очень устраивает.

Как с этим можно поработать, используя ИИ? Заглянем в Colorize.cc и посмотрим, что можно сделать. За основу возьмём один случайный кадр с командой инженеров нашего завода.

<i>Допустим, такие вот ребята</i>
Допустим, такие вот ребята

И попробуем через Colorize.cc сделать из этого цветное фото.

<i>Ребята в цвете</i>
Ребята в цвете

Получилось. И заняло всего несколько секунд. Да, уже давно любые фоторедакторы умеют превращать цветное в чёрно-белое, но теперь и обратная инверсия делается легко и спокойно.

Но что насчёт реставрации? Загружаем в Colorize.cc уже цветное фото нашей команды и ждём. Реставрация фотографии занимает побольше времени, так как здесь ИИ пытается найти и исправить мелкие дефекты, которые ему кажутся дефектами. Но результат всё равно приятный.

<i>Ребята в цвете и более чёткими лицами</i>
Ребята в цвете и более чёткими лицами

То есть, в итоге после двух операции Colorize и Restoration — мы получили свежее и чёткое изображение. С более живыми лицами и очертаниями. Конечно, это сложно заметить сходу, нужно присмотреться. Но эффект будет сильнее и заметнее, если брать настоящее ретро и работать с ним.

Здесь также есть ещё один режим Ai Portrait. Но он работает только для восстановления лица одного человека. С более глубокой проработкой. Если у вас в кадре кто-то один, кто с течением времени растерял человеческие черты — должно помочь. Пример от самого Colorize.cc.

<i>Чудесное преображение благодаря ИИ</i>
Чудесное преображение благодаря ИИ

Если собрать все факты — Colorize.cc про работу с архивами фотографий. Здесь мы можем освежить, восстановить и отколорировать фотографии давно ушедших лет. Как для личного, так и для корпоративного использования. Простой и стильный проект с конкретными задачами — точно могу рекомендовать.

Проекты от «Сбера» и «Яндекса» гремят на каждом углу. Поэтому сильно на них останавливаться не будем. Но для общей картины дадим задачку и для них. Одну на двоих.

Итак, условно, нам нужно подготовить оформление для меню нашего уютного заведения «Шашлыниндзя». Как вы понимаете, основное блюдо у нас — невероятный шашлык. Из говядины, курицы и даже кролика. Смогут ли эти нейросети помочь?

Давайте заглянем в «Кандинский» и испытаем его на прочность. Пишем запрос:

Нужно подготовить фотографию вкусного и сочного шашлыка из баранины для меню ресторана восточной кухни.

Попытка привела нас к такому результату.

<i>Вкусно, конечно, но не совсем</i>
Вкусно, конечно, но не совсем

Вроде неплохо, но помидор тут как желе. А кетчуп, вообще, странной формы. Что нам скажет «Шедеврум» по этому поводу?

Его версия событий следующая.

<i>Скриншот из приложения «Шедеврум»</i>
Скриншот из приложения «Шедеврум»

Плюсы и минусы очевидны. «Шедеврум» работает только через приложение и пока на бета-тесте. Ничего нельзя скачать, почти никак не применить.

Скриншоты это здорово. Но для коммерческих целей пока не годится. Хотя вроде они внедрили ИИ для работы с рекламой. Но это уже совсем другая история.

Впрочем, снимки, надо признать, отличные. Сразу потекли слюнки.

В «Кандинском» история другая. Можно тестировать, скачивать, менять стили и обрабатывать кадры. Но сама генерация оставлять желать лучшего.

Вы можете погрузиться с головой в изучение запросов и хитрости генерации. Результат будет лучше, но тоже ничего не гарантирует. Так что — на ваше усмотрение.

Дополнительный тест. Supa

В качестве альтернативы — рассмотрим проект, который я знаю уже давно и в котором тоже появились некоторые нейровозможности.

Supa изначально был сервисом для работы с видео. Но с некоторых пор здесь появились и другие фичи: дизайн для социальных сетей, карточки для маркетплейсов, логотипы — и много чего ещё. Вплоть до презентаций, бланков, сертификатов. И даже лендингов. Сейчас это большой дизайн-комбайн, заменивший Canva и похожие зарубежные сервисы. Но дело не в этом.

Дадим Supa отдельную задачу. По созданию рекламной листовки нашего выдуманного сервиса по ремонту музыкальных инструментов «Гобой и ковбой».

Листовки в небольших городах иногда единственный источник связи с покупателями помимо местных газет. Так что попробуем создать одну такую для летней акции.

Находим в списке шаблонов «Создать флаер» и открываем пустой бланк. К слову, нейросети в Supa приходят постепенно. И пока что мы можем подготовить только текст при помощи ИИ. Но это, скорее всего, ненадолго.

Работая в связке с любым другим ИИ-проектом чисто по изображениям, мы можем собирать в Supa готовые креативы уже с текстом (это подходит именно для сложных форматов или форматов для печати: визитки, буклеты, приглашения — и так далее). Удобно для синтеза ИИ-текстов и ИИ-изображений.

В нашем случае запрос для текста будет таким:

Нужно составить текст для рекламной листовки сервиса по ремонту музыкальных инструментов «Гобой и ковбой». И рассказать про летнюю акцию: «Ремонт со скидкой в 20% для первых покупателей».

Текст, который нас получился звучит так:

Дорогие меломаны и музыканты!

Если вы ищете надежный сервис по ремонту музыкальных инструментов, то мы рады представить вам нашу компанию «Гобой и ковбой»!

Мы занимаемся ремонтом всех видов музыкальных инструментов уже много лет и готовы предложить вам высококачественные услуги по доступным ценам.

У нас работают только профессионалы своего дела, которые смогут быстро и качественно восстановить ваш инструмент.

Мы используем только качественные запчасти и материалы, чтобы гарантировать долговечность и надежность ремонта.

А теперь самое интересное! Летняя акция «Ремонт со скидкой в 20% для первых покупателей» уже началась!

Если вы решите воспользоваться нашими услугами в ближайшее время, то сможете сэкономить до 20% от стоимости ремонта. Это отличная возможность получить качественный ремонт по выгодной цене!

Не упустите свой шанс и обращайтесь к нам уже сегодня! Мы гарантируем быстрый и качественный ремонт вашего инструмента, а также приятные скидки для первых покупателей.

Ждём вас в нашем сервисе «Гобой и ковбой»!

Нейросеть внутри Supa

Остаётся подсократить текст, добавить фон, адрес и телефон — и получится что-то вроде такого.

<i>Пример листовки из Supa</i>
Пример листовки из Supa

Вот что бывает, когда копирайтер занимается дизайном. Но смысл вы поняли. Мы берём креатив, которые уже собрали в каком-либо ИИ-сервисе (или создали сами) и подгоняем в Supa под определённый формат для печати. Все подходящие для этого настройки тут есть.

Для сравнения, нормальная листовка с сезонной акцией в Supa может выглядеть вот так. Поэтому лучше всё-таки, если этим будет заниматься именно дизайнер.

<i>Пример нормальной листовки в Supa</i>
Пример нормальной листовки в Supa

Supa — пример того, как ИИ входит и внедряется в многопрофильные сервисы. И это только начало. Посмотрим, что будет дальше. Из тестов пока всё.

<i>Последняя загадочная ИИ-незнакомка в этой серии</i>
Последняя загадочная ИИ-незнакомка в этой серии

Заключение

Что же, худо-бедно мы погрузились в этот мир. Потыкали, пощупали и к чему-то пришли. Наши выдуманные стартапы (небольшой дисклеймер: все совпадения случайны, названия и идеи были созданы чисто для этого обзора — всё дарю читателям не глядя) попытались улучшить и упростить своё существование при помощи ИИ. В каком-то смысле это получилось. Но не всё так просто.

Какие выводы можно сделать?

  • Нейросети умеют генерировать сложные и простые форматы изображений. Неидеально, но умеют. Если хоть немного поработать с запросами и знать, чего хочешь получить — оно будет работать
  • Но остаётся много слепых пятен. Легально ли это, этично ли? Я полагаю, что если использовать креативы от ИИ для создания на их основе чего-то действительно уникального — то можно. Мы ничего не нарушим. Но если мы пойдем регистрировать торговую марку с таким логотипом без обработки — это может вылиться во что-то серьёзное в будущем. Наверняка, на VC есть эксперты по праву в этой области — буду рад вашей оценке ситуации в комментариях
  • Именно в творческом плане — здесь нет границ и тормозов. Если у человека хорошая фантазия — то привести это может куда угодно. Для медиа, блогов, каких-то быстрых задач, статей, рекламы — это точно годится. Главное не переусердствовать и не убеждать себя, что теперь никто не нужен для подготовки того же таргетинга VK, кроме одного сервиса с ИИ. Это всё ещё не так. Весь креатив нужно проверять и дорабатывать, как бы сильно вы не торопились
  • Ну, и главный вопрос: что будет дальше? Если прямо сейчас мы "повиснем" на шее у нейросети и почувствуем себя здесь комфортно... Куда это нас заведёт? Вопрос риторический, для личных рассуждений. Моё видение на основе всех тестов, что я провёл для VC и своего сообщества копирайтеров — таково... На эту кухню нужно приходить со светлыми намерениями, с трезвым умом и умея готовить. Тогда на ужин вас ждёт настоящее ресторанное блюдо. В противном случае — ничего хорошего не выйдет.

И несколько слов про то, для каких конкретно задач подойдут эти сервисы.

Gerwin умеет в креатив. Подойдёт для любых задач по иллюстративному оформлению. И это не только плакаты и логотипы, но и иллюстрации для стикеров, обложек, чего угодно.

24AI поможет откаталогизировать товары на маркетплейсах. Быстро и в любых количествах.

Turbotext работает с людьми, животными, анимацией. Это именно про SMM или PR.

Colorize.cc — про работу с архивами фотографий. Собрать, восстановить и вернуть к жизни.

Проекты от IT-гигантов наверняка будут вписаны в экосистемы. Про них вы еще не раз услышите.

А Supa — для видео, компактного дизайна и печати.

Как-то так. Спасибо, что дочитали до конца.

Если у вас есть похожий сервис или бот — отмечайтесь в комментариях здесь и/или в июньском самопиаре проектов по ИИ. Я буду рад изучить и ваш проект.

И на этом на сегодня всё. Удачи!

P.s. Вопросы, пожелания, предложения — можно сюда

P.p.s. Предыдущий обзор по сервисам для работы с текстом — тут

3333
14 комментариев

Смотрю на лосось и мне страшно, словно не я его буду есть, а он меня

1

ну учитывая цены это не просто недалеко от истины, а именно так и есть на самом деле

1

Осетры соответствуют среде обитания )

Это было увлекательно