ИИ – погнали! Как «Гельтек» объяснял Midjourney загадку русской души
Как только первые, совсем еще молодые, на заплетающихся ножках версии нейросетей научились рисовать картинки, дизайнеры забили тревогу: «Машины отбирают у нас хлеб! Масло! И колбасу!»
На мой взгляд, такая паника, мягко говоря, необоснованная: даже самый умный инструмент – это всего лишь инструмент, и если им не управлять, инициативы он не проявит и конкуренцию не составит. Например, в начале XIX века луддиты громили станки, потому что автоматизация производства «съедала» рабочие места. А потом раз – и вдруг понадобились люди, которые эти станки бы производили, обслуживали. И рабочие места не исчезли, а появились в другой сфере.
Как минимум на текущий момент нейросеть не способна заменить живого дизайнера. И все эти подборки «Посмотрите, как нейросеть превратила персонажей "Симпсонов" в персонажей "Гарри Поттера"!» появились не по нажатию одной кнопки. За этим стоят довольно долгие часы человеческого труда.
Почему я так уверенно об этом говорю? Потому что у «Гельтек» был опыт работы с использованием искусственного интеллекта для разработки упаковки и оформления выставочного стенда.
Это был очень увлекательный опыт! Но совсем не простой.
Всем привет! С вами Сергей Кирш, владелец и руководитель компании по производству косметики «Гельтек», и я хочу рассказать, как мы добивались от нейросети понимания и взаимности. И добились.
Эй, ухнем, русская красавица: учим ИИ рисовать портреты
В прошлом году «Гельтек» собирался на международную выставку South China Beauty Expo 2023 в Китае. И чтобы привлечь внимание потенциальных клиентов, мы решили сделать что-то яркое, красочное и обязательно в национальных мотивах, чтобы выделиться. И на период подготовки как раз начала входить в моду нейросеть Midjourney и ее многочисленные сестры-братья.
Мы решили: а почему бы и нам не попробовать? Во-первых, это сэкономит время дизайнеру (мы тогда так думали). А во-вторых, поскольку найти нейродизайнера с опытом работы более 5 лет по понятным причинам затруднительно, надо уже сейчас растить его с нуля? И мы поручили нашему «человеческому» дизайнеру Насте освоить Midjourney и с его помощью подготовить материалы, которые можно было бы использовать для оформления стенда и специальной линии косметики для выставки.
Что мы хотели видеть:
- классическую русскую красавицу,
- кокошник из ягод,
- яблоки как один из символов России;
- сказочный стиль.
Сказано – сделано. И вот что было сделано в первом варианте:
Неплохо? Неплохо! Но и не так хорошо, как нам хотелось бы: все-таки больше похоже на фотоподборку, чем на иллюстрацию из книги сказок. Поэтому мы добавили запрос «иллюстрация». Получив такой результат:
Кажется, Midjourney посчитал, что русские сказки очень страшные. А их герои от пережитых приключений должны быть седые и с трагическим взглядом. Плюс сеть предлагала нам девушек с анимешными ушками и вместо кокошников из ягод генерировала… венки из лесных животных. Ну, почти, почти одно и то же.
Насчет своеобразного представления об анатомии человека у нейросетей не пошутил только ленивый. Но знаете, это каждый раз впечатляет:
В общем, на момент подготовки к выставке в «чистом» виде мы не могли использовать иллюстрации от Midjourney. Практически каждая дорабатывалась дизайнером: приходилось удалять лишние конечности, проверять их число, вычесывать из волос красавиц заблудившихся кабанов и оленей. Но все-таки это было в разы быстрее, чем рисовать все вручную с нуля. Плюс мы смогли попробовать куда большее количество вариантов, чем если бы дизайнер работал в одиночку.
В итоге мы остановились на таких вот плодах совместных трудов робота и человека:
И вот так это выглядело на стенде:
С помощью ИИ и живого дизайнера мы получили именно тот результат, который хотели: в меру реалистично, в меру сказочно и, безусловно, красиво и сочно.
Алоэ? Каланхоэ! Ботанические изыскания и немного латыни
Хотя иллюстрации для стенда нам понравились, мы не хотели дублировать их и в нашей косметической линии. Даешь разнообразие! Для косметической линии From Russia With Love (не баян, а классика), подготовленной для китайской выставки, мы создали отдельный набор иллюстраций для этикеток. Здесь акцент был сделан на венки из тех растений, которые использовались в составе косметических средств: экстракт алоэ, конского каштана, малины, ежевики и клюквы.
После венков из лесных животных мы думали, что венок из алоэ и малины будет для Midjourney… проще пареной клюквы. Но нет, в русскоязычных названиях растений нейросеть спасовала. Да и в англоязычных не сказать, что блеснула. Вместо алоэ, например, Midjourney предлагала нам артишоки, кактусы, каланхоэ, каменные розы. В общем, что угодно, кроме нужного нам растения.
Тем, кто столкнется с такой же проблемой, подсказываем лайфхак: Midjourney начал узнавать растения, когда мы ввели их названия… на латыни (из ботанического справочника). Видимо, обучаться по классическим справочникам ему было сподручнее. И дело пошло.
Еще пришлось повозиться с тем, что венок нейросеть упорно видела как праздничный аксессуар, который вешается на дверь. И не понимала, почему эти чокнутые русские хотят напялить его на голову. Так что и здесь без допиливания живым дизайнером не обошлось. Но в итоге снова получился результат, которого мы примерно и ожидали:
В итоге наши покупатели остались очень довольны, хвалили и оформление стенда на выставке, и упаковку для косметики. И помимо денежной выгоды, мы приобрели опыт, который я бы сформулировала следующим образом:
- Нейросеть – отличный помощник дизайнера! Но не его заменитель (по крайней мере, сейчас).
- Нейросетями можно и нужно учиться пользоваться. Они экономят время живого дизайнера, позволяют «поиграть со шрифтами» и вообще самыми безумными вариантами, которые вам только в голову придут, не тратя ценный человеческий ресурс.
Вот такой опыт работы с нейросетями в коммерческих целях был (и ещё будет) у компании «Гельтек». А если у вас был свой опыт разработки именно коммерческих иллюстраций с помощью нейросетей и вам есть с чем согласиться или что возразить, буду рад обменяться мнениями!
А я как-то пыталась референс с помощью Кандинского сгенерировать. Задачу дословно не помню, но что-то вроде - "Девочка в супермаркете первой схватила банку зеленого горошка и не дает и вызывающе смотрит на главного героя. Вид от первого лица"
Так вот вы какие, руки-загребуки!
Какой интересный горошек. И вызывающий взгляд тоже любопытный :)
Лучше сегодня мы уже не увидим, пора сворачивать интернет)
У нейросеток ещё одна проблема: зачастую видно, что изображение сгенерировано, даже если все конечности на месте. Это вызывает отторжение уже при не самой большой насмотренности. Так что не только человечеству нужно поспевать за нейронками, но и нейронкам ещё совершенствоваться и совершенствоваться, чтобы их "уши" не торчали.
Тоже верно. Поэтому мы бы "допиливали" с дизайнером изображения, даже если бы конечный результат нас, с большего, устроил.
Сначала не понял, что не так с последней картинкой нейросети, а потом каааак понял. Потом правда опять не понял.
Вот и мы до сих пор думаем, что это было.
У Midjourney действительно есть огромные проблемы с анатомией человеческого тела, да и не только человеческого, как он изображал собак, даже рассказывать не буду😂 Но все эти нюансы со временем уйдут, а пока нашему брату ИИ нужна наша помощь)
И не только у Midjourney, насколько мне известно. В момент, когда мы это всё генерили, ни одна нейросеть не умела в анатомию.
гугл выпустил сейчас новую нейросеть, она конечно еще в разработке но генерит сразу картину в целом, из-за этого с к анатомией там лучше чем у всех подобных моделей.
Ага, слышал про неё, спасибо. Если будем еще так делать, попробуем её.
Да-да, абсолютно у всех такая беда.
с первых попыток вышел довольно приличный результат, но характерный для нейросетей)пока еще очень бросается в глаза, что сгенерировано, у всех картинок ии общий стиль, при чем даже если рассматривать несколько нейронок
Ну, может в вакууме он и неплохой, но нашим требованиям не соответствовал. Ну и вы верно заметили: слишком оно какое-то одинаковое всё.
Для коммерции есть интересные нюансы.
ЕС рассматривает варианты обязательной маркировки любых нейроизображений, включая рекламные. Придется подписывать, если правки дизайнера небольшие. МЕТА и ряд компаний решили это делать в обязательном порядке.
Отсутствие copyright тоже играет роль.
Так-то любой инструмент хорош, если помогает в творческом процессе, но не делает за тебя.
А как определить размер правок? Вот, допустим, у нас они большие или небольшие?
Это уже как примут. Есть варианты сделать автоматической маркировку в стиле SynthID в момент генерации. Потом загружаете итоговую версию в аналог антиплагиата и она показывает, считается это генерацией или нет.
Как получится, посмотрим.
А этот аналог антиплагиата уже существует?
Их много, как illuminarty, hugging face. Пока нет универсального и уровень выявления разный.
Если компании обяжут делать маркировку в процессе генерации, станет все проще.
Китай пошел очевидным, суровым путем. Ставить метки обязаны сами граждане, иначе штрафы и штрафы.
Спасибо за информацию!
Офис шикарный
Спасибо, только это стенд, а не офис.
Стенд говно
...потому что ...?
Потому что это не офис
Штош, понятно
Извиняюсь за троллинг)
Измельчал нынче троллинг :(
У нейросеток ещё одна проблема: зачастую видно, что изображение сгенерировано, даже если все конечности на месте. Это вызывает отторжение уже при не самой большой насмотренности. Так что не только человечеству нужно поспевать за нейронками, но и нейронкам ещё совершенствоваться и совершенствоваться, чтобы их "уши" не торчали.
Согласна с тем, что нейросетей бояться не надо. А то тут люди считают, что нейросеть УЖЕ работает так, что нажал на кнопочку - и всё, готовый продукт. По факту же картинки надо ещё пилить и пилить, чтобы получилось красиво. Или делать десятки итераций запросов, всё больше детализируя.
Да, надо понимать, что нейросеть - это инструмент, а не решение.
Очень классно про нейросеть и другие современные технологии рассказано в последнем выпуске Дудя (с дизайнером из Таджикистана)
а мне Кандинский Изму дорисовывал. А теперь я не помню, как я это делала (а может вообще эту функцию убрали)
Изму? Из мультика?
Надо было идти дальше - матрешки в волосах, бочки с нефтью, балалайки. Кринж рулит...
Судя по всему, "загадку русских конечностей" объяснить так и не сумели.