Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Раньше AI мы читали как Adobe Illustrator, а теперь как Artificial Intelligence. ChatGPT защитил диплом, а Midjourney выиграл конкурс фотографов. Весь творческий сегмент YouTube в панике обсуждает грядущую борьбу с ИИ за рабочие места. Мы в 65pixels уже 2 месяца используем нейросети в работе, поэтому расскажем правда ли «враг» так опасен, как говорят.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Долгое время считалось, что роботы заменят исключительно «синих воротничков», то есть тех, чей труд монотонен и алгоритмизуем. Креативный класс верил, что машине творчество не под силу. Но так ли это? Даже если может нейросеть сделать что-то уникальное, способна ли она «скреативить» по тз на заказ, закрыть потребности клиентов и окончательно заменить дизайнеров?

Для того чтобы ответить на этот вопрос надо как следует разобраться. Однако мы можем с уверенностью сказать, что уже сейчас дизайнеры делегируют часть своей работы нейросетям. Более того, коллаборация человека и машины становится привлекательным рекламным ходом. Вот например Nestle совместно с DALLE 2 «продолжили» картину Яна Вермеера и использовали это в своём промо. Но можно ли использовать роботов не только для PR, но и для серьёзных работ?

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Как учится искусственный интеллект

Стержень нейросети — это модель. Это такое специальное математическое множество данных с огромным количеством измерений. Каждое из измерений отвечает за определённую характеристику — категорию по которой нейросеть объединила картинки, которые видела во время обучения. В Midjourney таких категорий более 500 и не одну из них человек не может описать словами.

Когда человек вводит запрос, нейросеть ищет место в модели, которое лежит на пересечении категорий в описании. После перебирает пиксели, пока результат не будет соответствовать, всем этим категориям. Так как генерация основана на случайном шуме, каждый результат уникален.

Почему работы нейросетей использовать нельзя

Пока ИИ не может сделать полноценный коммерческий дизайн-проект. Но где гарантии, что это не произойдет в будущем? Есть две проблемы: первая лежит в основе устройства нейросети, поэтому решится еще не скоро, вторая — вопрос последовательного труда создателей сервисов, предпосылки к ее решению мы видим уже сейчас.

AI и авторское право

Первая проблема — это авторство работ нейросети. На него претендуют художники, на картинах которых училась машина, создатели сервисов и авторы описаний, по которым сгенерированы изображения. Но почему каждый из них считает, что работа принадлежит им?

Материалы каждого этапа создания картинки принадлежат разным людям: источники для обучения — художникам, модель — создателям, описание — пользователям. И изменить это практически невозможно.

Так, например, Heinz обнаружил, что если попросить MidJourney сгенерировать картинку кетчупа, у него обязательно будут атрибуты дизайна их продукции. Если бы вы попробовали создать продуктовый дизайн кетчупа с помощью ИИ, точно бы нарвались на иск.

Из-за этой «врождённой» разрозненности авторского права нейросетей, продукты ей созданные почти невозможно коммерчески использовать. Например Бюро регистрации авторских прав США отозвало свое решение о регистрации комикса «Заря Рассвета» созданного Крис Каштановой при помощи MidJourney, объяснив это тем, что защита авторского права не распространяется на предмет искусства не созданный человеком.

Ошибки генерации и 20 пальцев на руке

Вторая проблема касается скорее нынешнего состояния технических возможностей нейронок. Сейчас большинство результатов попросту несуразные. Например нейросеть «Студии Артемия Лебедева» генерирует логотипы с случайными флуктуациями толщины линии. Вряд ли такой логотип понравится заказчику и его клиентам.

Блогер протестировал нейросеть Лебедева и вот что у него получилось (Иллюстрация: <a href="https://vc.ru/design/426418-rezultaty-testa-neyroseti-studii-artemiya-lebedeva" rel="nofollow noreferrer noopener" target="_blank">VC.ru</a>)
Блогер протестировал нейросеть Лебедева и вот что у него получилось (Иллюстрация: VC.ru)

У MidJourney в свою очередь проблемы с генерацией пальцев и зубов, чаще всего их больше, чем необходимо, и выглядит это жутко. Ей в принципе тяжело дается любая повторяющаяся геометрия из упорядоченных элементов, например колонны и окна домов. В представлении нейросети они имеют более природные формы в стиле Антонио Гауди, что часто не соответствует ожиданиям пользователя.

<p>Один из примеров того, как Midjourney генерирует руки (Иллюстрация: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fmedium.com%2Fmerzazine%2Fdrawing-hands-and-ai-78b501df0085&postId=634467" rel="nofollow noreferrer noopener" target="_blank">medium</a>)</p>

Один из примеров того, как Midjourney генерирует руки (Иллюстрация: medium)

Также у ИИ проблемы с постоянством. Так как в основе генерации изображения лежит подбор случайных пикселей, каждый результат уникален, даже если описание не изменилось. Поэтому Нейросеть не способна сделать серию изображений с одним и тем же объектом или в едином стиле, что также может стать проблемой при реализации проектов с участием MidJourney.

Однако есть предпосылки к тому, что эта проблема будет решена в относительно короткий срок. Например до недавнего времени MidJourney не умела стилизовать фотографии в гротескные иллюстрации и подбирать сложные ракурсы. Теперь она это умеет и это не единственное обновление.

Модель по прежнему учится, поэтому потолок точности и правдоподобия еще не достигнут.

Решением проблемы может также стать переход на нейросеть Stable Diffusion. Это более продвинутый инструмент, который позволяет контролировать процесс генерации с помощью специальных переменных, менять определённый кусочек изображения, дорисовывать детали результата. SD с использованием некоторых функций справляется с генерацией рук, может «мутировать» кота и пса в один вид, создать картину в стиле художника с Artstation или в стиле другой нейросети, например той же MidJourney.

<p>Нейросеть Stable Diffusion превратила западных звёзд в пионеров (Иллюстрация: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.google.com%2Famp%2Fs%2Fwww.ixbt.com%2Fnews%2F2022%2F11%2F22%2Fnejroset-stable-diffusion-prevratila-gollivudskih-kinozvjozd-v-sovetskih-pionerov.amp.html&postId=634467" rel="nofollow noreferrer noopener" target="_blank">IXBT</a>)</p>

Нейросеть Stable Diffusion превратила западных звёзд в пионеров (Иллюстрация: IXBT)

Несмотря на поистине безграничные возможности данной нейросети, её довольно сложно включить в рабочий процесс. Всё потому, что освоение такого могущественного, но сложного инструмента займёт время. Потребуется разобраться в технических тонкостях процесса генерации и выучить то, какие слова описания приведут к конкретному желаемому результату.

Не лишён Stable Diffusion и откровенных «багов». В процессе генерации придётся быть очень внимательным, повторять некоторые чисто технические операции и использовать «костыли». Пока это не самый дружелюбный к пользователям сервис. Процесс создания изображений трудоемкий, требует скрупулезного изучения и явно не попадает в категорию лайфхаков.

Однако у инструмента уже появляются комьюнити, эксперты и специализированные ресурсы. Почему? Потому что те, кто Stable Diffusion освоит, смогут самостоятельно создавать графику в любом стиле за считанные минуты, максимум часы.

Такая возможность — серьезное конкурентное преимущество.

Со временем SD станет доступнее, больше людей обучатся пользоваться ей, возникнет спрос на более продвинутую техническую поддержку и интуитивный интерфейс. Когда это произойдёт, никто не знает, но в том, что это так, сомнений нет.

Существует ли дизайн без человека

Причины по которым нейросети ещё не сменили дизайнеров не сводятся только к формальностям закона и техническим ограничениям. Всё потому, что дизайн — это не про визуал, а про решение задач. Процесс создания дизайна не равен генерации картинки с определёнными объектами в некотором стиле, он состоит в выборе того, что и как изобразить и упорядочить. Именно эту часть пользования нейросетью до сих пор делают люди при вводе промпта для генерации.

Нейросеть может создать уникальную картинку, но при этом она не учитывает потребности заказчика, особенности его бизнеса и рынка, на котором этот бизнес находится. ИИ не умеет распознавать «боли», проводить исследования, угадывать тренды и тестировать решения. Поэтому AI не имеет субъектности в дизайне и является лишь инструментом визуализации идей дизайнера. В этих идеях и скрыт смысл нашей профессии, в этом и заключается ценность нашей креативности.

<p>Пример креативного использования DALL-E 2 (Иллюстрация: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fnews.microsoft.com%2Fsource%2Ffeatures%2Fai%2Ffrom-hot-wheels-to-handling-content-how-brands-are-using-microsoft-ai-to-be-more-productive-and-imaginative%2F&postId=634467" rel="nofollow noreferrer noopener" target="_blank">Microsoft</a>)</p>

Пример креативного использования DALL-E 2 (Иллюстрация: Microsoft)

Но это не значит, что нейросети бесполезны в дизайне. Например, в крупнейшей немецкой частной кроссмедийной компании RTL с помощью ИИ создают эксклюзивные обложки в едином стиле к каждому выпуску подкаста. Такой подход помогает привлекать людей к конкретному эпизоду и повышает конверсию аудитории.

Тот же MidJourney — довольно неплохой инструмент для быстрого создания иллюстраций. В некоторых случаях может заменить стоки, выдавая при этом оригинальный, подходящий именно под вашу ситуацию, результат. А ещё MJ понятна и доступна новичку.

Эксперименты 65pixels

Понимая, что все аспекты работы с ИИ обсудить невозможно, мы решили проверить, где лежит граница его применения. Мы попробовали сгенерировать иллюстрации для наших текущих проектов в MidJourney.

Абстрактная 3d-композиция в стиле Octane Render для сайта банка

Такого рода изображения сложно точно описать словами — из-за этого процесс генерации становится неуправляемым. При использовании изображений-примеров результат наоборот становится слишком предсказуемым и похожим на оригинал. Также до сих пор присутствуют проблемы с созданием геометрии и её детализацией. Вывод: для этих целей MidJourney не годится, привлекли 3D-дизайнера.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Разработка логотипа

С этим заданием нейросеть справилась из рук вон плохо. Из-за проблем с геометрией, результатам не хватает постоянства в линии. Из-за особенностей обучения, логотипы получаются довольно посредственными. Также MidJourney недостает ясности. Она переусложняет композиции, что приблежает изображения к flat-иллюстрации.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Вывод: Логотипы у нейросети не получаются, а вот создать материалы для муд-борда она может.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Интерьеры для рекламной ретуши rich-контента бытовой электроники

Результат неотличим от фотографии. ИИ угадывает настроение. Материалы и освещение выглядят реалистично и соответствуют описанию. Есть небольшие проблемы с детализацией, но так как данный тип работ предполагает последующую обработку, проблемой это не становится.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Вывод: О интерьерных стоках можно забыть. Вместо часов поиска время сэкономит MidJourney.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Сюрреалистичная иллюстрация в стиле фотошоп-коллажа для поста в социальных сетях

Сюрреализм — конёк MidJourney. С этой задачей она справилась на ура. Это намного быстрее, чем создавать изображение с нуля и лучше подходит задаче, чем стоковая иллюстрация.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Вывод: Сюру быть.

MidJourney за пару секунд создаёт фотореалистичный коллаж. Скорость — залог постоянства публикаций в соцсетях. Ещё нейросеть предлагает несколько вариантов, поэтому полезна для поиска идей. Удачные находки можно позже объединить в фотошопе в финальный результат.

Человек против машины: использование нейронных сетей для решения реальных задач дизайн-студии 65pixels

Человек MidJourney друг

После наших экспериментов становится понятно, что нейросеть ещё какое-то время будет «несамостоятельной». Она не только совершенно не способна на аргументированное решение сложной графической задачи с большим количеством аспектов, что и является сутью дизайна, но и довольно плохо справляется с генерацией некоторых довольно простых описаний.

Для некоторых специфических задач AI — самое быстрое и эффективное решение. ИИ — передовой инструмент, которых необходимо осваивать, но не чтобы бороться с восстанием машин, а чтобы конкурировать с другими дизайнерами, освоившими технологию.

Именно на пересечении искусственного интеллекта с ценностью человеческого опыта и креативности рождаются по-настоящему интересные, а главное полезные решения. Мы в 65pixels уже включили нейросети в свои процессы: используем нейросети для вдохновения, разработки прототипов и черновиков, в выборе стиля. В следующих статьях расскажем, как внедрить искусственный интеллект — оставайтесь с нами.

2222
Начать дискуссию