Использование AI для генерации концепций (архитектура и дизайн)

В предыдущей статье я ознаменовала 2024 годом диджитал-демона и надо сказать, что пролетел он с оглушительной ск��ростью так, что моя статья устарела примерно через 5 минут после выхода. Мне поступило много вопросов, которые хотелось разобрать, но из-за того, насколько быстро всё развивалось,– то руки опускались, то таилась мысль “если подождать достаточно – то можно будет просто нажимать кнопку “сделать красиво”, а не уметь писать эти промпты и всё вот это”. Тем не менее, FOMO [Fear of Missing Out] берёт своё.

В этой (лонгрид) части посмотрим, что изменилось за год+, разберём глубже написание промптов для генерации изображений, протестируем примеры использования в специфической работе для архитекторов/дизайнеров, а в конце я вам даже не предложу ничего купить у меня.

Дисклеймер: статья предназначена для профессионалов в сфере дизайна, архитектуры, графики, а не для IT-специалистов. Представленная информация носит ознакомительный характер и не является профессиональным мнением, скорее описывает личный опыт применения.

Вводное слово

(Можно скипнуть до Части 1.)

AI-технологии удваивают свою мощность/способности каждые 6 месяцев, говорят специалисты на соответствующих конференциях [1, 2]. А на Reddit так вообще грозятся, что удвоение происходит каждые 2-4 месяца. Постепенно и неизбежно, искусственный интеллект становится неотъемлемой частью нашей жизни и это нас очень пугает. Не знаю, замеряют ли где-то температуру страха по комнате (как замеряют страх инвесторов на рынках, например), но ставки на Армагеддон точно превышают утопические взгляды. Тут есть два интересных примера.

Использование AI для генерации концепций (архитектура и дизайн)

Индустриальная революция.

Люди протестовали против внедрения механизации как минимум с 17-го века. Они устраивали погромы, ломали машины, поджигали фабрики, но все подобные восстания власти подавляли силой. Вытесненные работники были вынуждены менять свой привычный образ жизни и получать новые навыки (ну или спиваться). Если тогда работник обучался управлять машиной, то сейчас машина самообучаемая. Да, конечно, нам нужны разработчики и тестировщики, но чем дальше в лес, тем независимее становятся технологии.

Сегодня механическая работа позволяет человечеству иметь столько благ, что нам уже некуда их девать и мы тонем в мусоре потребительских товаров.

Подобная технофобия сейчас может показаться смешной, даже примитивной, но если присмотреться – мы такие же консерваторы, особенно чем старше мы становимся.

Невольно маятник раскачивается в обратную сторону: мы сильнее ценим ручную работу, труд живого человека, хотя прошлый век прививал надменность знаний интеллекта над традиционными навыками, в итоге мы стали попросту терять эти навыки, передаваемые из поколения в поколение. Человеку в целом свойственно получать удовольствие от физического труда, видеть результат своих стараний материализовавшимся во что-то. И есть небольшая надежда, что отдав на автоматизацию процессы без нашего участия, мы сможем больше времени уделять вопросам как, зачем, почему мы делаем вещи так, как мы их делаем. Почему мы строим города неудобно, почему мы следуем правилам, не имеющим никакого смысла – сейчас нам даже некогда подумать о большой картинке.

Машины никогда не заменят лошадей.

Вот вам простая аналогия: могли ли лошади думать, что железные коробки на колёсах лишат их работы? Замените “лошадей” на “людей” и получим современную мысль, что мы в безопасности. Эта мысль разбивается о реальность, когда вы видите прогресс, который произошёл за прошедший год. Всё, что мы можем сейчас сделать, это научиться работать с этими технологиями. (Или спиться).

В вакансиях на должность архитекторов и дизайнеров я уже неоднократно видела требование “Знать и уметь пользоваться AI технологиями”. Впервые увидев это, я откровенно удивилась, потому как видела кучу примеров того, как люди сравнивают свои результаты работы с тем, что предлагает им AI, и пока что это далеко от того, что можно отправить заказчику как финальный проект. Здесь есть несколько “но”: в большинстве случаев в этих экспериментах люди создают ужасные промпты, а как говорится в нашем деле “Нет ТЗ – результат хз”. То есть на выходе мы получаем то, что мы попросили сделать. Написание заданий и промптов это вообще отдельная тема, которой так часто пренебрегают.

Второе “но” заключается в том, что они используют бесплатные платформы. Для настоящего результата надо использовать профессиональные программы, в которых есть плагины с поддержкой AI, выдающие результаты за считанные секунды (такие как проставить размеры, просчитать помещения и их габариты, параметризация помещений, проверка соответствию стандартам). Примеры таких программ приведу далее в статье.

Последнее старческое кряхтение приведу с личным примером.

Я ещё застала те времена, когда таксисты не имели телефонов с GPS. Тогда любой водитель со стажем обязан был иметь бумажную карту в бардачке своего автомобиля, а ещё он знал свой город по памяти как свои пять пальцев. Сейчас любой приезжий может по карте разобраться в незнакомом месте, но интуитивно он понятия не имеет, где там север и с какой стороны на дереве должен расти мох. В этом безусловно есть победа технологий и удобство, но есть один нюанс: иногда технологии дают сбой. Если вы когда-то ехали по центру мегаполиса, где стоят “глушилки” сигналов, то водитель спрашивает у вас, как ему ехать, куда везти, потому что его навигатор показывает, что мы в речке плывём. А ты понятия не имеешь, ты-то тоже тут впервые.

Мораль сей басни: будет больше “специалистов”, понятия не имеющих, что они вообще делают. Почему размер тут такой, а не другой. Зато всё по ГОСТу же! (но и это не точно).

К сожалению, с количеством сгенерированного контента стало падать качество. Площадки как Pinterest и Instagram наводнили искусственными изображениями, которые не только не вдохновляют, но скорее отталкивают. Большая толика нашей работы связана с насмотренностью. Может быть, мы также, как нейросеть, тренируемся на том, что видим, а если мы будем видеть только бесконечные повторения уже созданных идей, не оригиналов, замыленных копий, также будет падать наша способность креативно мыслить. Есть несколько сайтов для вдохновения, где пока что нет рекламы и можно собрать более интересные референсы:

А ещё можно выйти из дома, пойти в музеи, библиотеки, исторические места и вдохновиться там. Но это уже совсем для любителей аналоговых референсов.

Часть 1. Промпты

Нейросеть начала не только генерировать более правдоподобные результаты с правильным количеством пальцев и зубов, но также стала лучше понимать наши запросы. Тем не менее, принципы, описанные мной ранее, всё ещё остаются актуальными: чтобы у нейросети было меньше шансов для галлюцинаций, лучше писать буквальные вводные, больше конкретики и меньше воды. В теории так, а на практике нужно тестировать отдельные формулировки, причём для разных платформ будут разные сложности. Разные слова имеют разный вес в промпте и научиться “говорить” на языке AI – наша задача. Например, Kive никак не могла мне сгенерировать fluted glass – видимо, не тренировали её на такой материал. А вот Playground справился с этой задачей моментально. В Midjourney не получался материал нержавейки, а вот Krea создала идеальный материал с первого раза, хотя общий стиль менее реалистичный-натуральный, как в Midjourney.

Чтобы создать хороший промпт, нужно иметь видение конечного результата. Для этого мы используем референсы, подгружая их в качестве опорной точки, а также просим языковые модели создать промпт, глядя на картинку (лайфхак!). Я пробовала это делать через Gemini, DeepSeek, ChatGPT, Claude. Лучше всех справлялся ChatGPT, хотя интересно, что у Claude были специфичные флаги, такие как aspect ratio (--ar) и версия Midjourney (--v 6.0) (подобные флаги рассмотрим далее в части о Midjourney), но также там было много воды, так что после получения промпта я анализирую его, удаляю лишнее и непонятное, прошу подкорректировать ещё раз, и тестирую разные варианты. В случае, когда какой-то материал не получается, я иду обратным путём: пытаюсь сгенерировать только этот один материал, чтобы понять, знает ли модель как вообще это выглядит. Далее нанизываете остальные детали, как бусинки на нитку.

Таким образом, весь процесс можно свести до следующей последовательности:

Референсы – описать картинку в языковой модели – анализирую, корректирую, исправляю – загружаю в генератор изображений – анализирую, корректирую, исправляю – генерирую снова – повторять два последних шага до желаемого результата.
Референсы – описать картинку в языковой модели – анализирую, корректирую, исправляю – загружаю в генератор изображений – анализирую, корректирую, исправляю – генерирую снова – повторять два последних шага до желаемого результата.

Стоит заметить, что помимо классических языковых моделей, есть отдельные платформы для генерации промптов непосредственно: Originality AI, Promptomania, Phraser, Midjourney Prompt Generator со специфичными флагами. Функция /describe также есть в самом MJ, но по опыту использования не оказалась эффективной. Чаще всего я обращаюсь к ChatGPT с картинкой и задачей “Please create prompt for this image”. (да, я из тех, кто чувствует себя плохо, если не добавляет “пожалуйста” и “спасибо”)

Часть 2. Платформы

Для своей задачи я выбрала создание материал-борда для абстрактного проекта. Мне хотелось показать следующие материалы: шпон натурального ореха, латунные или золотые фрагменты, зелёная ткань вельвет или бархат, натуральный камень и рифлёное стекло.

Playground AI

В прошлой статье мы генерировали изображения на платформе Playground AI, так как она предоставляла множество бесплатных генераций. Компания обновила платформу, выпустила мобильное приложение, постоянно внедряет улучшения (улучшения ли) и, естественно, просит занести им копеечку, но в целом для новичков вполне достаточно попробовать себя в размере 25 генераций в день. Пытаясь упростить платформу, Playground AI кардинально изменили внешний вид и взаимодействие с платформой. Хотя, по общему мнению в интернете, стало менее удобно, но пробуем тестировать.

Как только мы заходим на платформу, нас просят выбрать, что мы хотим сгенерировать. Из всех вариаций мне ничего не показалось подходящим, поэтому я загружаю картинку какого-то мудборда из Пинтереста, затем в Change text использую собственный промпт.

Использование AI для генерации концепций (архитектура и дизайн)

В целом, результаты неплохие. Особенно мне нравится, как получилось стекло и собранная ткань. Композиция хорошо сложена, довольно релистична и подчиняется промпту.

Из минусов: убрали мой любимый инструмент “канва”, где ты мог вывешивать сразу многие свои попытки и сравнивать воочию. Я мало где встречала такой аналог работы с ИИ и мне кажется, платформа потеряла свою изюминку; нет возможности посмотреть свой промпт, он уходит “в никуда”; изображения генерируются по одному (в отличии от 4х в MJ).

Из плюсов: неплохие кнопки “Add to prompt”, “Change text”, “What if it were” для уточнения. Но вариативность изображений маленькая, так как нет контроля за хаосом (флаг --chaos в MJ) промпта. Подойдёт для совсем начинающих.

Kive.ai

Подойдёт для продакт-дизайнеров, так как имеет вшитые функции-шаблоны для продукции, а также возможность натренировать модель на своём бренде или стиле.

Под мои запросы справлялся довольно плохо, указание цвета конкретного объекта часто влияло на всё вокруг, нет чёткой передачи материалов, текстур. Я начинала с описательного промпта.

Использование AI для генерации концепций (архитектура и дизайн)

У меня было не менее 20 проб и это лучшие изображения, которые я получила. Справедливости ради – я не использовала никакого референтного изображения и не пыталась “натренировать” ИИ. После ещё пары вариантов других проектов, я оставила попытки покорить эту платформу.

Krea.ai

Интересный проект, доступно много бесплатных генераций, есть удобная функция референтного изображения с возможностью регулировки силы влияния (флаг --iw в MJ).

Огромный плюс – скорость генерации изображений самая быстрая, что я встречала. Плюсы поменьше: можно пользоваться с помощью чата, то есть присылать промпт в чат и далее добавлять или удалять к изображению детали без переписывания промпта заново. Удобные кнопки смены стиля, создания видео из картинки. Минусы: только 1 картинка (но зато быстрая), стилистически сложно получить реалистичное изображение, видео работает плохо, а часто не работает вообще.

Использование AI для генерации концепций (архитектура и дизайн)

Midjourney

Безусловное преимущество MJ заключается в стиле “Home” по умолчанию. Благодаря этому получаются более реалистичные, не такие мультяшные результаты, как на остальных платформах, обладающие некой эстетикой фотографии.

Использование AI для генерации концепций (архитектура и дизайн)

Основное отличие платформы это флаги, с помощью которых можно варьировать и контролировать последовательные результаты генерации. Таких флагов довольно много и на сайте MJ есть хорошие инструкции по большинству из них, я опишу только некоторые для начала. По сути, флаги – это параметризация вашего промпта. Как вы уже могли заметить, указание флага в промпте начинается с двух дефисов. Важно всегда соблюдать формуле написания флага, как в кодировании: --[флаг]_N

Aspect Ratio отвечает за соотношение сторон в картинке, например 1:1 квадрат, или другие значения:

--ar 16:9

Версия MJ (я не указываю, так как по умолчанию всегда последняя версия идёт):

--v 6.1

Style Reference поможет повторить стиль или создать ваш собственный. Загрузите картинку на сторонний хостинг (можно прямо в чат, если работаете в MJ Studio или Discord):

--sref [link]

Управлять влиянием стиля этого референса можно с помощью флага

--sw N

Где N – значения от 0 до 1000, где 1000 максимальное влияние стилизации. (Не путать с флагом --s)

Character Reference

--cref [link]

Управлять влиянием этого референса можно с помощью флага

--cw N

Где N – значения от 0 до 100, значение 100 это полное повторение персонажа: лицо, поза, одежда; 0 - оставит только лицо персонажа. (Похожая функция используется при замене лица в изображения). По умолчанию стоит значение 100.

Команда /image [link] и далее [промпт] будет повторять стилизацию, композицию изображения, но сгенерирует ваше описание. Влиять на этот параметр можно с помощью веса Image Reference:

--iw N

Где N – значения от 0 до 2, но можно использовать десятичные дроби, например значение 0.5 даст вам результат с небольшим влиянием референтного изображения, а 2 – максимально приближенное.

Для отступа от вашего промпта и экспериментирования в случайно образе можно варьировать флаги --chaos и --weird, названия которых и отвечают сами за себя. Значения 0 будут придерживаться промпта, значения до 100 помогут отступить и получить новые результаты. Применять такие флаги можно когда у вас есть собственный стиль Style Reference, к примеру, но вы хотите получить новый результат, так как существующий не даёт разнообразия и самоповторяется в нежелательной форме.

--chaos N

--weird N

Где N – значения от 0 до 100.

Ремарка: для меня эффективным оказалось использовать слово-токен “otherworldly”. На мой взгляд, слово выполняет похожую функцию с этими флагами, создавая неожиданные результаты, но придерживаясь промпта.

Флаги --weird и --chaos со значением 50 сгенерировали грустную собачку стоящую в море.
Флаги --weird и --chaos со значением 50 сгенерировали грустную собачку стоящую в море.

Если изображение кажется вам слишком обработанным, стилизованным, можно также попробовать использовать такой флаг:

--style raw

Он будет придерживаться вашего описания, но если нет слов-токенов задающих настроение, атмосферу, стилистику – результат может получиться слишком уж raw, сырым и просто неэстетичным.

Другой параметр, влияющий на стилизацию Stylize:

--s N

Где N значения от 0 до 1000, при значении 0 изображение будет никак не обработано-стилизовано. Оптимальные значения часто берут около 350.

Далее мне захотелось из созданных мною материал-бордов сделать примеры интерьера. Задача была использовать эти материалы в простом интерьере с деревянными панелями, латунными акцентами, диванов в зелёном вельвете и столиком с камнем.

Использование AI для генерации концепций (архитектура и дизайн)

Представляя в голове эту картинку, мне хотелось видеть не классический диван, а что-то современное, например икону дизайна Camaleonda Sofa by Mario Bellini, выпускаемый компанией B&B Italia. Сколько я бы не пыталась прописать это в промпте, выходили глупости. Поэтому мне пришло в голову использовать флаг --cref и в качестве персонажа использовать картинку этого дивана без фона. И вот что получилось:

Использование AI для генерации концепций (архитектура и дизайн)

Иногда диван получался очень хорошо, иногда отдалённо, но общая идея сработала: я получила более современный диван и осталась довольна результатом. На первых этапах проекта для проработки общего настроения такие картинки могут “продать” ваш дизайн. Но в последствии проекта с конкретными узлами, деталями, материалами и моделями всё равно придётся прорабатывать визуализатору.

Советы по Midjourney

• Одна из важных функций для понимания “языка” MJ функция /shorten. Во-первых, эта функция предоставит вам 5 аналогов промпта, который будет более эффективным. Во-вторых, поможет понять, какие слова-токены имеют вес, а какие бесполезны.

Использование AI для генерации концепций (архитектура и дизайн)

• Искать фразы, которые будут работать для промпта. Заведите свой файл с фразами, которые работают для вашего стиля. Так вы создадите свою библиотеку фраз и стилей.

• Дублируйте элементы разными описаниями, углубляясь в детали. Например, “Building covered in fabric. The fabric is wrapped around the building”.

• Используйте формулу написания промптов:

Использование AI для генерации концепций (архитектура и дизайн)

Часть 3. Вопросы и ответы

Как сделать визуализацию из эскиза?

Midjourney научили генерировать из эскизов фотореалистичные картинки, но из того что я видела – изображение слишком абстрактно. Делается это с помощью функции Image Reference. Существуют другие платформы, как Invoke.ai и Prome AI, которые обещают сделать хороший рендер из скетча. Возможно, если появится достаточно желающих, следующий гайд по AI будет на тему тестирования пайплайна скетч-фотография.

Как сделать паттерн?

В описании промпта задайте флаг --tile, это создаёт бесшовные паттерны.

Можно ли генерировать в ChatGPT?

ChatGPT тоже умеет теперь рисовать картинки на базе движка Stable Diffusion, но результат вам вряд ли понравится, только если для иллюстраций.

Как можно использовать AI для чертежей?

Существуют некоторые плагины, встроенные в Revit/Archicad/Autocad.

Некоторые из них: Kreo, Togal, Swapp, но они платные, пока что тестировать их не было возможности. Но то, что показывают в рекламных материалах выглядит хорошо.

Единственный плагин, который мне удалось потестировать это визуализации для Revit в Evolve Lab Veras – и честно сказать, результат меня не особо впечатлил, но у меня было всего 20 бесплатных попыток визуализаций для учебного проекта. Если постараться, то пресет для осени выглядел лучше всех, но мне нужно будет его всё равно доработать в Photoshop, чтобы использовать где-либо.

Как сделать видео из картинки?

Лайфхак: если нужны разные ракурсы изображения, можно попробовать использовать видео визуализацию вашей картинки. У меня удивительно хорошо сработал Kling AI (в отличии от Krea AI), там также дают пару попыток бесплатно. Я сделала изображение макета в Midjourney, загрузила его в Kling AI и сделала простое видео облёт вокруг макета. Так у меня появилось и классное видео, и несколько ракурсов макета, которые имеют постоянство, а не генерируются заново в MJ.

Заключение

Тут могло бы быть избитое клише “это всё написал ChatGPT”, но мне нравится писать, поэтому весь текст набираю своими руками. Для чистоты эксперимента я попробовала “скормить” чату свои предыдущие статьи и попросила его написать новую, но никакой новизны не было там, только уже использованные мной ранее отсылки и метафоры.

Одно изображение может занять у вас уйму времени. Пожалуй, генерация нужного изображения за секунды – это миф. Художник может потратить 17 часов на изображение того, что он себе представил в воображении. Стоит подумать, быстрее ли в 3D’sMax собрать картинку с множеством ракурсов и точным отображением всего, что вам нужно, или прибегать к непредсказуемому результату для интерьеров. Всё сильно зависит от задачи.

Такие длинные промпты могут сломать Midjourney, так что не советую так делать, хотя в данном случае сработал хорошо, но картинка была не под конкретную задачу, а абстрактная.
Такие длинные промпты могут сломать Midjourney, так что не советую так делать, хотя в данном случае сработал хорошо, но картинка была не под конкретную задачу, а абстрактная.

Один из постоянно попадающихся мне в рекламе курсов “всего лишь за 159$” – материал-борды в Midjourney. Присмотревшись внимательно на это изображение вижу, что тут наверное десять видов разного дерева. Я не понимаю, кому и зачем нужно изобразить десять видов дерева, а ещё смотрю на размер промпта, который они предлагают нам купить: треть этого промпта просто бесполезна, судя по отчётам команды /shorten.

Рассмотренные платформы обладают ограниченным, по сравнению с MJ, набором функций и параметров, но для первых экспериментов вполне могут подойти. Для углубления нужно будет изучать функционал MJ, команды, флаги, а главное – не бояться результатов, методом проб и ошибок. С опытом вы обретёте собственный метод работы с ИИ, какой для ваших задач удобнее.

Использование AI для генерации концепций (архитектура и дизайн)

Этика невыполнимых проектов.

Архитекторов/дизайнеров часто ругают, что мы делаем красивую картинку, а как это будет в реальности – никто не думает, поэтому на выходе мы получаем совсем не ту эстетику, которая была в проекте. Иногда это зависит не от автора проекта, а от исполнителей, бюджетов и клиента с его “хотелками”. Искусственный интеллект нас отдаляет от реальности ещё больше: если автор нарисовал, но понятия не имеет, как это выполнить в реальности – тут и настанет разочарование, раздутые бюджеты, непродуманность дизайна…

К примеру, мои материал-борды в работе не пригодятся, скорее всего, никогда. Материал-борд это отличный инструмент презентации клиенту проекта, иногда такую подборку реальных материалов передают клиенту при визуализации, иногда перед закупкой мебели или отделок, приходят на объект и прикладывают материалы к строящимся стенам и смотрят, как падает свет. Я не вижу применения материал-борда ИИ в реальной работе, если у вас есть идеи – поделитесь. Клиенты часто справедливо придирчивы к финальному результату. Они сравнивают очень конкретные текстуры на фото и в реальности. Понятно, что добиться постоянства очень трудно в ИИ, по крайней мере, на сегоднящний день. Ну, и потрогать-то нельзя. Остаётся только генерировать красоту и выкладывать онлайн.

Использование AI для генерации концепций (архитектура и дизайн)

Думаю ли я, что ИИ заменит нас? Да, но не в той мере, в которой мы это представляем. Изменения неизбежны, но не пользоваться благами просто непродуктивно в современном мире, требующим от нас делать больше контента, собирать больше охватов, зарабатывать корпорациям больше денег. Если вы не планируете уйти жить в лес, то лучше уметь пользоваться новой технологией.

4
1 комментарий