Применимы ли нейросети в автобизнесе? Эксперимент с дизайном изображений

Совсем недавно нейросети были просто забавой, а сегодня их уже считают полноценными и эффективными помощниками человека. Они активно помогают нам не только в механической работе, требующей точности, например, в изучении огромного массива данных, но и в различных креативных задачах – писать стихи, сценарии и рекламные слоганы, создавать мелодии и различную визуализацию. За считанные минуты алгоритмы рисуют качественные (или не очень) изображения по практически любым текстовым запросам. Технический директор Kodix Automotive Андрей Масленников протестировал несколько сервисов и сгенерировал целый альбом картинок с автомобилями. Делимся с вами результатом и своими выводами о том, чем нейросети могут быть полезны автодилерам. Если могут.

Для начала коротко о том, как работает алгоритм. Если говорить простыми словами, нейронная сеть (она же artificial neural network) – разновидность машинного обучения, при котором программа работает по принципу человеческого мозга, состоящего из нейронов, связанных между собой синапсами и передающих электрохимические импульсы. В нейросети роль нейронов выполняют вычислительные элементы, которые имитируют мозг человека. Нейросеть состоит из моделей и данных для обучения, которое может быть как автоматизированным (например, в случае обучения игры в компьютерные игры), так и ручным (например, когда нужно подтвердить, что «вы не робот» и выбрать картинки с автобусами на Google Capcha). Таким образом нейросеть формирует в себе цепочки связей – вот это похоже на автобус, а это на машину.

Ежедневно работая с сайтами автодилеров, мы задумались, а может ли эта технология заменить или упростить жизнь дизайнерам и маркетологам дилерских центров?! Представьте: вы маркетолог в ДЦ, и вам необходимо быстро запустить креативную рекламную кампанию в сети с изображениями Nissan, который дрифтует на закате. Вместо того, чтобы ставить задачу дизайнеру, вы открываете сервис, вбиваете запрос на английском “Nissan doing drifting by the sunset” и через минуту получаете готовые картинки. Это реальность сегодняшнего дня. Но действительно ли нейросети уже можно использовать дилерам для решения маркетинговых задач? Давайте проверим.

DALL-E Mini

Разработчики DALL-E Mini научили алгоритм довольно точно «рисовать» по текстовому описанию. Сервис не требует авторизации и специальных настроек, а также требований к вычислительным мощностям. Нейросеть генерирует по тексту сразу девять картинок – так можно увидеть разные попытки изобразить задумку – идеальный формат, чтобы визуализировать любую даже самую безумную идею.

Вот, например, мы фантазировали о рекламной кампании BMW, приуроченной к самой ожидаемой премьере – приквелу сериала «Игры Престолов» «Дом дракона». Как вам такой визуал?

BMW + game of thrones
BMW + game of thrones

Вот еще варианты, сгенерированные с помощью DALL-E Mini:

BMW on the sunny road
BMW on the sunny road
Volkswagen in the Grand canyon
Volkswagen in the Grand canyon

Где попробовать: сайты Dall-e Mini и Craiyon, телеграм-бот

MidJourney

Сервис генерирует четыре варианта картинок под текстовый запрос. Некоторые результаты поражают деталями и проработкой. Правда, чтобы получить картинки, необходима регистрация в популярном у разработчиков, дизайнеров и геймеров мессенджере Discord: текст нужно направить боту в чат, а в ответ он пришлёт сгенерированные изображения. Разработчик MidJourney Дэвид Хольц неспроста выбрал доступ к сервису через мессенджер: он считает, что люди охотнее фантазируют, когда собираются вместе, и срабатывает групповой принцип работы.

Бесплатная версия MidJourney позволяет сгенерировать и скачать до 12 изображений, но не дает доступ к личному кабинету.

Мы попросили нейросеть нарисовать BMW m8 в лучах солнца, BMW m5, а также Nissan Qashqai в полях – получилось довольно качественно и узнаваемо.

BMW m5
BMW m5
BMW m8 in front of sunlight
BMW m8 in front of sunlight
Nissan Qashqai car on a road surrounded by wheat fields
Nissan Qashqai car on a road surrounded by wheat fields

Где попробовать: discord-сервер проекта

Stable Diffusion

Не так давно сервис завершил бета-тест, и теперь его могут опробовать бесплатно и почти без ограничений все желающие. Благодаря реалистичным результатам и тонкой настройке текстовых запросов данную нейросеть сразу назвали новым конкурентом главных инструментов на рынке – DALL-E 2 и Midjourney.

Нейросеть самостоятельно фильтрует изображения в зависимости от того, насколько они «красивы». Затрудняемся сказать, по каким критериям оценивается «красивое», но нам результат понравился:

Где попробовать: на сайте производителя или Hugging Face - без ограничений и регистрации

– Все протестированные сервисы довольно просты в использовании – введите нужный текстовый запрос и получите изображение. В целом, мне больше всего понравилась сеть MidJourney – на мой взгляд, она сгенерировала интересные картинки. В Discord’e можно найти большое количество ранее сгенерированных изображений и выбрать подходящее. Что касается автотематики, то на данный момент автомобили генерируются нейросетями достаточно странно – отсутствуют узнаваемые знаки (например, логотипы брендов), многие авто на изображениях имеют по 1 двери или не имеют колёс. Так что говорить о полноценной замене дизайнера нейросетями пока что рано. А вот использовать их как вспомогательные инструменты вполне реально. Сервисы могут стать огромным источником для вдохновения. Так, например, нарисованные нейросетями пейзажи выглядят достаточно реалистично и симпатично.

Андрей Масленников, технический директор Kodix Automotive
road surrounded by the forest
road surrounded by the forest
road to the sea
road to the sea

Мы решили немного поэкспериментировать и использовали синтез искусственного интеллекта и человека: нейросеть нарисовала пейзаж, а дизайнер поместил туда автомобиль. Результат очень даже порадовал:

<p>hyperrealistic_surreal_hellish_landscape_red_storm</p>

hyperrealistic_surreal_hellish_landscape_red_storm

Нейросеть + Дизайнер
Нейросеть + Дизайнер

В процессе подготовки было довольно просто нагенерировать фоны из текстовых описаний и вставить в итоговое изображение автомобиль.

Что можно сказать по итогам? Конечно, нейросеть не заменит дизайнеров (особенно в автобизнесе), но уже сейчас этот инструмент может упростить им работу, решив проблему отсутствия подходящего контента на фотостоках.

11
Начать дискуссию