Как мы сделали 1000 картинок почти в два раза дешевле обычного благодаря нейросети

Привет! На связи креативный продюсер Наташа Лиликова и старший дизайнер Миша Горлов из Авито. В конце прошлого года у нас возникла большая задача — заменить контурные иконки в поисковых подсказках на цветные привлекательные изображения. За 4 недели нужно было создать 1044 картинки. Рассказываем, как нам удалось решить задачу с помощью нейросети и сэкономить более 350 000 ₽.

Почему мы использовали нейросеть

Раньше мы уже делали подход к дизайну подсказок на поиске, и наши исследования показали, что люди чаще переходят внутрь категории, если подсказка сопровождается цветной картинкой. Наши иконки были контурными, так что мы приняли решение их поменять.

Так иконки выглядели изначально
Так иконки выглядели изначально

Обычно для подобных задач мы пользовались стоками, но у них есть ряд существенных недостатков:

💰 Они дорогие.

🖼 Если нужно много разных изображений, они почти наверняка будут неоднородными: с разными ракурсами и освещением, так что их придётся ретушировать и обтравливать.

🕐 Искать изображения на стоках долго, и можно не найти ничего подходящего.

У нас были сжатые сроки — всего 4 недели, за которые надо было сделать 1044 картинки. Единственным вариантом решения задачи была нейросеть, и мы использовали Midjourney.

Почему мы так решили:

✅ Подписка на Midjourney на порядок дешевле стоков — наш PRO-вариант обходится в 60 $ на одного пользователя. Базовые начинаются с 10 $.

✅ Можно генерировать изображения на нужном фоне и в нужном ракурсе и получать консистентные картинки.

✅ Создание картинки занимает максимум 15 минут — это быстро по сравнению с поиском на стоках.

Как происходил процесс создания картинок

Год назад мы уже начали тестировать Midjourney по предложению Вити Лушина, руководителя дизайна горизонталей, и описали свои наблюдения и рекомендации в Фигме: что можно генерировать, а что нет, как получить годные картинки. Эта масштабная задача на 1044 изображений стала первым практическим применением наших заготовок.

Мы создали три аккаунта для трёх наших подрядчиков и провели с ними ознакомительную встречу, на которой рассказали, что и как делать.

Сам процесс генерации был несложным. Запрос в нейросеть состоит из трёх сегментов:

🤖 Описание сцены в виде предложения. Например: A medium shot of a third-quarters view Blue 2019 BMW 330i G20 on the St Peterburg Street

🤖 Перечисление необходимых характеристик в свободной форме. Например: summer noon, natural daylight

🤖 Строгие параметры, через которые можно регулировать, например, соотношение сторон, стилизацию, версию модели: --seed 1 --ar 16:9

Вот такая картинка получится по этому запросу
Вот такая картинка получится по этому запросу

Мы хотели получить объекты на белом фоне, потому что нам надо было их обтравливать. Поэтому общая формула нашего запроса была вот такой: описание сцены (object description), белый фон (on white background) и параметры по ситуации (--v 5.2):

Общий пример нашего описания
Общий пример нашего описания

Сложных сцен у нас не было — в основном объекты, поэтому нужную картинку получали после 1–2 итераций. Например, так делали иконки с корги, монетами, чемоданом.

Ещё несколько наших примеров
Ещё несколько наших примеров

Но не все запросы были такими простыми. У нас встречается разное оборудование, например, для электрокардиографии — для него тоже нужны иллюстрации. Такие специфические запросы мы переводили через Deepl — AI-переводчик.

Бывало, что Midjourney не понимала переводы, поэтому мы пользовались обратным переводом. Закидывали в чат-бот картинку, которую нашли в Яндекс.Картинках, просили Midjourney описать её, а потом добавляли в наш запрос элементы из её описания.

Эти 24 картинки медицинского оборудования сгенерированы нейросетью. На стоках трудно найти что-то подобное
Эти 24 картинки медицинского оборудования сгенерированы нейросетью. На стоках трудно найти что-то подобное

Ещё классные примеры работы нейросети — иллюстрации для разных столярных изделий. Маловероятно, чтобы мы нашли их на стоках.

Как мы сделали 1000 картинок почти в два раза дешевле обычного благодаря нейросети

Брус, штапик, вагонка, горбыль и другие столярные изделия в исполнении нейросети

Классно получились и сыпучие материалы. Вероятность найти на стоках изображения торфа, щебня, чернозёма, керамзита и других материалов в одном стиле и одном ракурсе почти нулевая.

В изображении сыпучих материалов нейросеть превзошла ожидания
В изображении сыпучих материалов нейросеть превзошла ожидания

Конечно, у нейросети бывали и ляпы. Но многие из них некритичные или почти незаметные, особенно учитывая формат наших картинок — 40х40 пикселей.

Слева — старые контурные иконки. Справа — новые картинки, которые нам помогла собрать нейросеть
Слева — старые контурные иконки. Справа — новые картинки, которые нам помогла собрать нейросеть
Все 1 044 картинки, сгенерированные для разных категорий товаров
Все 1 044 картинки, сгенерированные для разных категорий товаров

Сколько денег сэкономила нейросеть

Подписка на стоке на 1000 картинок стоит 8 000 $ — на момент работы с иконками это было примерно 800 000 ₽. Получается 800 ₽ за картинку, если не считать ресурса дизайнеров на поиск и обтравку изображений.

Пять подписок Midjourney на месяц обошлись нам в 300 $, плюс мы оплатили работу подрядчиков. В итоге потратили 438 000 ₽ — или 420 ₽ за картинку.

💰 Экономия составила 800 000 − 438 000 = 362 000 ₽

1111