Реальный кейс: съемка костюма-сауны для карточек на WB с помощью нейросети
В мире электронной коммерции визуальный контент играет ключевую роль в привлечении внимания покупателей. Особенно это актуально для маркетплейсов, где качественные фотографии товара могут значительно повысить продажи.
Сегодня хочу поделиться историей одного из наших недавних заказов, который наглядно демонстрирует, как работают нейросети и с какими сложностями иногда приходится сталкиваться:)
Заказчик и задача
Заказчик: продавец на Wildberries
Товар: костюм-сауна.
Запрос: создать 10 фотографий для карточек товара, где мужчина в этом костюме занимается на тренажерах или находится в спортивном зале.
Важно было показать как динамичные сцены, так и статичные изображения, чтобы продемонстрировать товар с разных ракурсов и в разных ситуациях.
Подход к выполнению задачи
Для создания визуального контента у нас есть два основных варианта:
- Генерация изображений на уже готовой модели. У нас есть библиотека ИИ-моделей мужчин и женщин, которые идеально подходят для демонстрации одежды.
- Создание индивидуальной модели человека. Этот вариант подходит, если заказчик хочет использовать конкретного человека для показа товара.
После обсуждения заказчик выбрал первый вариант, что позволило нам сразу приступить к работе.
Генерация костюма-сауны
Исходные фотографии костюма, предоставленные заказчиком, были высокого качества: студийные снимки, сделанные на человеке. Это значительно упростило процесс генерации LoRa-модели костюма.
Однако мы столкнулись с одной сложностью, которая часто возникает при работе с нейросетями.
Проблема с логотипом
Нейросети, как правило, плохо справляются с распознаванием и воспроизведением мелких деталей, таких как логотипы, надписи или буквы. Для ИИ это "неопознанные объекты", которые сложно корректно интегрировать в изображение. В нашем случае логотип на костюме-сауне не считывался нейросетью, что требовало дополнительной обработки.
Вот здесь на изображениях логотип не соответствует оригиналу на 100%, что требует дополнительной обработки:
Мы нашли решение: после генерации изображений мы использовали профессиональный графический редактор, чтобы вручную наложить логотип на несколько фотографий. Это позволило нам показать заказчику, как будет выглядеть конечный результат.
Обратная связь от заказчика
После отправки изображений на согласование мы получили неожиданный ответ: заказчик попросил убрать логотип с фотографий. Причины этого решения остались для нас загадкой — возможно, логотип планируется изменить, или его размер и расположение будут скорректированы в будущем. В любом случае, мы оперативно внесли правки, убрав логотип со всех изображений.
Итог работы
Заказчик остался очень доволен результатом:
в своем отзыве он отметил, что мы выполнили работу на 100% в соответствии с техническим заданием:)
Если моя статья была полезна - обязательно поставьте лайк и заходите на телеграм канал - еще больше интересного о генерации изображений и нейрофотосессиях в телеграм канале :)