На самом деле, текущий кейс сильно слож с задачей от Aliexpress, которую мы описывали ранее. Снятое качественное изображение товара надо определить на фотографии, вырезать целиком и вставить в нужный нам фон с учетом его позиции, света и других важных факторов, . В целом, это вписывается в задачу обработки rich-контента для коммерческих целей.
Stable Diffusion действительно кажется перспективным решением, у них уже есть обноавление и это можно реализовать еще проще. Но да, вижу, что кейс не совсем свежий