И мы начали собирать сырые данные о поведении пользователей, на тот момент ещё плохо понимая, что будем делать с ними в дальнейшем. Собирали буквально всё: открытия карточек товара, просмотр изображений товара, доскроливание до того или иного блока на сайте, взаимодействие с этим блоком, фиксировали время затраченное на все эти операции, и, конечно же, привязывали это всё к id пользователя.
Комментарий недоступен
Если уходить совсем в математику, то для выделения фич из изображений использовали нейросетевой классификатор без верхних (полносвязанных) слоев, а для расчета рекомендаций для кластеров пользователей вычисления проходили в 2 этапа. На первом происходила непосредственно кластеризация пользовательских данных методом k-средних, а на втором – прогнозирование рейтингов товаров для каждого кластера методом Non-Negative Matrix Factorization (NNMF) с методом инициализации “nndsvd” и методом численного решения “Multiplicative Update solver”.
В общем, можно сказать что использовали ИИ )