{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Epoch8.co — рекомендательная система для интернет-магазина на основе машинного обучения

Как нам удалось в два раза увеличить конверсию из просмотра товара в покупку по сравнению с лучшим рекомендательным алгоритмом в интернет-магазине нашего клиента.

Задача построения персонализированных товарных рекомендаций для интернет-магазина уже давно решена: на рынке есть много игроков, которые предлагают рекомендательные сервисы, и много открытых библиотек, которые позволяют реализовать рекомендательный функционал самостоятельно.

Однако интернет-магазины эволюционируют: товаров в магазинах становится больше, чем покупателей, ассортимент быстро меняется. Далеко не все рекомендательные алгоритмы могут хорошо работать в таких условиях.

Как работают классические алгоритмы рекомендаций, и когда они ломаются

Классические алгоритмы рекомендаций работают так: машина ничего не знает про товар, кроме его идентификатора в базе.

Когда пользователь взаимодействует с товаром, алгоритм получает обучающие данные вида «человек посмотрел товар номер 1 и 2, затем купил товар номер 3; буду всегда рекомендовать товар номер 3 после просмотров 1 и 2» или «человек купил товары 3 и 4, наверное, это близкие товары, надо их рядом показать».

Этот подход хорошо работает, когда товаров существенно меньше, чем покупателей: в этом случае для каждого товара есть история просмотров и покупок, и алгоритму хватает данных для подбора хороших рекомендаций.

Но что делать, если товаров в вашем интернет-магазине гораздо больше, чем посетителей или товарный ассортимент очень часто меняется? Так бывает, если у вас, например, маркетплейс китайских товаров, магазин одежды с большим количеством новинок или доска объявлений, где каждый «товар» (объявление) уникально.

Альтернативный подход к формированию рекомендаций

Нам хотелось бы, чтобы рекомендательный алгоритм работал так, как работает человек, которого попросили что-то порекомендовать.

Представим себе, что Алиса зашла на сайт крупного интернет-магазина bizon.ru с задачей подобрать хороший подарок на день рождения своему другу Бобу.

Сначала Алиса оценивает ассортимент магазина, чтобы понять, из чего выбирать.

Затем она вспоминает интересы Боба, например, так: «Боб любит экстремальный спорт, фотографировать и собирает коллекцию курительных трубок».

Курительных трубок на bizon.ru нет, поэтому Алиса выбирает подарки, связанные с экстремальным спортом и фотографией.

Это Боб и его интересы (по мнению Алисы)

Дальше Алиса разными способами фильтрует товары на bizon.ru и оценивает, насколько найденные товары соответствуют интересам Боба. Для этого каждый товар, который она просматривает, она оценивает по двум параметрам: насколько он «про экстремальный спорт» и насколько он «про фотографию».

GoPro: подходит для экстремальных съемок, фотографировать тоже что-то умеет.
Рация: пригодится «экстремальщику» в путешествии, а фотографу не нужна.
Умные часы: могут принести какую-то пользу «экстремальщику», а фотографу, скорее всего, не нужны.
Polaroid: не нужен «экстремальщику», зато может быть приятным аксессуаром для фотографа.
Дрон с фотокамерой: хорошо подходит и «экстремальщику», и фотографу.

Таким образом, у Алисы формируется список потенциальных подарков Бобу, отсортированных от самого подходящего к наименее подходящему.

Если бы на месте Алисы была машина, которая может просмотреть весь ассортимент интернет-магазина, оценить каждый товар и разложить их от самого подходящего к наименее подходящему, то мы получили бы очень релевантный набор рекомендаций для Боба.

Реализуем этот подход на практике

Мы хотим, чтобы наш рекомендательный алгоритм работал как Алиса, то есть понимал «смысл» товаров и суть интересов пользователя.

Мы реализовали такой подход к рекомендациям для одного из наших клиентов — крупного маркетплейса китайских товаров.

Сначала мы проанализировали все товары в маркетплейсе и выделили для каждого товара набор его ключевых характеристик на основании его описания, фотографий и категории.

Когда покупатель просматривает какой-то товар, алгоритм фиксирует интерес покупателя к набору характеристик, которые есть у этого товара. Чем больше товаров смотрит покупатель, тем лучше алгоритм понимает профиль его интересов (а его базовые предпочтения становятся понятны уже после нескольких просмотров).

Затем для каждого покупателя мы построили его личный список рекомендаций, отсортировав товары по их близости к профилю интересов покупателя.

В течение первых минут работы рекомендательной системы «в бою» мы получили характерные профили покупателей.

Типичный женский профиль
И это тоже типичный женский профиль
Похоже, что этот покупатель — техногик
А этот профиль похож на профиль автолюбителя

Метрики

До внедрения нашего алгоритма самым успешным рекомендательным алгоритмом в маркетплейсе был «топ продаваемых товаров». Он показывал самые популярные товары маркетплейса за последние сутки: список, который очень быстро обновлялся и выражал сиюминутные интересы всех покупателей.

Когда мы запустили наш алгоритм на основе машинного обучения, выяснилось, что он показывает конверсию из показов в покупку в два раза выше, чем «топ продаваемых товаров».

Преимущества такого подхода к построению рекомендаций

  • Для того, чтобы рекомендательная система заработала, нам не нужна история просмотров и покупок товара: алгоритм работает с «сутью» товара, а не с его безликим численным id.

  • Нет проблемы «холодного старта»: рекомендательная система начинает работать очень быстро: пользователю достаточно посмотреть 3-5 товаров, чтобы профиль пользователя заполнился, и алгоритм начал понимать его интересы.

  • Рекомендательная система может работать даже с плохой текстовой информацией, например, с наименованиями товаров в чеке.

Сложно ли интегрироваться?

Супер-просто.

Сначала мы забираем фид товаров вашего интернет-магазина и историю покупок товаров.

Затем мы выставляем для вас API с тремя методами:

  • Появился новый товар;

  • Пользователь просмотрел товар;

  • Дай мне рекомендации для такого-то пользователя.

Вы отправляете нам информацию о появлении новых товаров в вашем магазине, о просмотрах и покупках товаров пользователями, а взамен получаете список рекомендованных товаров для этого пользователя.

Хочу тестировать, куда писать?

Пишите: [email protected] (мы пока в альфе, поэтому подключаем клиентов вручную).

0
20 комментариев
Написать комментарий...
Valentin Dombrovsky

Вы внедрили рекомендательную систему в магазин, который по сути работал без неё и получили супер-результат. Здорово, великолепно. А теперь дайте свои метрики по сравнению, скажем, с https://retailrocket.net/

Ответить
Развернуть ветку
Epoch 8
Автор

Валентин, retailrocket рассматривался как альтернатива нашей разработке заказчиком, но не подошел, так как не решает задачу "пересортировка результатов фильтрации".

То есть наше решение встраивается в листинг не отдельным блоком типа "те, кто смотрел это еще смотрят другое", а сам порядок объектов в листинге меняется в соответствии с результатом работы системы персонализации.

Как пример: главный экран сервиса Wish или Joom, перечень и порядок объектов на этом экране - результат персонализации, он меняется в зависимости от вашего поведения.

Ответить
Развернуть ветку
Nikita Rogatov

"До внедрения нашего алгоритма самым успешным рекомендательным алгоритмом в маркетплейсе был “топ продаваемых товаров”"
может это не ваша заслуга а косяк маркетплейса?

Ответить
Развернуть ветку
Epoch 8
Автор

На самом деле аккуратная эмпирика вида "товары у которых идет рост популярности за последний час/день/неделю" - очень хороший способ оперативно реагировать на сезонные тренды и другие ситуации которые не были представлены в обучающих данных.

Более того, вне зависимости от персональных предпочтений возможны ситуации, когда тренд-товары становятся релевантнее, например, рождество и соответствующий сдвиг в поведении пользователей.

В этом конкретном маркетплейсе кроме нашего решения стояла еще одна система персонализированных рекомендаций, которая сильно проигрывала "топу продаваемых товаров" по итогам А/Б теста.

Ответить
Развернуть ветку
Nikita Rogatov

А если не секрет (я понимаю что это скользкая тема), как вы разделяете то value что дает ваше решение и остальное? например рекламные кампании стартующие одновремено с вами и тп

Ответить
Развернуть ветку
Epoch 8
Автор

A/Б тестирование разных стратегий рекомендации (не только нашей, но и конкурирующих) + система атрибуции покупки к конкретной стратегии.

То есть: в тот момент когда человек видит конкретный товар, мы знаем какой стратегией он был подготовлен, эта атрибуция сохраняется при добавлении товара в корзину и оформлении заказа.

После этого можно построить метрики для каждой стратегии:
- отношение количества показов к переходу в карточку товара
- отношение показов к оформленным заказам
- отношение показов к выручке

Ответить
Развернуть ветку
Денис Демидов

Если вы будете работать только по API, то круг ваших клиентов будет исключительно из маленьких магазинов, средним и крупным не вариант зависеть от стороннего, молодого сервиса.

Ответить
Развернуть ветку
Epoch 8
Автор

Мы предусматриваем возможность размещения системы в контуре у заказчика. Единственный нюанс - для переобучения потребуются сервера с GPU.

Ответить
Развернуть ветку
Е. К.

Все это очень водянисто... Нет цифр.... Для нормальной работы систем машинного обучения трубуются не "киллограммы", а "тонны" данных. Т.е. это не тысячи, а миилионы покупателей (не просмотров товаров). И тут возникают противоречия:
* маленькому магазину вы не сможете поднять конверсию в сравнении с его блоком "с этом товаром покупают"
* кропному магазину вы вряд ли уже нужны. Так как если он дорост до такого размера то скорее всего с системами рекомендации у них все в порядке...

Ответить
Развернуть ветку
Виталий
>> Этот подход хорошо работает, когда товаров существенно меньше, чем покупателей

А вот и нет)

Ответить
Развернуть ветку
Andrey Tatarinov

Виталий, вы не могли бы раскрыть что именно имеете ввиду?

Ответить
Развернуть ветку
Виталий

Я имею ввиду, что оно может нормально работать не только когда покупателей больше чем товаров.

Ответить
Развернуть ветку
Epoch 8
Автор

Виталий, все верно, спасибо за уточнение.

Более корректным утверждением было бы "системы рекомендаций на основе идентификаторов работают хорошо, когда объекты рекомендации хорошо покрыты действиями пользователей и пользователи демонстрируют нетривиальное поведение (взаимодействуют больше чем с одним объектом)". В типовом случае это примерно то же самое, что и "пользователей больше чем товаров". :)

Ответить
Развернуть ветку
Андрей Евстафьев

Удивили повара подбором продуктов! Если я беру свиную шейку и уголь, то любая нормальная система сразу предложит шампуры, мангал, киви и кефири для маринада. И никаких градаций по маркерам предпочтений - человек собрался на шашлыки.
А в другой раз я куплю ингредиенты для борща - и у вашего API сорвёт крышу...

Ответить
Развернуть ветку
Epoch 8
Автор

Андрей, скорее всего нет.

С большой вероятностью в этой гипотетической ситуации в качестве рекомендаций вы получите микс товаров для борща и шашлыков (так как шашлыки еще остались в вашем профиле предпочтений), но с перевесом на борщ (так как борщ был более новой группой событий).

Ответить
Развернуть ветку
Андрей Евстафьев

Ну как же... Утром мне готовить манную кашу, я покупаю манку и хорошее мороженое (лайфхак для каши), но не беру молоко, оно есть. Система всё равно подумает что шашлыки - если будет знать, что я планирую мясо в манке (для корочки, кста). А поймёт ли она, система, что подготовка идёт к каше. Или наоборот - к шашлыкам вместо каши?

Ответить
Развернуть ветку
Nikita Rogatov

Лук и уксус! Никаких хипстерских шашлыков на киви!!!

Ответить
Развернуть ветку
Андрей Евстафьев

На вкус и цвет...

Ответить
Развернуть ветку
Artem Bochkov
Когда покупатель просматривает какой-то товар, алгоритм фиксирует интерес покупателя к набору характеристик, которые есть у этого товара. Чем больше товаров смотрит покупатель, тем лучше алгоритм понимает профиль его интересов.

О каких характеристиках идёт речь? Чтобы это работало, нужна подходящая разметка товаров, в вашем примере это "Экстремальность" и "Фотографичность".
В реальном мире в базе магазина для товаров лежат какие-нибудь измерения типа материала, цвета, толщины, веса, ширины, дальности, объёма и "наличия чехла".

Ответить
Развернуть ветку
Liza Danilina

Netflix фильм про обманщицу

Ответить
Развернуть ветку
17 комментариев
Раскрывать всегда