Анализ потребительских предпочтений с помощью SHAP-модели на рынке HoReCa

Один из Клиентов агентства Paper Planes - сеть ресторанов в Москве, обратился к нам за разработкой стратегии и позиционирования своих заведений.

В рамках поиска формата мы решили проанализировать клиентские предпочтения аудитории, выявить то, какие факторы влияют на оценки пользователей после посещения кафе/ресторана.

Мы обратились к открытым источникам, главным критерием выбора которых стало наличие подробной информации о заведениях Москвы: формат, разновидность кухни, отзывы, стоимость и рейтинг от посетителей. TripAdvisor прекрасно подошел для выполнения данной задачи.

Проблемы подобного решения:

  • Отсутствие возможности выгрузки статистики;
  • Данная статистика не отражает зависимость между критериями заведения и оценками пользователей.

Как мы это преодолели:

  • Разработка парсера, который позволил в оперативном режиме выгрузить все необходимые данные по 9 245 заведениям Москвы;
  • По итогам выгрузки мы построили интерактивный дашборд с общей статистикой.
Анализ потребительских предпочтений с помощью SHAP-модели на рынке HoReCa

Для верной интерпретации графиков развернули SHAP-модель, что позволило выявить корреляцию между характеристиками заведения и оценками пользователей.

Как характеристики заведения влияют на оценку клиента?

Немного о подходе

SHAP расшифровывается как SHapley Additive explanation. Этот метод помогает разбить на части прогноз, чтобы выявить значение каждого признака. Он основан на Векторе Шепли, принципе, используемом в теории игр для определения, насколько каждый игрок при совместной игре способствует ее успешному исходу.

SHAP можно использовать для разных целей, при анализе параметров ресторана, как в нашем случае, или, например, в HR-аналитике, чтобы сформировать портрет сотрудника, который с наибольшей вероятностью покинет рабочее место. Везде, где необходимо кластеризовать большие данные и найти взаимосвязи между группами параметров.

Что мы получили

Анализ потребительских предпочтений с помощью SHAP-модели на рынке HoReCa

Полученный график интерпретируется следующим образом:

По Y оси - сила влияния конкретного фактора на рейтинг: чем выше находится строчка (в красной зоне), тем сильнее она влияет на оценку посетителей.

Точки внутри - это конкретные рестораны, которые подпадают под данный критерий.

Чем больше красных точек сбивается вправо, тем позитивнее сказывается параметр на оценке заведения и наоборот.

По итогам анализа мы выделили критерии, положительно влияющие на рейтинг ресторана:

• Гастропабы;

• Итальянская кухня;

• Современная;

• Здоровое питание;

• Барбекю

• Восточно-европейская кухня

Именно такие заведения в среднем гораздо чаще получают высокую оценку. А заведения японской кухни, фастфуд или кафе Клиенты оценивают более активно, но уже в негативном ключе.

В итоге с помощью моделирования и анализа клиентского опыта мы решили выстроить позиционирование Клиента в тематике восточно-европейской кухни.

Таким образом, используя только открытые источники данных и собственные наработки, мы смогли сформировать позиционирование и стратегию для нашего Клиента, а также провести анализ потребительских предпочтений и выявить актуальные тренды в сфере HoReCa.

44
2 комментария

эммм. т.е. речь о визуальной оценке массива данных указывающего на частотность параметро в той или иной категории? (честно, с первого раза не очень понял shap суть). циферно же можно выразить? в такой категории позитивных отзывов больше чем негативных. сумма, среднее и тп

Если врубиться (что непросто) - то сама методика - топ!