«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

За последние 5-7 лет стал абсолютно ясен тупиковый путь развития описательных моделей ЦА, основанных на социльно-экономических характеристиках групп людей для прогностических моделей потребительского поведения.

Так, условный Вася из сегмента: "М,20-24, МСК, BC+, 60-80 т.р, холост" - в локальных ситуациях может иметь широчайший спектр потребительского поведения. В этой ситуации намного перспективнее выглядят поведенческие подходы, но они сложны и редко связаны с друг с другом в какой то цельный метод.

Существует проблема взаимной интеграции карт путешествия клиента с разметкой аудиторных сегментов по методологии Jobs To Be Done. И не говорите что нет.

Об этой проблеме и речь.

Возьмем пример:

Дано: интернет-магазин, SKU штучек 300-350, россыпь платформ (VK, FB, INST, YouTube, программатик, смс, email-цепочки, etc.), продажи закрываются через сайт, внутри, как водиться цели и метки, по всей воронке (CJM будем считать есть).

Для товарных категорий определены свои матрицы потребностей (будем считать что JTBD по группам товаров у нас тоже есть).

Вот тут то и начинается самое интересное. Классические подходы никак не увязывают то, как путешествует клиент и то, какую свою проблему он решает. (кроме связки "сообщение-продукт")

Пробуем разобраться.

Будем считать совокупность измеримых показателей (точек) поведением.

Представим, что получили ряд точек данных:

Видел креатив A

На платформе Б

Через рекламную систему В

Перешел на страницу товара Г

Посмотрел характеристики Д

Пошел шляться на другие товары Е

Свалил Ё

Глянул креатив Ж

Ретаргет на платформе З

Завернул опять на товар И

Закинул в корзину Й

Выбрана доставка курьером К

Оплатил товар Л

Доставка осуществлена М

Отзыва нет Н

Таким образом, у нас есть отпечаток поведения, само собой в матричном виде:

«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

Как астрономы до середины 20 века, изучаем то, что видим, то что светиться.

Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты:

«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

Мне по душе вот такое представление:

На этом этапе, мы знаем:

  • Где человек был и/или чем был занят (условно: “Вася сидел в ВК в 15:45”).
  • Какой креатив видел (на какой отреагировал)
  • На что нажимал и куда переходил
  • Что купил и смотрел.
  • Когда и как быстро это случилось

Теперь возьмем когорту матриц-отпечатков, путем сравнения отпечатков мы сможем увидеть как поведенческие паттерны кластеризируются вокруг узловых линий (CJM) и опорных точек конструкции маркетинга компании (маркетинговые платформы, точки контакта), это мы знали и раньше, как минимум эмпирически, но используя метод обратных взвешенных расстояний мы увидим не только общие места, но и похожие и различные отпечатки-поведенческие модели.

Соберем их в группы:

«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

Возьмем данные по ARPU/LTC (у меня еще там CAC) по тем же когортам и ранжируем их.

«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

На этом этапе, подмывает попробовать найти возможность масштабировать клиентов из шорт листа отпечатков, этому многих научили все эти системы LAL, я бы не рекомендовал увлекаться, это создаст более эффективный маркетинг на коротком промежутке времени, но и более хрупкий бизнес, зависимый от объема узкого аудиторного сегмента, лучше сделать стабильную структуру, хоть в нашей стране так и не принято, куда кудрявее дать быстрый прирост, состричь купоны и уехать в закат, до того, как шефу принесут отчет с VAR.

Варианты использования (тут выстреливает ружье (JTBD), которое я повесил в начале).

1. Сопоставим с группировками (так звучит куда круче) отпечатков - креативы/площадки, оптимизируем распределение бюджета в попытке увеличить тем самым LTV на когорте.

2. Оптимизируем воронку/CJM под группировки: креативы, посадки, формулировки и.т.д которые "зайдут" именно им.

3. Рассмотрим подробнее ключевые для группировок точки карты путешествия клиента. Возможно, найдутся ключевые точки, критичные для важных группировок клиентов (система оплаты, путаная карточка товара etc.)

4. Рассмотрим матрицы JTBD и сопоставив их с группировками сделаем предположение о том, какие реальные потребности генерируют для нас максимальный объем привлеченных через маркетинг денежных средств.

Пример реализации подхода №1 (easy):

Мы можем распознать поведенческий паттерн до его завершения и завесить экран посетителя ловцом лидов до его ухода.

Пример реализации подхода №2 (hard):

Распознав "гастролера" в интернет магазине, не тратим деньги на ретаргет по его группе т.к. вероятность покупки минимальна.

Пример реализации подхода №3 (impossible):

Мы догоняем человека с распознанным паттерном поведения подстроенными под него креативами/правильной серией имейл рассылки (если собрали почту).

Etc.

Вместо заключения

Система сырая и у меня выдает в среднем только 5-6% дополнительной доходности, при 7-10% более оптимизированного бюджета.

Я говорил выше именно про высоконагруженные системы с оминканальностью и приличным пулом SKU, только в таком случае имеет смысл использовать необходимые аналитические системы корпоративного уровня, нанимать разработчиков на питоне и.т.д, но именно на размере прирост в 5-6% доходности и экономия 7-10% объема инвестиций в маркетинг даст достаточное количество миллионов, чтобы игра стоила свеч.

Буду рад, если кто то "докрутит", предложит свой вариант реализации аналитики или просто оскорбит меня в комментах, если что не так.

1212
8 комментариев

Все отлично, но практически не применимо если мало данных.

2

На малых данных вообще ничего толкового не применимо )))

Кластеризовать можно иначе. Возможно, иная кластеризация даст качественно другой результат. Вроде стандартная кластеризация/классификация сейчас считается случайным лесом. Обратные расстояния это видимо свёртка, тоже в принципе стандартный подход.
Тюнить можно и распознавание паттерна, об этом в статье вроде ни слова.
Ну и конечно постоянное изменение/тестирование CJM никто не отменял. 
Ну и сегментировать тоньше и на этом ещё пару % добавить. 

1

Интуиция подсказывает, что где-то за все своем этим хаосом из слов и обрывков иллюстраций прячутся интересные идеи. 

Вы же пишите статью чтобы ее не просто прочли, но сделали что-то ещё? Сейчас не хватает  деталей во многих местах. Вот к примеру пишите: "Таким образом, у нас есть отпечаток поведения, само собой в матричном виде". Что у вас в строках и столбцах матрицы? Или сразу после: "Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты" - аналогичный вопрос к иллюстрации. Далее когорты, по времени первого визита? Или источник + время? И в завершение, ещё один пик неопределенности - вы предлагаете нам поверить, что поведенческие логи сами собой кластеризуются. 

Прошу не принимать близко к сердцу мою прямоту, то сейчас ваши заметки бесполезны. Проявите толику заботы о читателе и упакуйте все это в связный текст. Пожалуйста.

Ринат, спасибо за замечания. Писатель из меня и правда довольно сомнительный, по этой причине никогда ранее ничего не публиковал, а сейчас просто душевный порыв, но верю, что мой уровень со временем станет лучше, если продолжу.

По существу:
Как раз не хотел писать какую либо инструкцию, пока система сыровата. Скорее как раз покидать идей "на подумать". 

Маленькая таблица: слева до времени идут отметки тригеров (целевых действий, которые мы посчитали), справа от времени - сколько таких действий в других когортах, идея в том, что если вычеркнуть общее - останется разность поведения. 

Большая таблица: все тригеры и все когорты, цифра в ячейках - результат сравнения всех данных когорты с исследуемым). 

Когорты в данном случае по первому целевому действию (что не равно источнику, но часто связано). 

Логи, конечно, сами собой не кластеризируются, но репрезентативность данных можно проверить радикально влияя на рекламные системы и сравнивая результат. 
История в том, что люди, из разных источников и сегментов, пришедшие по одним креативам к одному продукту созданным в рамках А/B тестов ведут себя по разному в дальнейшем. На выборке в 12000 человек - паттернов у меня вышло 21, на выборке в 24000 - паттернов 23. Чем не показатель кластеризации поведения. Но, ради чего все и затевалось, если добавить новых формулировок на той же структуре маркетинга - данные могут сойтись к 10 паттернам, что для меня доказательство наличия некого "первичного запроса" в структуре JTBD, так и его доминирования перед социально-экономическим подходом аудиторной сегментации. 

2