Дано: интернет-магазин, SKU штучек 300-350, россыпь платформ (VK, FB, INST, YouTube, программатик, смс, email-цепочки, etc.), продажи закрываются через сайт, внутри, как водиться цели и метки, по всей воронке (CJM будем считать есть).
Для товарных категорий определены свои матрицы потребностей (будем считать что JTBD по группам товаров у нас тоже есть).
Все отлично, но практически не применимо если мало данных.
Плюсанул
На малых данных вообще ничего толкового не применимо )))
Кластеризовать можно иначе. Возможно, иная кластеризация даст качественно другой результат. Вроде стандартная кластеризация/классификация сейчас считается случайным лесом. Обратные расстояния это видимо свёртка, тоже в принципе стандартный подход.
Тюнить можно и распознавание паттерна, об этом в статье вроде ни слова.
Ну и конечно постоянное изменение/тестирование CJM никто не отменял.
Ну и сегментировать тоньше и на этом ещё пару % добавить.
Интуиция подсказывает, что где-то за все своем этим хаосом из слов и обрывков иллюстраций прячутся интересные идеи.
Вы же пишите статью чтобы ее не просто прочли, но сделали что-то ещё? Сейчас не хватает деталей во многих местах. Вот к примеру пишите: "Таким образом, у нас есть отпечаток поведения, само собой в матричном виде". Что у вас в строках и столбцах матрицы? Или сразу после: "Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты" - аналогичный вопрос к иллюстрации. Далее когорты, по времени первого визита? Или источник + время? И в завершение, ещё один пик неопределенности - вы предлагаете нам поверить, что поведенческие логи сами собой кластеризуются.
Прошу не принимать близко к сердцу мою прямоту, то сейчас ваши заметки бесполезны. Проявите толику заботы о читателе и упакуйте все это в связный текст. Пожалуйста.
Ринат, спасибо за замечания. Писатель из меня и правда довольно сомнительный, по этой причине никогда ранее ничего не публиковал, а сейчас просто душевный порыв, но верю, что мой уровень со временем станет лучше, если продолжу.
По существу:
Как раз не хотел писать какую либо инструкцию, пока система сыровата. Скорее как раз покидать идей "на подумать".
Маленькая таблица: слева до времени идут отметки тригеров (целевых действий, которые мы посчитали), справа от времени - сколько таких действий в других когортах, идея в том, что если вычеркнуть общее - останется разность поведения.
Большая таблица: все тригеры и все когорты, цифра в ячейках - результат сравнения всех данных когорты с исследуемым).
Когорты в данном случае по первому целевому действию (что не равно источнику, но часто связано).
Логи, конечно, сами собой не кластеризируются, но репрезентативность данных можно проверить радикально влияя на рекламные системы и сравнивая результат.
История в том, что люди, из разных источников и сегментов, пришедшие по одним креативам к одному продукту созданным в рамках А/B тестов ведут себя по разному в дальнейшем. На выборке в 12000 человек - паттернов у меня вышло 21, на выборке в 24000 - паттернов 23. Чем не показатель кластеризации поведения. Но, ради чего все и затевалось, если добавить новых формулировок на той же структуре маркетинга - данные могут сойтись к 10 паттернам, что для меня доказательство наличия некого "первичного запроса" в структуре JTBD, так и его доминирования перед социально-экономическим подходом аудиторной сегментации.