«Вы че тут третесь?»: поведенческая аудиторная сегментация и JTBD для нагруженных CJM

За последние 5-7 лет стал абсолютно ясен тупиковый путь развития описательных моделей ЦА, основанных на социльно-экономических характеристиках групп людей для прогностических моделей потребительского поведения.

1212

Интуиция подсказывает, что где-то за все своем этим хаосом из слов и обрывков иллюстраций прячутся интересные идеи. 

Вы же пишите статью чтобы ее не просто прочли, но сделали что-то ещё? Сейчас не хватает  деталей во многих местах. Вот к примеру пишите: "Таким образом, у нас есть отпечаток поведения, само собой в матричном виде". Что у вас в строках и столбцах матрицы? Или сразу после: "Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты" - аналогичный вопрос к иллюстрации. Далее когорты, по времени первого визита? Или источник + время? И в завершение, ещё один пик неопределенности - вы предлагаете нам поверить, что поведенческие логи сами собой кластеризуются. 

Прошу не принимать близко к сердцу мою прямоту, то сейчас ваши заметки бесполезны. Проявите толику заботы о читателе и упакуйте все это в связный текст. Пожалуйста.

Ринат, спасибо за замечания. Писатель из меня и правда довольно сомнительный, по этой причине никогда ранее ничего не публиковал, а сейчас просто душевный порыв, но верю, что мой уровень со временем станет лучше, если продолжу.

По существу:
Как раз не хотел писать какую либо инструкцию, пока система сыровата. Скорее как раз покидать идей "на подумать". 

Маленькая таблица: слева до времени идут отметки тригеров (целевых действий, которые мы посчитали), справа от времени - сколько таких действий в других когортах, идея в том, что если вычеркнуть общее - останется разность поведения. 

Большая таблица: все тригеры и все когорты, цифра в ячейках - результат сравнения всех данных когорты с исследуемым). 

Когорты в данном случае по первому целевому действию (что не равно источнику, но часто связано). 

Логи, конечно, сами собой не кластеризируются, но репрезентативность данных можно проверить радикально влияя на рекламные системы и сравнивая результат. 
История в том, что люди, из разных источников и сегментов, пришедшие по одним креативам к одному продукту созданным в рамках А/B тестов ведут себя по разному в дальнейшем. На выборке в 12000 человек - паттернов у меня вышло 21, на выборке в 24000 - паттернов 23. Чем не показатель кластеризации поведения. Но, ради чего все и затевалось, если добавить новых формулировок на той же структуре маркетинга - данные могут сойтись к 10 паттернам, что для меня доказательство наличия некого "первичного запроса" в структуре JTBD, так и его доминирования перед социально-экономическим подходом аудиторной сегментации. 

2