Интуиция подсказывает, что где-то за все своем этим хаосом из слов и обрывков иллюстраций прячутся интересные идеи.
Вы же пишите статью чтобы ее не просто прочли, но сделали что-то ещё? Сейчас не хватает деталей во многих местах. Вот к примеру пишите: "Таким образом, у нас есть отпечаток поведения, само собой в матричном виде". Что у вас в строках и столбцах матрицы? Или сразу после: "Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты" - аналогичный вопрос к иллюстрации. Далее когорты, по времени первого визита? Или источник + время? И в завершение, ещё один пик неопределенности - вы предлагаете нам поверить, что поведенческие логи сами собой кластеризуются.
Прошу не принимать близко к сердцу мою прямоту, то сейчас ваши заметки бесполезны. Проявите толику заботы о читателе и упакуйте все это в связный текст. Пожалуйста.
Ринат, спасибо за замечания. Писатель из меня и правда довольно сомнительный, по этой причине никогда ранее ничего не публиковал, а сейчас просто душевный порыв, но верю, что мой уровень со временем станет лучше, если продолжу.
По существу: Как раз не хотел писать какую либо инструкцию, пока система сыровата. Скорее как раз покидать идей "на подумать".
Маленькая таблица: слева до времени идут отметки тригеров (целевых действий, которые мы посчитали), справа от времени - сколько таких действий в других когортах, идея в том, что если вычеркнуть общее - останется разность поведения.
Большая таблица: все тригеры и все когорты, цифра в ячейках - результат сравнения всех данных когорты с исследуемым).
Когорты в данном случае по первому целевому действию (что не равно источнику, но часто связано).
Логи, конечно, сами собой не кластеризируются, но репрезентативность данных можно проверить радикально влияя на рекламные системы и сравнивая результат. История в том, что люди, из разных источников и сегментов, пришедшие по одним креативам к одному продукту созданным в рамках А/B тестов ведут себя по разному в дальнейшем. На выборке в 12000 человек - паттернов у меня вышло 21, на выборке в 24000 - паттернов 23. Чем не показатель кластеризации поведения. Но, ради чего все и затевалось, если добавить новых формулировок на той же структуре маркетинга - данные могут сойтись к 10 паттернам, что для меня доказательство наличия некого "первичного запроса" в структуре JTBD, так и его доминирования перед социально-экономическим подходом аудиторной сегментации.
Интуиция подсказывает, что где-то за все своем этим хаосом из слов и обрывков иллюстраций прячутся интересные идеи.
Вы же пишите статью чтобы ее не просто прочли, но сделали что-то ещё? Сейчас не хватает деталей во многих местах. Вот к примеру пишите: "Таким образом, у нас есть отпечаток поведения, само собой в матричном виде". Что у вас в строках и столбцах матрицы? Или сразу после: "Но нам важно иметь полноту данных, изучать события, которые, по каким то причинам не произошли, взять все возможные варианты" - аналогичный вопрос к иллюстрации. Далее когорты, по времени первого визита? Или источник + время? И в завершение, ещё один пик неопределенности - вы предлагаете нам поверить, что поведенческие логи сами собой кластеризуются.
Прошу не принимать близко к сердцу мою прямоту, то сейчас ваши заметки бесполезны. Проявите толику заботы о читателе и упакуйте все это в связный текст. Пожалуйста.
Ринат, спасибо за замечания. Писатель из меня и правда довольно сомнительный, по этой причине никогда ранее ничего не публиковал, а сейчас просто душевный порыв, но верю, что мой уровень со временем станет лучше, если продолжу.
По существу:
Как раз не хотел писать какую либо инструкцию, пока система сыровата. Скорее как раз покидать идей "на подумать".
Маленькая таблица: слева до времени идут отметки тригеров (целевых действий, которые мы посчитали), справа от времени - сколько таких действий в других когортах, идея в том, что если вычеркнуть общее - останется разность поведения.
Большая таблица: все тригеры и все когорты, цифра в ячейках - результат сравнения всех данных когорты с исследуемым).
Когорты в данном случае по первому целевому действию (что не равно источнику, но часто связано).
Логи, конечно, сами собой не кластеризируются, но репрезентативность данных можно проверить радикально влияя на рекламные системы и сравнивая результат.
История в том, что люди, из разных источников и сегментов, пришедшие по одним креативам к одному продукту созданным в рамках А/B тестов ведут себя по разному в дальнейшем. На выборке в 12000 человек - паттернов у меня вышло 21, на выборке в 24000 - паттернов 23. Чем не показатель кластеризации поведения. Но, ради чего все и затевалось, если добавить новых формулировок на той же структуре маркетинга - данные могут сойтись к 10 паттернам, что для меня доказательство наличия некого "первичного запроса" в структуре JTBD, так и его доминирования перед социально-экономическим подходом аудиторной сегментации.