Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах
Это вторая часть нашей статьи про корреляционный анализ — первую вы можете прочитать по этой ссылке.
Оптимизация кампаний в Яндекс Директе и на других рекламных площадках по микроцелям
Качество обучения стратегий зависит от количества данных, которые вы им предоставляете. Малому бизнесу часто не хватает данных для оптимизации по макроцелям из-за ограниченного бюджета. А у среднего и крупного, как правило, либо имеются кампании под локальные задачи с небольшим бюджетом, либо длинный цикл сделки с несколькими промежуточными микроцелями. В последнем варианте кампании сложно обучить на макроцели, потому что система не учитывает данные о сделках с циклом более 21 дня.
Решение, которое подходит любому бизнесу, — одновременная оптимизация кампании на макро имикроцели.
Мы предлагаем несколько подходов оптимизации по микроцелям для Яндекс Директа.
Расчёт ценности микроцели напрямую на основе коэффициента корреляции «по Дёмину»
Впервые с таким подходом мы столкнулись в статье своего коллеги — эксперта по обучению Яндекс Рекламы Андрея Дёмина. Давайте разберём подход на наших данных.
Напомню, что по нашим целям получились такие коэффициенты корреляции по Пирсону:
- корреляция микроцели 1 (Micro 1) и макроцели (Macro) = 0,92;
- корреляция микроцели 3 (Micro 3) и макроцели (Macro) = 0,85.
Мы не берём остальные микроцели, потому что они не коррелируют с макроцелью. Данная методика расчёта подходит для корреляции по Пирсону (линейной), Спирмену (ранговой) и взаимной информации. Главное условие — все коэффициенты, которые вы применяете, должны быть рассчитаны одним методом.
За выбранный период было достигнуто:
- 399 целей Micro 1;
- 2 390 целей Micro 3;
- 114 целей Macro.
Сведём это всё в единую таблицу и для примера допустим, что мы готовы платить за одну макроцель 5 000 руб.:
Если мы хотим оптимизироваться по микроконверсиям, тогда можно допустить, что на 114 Macro приходится 399 Micro 1 и 2 390 Micro 3 конверсий (достижений цели). Таким образом мы можем получить такое уравнение для расчёта ценности микроцелей:
5 000 × 114 = 399 × X + 2 390 × Y
К сожалению, такое уравнение имеет множество решений и нам не подходит. Поэтому автор методики предложил использовать допущение, что ценность конверсии зависит только от корреляции. Тогда мы можем выразить Y через X, используя простую математическую пропорцию:
Y относится к 0,85 так же, как X к 0,92,
или
Y : 0,85 = X : 0,92
Y = 0,85 × X ÷ 0,92
Y = 0,92X
Теперь подставим эти данные в уравнение с двумя неизвестными и найдём X:
5 000 × 114 = 399X + 2 390Y = 399X + 2 390 × 0,92X
2 598X = 570 000
X = 219,4 руб.
Y = 0,92X = 201,5 руб.
Можем проверить результат. Если бы мы оптимизировались по макроцели, то за 114 конверсий заплатили бы 114 × 5 000 = 570 000 руб. Если же мы оптимизируемся по микроцелям, то будет 399 конверсий по 219,4 руб. и 2 390 по 201,5 руб.:
399 × 219,4 + 2 390 × 201,5 = 569 125,6 руб.*
* Цифры аналогичны, есть расхождение 0,1534% из-за округления.
Стоит отметить, что текущий подход подразумевает оптимизацию только по микроцелям, так как весь бюджет был распределён на них. Для оптимизации и по микро-, и по макроцелям мы предлагаем усовершенствованный метод.
Усовершенствованный метод «по Дёмину»
У данного подхода есть несколько вариантов. Все они сводятся к тому, чтобы распределить ценность между микро- и макроцелями.
Самое простое решение — разделить пополам все ценности целей:
Macro = 5 000 ÷ 2 = 2 500 руб.
Micro 1 = 219,4 ÷ 2 = 109,7 ≈ 110 руб.
- Micro 3 = 201,5 ÷ 2 = 100,75 ≈ 101 руб.
Чтобы проверить результат, умножим ценности конверсий на их количество и сложим полученные бюджеты:
114 × 2 500 + 399 × 110 + 2 390 × 101 = 570 280 руб.
Как видим, месячный бюджет совпал. Мы включили в оптимизацию все возможные сигналы и даже указали стратегии, что ценность конечной макроцели практически в 25 раз выше, чем ценность микроцели (2 500 руб. к 101 и 110 руб.).
При необходимости вы можете изменить доли и распределить ценность между макро- и микроцелями в соотношении, к примеру, 20 на 80. В данном случае у вас есть поле для экспериментов с распределением бюджета. При этом бюджет как таковой остаётся тем же, но вы оперируете весами для обучения алгоритмов рекламной системы.
Метод расчёта «Журова-Чванникова» по уравнению регрессии
Главный минус предыдущего подхода в том, что он оперирует допущениями. Ведь на самом деле корреляция говорит о силе связей между двумя целями или, проще говоря, о том, приведёт ли изменение одной цели к изменению другой. При этом она не описывает степень таких изменений, зато это делает уравнение регрессии.
Хотя предыдущий подход хорошо показал себя в рекламных кампаниях, мы предлагаем свой метод на основе регрессионного уравнения. Оно поможет спрогнозировать макроконверсии от микро и назначить ценность микроцелей.
Также стоит понимать: когда у одной микроцели линейная зависимость от макроцели, а у другой — логарифмическая или степенная, скорее всего, по ним придётся считать разные коэффициенты корреляции. Они будут не сравнимы между собой, так как используют разный подход в расчётах. Соответственно, подход, описанный выше, просто отпадает. А метод «Журова-Чванникова» не зависит от вида корреляции и поэтому универсален.
В первой части статьи мы строили график (диаграмму рассеивания) и на нём проводили линию тренда. Вернёмся к настройкам этой линии. Для этого кликнем по ней правой кнопкой мыши и выберем «Формат линии тренда» (1).
В открывшемся окне поставим галку напротив «Показать уравнение на диаграмме» (2). Это уравнение как раз описывает модель зависимости нашей микроцели от макро. Также стоит включить величину достоверности аппроксимации. Она говорит о том, насколько точно уравнение может прогнозировать данные.
Поставим эти галки для двух наших графиков — «Micro 1 к Macro» и «Micro 3 к Macro»:
Выпишем уравнения текстом для более лёгкого восприятия и не забудем подписать X и Y своими целями. Так мы не перепутаем, кому какой принадлежит:
- Ymacro = 0,2255Xmicro1 + 0,7755 (R² = 0,8515)
- Ymacro = 0,0172Xmicro3 + 2,3501 (R² = 0,7295)
Исходя из наших условий у нас за месяц было 399 конверсий по цели Micro 1 и 2 390 по цели Micro 3. Давайте сделаем прогноз, сколько каждая из этих целей принесёт нам макроконверсий. Для этого просто подставим количество микроконверсий в формулы:
- Ymacro = 0,2255Xmicro1 + 0,7755 = 0,2255 × 399 + 0,7755 ≈ 90,75
- Ymacro = 0,0172Xmicro3 + 2,3501 = 0,0172 × 2 390 + 2,3501 ≈ 43,46
Таким образом, оптимизация по цели Micro 1 может принести нам 90,75 конверсий Macro, а цель Micro 3 — 43,46. От этого уже можно отталкиваться и выставлять ценность. Однако мы предлагаем взять в зачёт ещё и точность прогнозной модели (аппроксимацию) и скорректировать результат на неё. Так получим не «среднюю по больнице», а пессимистическую модель и дадим чуть больше веса той цели, чья прогнозная модель достовернее.
- Ymacro (для Xmicro1) = 90,75 × R² = 90,75 × 0,8515 ≈ 77,3
- Ymacro (для Xmicro3) = 43,46 × R² = 43,46 × 0,7295 ≈ 31,7
Пессимистическая модель говорит нам, что цель Micro 1 при таком же количестве конверсий, как в предыдущем месяце, может принести нам 77,3 конверсии по цели Macro, а Micro 3 — соответственно 31,7 Macro. Согласитесь, что при таких вводных нам куда понятнее, какой микроцели отдать большую ценность.
Давайте создадим аналогичную первому варианту таблицу, но уже с нашими прогнозными данными.
Выразим A через B с помощью пропорции:
A относится к 77,3 так же, как B к 31,7,
или
A : 77,3 = B : 31,7
A = 77,3 × B ÷ 31,7
A = 2,44B
Это означает, что конверсия по Micro 1 (A) для нас в 2,44 раза ценнее, чем по Micro 3 (B), т. к. она приведёт в 2,44 раза больше Macro. Теперь подставим эти данные в уравнение с двумя неизвестными из первого примера:
5 000 × 114 = 399A + 2 390B = 399 × 2,44 × B + 2 390 × B
3 363,56B = 570 000
B = 169,5 руб.
Подставим эти данные для ценности Micro 1:
A = 2,44B = 413,5 руб.
Таким образом, ценность цели Micro 1 составит 413,5 руб., а цели Micro 3 — 169,5 руб. Проверяем результат:
399 × 416,5 + 2 390 × 169,5 = 571 288,5 руб.
Далее мы можем, как и в усовершенствованном первом подходе, добавлять в оптимизацию макроцель и распределять бюджет между ней и микроцелями. Для примера отдадим макроцели 20% бюджета, а микроцелям — 80%:
- Macro = 5 000 × 0,2 = 1 000 руб.
- Micro 1 = 413,5 × 0,8 ≈ 330,8 руб.
- Micro 3 = 169,5 × 0,8 = 135,6 руб.
Проверяем результат:
114 × 1 000 + 399 × 330,8 + 2 390 × 135,6 ≈ 570 073 руб.
Таким образом, метод «Журова-Чванникова» позволил перераспределить часть бюджета в пользу той микроцели, которая приносит больше заявок. Это даёт неплохие шансы, что алгоритмы рекламной системы начнут постепенно перераспределять бюджет в её сторону. Так в будущем мы сможем получать больше макроконверсий.
Выбор между усовершенствованным методом «по Дёмину» и методом «Журова-Чванникова» зависит от вас. Если есть возможность, запускайте оба метода в параллель через A/B-тестирование.
Использование данных корреляции в других целях
Мы заметили, что практически во всех статьях корреляцию используют только для оптимизации конверсионных стратегий. Но ведь в нашей работе есть и другие сферы, где эти данные пригодятся. Разберём некоторые из них.
Корректировки ставок по сегментам пользователей
Допустим, вы обнаружили, что какая-то микроцель коррелирует с основной макроцелью, но при этом вы не хотите запускать рекламу с оплатой за конверсии. Тогда вы можете создать в Яндекс Метрике сегменты пользователей, совершивших микроконверсию, и назначить на них повышающие или понижающие корректировки ставок. Также можно добавить корректировку в список условий подбора аудиторий сразу по цели в интерфейсе Директа.
Повышаем конверсию по коррелирующим показателям за счёт внесения правок на сайте
Здесь есть две стороны медали:
- Отрицательно коррелирующие с макроцелью цели могут сигнализировать о проблемах на сайте. К примеру, отрицательная или слабая корреляция между отправкой формы и квалифицированным лидом может говорить о проблемах интеграции сайта и CRM или отсутствии проверки на спам при отправке формы. Также есть вероятность, что в аналитику неверно передаются данные по этой микроцели. Это может быть связано с тем, что GTM и автоцели Метрики в некоторых сценариях могут фиксировать ложные срабатывания цели при заполнении промокодов, поиске по сайту и пр.
- Положительно коррелирующие с макроцелью цели также являются важным сигналом. К примеру, скачивание прайс-листа с сайта хорошо коррелирует с покупкой. Тогда можно переделать ссылку на скачивание в яркую кнопку, и достижений цели станет больше.
В подтверждение вышесказанного приведём данные из кейса.
У клиента отправка формы хорошо коррелировала с продажей. При этом товар, который продавали через форму, требовал замера помещения перед покупкой, а кнопка для открытия формы называлась «Купить». Выдвинули гипотезу: если переименовать кнопку в «Заказать замер», мы расширим воронку в слабом месте и увеличим количество покупок на 25%. Для её проверки запустили эксперимент в Метрике. Промежуточные результаты на скриншоте подтверждают гипотезу.
В заключение
- Использование корреляционного и регрессионного анализа может помочь в ситуациях, когда данных собирается мало, а обучать кампании и принимать решения нужно. При этом чем больше данных будет учитывать модель, тем выше шанс, что она будет работать стабильнее.
- Тестируйте разные модели. Особенно это важно с учётом того, что не все кампании будут разгоняться на сложных составных целях. А некоторые микроцели могут сильно влиять на коэффициенты корреляции всех остальных целей, если оптимизироваться по ним.
- Вы также можете считать коэффициенты и строить модели для когорт данных. Если данных достаточно, можно сравнить, например, значения для мобильного и десктопного трафика.
- Не забывайте отслеживать изменения коэффициентов спустя время. Значения, которые вы получите, будут изменяться в будущем по многим факторам, и их нужно учитывать.
- Полную версию статьи мы опубликуем в PDF. Там мы разобрали коэффициент взаимной информации и привели дополнительные примеры. Следите за обновлениями в сообществе, чтобы не пропустить!
Спасибо за исследование, замечательный материал. Пробовал корреляционный по Пирсону, для тестирования выбора основных целей аккаунтов, но так глубоко не копал. Есть над чем подумать.