Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах

Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах

Это вторая часть нашей статьи про корреляционный анализ — первую вы можете прочитать по этой ссылке.

Оптимизация кампаний в Яндекс Директе и на других рекламных площадках по микроцелям

Качество обучения стратегий зависит от количества данных, которые вы им предоставляете. Малому бизнесу часто не хватает данных для оптимизации по макроцелям из-за ограниченного бюджета. А у среднего и крупного, как правило, либо имеются кампании под локальные задачи с небольшим бюджетом, либо длинный цикл сделки с несколькими промежуточными микроцелями. В последнем варианте кампании сложно обучить на макроцели, потому что система не учитывает данные о сделках с циклом более 21 дня.

Решение, которое подходит любому бизнесу, — одновременная оптимизация кампании на макро имикроцели.

Мы предлагаем несколько подходов оптимизации по микроцелям для Яндекс Директа.

Расчёт ценности микроцели напрямую на основе коэффициента корреляции «по Дёмину»

Впервые с таким подходом мы столкнулись в статье своего коллеги — эксперта по обучению Яндекс Рекламы Андрея Дёмина. Давайте разберём подход на наших данных.

Напомню, что по нашим целям получились такие коэффициенты корреляции по Пирсону:

  • корреляция микроцели 1 (Micro 1) и макроцели (Macro) = 0,92;
  • корреляция микроцели 3 (Micro 3) и макроцели (Macro) = 0,85.

Мы не берём остальные микроцели, потому что они не коррелируют с макроцелью. Данная методика расчёта подходит для корреляции по Пирсону (линейной), Спирмену (ранговой) и взаимной информации. Главное условие — все коэффициенты, которые вы применяете, должны быть рассчитаны одним методом.

За выбранный период было достигнуто:

  • 399 целей Micro 1;
  • 2 390 целей Micro 3;
  • 114 целей Macro.

Сведём это всё в единую таблицу и для примера допустим, что мы готовы платить за одну макроцель 5 000 руб.:

Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах

Если мы хотим оптимизироваться по микроконверсиям, тогда можно допустить, что на 114 Macro приходится 399 Micro 1 и 2 390 Micro 3 конверсий (достижений цели). Таким образом мы можем получить такое уравнение для расчёта ценности микроцелей:

5 000 × 114 = 399 × X + 2 390 × Y

К сожалению, такое уравнение имеет множество решений и нам не подходит. Поэтому автор методики предложил использовать допущение, что ценность конверсии зависит только от корреляции. Тогда мы можем выразить Y через X, используя простую математическую пропорцию:

Y относится к 0,85 так же, как X к 0,92,

или

Y : 0,85 = X : 0,92

Y = 0,85 × X ÷ 0,92

Y = 0,92X

Теперь подставим эти данные в уравнение с двумя неизвестными и найдём X:

5 000 × 114 = 399X + 2 390Y = 399X + 2 390 × 0,92X

2 598X = 570 000

X = 219,4 руб.

Y = 0,92X = 201,5 руб.

Можем проверить результат. Если бы мы оптимизировались по макроцели, то за 114 конверсий заплатили бы 114 × 5 000 = 570 000 руб. Если же мы оптимизируемся по микроцелям, то будет 399 конверсий по 219,4 руб. и 2 390 по 201,5 руб.:

399 × 219,4 + 2 390 × 201,5 = 569 125,6 руб.*

* Цифры аналогичны, есть расхождение 0,1534% из-за округления.

Стоит отметить, что текущий подход подразумевает оптимизацию только по микроцелям, так как весь бюджет был распределён на них. Для оптимизации и по микро-, и по макроцелям мы предлагаем усовершенствованный метод.

Усовершенствованный метод «по Дёмину»

У данного подхода есть несколько вариантов. Все они сводятся к тому, чтобы распределить ценность между микро- и макроцелями.

Самое простое решение — разделить пополам все ценности целей:

  • Macro = 5 000 ÷ 2 = 2 500 руб.

  • Micro 1 = 219,4 ÷ 2 = 109,7 ≈ 110 руб.

  • Micro 3 = 201,5 ÷ 2 = 100,75 ≈ 101 руб.

Чтобы проверить результат, умножим ценности конверсий на их количество и сложим полученные бюджеты:

114 × 2 500 + 399 × 110 + 2 390 × 101 = 570 280 руб.

Как видим, месячный бюджет совпал. Мы включили в оптимизацию все возможные сигналы и даже указали стратегии, что ценность конечной макроцели практически в 25 раз выше, чем ценность микроцели (2 500 руб. к 101 и 110 руб.).

При необходимости вы можете изменить доли и распределить ценность между макро- и микроцелями в соотношении, к примеру, 20 на 80. В данном случае у вас есть поле для экспериментов с распределением бюджета. При этом бюджет как таковой остаётся тем же, но вы оперируете весами для обучения алгоритмов рекламной системы.

Метод расчёта «Журова-Чванникова» по уравнению регрессии

Главный минус предыдущего подхода в том, что он оперирует допущениями. Ведь на самом деле корреляция говорит о силе связей между двумя целями или, проще говоря, о том, приведёт ли изменение одной цели к изменению другой. При этом она не описывает степень таких изменений, зато это делает уравнение регрессии.

Хотя предыдущий подход хорошо показал себя в рекламных кампаниях, мы предлагаем свой метод на основе регрессионного уравнения. Оно поможет спрогнозировать макроконверсии от микро и назначить ценность микроцелей.

Также стоит понимать: когда у одной микроцели линейная зависимость от макроцели, а у другой — логарифмическая или степенная, скорее всего, по ним придётся считать разные коэффициенты корреляции. Они будут не сравнимы между собой, так как используют разный подход в расчётах. Соответственно, подход, описанный выше, просто отпадает. А метод «Журова-Чванникова» не зависит от вида корреляции и поэтому универсален.

В первой части статьи мы строили график (диаграмму рассеивания) и на нём проводили линию тренда. Вернёмся к настройкам этой линии. Для этого кликнем по ней правой кнопкой мыши и выберем «Формат линии тренда» (1).

В открывшемся окне поставим галку напротив «Показать уравнение на диаграмме» (2). Это уравнение как раз описывает модель зависимости нашей микроцели от макро. Также стоит включить величину достоверности аппроксимации. Она говорит о том, насколько точно уравнение может прогнозировать данные.

<i>На скриншоте отметили, какие кнопки нужно нажать</i>
На скриншоте отметили, какие кнопки нужно нажать

Поставим эти галки для двух наших графиков — «Micro 1 к Macro» и «Micro 3 к Macro»:

Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах

Выпишем уравнения текстом для более лёгкого восприятия и не забудем подписать X и Y своими целями. Так мы не перепутаем, кому какой принадлежит:

  • Ymacro = 0,2255Xmicro1 + 0,7755 (R² = 0,8515)
  • Ymacro = 0,0172Xmicro3 + 2,3501 (R² = 0,7295)

Исходя из наших условий у нас за месяц было 399 конверсий по цели Micro 1 и 2 390 по цели Micro 3. Давайте сделаем прогноз, сколько каждая из этих целей принесёт нам макроконверсий. Для этого просто подставим количество микроконверсий в формулы:

  • Ymacro = 0,2255Xmicro1 + 0,7755 = 0,2255 × 399 + 0,7755 ≈ 90,75
  • Ymacro = 0,0172Xmicro3 + 2,3501 = 0,0172 × 2 390 + 2,3501 ≈ 43,46

Таким образом, оптимизация по цели Micro 1 может принести нам 90,75 конверсий Macro, а цель Micro 3 — 43,46. От этого уже можно отталкиваться и выставлять ценность. Однако мы предлагаем взять в зачёт ещё и точность прогнозной модели (аппроксимацию) и скорректировать результат на неё. Так получим не «среднюю по больнице», а пессимистическую модель и дадим чуть больше веса той цели, чья прогнозная модель достовернее.

  • Ymacro (для Xmicro1) = 90,75 × R² = 90,75 × 0,8515 ≈ 77,3
  • Ymacro (для Xmicro3) = 43,46 × R² = 43,46 × 0,7295 ≈ 31,7

Пессимистическая модель говорит нам, что цель Micro 1 при таком же количестве конверсий, как в предыдущем месяце, может принести нам 77,3 конверсии по цели Macro, а Micro 3 — соответственно 31,7 Macro. Согласитесь, что при таких вводных нам куда понятнее, какой микроцели отдать большую ценность.

Давайте создадим аналогичную первому варианту таблицу, но уже с нашими прогнозными данными.

Как применять корреляционный анализ в контекстной рекламе: объясняем на примерах

Выразим A через B с помощью пропорции:

A относится к 77,3 так же, как B к 31,7,

или

A : 77,3 = B : 31,7

A = 77,3 × B ÷ 31,7

A = 2,44B

Это означает, что конверсия по Micro 1 (A) для нас в 2,44 раза ценнее, чем по Micro 3 (B), т. к. она приведёт в 2,44 раза больше Macro. Теперь подставим эти данные в уравнение с двумя неизвестными из первого примера:

5 000 × 114 = 399A + 2 390B = 399 × 2,44 × B + 2 390 × B

3 363,56B = 570 000

B = 169,5 руб.

Подставим эти данные для ценности Micro 1:

A = 2,44B = 413,5 руб.

Таким образом, ценность цели Micro 1 составит 413,5 руб., а цели Micro 3169,5 руб. Проверяем результат:

399 × 416,5 + 2 390 × 169,5 = 571 288,5 руб.

Далее мы можем, как и в усовершенствованном первом подходе, добавлять в оптимизацию макроцель и распределять бюджет между ней и микроцелями. Для примера отдадим макроцели 20% бюджета, а микроцелям — 80%:

  • Macro = 5 000 × 0,2 = 1 000 руб.
  • Micro 1 = 413,5 × 0,8 ≈ 330,8 руб.
  • Micro 3 = 169,5 × 0,8 = 135,6 руб.

Проверяем результат:

114 × 1 000 + 399 × 330,8 + 2 390 × 135,6 ≈ 570 073 руб.

Таким образом, метод «Журова-Чванникова» позволил перераспределить часть бюджета в пользу той микроцели, которая приносит больше заявок. Это даёт неплохие шансы, что алгоритмы рекламной системы начнут постепенно перераспределять бюджет в её сторону. Так в будущем мы сможем получать больше макроконверсий.

Выбор между усовершенствованным методом «по Дёмину» и методом «Журова-Чванникова» зависит от вас. Если есть возможность, запускайте оба метода в параллель через A/B-тестирование.

Использование данных корреляции в других целях

Мы заметили, что практически во всех статьях корреляцию используют только для оптимизации конверсионных стратегий. Но ведь в нашей работе есть и другие сферы, где эти данные пригодятся. Разберём некоторые из них.

Корректировки ставок по сегментам пользователей

Допустим, вы обнаружили, что какая-то микроцель коррелирует с основной макроцелью, но при этом вы не хотите запускать рекламу с оплатой за конверсии. Тогда вы можете создать в Яндекс Метрике сегменты пользователей, совершивших микроконверсию, и назначить на них повышающие или понижающие корректировки ставок. Также можно добавить корректировку в список условий подбора аудиторий сразу по цели в интерфейсе Директа.

<i>Так можно добавить новое условие</i>
Так можно добавить новое условие

Повышаем конверсию по коррелирующим показателям за счёт внесения правок на сайте

Здесь есть две стороны медали:

  1. Отрицательно коррелирующие с макроцелью цели могут сигнализировать о проблемах на сайте. К примеру, отрицательная или слабая корреляция между отправкой формы и квалифицированным лидом может говорить о проблемах интеграции сайта и CRM или отсутствии проверки на спам при отправке формы. Также есть вероятность, что в аналитику неверно передаются данные по этой микроцели. Это может быть связано с тем, что GTM и автоцели Метрики в некоторых сценариях могут фиксировать ложные срабатывания цели при заполнении промокодов, поиске по сайту и пр.
  2. Положительно коррелирующие с макроцелью цели также являются важным сигналом. К примеру, скачивание прайс-листа с сайта хорошо коррелирует с покупкой. Тогда можно переделать ссылку на скачивание в яркую кнопку, и достижений цели станет больше.

В подтверждение вышесказанного приведём данные из кейса.

У клиента отправка формы хорошо коррелировала с продажей. При этом товар, который продавали через форму, требовал замера помещения перед покупкой, а кнопка для открытия формы называлась «Купить». Выдвинули гипотезу: если переименовать кнопку в «Заказать замер», мы расширим воронку в слабом месте и увеличим количество покупок на 25%. Для её проверки запустили эксперимент в Метрике. Промежуточные результаты на скриншоте подтверждают гипотезу.

<i>Кнопка «Заказать замер» сработала лучше, чем «Заказать» и «Купить»</i>
Кнопка «Заказать замер» сработала лучше, чем «Заказать» и «Купить»

В заключение

  1. Использование корреляционного и регрессионного анализа может помочь в ситуациях, когда данных собирается мало, а обучать кампании и принимать решения нужно. При этом чем больше данных будет учитывать модель, тем выше шанс, что она будет работать стабильнее.
  2. Тестируйте разные модели. Особенно это важно с учётом того, что не все кампании будут разгоняться на сложных составных целях. А некоторые микроцели могут сильно влиять на коэффициенты корреляции всех остальных целей, если оптимизироваться по ним.
  3. Вы также можете считать коэффициенты и строить модели для когорт данных. Если данных достаточно, можно сравнить, например, значения для мобильного и десктопного трафика.
  4. Не забывайте отслеживать изменения коэффициентов спустя время. Значения, которые вы получите, будут изменяться в будущем по многим факторам, и их нужно учитывать.
  5. Полную версию статьи мы опубликуем в PDF. Там мы разобрали коэффициент взаимной информации и привели дополнительные примеры. Следите за обновлениями в сообществе, чтобы не пропустить!
2727
1 комментарий

Спасибо за исследование, замечательный материал. Пробовал корреляционный по Пирсону, для тестирования выбора основных целей аккаунтов, но так глубоко не копал. Есть над чем подумать.

1