{"id":14272,"url":"\/distributions\/14272\/click?bit=1&hash=9c431bca9c7cafdd4ed114bc7fb4d407f06f28aa165d6f80b9637d3a8581e5c2","title":"\u0421\u0431\u0435\u0440\u041a\u043e\u0442 \u2014 \u043f\u0435\u0440\u0432\u044b\u0439 \u0446\u0438\u0444\u0440\u043e\u0432\u043e\u0439 \u0438\u043d\u0444\u043b\u044e\u0435\u043d\u0441\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u043b\u0435\u0442\u0435\u043b \u0432 \u043a\u043e\u0441\u043c\u043e\u0441","buttonText":"","imageUuid":""}

Зависит ли количество показов сайта в поиске Google от погоды? Пример отчета

Некоторое время назад один из моих клиентов попросил изучить корреляцию показов сайта от погоды. Вопрос звучал так: «Зависит ли количество запросов сайта в поиске Google от погоды в этот день?» Хороший вопрос так-то, да? И я решила разобраться.

Так как я не могу раскрывать информацию клиента, для статьи я заменила данные о количестве поисковых запросов на показатели другого сайта, большая часть трафика на который идет из Москвы. А бизнес клиента находится в Лондоне, поэтому данные о погоде мы использовали для Лондона. В результате я получила отчет с корреляцией запросов российского сайта оказания услуг от погоды в Лондоне. Не очень логично, но я хочу рассказать о том, как я делала отчет, а не поделиться реальными цифрами. Поэтому, если вам это понравится и будет актуально, то всегда можно подставить шаблон реальные данные.

Итак, поехали.

Какие наборы данных используем на входе

Документ с тестовыми данными можно найти по ссылке.

Для анализа мы выбрали период с начала 2020 года до 16 июня 2021, то есть 1,5 года.

Данные о поисковых запросах я получила из Google Search Console, поле Impressions. С помощью коннектора для Google Sheets выгрузила данные на вкладку «Impressions». Данные сразу же находятся в удобном формате и требуют преобразований. У нас таблица с двумя столбцами: дата и количество показов сайта в поиске Google.

Данные о погоде можно найти на различных сайтах. Мне их уже в готовом виде прислал клиент, но данные можно найти на различных сайтах, например, на www.meteomatics.com с доступом через API и бесплатным тестовым периодом на 14 дней. Если вам, так же как и мне, данные нужны разово, то бесплатного тестового периода будет вполне достаточно.

На входе я получила 3 вкладки в Google Sheets с данными по часам:

  • Температура на вкладке High Temp by the hour
  • Дождь – вкладка Rainfall by the hour
  • Облачность — Cloud Cover by the hour

Преобразования данных о погоде

Данные о погоде и данные о показах сайта в поисковой выдаче имеют разный уровень детализации и мы не можем просто взять и сравнить данные о погоде по часам с показами сайта в разбивке по дням. Поэтому я решила построить сводные таблицы для каждого показателя погоды и группировать данные по дням.

Так как дождь может быть только в определенные часы и облачность также может быть в какое-то время суток, а в какое-то нет, я расчитала среднее значение для каждого показателя. По температуре я сделала 2 среза – среднее за день и максимальная температура за день.

Трафик ночью сильно ниже, чем днем, поэтому я решила убрать из анализа данные с 1 ночи до 6 утра, как не релевантные.

Сначала я свела данные из 3-х вкладок с погодой в одну «weather_hour» и перевела дату из формата Timestamp в отдельные колонки с датой и временем. Формулы для Google Sheets такие:

Исходные данные:

Timestamp A2 = 20200101T0000

Преобразуем:

Date B2 = date(left(A2,4),mid(A2,5,2),mid(A2,7,2))

Time C2 = =time(mid(A2,10,2),right(A2,2),0)

Следующие 3 колонки – температура, дождь и облачность подставила данные из исходных вкладок с помощью ВПР.

Формулы:

High Temp by the hour D2 = VLOOKUP($A2,’High Temp by the hour’!$A:$B,2,0)

Rainfall by the hour E2 = VLOOKUP($A2,’Rainfall by the hour’!$A:$B,2,0)

Cloud Cover by the hour F2 = VLOOKUP($A2,’Cloud Cover by the hour’!$A:$B,2,0)

Когда таблица с данными по часам сформирована, можно сделать сводную и группировать данные по дням. Результат на вкладке «weather_day». Здесь в фильтре отключаем ночные часы и выбираем нужные для работы колонки. Для температуры создаем 2 столбца – со средним и максимальным значением.

Теперь можем объединить данные в одну таблицу на вкладке «GDS_Impr_Weather». С помощью той же функции ВПР соединяем данные о показах со вкладки «Impressions» и данные о погоде по дням со вкладки «weather_day».

Наш набор данных для визуализации готов. Переходим к картинкам.

Визуализация данных в Google Data Studio

На первой странице представлены данные только за прошлый месяц. На верхних графиках линией представлены показы сайта в поиске и столбцами средняя и максимальная температура в этот день. Даже на таком графике уже видно, что при понижении температуры количество показов сайта было выше.

На второй строке с данными об осадках и облачности закономерности на первый взгляд не заметно.

Далее я решила построить графики корреляции, на каждый из которых добавила линейную линию тренда. Линия тренда более наглядно показывает, что при повышении температуры количество показов сайта в поиске понижается. Для осадков и облачности также есть незначительная корреляция, но она более слабо выражена.

На второй странице отчета я вывела те же графики, но за весь период – 1,5 года. В целом, картинка повторила данные за май, кроме облачности. На большом промежутке времени заметно небольшое повышение количества показов сайта в те дни, когда небо затянуто тучами или облаками. Ну и в целом, точек на графике стало больше и данная выборка может считаться более релевантной.

Строим матрицу корреляций

Можно было бы остановиться и на этом, но мне стало интересно построить общую матрицу корреляций, для чего я воспользовалась библиотеками Python для статистики и визуализации данных. Документ можно посмотреть по ссылке.

Я загрузила те же данные, которые использовала для визуализации в Google Data Studio. Построила гистограммы для каждого параметра. В целом, это было не нужно, но интересно посмотреть на равномерность распределения данных. Кстати, интересный факт, что гистограмма температуры имеет близкое к нормальному распределение.

Так как данные представлены в разных единицах измерения, я их нормализовала и построила матрицу корреляций.

На основе данной матрицы можно сделать следующие выводы

  • Существует слабая корреляция между облачностью и показами сайта. В облачный день с вероятностью 5-10% можно ожидать повышения количества показов сайта в поиске.
  • Более ярко выражена обратная корреляция с температурой. Здесь уже с вероятностью 25% можно утверждать, что в жаркий день показы сайта будут уменьшаться и наоборот, в прохладный увеличиваться.
  • И еще один интересный вывод, что в облачные дни с вероятностью 30% температура будет ниже, а вероятность дождя, в среднем 25%.

И что мне с этим делать?

На тестовых данных уровень корреляции показов сайта и погоды не слишком высокий, но если взять реально работающий сезонный бизнес, то такой анализ может помочь эффективнее работать с рекламными каналами. Например, можно увеличивать или уменьшать рекламный бюджет в зависимости от прогноза погоды.

Если вам понравился мой пример, можете повторить его на своих данных и посмотреть как погода влияет на ваш бизнес.

0
5 комментариев
Артем Акулов

Объем показов зависит не только от того, тусуют люди в ынтырнетах при плохой погоде или шатаются по улицам при хорошей, но и от миллионов других вещей: инфополе, громкие трагедии, политические события, спортивные турниры, ковидные истерики, и тд.

Что делать с этим всем? Ничего. На это нельзя влиять и нельзя предсказать. Все эти "исследования", гугл таблички, и какие-то невнятные выводы - работа ради работы. Лучше заняться вопросом нахождения в топ-1 по интересующим запросам в Google.

Ответить
Развернуть ветку
Nasha Rasha

ну ей то заплатили наверняка за эту работу ради работы, так что не совсем это верно

Ответить
Развернуть ветку
Galina Ivannikova
Автор

конечно, есть большое количество факторов, которые влияют на показы. Это же модель. Здесь я показываю как я решила кейс. Запрос клиента был - посмотреть меняется ли количество запросов от погоды - я посмотрела и рассказала методику того, как я это сделала. 
Кейс не для всех актуален. Но, если вы крем от загара продаете или уличную мебель для дачи, например, то прогноз погоды может иметь значение. 
Еще раз подчеркну, что я поделилась методикой решения задачи. 

Ответить
Развернуть ветку
Коворкинг BLOKS

Это интересно тем, что я четко заметил повышение конверсии в заявки с сайта при ненастной погоде. Но пока на уровне "вижу глазами, не могу доказать". Вот бы такое исследование запилить.

Ответить
Развернуть ветку
Galina Ivannikova
Автор

если заявок какое-то достаточное количество (не одна-две), то можете сами по такой же схеме сделать :)

Ответить
Развернуть ветку
2 комментария
Раскрывать всегда