{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

Нестандартный анализ SEO или как посчитать влияние редизайна на SEO в ecommerce

Если вы занимаетесь аналитикой или менеджментом в продукте, где SEO играет важную роль и является частью стратегии привлечения клиентов, то вы уже задавались вопросом как менее шумно и более эффективно анализировать результативность работы в области поисковой оптимизации. Как принимать решения на данных или, что еще важнее, как проверить, что те или иные крупные изменения не привели вас к ослаблению этого канала привлечения.

Начнем с предыстории

Мы с командой долго планировали редизайн сайта, который не претерпевал значительных изменений уже более 10-ти лет. И большую часть таких изменений на продукт достаточно не сложно проверить и посчитать – можно сравнивать воронки, точечно проверять ранее сформулированные для редизайна гипотезы или даже строить пути по пользовательским сессиям (об этом я чуть позже расскажу в будущих статьях).

Но что делать с оценкой влияния такого массового изменения на SEO было не совсем понятно.

Стандартные методы нам не подходят из-за специфики продукта – мы помогаем продавать билеты на мероприятия, на которые часто имеем эксклюзивные права. Что делает нас продуктом, где достаточно большой процент трафика нам привлекает сам организатор, известность которого так же влияет на органический трафик, независимо от позиции наших страниц в поиске.

В общем, на первый взгляд задача казалась более тривиальной, чем оказалась на самом деле :)

Нужно со всеми поговорить

Чтобы понять специфику вопроса и задачи лучше, нужно узнать не просто мнения, но скорее понимание и дефиниции сторон.

Не буду растягивать эту главу и просто соберу буллет-поинтами то, какие заметки удалось собрать в процессе изучения вопроса:

  • Было бы неправильно грести под одну гребенку разные страницы или даже объединять их в группы для анализа по типам – каждая страница в нашем конкретном случае уникальна, так как все мероприятия разные и над ними осуществляется разная работа (даже несмотря на общий редизайн и изменение общего шаблона страниц);
  • За аналитикой общего редизайна нельзя потерять и размыть частную работу по SEO оптимизации для отдельных проектов, так как такой отчет скорее всего будет использоваться не просто как оценка редизайна, а как аналитика результативности SEO стратегии в целом. Нужно помочь нашей команде оценить редизайн и, вместе с этим, команде SEO оценить их частную работу;
  • Как я упоминал выше – просто трафик из Search консоли для нас не может являться универсальным показателем, так как на него влияет очень много шумов, которые мы не сможем вычистить;
  • Страницы могут пропадать и появляться. Листинг предложений на нашем ресурсе может быть как и постоянным/реккурентным, так и разовым. Это нужно несомненно учитывать;
  • Ресурс команды SEO не резиновый, а ряд данных можно собрать только мануально и делать это нужно регулярно. Объем данных для мануального сбора не должен зааффектить работу ребят и отнять у них слишком много ресурсов.

Поиск подходов и инструментов

Как мы выяснили – задача интересная! Идем ковыряться в чертогах разума и гуглить.

Все что удалось придумать поначалу не подходило по 1-2 пунктам, а удовлетворение каждого пункта для нас в этой задаче и при условиях специфики продукта – важно.

Это как с донорством костного мозга – должны совпасть все 5 пунктов, иначе будет аутоиммунная реакция и организм не примет то, что в него только что пересадили. А в нашем случае, результат такого неточного исследования можно будет использовать как подставку под кружку кофе, так как верить ему хотя бы на 90% будет нельзя.

Ниже методы, которые я нашел, их pros и cons конкретно в нашем случае (хотя, вынужден отметить, наш случай далеко не уникальный для e-commerce, так что эта таблица может быть актуальна и для вас):

Таблица сравнения разных популярных подходов в контексте нашего продукта

В самый последний момент и неожиданно для себя я нашел нестандартное (я хочу верить, что мало кто так натягивал сову на глобус ранее) применение диаграмме скаттера в контексте этой задачи.

На идею того, что было бы круто связать два ключевых показателя и посмотреть их зависимость, меня натолкнул мой хороший друг дата-сатанист в прошлом и, по совместительству, руководитель одного продукта в настоящем – Михаил Ключников.

А теперь давайте по порядку разберем этот интересный способ поженить метрики.

Стоит еще раз оговориться, что ряд тезисов работает и применим к нашей специфике продукта, но, я уверен, эти тезисы будут актуальны для многих e-commerce компаний!

Диаграммы скаттера как метод анализа SEO

Диаграмма рассеяния (также точечная диаграмма, англ. scatter plot) — математическая диаграмма, изображающая значения двух переменных в виде точек на декартовой плоскости.

Wikipedia

В нашем продукте простой анализ SEO не подходит по двум основным причинам (но не только по ним):

  • Высокий уровень или прирост органического трафика из поисковой выдачи может происходить независимо от того, были ли произведены изменения. И даже могут быть не связаны с позицией страницы в этой самой выдаче;
  • Позиции в поисковой выдаче могут не приносить трафика, несмотря на все возможные виды сделанных шагов на пути к SEO оптимизации. Это может зависеть от сезона и предложения внутри ниши, и принести ощутимый результат позже.

При этом диаграмма скаттера, где одна точка это страница+запрос, покажет зависимость этих двух метрик. А разноцветное отображение серий и отображение векторов по сущностям от одной серии к другой покажет динамику.

Пример отображения серий разными цветами

В контексте же редизайна – облака (скопления) таких точек и миграция этих облаков от серии к серии покажет результативность массовых изменений, как раз таких, как редизайн.

Какие данные нужны и что с ними делать?

Шаг первый

Нужно собирать данные о позициях страниц в поиске и impressions на выбранных поисковых запросах. Этот список нужно составить заранее, определив, какие страницы проживут дольше и на каких будут происходить изменения.

После того, как удалось собрать такой список, необходимо направиться к SEO специалистам и определить ряд поисковых запросов, по которым пользователи находят эти страницы в поиске.

В итоге мы получаем примерно такую табличку:

Таблица с набором запросов и страниц для SEO анализа

То есть, как вы могли заметить, страницы – штуки не уникальные. На каждую страницу может вести несколько разных запросов, а позиции в поиске и трафик на эту страницу сильно от них (запросов) зависит.

Шаг второй

Собираем данные о позициях и impressions на этих страницах. Делаем это сериями с равным интервалом.

Например, интервалом выбрана неделя, значит мы помещаем в одну серию информацию о средней позиции страницы в поиске за неделю и суммарный объем impressions, который при таком запросе и на такой странице удалось собрать. Получается что-то такое:

Пример данных для построение диаграммы

Шаг третий

Сводим таблицу в формат, который принимают диаграммы скаттера от Google Sheets, или просим аналитиков сделать тоже самое на питоне. Вдаваться в подробности не буду, так как конечный формат данных очень зависит от инструмента построения диаграмм, который вы выбрали.

После сведения строим диаграмму. Ось X у нас будет содержать в себе impressions, а ось Y – позиции. Ось Y, кстати, лучше развернуть, чтобы самая большая позиции была внизу, а самая маленькая – сверху. Это позже поможет нам более наглядно и логично читать и анализировать эти диаграммы. Сделать это просто – можно сделать позиции страниц отрицательными числами по тому же модулю (например, 3 превратиться в -3, просто для удобства чтения).

По итогу у нас должно получиться что-то такое:

Пример диаграммы скаттера на семпле данных

Это ветрянка? Как это читать?

На самом деле, все очень просто читается и анализируется. Давайте по пунктам.

Стоит отметить, что это пример данных, поэтому в них нет примеров, как что-то стало хуже :) Но по абсолютной аналогии с паттернами улучшений, которые я покажу, работают и паттерны ухудшения, только вектора (скоро вы поймете, о чем я) будут направлены в другую сторону.

Влияние всего редизайна

Нам нужно оценить влияние массовых изменений, а значит – и влияние будет массовое. Напомню, что каждая точка на диаграмме это запрос+страница. Соотвественно, если мы меняем шаблон сразу группы страниц, то и изменения на графике должны произойти группой.

Ниже на картинке я оставил только одну серию, чтобы не было мешанины и было легче понять, где группы:

Группы страниц на графике

На графике отчетливо видно два облака. Каждое из них – это группа страниц. Например, страницы товара и страницы категорий. Они выделились в такие обособленные группы на графике, потому что объемы траффика и позиции в поиске для каждой группы разные.

Давайте добавим последнюю серию, чтобы посмотреть, что стало с облаками (группами страниц):

Оценка изменений в целой группе

Я выделил новую серию желтыми фигурами, чтобы было нагляднее, и проложил вектора. Что вы видите на этом графике?

На самом деле, на графике очень хорошо видно, как целые группы страниц пошли по диагонали вверх в новой серии, а это значит, что изменения шаблонов у этих типов страниц прошли успешно – они поднялись выше в поиске (вектор вверх по оси Y) и зависимо от этого получили больше трафика (вправо по оси X).

Стоит отметить, что консистентное движение на ~45º вправо вверх указывает о чистой причинно-следственной связи: Лучшая оптимизация SEO –> Выше позиция в поиске –> Больше трафика.

Давайте же разберем частные случаи направления векторов и как следствие заключений, которые можно сделать по каждому смещению в ту или иную сторону:

  • Облака на месте, движения нет – очевидно, что ничего не изменилось в общем. Вероятно, есть изменения частных случаев, но это мы разберем в следующих разделах статьи.
  • Облака поехали вправо, но не сдвинулись с места по оси Y. Такое движение говорит о том, что мы глобально не повлияли со стороны SEO на качество групп страниц, но стали органически получать больше трафика. Это связано с увеличивающимся трендом в поиске и может говорить о старте сезона, например.
  • Облака пошли вверх, но не сдвинулись по оси X. Такое поведение свойственно для улучшений SEO, которые привели к улучшению, но пока не получили результата в трафике. Проще: мы уже в топе, но нас пока/еще/вообще не ищут (так же может свидетельствовать о неверно выбранных и используемых на странице ключевых словах).
  • Все пошло влево и вниз. Произошло массовое ухудшение.

Отдельная точечная работа SEO команды

Напомню, что одна из задач, которую мы преследовали, это не только оценить результативность массовых изменений групп страниц, но и проанализировать результат точечных работ над отдельно взятыми страницами на платформе.

В этом нам поможет то, что я уже упоминал ранее – каждая точка на скаттер диаграмме это буквально страница+запрос.

То есть, если:

  • сохранить каждую связку страница+запрос под своим id в таблице аналитики
  • связать векторами старые и новые точки, относящиеся к одним и тем же страницам

...то мы увидим движение не только групп, но и отбившихся от стаи точек, которые, по той или иной причине, стали эффективнее основной массы или менее эффективнее.

Прикинем:

Анализ отдельных страниц и результативность их частной оптимизации

Чтобы было удобнее, можно тем же скриптом окрашивать вектора, отличающиеся углом наклона от общей массы более чем медианное значение вектора в этой массе.

Таким образом, на графике видно, что 4 частных случая отбились от группы и улучшились/ухудшились больше, чем это сделали остальные.

А так как мы храним связку страница+запрос по каждой из этих точек, мы можем с легкостью проверить, какие изменения происходили с этими страницами в течении этой серии. И понять, как они могли привести к тем или иным результатам.

Заключение

В первую очередь в заключении я хотел бы перечислить несколько замечаний, о которых вы могли подумать, пока читали эту статью:

  • Для более простого понимания и быстрой подготовки скриншотов в статье приведены сэмпл-данные, в реальных условиях облака будут менее очевидны и одними Google Sheets обойтись будет тяжело. Такой подход лучше проворачивать вооружившись аналитиком и питоном, чтобы правильно идентифицировать страницы по точкам и сразу строить вектора движений от серии к серии, чего Google Sheet сможет сделать только с помощью костылей.
  • На реальных данных модель показывает чуть больший разброс по градусам векторов, но все равно не составляет труда вычислить частные случаи по отличающемуся от медианы показателю с шагом в 15-20%.
  • Групп страниц может быть больше, их тоже лучше размечать в дата-сете, а не по паттерну траффик+позиция, так как одинаковые показатели могут быть у страниц из абсолютно разных групп.
  • Автор статьи не аналитик, а менеджер продукта, поэтому воспринимайте это как описание альтернативного подхода, а не как законченную инструкцию к действию :)

Такой метод анализа отлично подходит для оценки результативности SEO стратегии в целом, и/или массовых/частных изменений. Он позволяет более тонко прощупывать изменения и накапливать базу данных, насмотренности и понимания своего продукта и того, какие действия приводят к тем или иным результатам.

В моих дальнейших планах я изучаю возможности автоматизации сбора всех типов необходимых для отчета данных, чтобы поставить этот процесс на поток и собрать удобный дашборд, который позволит держать руку на пульсе уже не только при глобальных изменениях, но на регулярной основе.

0
16 комментариев
Написать комментарий...
Слегка Придурковатый

Не читал, но устал скроллить. Кто прочитал, скажите - там есть нормальная тема для сеошки? Или очередная лабуда, написанная потому, что как-то надо привлечь внимание к нашей охуительной дижытал-компании?

Ответить
Развернуть ветку
Виктор Петров

Тут дан красивый подход к аналитике на данных там, где обычно резюме по итогам внедрений ограничивается "Ну ничо так, гламурненько, но мне старый сайт больше нравился". Ну и в принципе для оценки гипотез.
Если, конечно, не пугают слова типа "вектор", "матрица", "классификация запросов" и прочая математика.

Ответить
Развернуть ветку
Слегка Придурковатый

Ну ок, прочитаю на днях.

Ответить
Развернуть ветку
OOSOBAA

Пользы ноль

Ответить
Развернуть ветку
Чайка О.

Если я правильно поняла:
— элемент = запрос (который априори связан с конкретной веб-страницей);
— элементы представлены на диаграмме, где оси — позиция страницы по запросу и трафик на страницу;
— анализ распределения элементов в системе координат позволяет выделить группы (группа = веб-страница)
— данные рассматриваются в динамике; вектор изменений позволяет сделать вывод об эффективности работы SEO-специалиста (который производил некоторые манипуляции с веб-страницами).

Ответить
Развернуть ветку
Damian Kapranov
Автор

Элемент на графике это запрос+страница, а группа таких элементов — это какая-то условная группа, если вам нужно ее выделить. Как в моем примере — это разные типы страниц: страница товара и страница категории.

Ответить
Развернуть ветку
Чайка О.

"Элемент на графике это запрос+страница" — да, я это и имела в виду. Это одно из допущений в данной модели. Если его не использовать, модель усложнится (например, в реальности страница, релевантная запросу, может меняться).
*
"какая-то условная группа, если вам нужно ее выделить" — вот это не совсем понятно при большом объёме данных.
Вы пишете: "На графике отчетливо видно два облака. Каждое из них – это группа страниц. Например, страницы товара и страницы категорий. Они выделились в такие обособленные группы на графике, потому что объемы траффика и позиции в поиске для каждой группы разные." Это приятный вариант для наглядности, а как на самом деле?

Ответить
Развернуть ветку
Damian Kapranov
Автор

В заключении я дал небольшой комментарий, что на реальных данных нужно задать группу заранее уже в наборе данных, так как просто наглядно на графике это будет совсем не очевидно. Уже перед визуализацией данные, в идеале, должны выглядеть как-то так: entityId;query;pagePath;pageGroup

Ответить
Развернуть ветку
Чайка О.

*Извините, если выглядит так, будто я прикапываюсь; на самом деле, пытаюсь понять, как лучше применить.*
Есть ли смысл именно в таком представлении данных?
Если запросы жёстко привязаны к группе, а группы заданы заранее, то для отслеживания динамики групп (и запросов внутри этих групп) их проще визуализировать отдельно. Или логическими блоками (например, разделами). Возможно, вы это уже где-то имели в виду, но я не так поняла.
В то же время для понимания общей динамики можно не задавать группы вообще.
Или я ошибаюсь?

Ответить
Развернуть ветку
Damian Kapranov
Автор

Все верно! Так как описан верхнеуровнево подход, то вариантов применения может быть множество. Можно делать графики уже по отдельным группам, а можно все склеивать в один.

Пока для нас это adhoc задача, которая не встала на поток. Вполне вероятно, что мы будем эволюционировать этот метод и развивать его в дальнейшем. Если это произойдет, я обязательно напишу вторую часть этой статьи с апдейтами.

Ответить
Развернуть ветку
Чайка О.

"трафик на страницу" – по тому же запросу

Ответить
Развернуть ветку
Виктор Петров

Отличный текст, заныкаю в закладки для перечитывания - заинтересовала методика работы с данными. Сам копаю в этом направлении, но иначе и много непонятного.
Больше про дата-сатанизм в сеошке!

Ответить
Развернуть ветку
Damian Kapranov
Автор

Спасибо! Мне остаётся только стать дата-сатанистом, чтобы писать про него больше :)

Ответить
Развернуть ветку
Виктор Петров

Любые идеи и подходы - в жилу, это самое ценное. Этот мир явно устал от чеклистов и "делайте ваш сайт лучше, а хуже не делайте"

Ответить
Развернуть ветку
Диана Ашумова
>>Элемент на графике это запрос+страница, а группа таких элементов — это какая-то условная группа, если вам нужно ее выделить.

Дмитрий, а для вас важнее было анализировать позапросно, а не по кластерам, привязанным к одной посадочной странице?

Покажите Ваш сайт с продуктом по продаже билетов на мероприятия? Что происходит с посадочной страницей мероприятия, которое уже прошло? Вы ее оставляете для индексирования или склеиваете с чем-то подходящим?

Ответить
Развернуть ветку
Damian Kapranov
Автор

1. Чтобы снять позицию страницы в нашем случае пришлось брать конкретные запросы, а не кластеры. Если есть возможность узнать средние позиции страницы в целом кластере, полагаю, что это тоже можно использовать.
2. Я пока не хочу ссылаться на продукт, чтобы это не выглядело рекламой. Старые страницы мероприятий почти всегда остаются открыты к индексации и ловят трафик, который мы стараемся конвертировать на схожие по экспириенсу или на будущие этого же артиста/группы, если такие планируются (не редирект, а соответствующие элементы в UX).

Ответить
Развернуть ветку
13 комментариев
Раскрывать всегда