Парадоксы аналитики SEO-данных

Причина, по которой в названии статьи есть слово «парадокс», заключается в неопределенности работы с данными, что обусловлено изменением работы поисковых систем. Автор статьи Влад Осадчий, аналитик SEOWORK, специализируется на работе с «буржем» (западное направление), поэтому все пояснения будут строиться на ПС Google и ее описании.

Достоверность SEO-данных

Что значит «неопределенность», и как члены нашей команды с ней справляются.

Для тех, кто не следит за изменениями поисковых алгоритмов Google, а также их UI/UX сайта google.com, обращу внимание на некоторые новости.

24 августа 2021 года в блоге, а также месяцем позже Google была опубликована статья о том, как ПС автоматически генерировала теги <title> на основании запроса к поисковой системе.

Сейчас они утверждают, что позапросно этого не делают, однако замена по-прежнему происходит преимущественно в случаях, когда длина <title> больше 60 символов.

Да, если Вам будет лень читать статьи, поясню откуда берутся данные для сгенерированных :

  • <H1>
  • <H2>
  • <alt> какого-либо изображения (возможно, LCP, но это неточно)

Может что-то и упустил, но с этими кейсами замены сталкивался на практике.

Кроме автогенерации, Google имеет фичерд сниппеты (Featured Snippets), их виды мы описывали у нас в статье.

Рич сниппеты (Rich Snippets) - сниппеты в органической выдаче, появляющиеся в основном благодаря микроразметке данного документа. Они позволяют повысить CTR в SERP. Звездочки, отзывы, How-to и пр.

Более того, если мы говорим про UI/UX сайта google.com, то ребята внедрили INfinite scrolling на мобильной выдаче, а неделю назад - на десктопной. Таким образом, шутка про «хотите спрятать тело, спрячьте его на второй странице выдачи Google», больше неактуальная.

Мы подсветили лишь ряд моментов. Надеемся, помогли вам осознать, что метрики, на основании которых производится распределение CTR в поисковой выдаче Google - величина непостоянная. И даже исследования, проводимые гигантами типа Backlinko, хоть и дают представление, но не являются истиной в последней инстанции.

В SEOWORK при аналитике данных мы также опираемся на распределение CTR. У нас есть собственная рассчитанная формула. И что интересно, полученные константы, использующиеся в нашей формуле, совпадают с тем, что мы видим у Backlinko.

«Переменные», влияющие на достоверность

В главе выше мы подсветили причины, по которым распределение CTR в SERP ПС Google не является 100% точным, ввиду чего оценка видимости проекта в любой поисковой системе может вызвать сомнения, а также усложнять задачу по прогнозированию трафика. Специалист, анализируя определенный поисковый запрос, не может учесть вероятность появления:

  • дополнительной позиции контекстной рекламы в SERP,
  • появление колдунщика,
  • географические, политические и пр. изменения, оказывающие влияние на спрос по вашей нише или конкретному кластеру.

Комплексный подход подразумевает учет всех (или доступных) нам переменных:

  • Мы уже умеем собирать нулевую позицию с поисковой выдачи
<i>Источник: SEOWORK Positions Report</i>
Источник: SEOWORK Positions Report
Парадоксы аналитики SEO-данных
  • Google Keyword Planner уже отдает среднемесячную частотность за прошедший год
Парадоксы аналитики SEO-данных
  • И наш отдел разработки занят тем, чтобы прикрутить «сезонность», избавив нас еще от одной «переменной» при анализе SEO-метрик
Парадоксы аналитики SEO-данных

Источник: Google Trends

Аналитика, с учетом «переменных»

Но несмотря на то, что мы умеем агрегировать данные, как никто другой на рынке, не каждый специалист способен адекватно их обработать, даже при наличии доступа к платформе SEOWORK.

Рассмотрим на примере интернет-магазина.

Ин-хаус специалист залил семантику по кластеру определенного оборудования, причем инструмент, который «дал» ему эти ключевые слова, нашел 52 ключа для одной посадочной страницы и в среднем по 3-5 ключей, для остальных в этом сегменте

<i>Источник: SEOWORK Visibility Module - URLs</i>
Источник: SEOWORK Visibility Module - URLs

Таким образом, неравномерное распределение ключевых запросов по посадочным страницам сегмента может повысить зависимость ряда метрик (Средняя позиция, ТОП100, ТОП10, ТОП3, Видимость), от одного URL. Последствия, к которым это может привести, вы видите на графики ниже: Многократное падение по показателю вхождения ключевых слов в ТОП3 и показателю частотности ключевых слов, ранжирующихся в ТОП10.

Парадоксы аналитики SEO-данных

И если знать, что искать, вы не потратите много времени на то оценку произошедшего.

Дело в следующем: когда инхаус специалист добавлял ключевые запросы, он не учел, что среди тех 52 - уйма НЧ (низкочастотных), а на другом УРЛе закреплен один ВЧ запрос, который составляет колоссальную часть от общей частотности сегмента. Таким образом, в случае, когда один ВЧ запрос вылетает из ТОП10 - страдает показатель по частотности в ТОП10 для всего сегмента, а %TOP3 вообще не коррелирует с частотностью. Другими словами, из ТОП3 выпали запросы с более низкой частотностью. То есть они выпали из ТОП3, но не из ТОП10, поскольку метрика ТОП10 (бирюзовая линия) не изменилась, соответственно, и на частотности они никак сказаться не могли.

Парадоксы аналитики SEO-данных

Помимо прочего, нужно учитывать, то, как именно ПС Google предоставляет свои данные по частотности. Обратимся еще раз к скриншоту из нашего модуля Positions Report:

<i>Источник: SEOWORK Positions Report</i>
Источник: SEOWORK Positions Report

Обратите внимание на частотность в красных боксах. Она совпадает у некоторых запросов.

Это связано с тем, что Google Keyword Planner отдает информацию об историчности частотности запросов на основании phrase match. Это значит, что инструмент «схлопывает» частотность нескольких похожих по смыслу запросов в одну группу и предоставляет эти данные на экспорт. Таким образом, каждый раз когда сторонний сервис отдает вам данные, нужно помнить что частотность по вашему конкретному запросу на самом деле меньше, чем вы видите.

На данный момент SEOWORK внедряет алгоритм, способный учитывать и эту недоработку со стороны GKP, а пока - запомните и учитывайте упомянутое выше при аналитике.

Влияние историчности данных по phrase match, отдаваемых GKP, на аналитику данных

Кейс, демонстрирующий, на что может повлиять phrase match:

<i>Источник: SEOWORK Visibility Module</i>
Источник: SEOWORK Visibility Module

Как вы видите на таблице выше, в первой колонке указаны домены, отсортированные по их видимости в поисковой системе Google, на основании данных от 8/12/2022. Непосредственные конкуренты данного проекта - это Affiliate сайты в iGaming нише.

Остальные же, как можно понять по вхождение ключевого слова в домен, являются брендами казино, зеркалами, либо аффилированными с данным брендом сайтами.

Для анализа видимости взят пул запросов кластера обзоров брендов казино, работающих в определенном гео. Как так вышло, что видимость у сайтов-зеркал конкретных брендов выше, видимости сайтов-обзорников?

В первую очередь давайте рассмотрим, что это за бренды:

  • Ozwin Casino
  • Fair Go Casino
  • Play Croco
  • Joe Fortune

Если мы откроем любой инструмент для анализа ключевых слов, мы поймем, что перечисленные выше бренды являются самыми популярными в нашем гео, то есть обладают наибольшим спросом. А поскольку ключевые фразы

  • «brand»
  • «brand» + casino
  • «brand» + casino review

похожи по смыслу, то GKP вероятно, определит их в одну группу по phrase match и присвоит каждому ключу максимальную частотность всей группы. Соответственно, чем популярнее бренды, тем большее как суммарная частотность группы запросов бренда, так и индивидуальная по каждому ключу.

А поскольку формула поисковой видимости Visibility - это не что иное, как «CTR позиции в ТОП10 выдачи» × «Частотность», то получается: чем больше частотность, тем больше видимость, тем большую часть %Visibility от кластера занимается %Visibility по конкретному бренду.

Заключение

Несмотря на то, что данные, предоставляемые ПС Google через Google Keyword Planner, должны считаться наиболее достоверными, различные сервисы аналитики стремятся показать своё первенство в этом аспекте, поскольку надежность данных является одним из важнейших критериев для конечного потребителя.

<i>Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.co%2FdXY3mSv467&postId=592887" rel="nofollow noreferrer noopener" target="_blank">SEMRUSH Blog</a></i>
Источник: SEMRUSH Blog

И каждый из крупных сервисов, говоря об источниках данных, упоминает связку «GKP + Third Party Sources», что не говорит о надежности, но не оставляет нам выбора за неимением других вариантов.

1111
Начать дискуссию