(function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); for (var j = 0; j < document.scripts.length; j++) {if (document.scripts[j].src === r) { return; }} k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)}) (window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym"); ym(41218439, "init", { defer: true, clickmap:true, trackLinks:true, accurateTrackBounce:true }); ym(41218439, 'hit', window.location.href);

Поиск точек роста для SEO и performance за счет аналитики товарных сегментов. Кейс Printbar

Когда приходишь в крупный ecom, есть стойкое ожидание, что здесь уже все есть: красивые дашборды, структурированные данные, аналитика как на ладони. Но это не так — в большинстве своем нужно делать все с нуля. Какие сложности есть в компании, где любое слово является ключевиком? Как выбрать инструменты аналитики? Да где эти ваши точки роста? Интересным кейсом поделился Евгений Горбунов, Head of SEO в Printbar, на прошедшем Optimization 2022.

Специфика проекта:

  • это мерч, одежда и всё-всё-всё с рисунком, принтом, изображением
  • бесконечная семантика
  • нет физических товаров, а по факту их миллион
  • 2 крупных игрока на рынке РФ
  • ТОП10 — это либо мы и конкурент, либо партнёры

Какая была проблематика проекта:

  • не было аналитики по каналам трафика в связке с другими категориями
  • не было никакой семантики, нет историчности
  • отчеты в Яндекс Метрике, Google и вебмастерах имеют сильную погрешность
  • мало инструментов для поиска точек роста
  • семантику (имеется в виду идеи) формируют смежные отделы, в том числе контекст, дизайнеры (как штатные, так и внешние) — нет единой системы
  • нельзя просто так создавать +100500 товаров
  • есть авторские права и лицензии

Проблематика в SEO:

  • на тот период было падение трафика примерно в 2 раза
  • плоская структура
  • много 18+ запросов
  • дубли названий у принтов = повтор карточек на первом листинге
  • влияние мировых событий
  • типичные SEO-проблемы: техничка, логи, мета, кф
  • слабая SEO-админка
  • canonical на трафиковых страницах
  • уникальность контента в тематике

От руководства стояли понятные задачи: нарастить органику в 2-3 раза, настроить работу процессов и построить систему аналитики SEO (данные по каталогу, семантике, трафику, продажам и др). На старте кейса была хорошая команда — крутой IT-отдел и дизайнеры. Но вместе с этим отсутствовала сила бренда, инструменты для сквозной SEO-аналитики, стратегии и систематизации в целом. Многие процессы пришлось выстраивать с нуля, и вот как это было!

Систематизируем

Было много-много процессов, которые работали без какой-либо основы — нужна SEO-стратегия. Уже в рамках плана оптимизации быстро собирали семантику и прорабатывали критические проблемы. Далее решались на переезд каталога — уходили от плоской структуры. Формировали бэклог задач, где ключевыми у являются аналитика и фундаментальные отчеты. Определялись с инструментами — будет интересный кейс на примере DATAFORCE от SEOWORK.

Выбор инструментов

Яндекс Метрика и Google Analytics настольные инструменты SEOшника, но все-таки они не рассчитаны на загрузку огромного объема данных. Сервисы, во-первых, начинают тормозить, а во-вторых, нет фильтров для собранных сегментов. В силу неудобств аналитики этими инструментами обратились к Google Data Studio и SEOWORK.

В GDS строили дашборды, на которых отфильтровали страницы по нужным запросам, а также создали 3 фундаментальных отчета: трафик, поиск по сайту и Google Search Console (последний сервис часто используется дизайнерами проекта). Дашборды GDS довольно простые, но к их преимуществам можно отнести обработку большого массива данных без лагов, фильтр точек входа, поиск страниц вне структуры, а также фиксацию резких изменений (прирост/падение). В Printbar данные рассматриваются часто: сравниваем 7 дней к предыдущим 7 дням и смотрим динамику.

Google Data Studio — уже отфильтрованные данные

Семантика 18+

Порядка 10 тыс кликов в Google приходилось на “спорные” запросы. Как оптимизировали работу с ключами 18+?

  • Убрали все “взрослые” макеты из детской категории
  • Убрали рекомендации товаров с принтами 18+ категории для детей
  • Во “взрослых” продуктипах не показываются детские товары
Результат оптимизации семантики 18+

Таким образом снизили показы где-то до 1000.

Инструменты SEO-аналитика

Как уже сказано выше, в Google Data Studio составляются 3 типа отчетов. Наряду с этим инструментом Printbar использует Power BI для органического трафика. PBI удобнее GDS, однако первый нуждается в хорошей поддержке и инфраструктуре, т.к. здесь завязаны данные из BigQuery, а это уже требует определенных скиллов от аналитика. Дополнительно проект собирает данные по позициям из Serpstat, базовую текстовую аналитику в Searchlab и вхождения в текстах в Labrika.

Большинство данных получаем из SEOWORK.

Модуль SEOWORK

Туда загружено порядка 30 тыс запросов, используется сегментация для визуализации данных на BI-отчетах.

Как Printbar использует платформу? Например, нужно узнать, какое количество товаров на листинге эффективнее, потому что они лучше конвертируют как в Яндексе, так и в Google.

Есть и другой пример.

Есть ряд вхождений “с принтом”. Важно понимать, какие спрос и видимость у таких запросов. Знание всей картины позволит делать соответствующие решения, например, добавлять эти фразы в тайтл.

Выбранные софты позволяют собирать отчеты, которые важны для работы отделов SEO, маркетинга и дизайна. Они иллюстрируют интересы пользователей, которые конвертируются в конкретные задачи. Другими словами, дизайнер видит запрос, под который стоит рисовать новый макет.

Кроме того, всегда на виду динамика проекта. Информация о росте или резком падении категорий дают возможность своевременно и без трафиковых потерь реагировать на обстоятельства.

Отделу SEO стало легко работать с новыми/старыми коллекциями в SEO-admin:

  • простой импорт и экспорт
  • API для фидов
  • управление блоками линковки
  • шаблонизаторы для всех meta и текстов (для листингов и карточек)
  • легко строить сегменты для SEOWORK

Для сайта с количеством страниц более 500 тыс, а тем более в 1+ млн такая детальная аналитика крайне важна, потому что в точках входа скапливается очень много мусора

Казалось бы, что мешает Printbar сгенерировать миллион запросов, создать столько же страниц и удвоить, а то и утроить прибыль? Увы, все не так просто.

Сложности с семантикой

Где искать?

К СЯ eCommerce такого плана относится все что угодно, включая мемы, фразы, знаки зодиака, праздники, города и еще бесконечное множество. Однако параллельно со “всем” существуют и лицензии — нельзя просто так взять и распечатать Человека-паука.

В целом вордстат у ребят из Printbar очень своеобразный. Он будто бы все отображает, но при этом не всегда успевает. Например, сегодня будет релиз трека популярного исполнителя, вечером он станет хитом, и завтра уже все хотят найти трендовые принты. Из-за этого доля трафика проекта составляет 50% листинги и 50% карточки товаров. Отсюда важные условия:

  • на многое влияет название карточки
  • наличие карточки в индексе необходимо
  • существует нерелевантность карточки (в основном в Google)
Отчет из Google Data Studio + Яндекс Вордстат

Вордстат не всегда отражает реальность/актуальность и не понимает интент. Например, запросы про мерч с певцом “shaman одежда” вордстат не учитывает. Благодаря отчету по внутреннему поиску сайта учитываются только релевантные проекту запросы. Заметив реальный спрос, команда создает новый принт и новую карточку товара, которую пользователь может купить.

Как Printbar ищет семантику?

  • Внутренний поиск, вебмастера — ключевой инструмент
  • Парсинг конкурентов и выдачи
  • Сервисы keyso, moab, букварикс, overlead
  • Инфо сайты по фильмам, играм
  • Сайты с картинками
  • Мемы, ситуации и другой креатив

Найденные запросы проверяются в инструментах на предмет массовости желания и при соответствующих показателях запускается в работу.

Как собирать?

У проекта есть своя фишка. Чтобы потом не делить на группы большой массив данных, команда сразу их формирует. Собираются все коллекции через скрейпер, создается элементарная сцепка, например, [по возрасту — 27 лет: 27 лет футболки] или [Rap — 2Pac: 2Pac футболки] и тд — все это парсится, проверяется частотность, и в результате получается семантика готовая к загрузке в SEOWORK и другие инструменты. Такой метод можно использовать в любой тематике (металлопрокат, промышленное оборудование…).

План сбора

  • Генержка: берем “природа”, собираем весь словарь, нормализуем в py7.ru/tools/norm/
  • Комбинируем с продуктипами, коммерческими и тематическими масками
  • Парсим подсказки, wordstat, mutagen, overlead, word-keeper
  • Парсим рел.страницы (вдруг уже есть, а топа нет)
  • Через рел.страницы парсим еще в moab, keyso
  • Парсим инфо сайты любой тематики: кино, музыка, аниме, игры
  • Парсим нужные поля типа: автор, режиссер, актер, герой

Метрики

Что учитывается при работе с семантикой:

  • Частотность (в том числе за год)
  • Вебмастера: показы / клики
  • Данные внутри поиска: показы / количество запросов
  • Данные по контексту: показы
  • Данные ТОП10: наличие сайтов нашей тематики (иногда могут быть выше нас)
  • Данные специфических сайтов:
  • • количество просмотров аниме/сериалы
  • • количество подписчиков в группе ВКонтакте и тп

Поясним про последнее. Например, появляется какая-то малоизвестная музыкальная группа. В вордстате нет репрезентативных данных. Но параллельно с этим в официальном сообществе ВК этой муз. группы порядка 40 тыс подписчиков = пользователям интересно, а у дизайнера появилась задача отрисовать новый принт.

Как хранить?

Хранить 3+ млн фраз в постоянной обработке, а вместе с ними “нулевки” и запрещенки тяжело. В виду того, что нам не нужна классическая кластеризация, а все данные лежат на уровне коллекций, вопрос с хранением стоит остро. Для такого количества информации Printbar работает над созданием собственного сервиса.

Вывод:

  • Собирайте отчеты в pbi/gds и смотрите точки входа
  • Обогащайте доп. данными по семантике
  • Используйте вебмастера, там больше актуальности
  • Поиск по сайту - дает очень много инфы
  • Парсите сайты ближайших тематик, идеи для кластеров
  • Смотрите зарубежные сайты схожей тематики
  • Если доступ к статистике маркетплейсов, используйте
  • Разбирайте названия карточек и их характеристики
  • По возможности храните данные у себя
  • Комбинируйте фразы, парсите вглубь

Первый результат

Обновленное семантическое ядро вышло на 21 тыс запросов. Залили его в сеть и вот что получили практически сразу:

  • Решили критические тех. проблемы и систематизировали работу с IT в течение 3-х месяцев
  • Сформировали стратегию и бэклог задач в течение 2-х месяцев
  • К Новому году (2022) вышли на хороший трафик даже с учетом сезона

Поиск точек роста: DATAFORCE

Структура

В Print Bar есть Power BI, но его не хватает для полноценной аналитики. Выбор пал на DATAFORCE, потому что это наш инструмент)

В виду специфики у проекта есть 2 ключевых структуры: листинги и карточки товаров. Есть потребность мониторить отдельно как “худи”, так и в целом категорию “игры”. В DATAFORCE можно увидеть количество и листингов, и карточек, что критично для Print Bar.

Быстрый мониторинг на предмет какие коллекции и на каком продукте покупают, что именно приносит трафик. Или наоборот, что перестало приносить его — тогда аналитики решают, что с этим делать, оставлять или удалять.

Опять же, какой дизайн и на каком продукте покупают/приносит трафик? Для креативного eCommerce такого плана эти данные необходимы, поскольку на них завязана большая работа команды дизайнеров.

Карточки товаров

Стандарт: "спарсили названия товаров → создали теги → растем". Прием хорошо работает, но как этот процесс выглядит в Print Bar? Для роста трафика на сайте принтов большую роль играет нейминг карточек. Они уже имеют какое-то название, но часто возникает проблема дубликатов. Например, на 1 листинге может быть 40 карточек с одинаковым названием, что плодит неуникальность и прочие проблемы. Такие задачи Printbar решает, используя ренейминг в SEO-админ и впоследствии мониторит динамику трафика в DATAFORCE.

Performance

Отделам контекста, SMM, email тоже важно мониторить, что продается хорошо, куда идет трафик, а где он пропал, что конвертируется лучше и тд. Быстрая реакция на изменения не даст бизнесу потерять прибыль.

Практика

Старые карточки

В Google Data Studio нашли старые карточки товаров, которые тянутся из очень старой структуры сайта, но при этом приносили хороший трафик в Google. Однако на тот момент не удалось понять, сколько именно, потому что не удалось построить маску. Команда приняла решение сделать 301 редирект. Какая-то часть переехала в новую структуру, но в основном потеряли около 4,5 тыс трафика.

Дополненное представление в поиске Яндекс

  • Подключили API yml
  • На старте было где-то 1400 фидов, что равняется 53 млн офферов. Офферов действительно было много, но можно их тегать с помощью utm — удобно для внутренней аналитики. Был хороший прирост трафика
  • Со временем решили урезать количество фидов и сейчас около 250 = ~6,6 млн офферов — трафик постепенно начинает расти
  • Доля посетителей, совершивших заказ = ~3%

Дополнение от Яндекса интересное, есть свои особенности. Например, если у Printbar не будет карточки или листинга в индексе, но при этом человек сделает запрос с принтом и попадет в нужное название, то покажется ваш проект. Это позволяет всегда получать какую-то долю трафика.

0
8 комментариев
Написать комментарий...
Сергей Фром

интересная специфика бизнеса, спасибо за хороший доклад и статью

Ответить
Развернуть ветку
Viktor Galich

Как в описанном случае трекается платный трафик? Используете ли эти данные для формирования СЯ?

Ответить
Развернуть ветку
Евгений Горбунов

Контекст (продажи) трекался в PBI. В data studio я только под seo формировал отчеты, но и другие каналы там были видны. В остальном такого запроса не поступало от отдела.
В планах было совмещение ядра контекста и seo для поиска не охваченных точек.

Ответить
Развернуть ветку
Viktor Galich

понял, спасибо

Ответить
Развернуть ветку
Чайка О.

Спасибо, интересно.

нам не нужна классическая кластеризация, а все данные лежат на уровне коллекций

Можно подробнее об этом?
Если не классическая кластеризация, то какая?
Что означает хранение коллекциями?

Ответить
Развернуть ветку
Евгений Горбунов

Ольга, приветствую!
Классическая = собрали запросы, кластеризовали в любом сервисе по любому методу, залили эти кластеры.
Ориентир на топ - не работает, потому что его формирует по сути 2 сайта, все остальные партнеры. И у обоих сайтов - одна технология структуры.
Есть всегда четкая привязка товара к типу (футболка) и к коллекции (авто - мерседес).
Не классическая - распределение на более низкий уровень что и было реализовано (авто - мерседес - amg), а так же "теги" (можно собирать из текстовых сущностей), только кластеризация идет на основе текстовых вхождений названий товаров.

Ответить
Развернуть ветку
Чайка О.

Добрый день, Евгений.
Спасибо за ответ.
О хранении спросила потому, что тоже попала в похожую тему. Пришла к выводу, что удобнее хранить данные в базе, а заполнять разделы по маркерам из текстовых сущностей.

Ответить
Развернуть ветку
Чайка О.

Оказывается, ГДС уже Looker Studio.

Ответить
Развернуть ветку
5 комментариев
Раскрывать всегда