SEOWORK

15 дек 2022 15.12.2022

Поиск точек роста для SEO и performance за счет аналитики товарных сегментов. Кейс Printbar

Когда приходишь в крупный ecom, есть стойкое ожидание, что здесь уже все есть: красивые дашборды, структурированные данные, аналитика как на ладони. Но это не так — в большинстве своем нужно делать все с нуля. Какие сложности есть в компании, где любое слово является ключевиком? Как выбрать инструменты аналитики? Да где эти ваши точки роста? Интересным кейсом поделился Евгений Горбунов, Head of SEO в Printbar, на прошедшем Optimization 2022.

Специфика проекта:

это мерч, одежда и всё-всё-всё с рисунком, принтом, изображением
бесконечная семантика
нет физических товаров, а по факту их миллион
2 крупных игрока на рынке РФ
ТОП10 — это либо мы и конкурент, либо партнёры

Какая была проблематика проекта:

не было аналитики по каналам трафика в связке с другими категориями
не было никакой семантики, нет историчности
отчеты в Яндекс Метрике, Google и вебмастерах имеют сильную погрешность
мало инструментов для поиска точек роста
семантику (имеется в виду идеи) формируют смежные отделы, в том числе контекст, дизайнеры (как штатные, так и внешние) — нет единой системы
нельзя просто так создавать +100500 товаров
есть авторские права и лицензии

Проблематика в SEO:

на тот период было падение трафика примерно в 2 раза
плоская структура
много 18+ запросов
дубли названий у принтов = повтор карточек на первом листинге
влияние мировых событий
типичные SEO-проблемы: техничка, логи, мета, кф
слабая SEO-админка
canonical на трафиковых страницах
уникальность контента в тематике

От руководства стояли понятные задачи: нарастить органику в 2-3 раза, настроить работу процессов и построить систему аналитики SEO (данные по каталогу, семантике, трафику, продажам и др). На старте кейса была хорошая команда — крутой IT-отдел и дизайнеры. Но вместе с этим отсутствовала сила бренда, инструменты для сквозной SEO-аналитики, стратегии и систематизации в целом. Многие процессы пришлось выстраивать с нуля, и вот как это было!

Систематизируем

Было много-много процессов, которые работали без какой-либо основы — нужна SEO-стратегия. Уже в рамках плана оптимизации быстро собирали семантику и прорабатывали критические проблемы. Далее решались на переезд каталога — уходили от плоской структуры. Формировали бэклог задач, где ключевыми у являются аналитика и фундаментальные отчеты. Определялись с инструментами — будет интересный кейс на примере DATAFORCE от SEOWORK.

Выбор инструментов

Яндекс Метрика и Google Analytics настольные инструменты SEOшника, но все-таки они не рассчитаны на загрузку огромного объема данных. Сервисы, во-первых, начинают тормозить, а во-вторых, нет фильтров для собранных сегментов. В силу неудобств аналитики этими инструментами обратились к Google Data Studio и SEOWORK.

В GDS строили дашборды, на которых отфильтровали страницы по нужным запросам, а также создали 3 фундаментальных отчета: трафик, поиск по сайту и Google Search Console (последний сервис часто используется дизайнерами проекта). Дашборды GDS довольно простые, но к их преимуществам можно отнести обработку большого массива данных без лагов, фильтр точек входа, поиск страниц вне структуры, а также фиксацию резких изменений (прирост/падение). В Printbar данные рассматриваются часто: сравниваем 7 дней к предыдущим 7 дням и смотрим динамику.

Google Data Studio — уже отфильтрованные данные

Семантика 18+

Порядка 10 тыс кликов в Google приходилось на “спорные” запросы. Как оптимизировали работу с ключами 18+?

Убрали все “взрослые” макеты из детской категории
Убрали рекомендации товаров с принтами 18+ категории для детей
Во “взрослых” продуктипах не показываются детские товары

Результат оптимизации семантики 18+

Таким образом снизили показы где-то до 1000.

Инструменты SEO-аналитика

Как уже сказано выше, в Google Data Studio составляются 3 типа отчетов. Наряду с этим инструментом Printbar использует Power BI для органического трафика. PBI удобнее GDS, однако первый нуждается в хорошей поддержке и инфраструктуре, т.к. здесь завязаны данные из BigQuery, а это уже требует определенных скиллов от аналитика. Дополнительно проект собирает данные по позициям из Serpstat, базовую текстовую аналитику в Searchlab и вхождения в текстах в Labrika.

Большинство данных получаем из SEOWORK.

Модуль SEOWORK

Туда загружено порядка 30 тыс запросов, используется сегментация для визуализации данных на BI-отчетах.

Как Printbar использует платформу? Например, нужно узнать, какое количество товаров на листинге эффективнее, потому что они лучше конвертируют как в Яндексе, так и в Google.

Есть и другой пример.

Есть ряд вхождений “с принтом”. Важно понимать, какие спрос и видимость у таких запросов. Знание всей картины позволит делать соответствующие решения, например, добавлять эти фразы в тайтл.

Выбранные софты позволяют собирать отчеты, которые важны для работы отделов SEO, маркетинга и дизайна. Они иллюстрируют интересы пользователей, которые конвертируются в конкретные задачи. Другими словами, дизайнер видит запрос, под который стоит рисовать новый макет.

Кроме того, всегда на виду динамика проекта. Информация о росте или резком падении категорий дают возможность своевременно и без трафиковых потерь реагировать на обстоятельства.

Отделу SEO стало легко работать с новыми/старыми коллекциями в SEO-admin:

простой импорт и экспорт
API для фидов
управление блоками линковки
шаблонизаторы для всех meta и текстов (для листингов и карточек)
легко строить сегменты для SEOWORK

Для сайта с количеством страниц более 500 тыс, а тем более в 1+ млн такая детальная аналитика крайне важна, потому что в точках входа скапливается очень много мусора

Казалось бы, что мешает Printbar сгенерировать миллион запросов, создать столько же страниц и удвоить, а то и утроить прибыль? Увы, все не так просто.

Сложности с семантикой

Где искать?

К СЯ eCommerce такого плана относится все что угодно, включая мемы, фразы, знаки зодиака, праздники, города и еще бесконечное множество. Однако параллельно со “всем” существуют и лицензии — нельзя просто так взять и распечатать Человека-паука.

В целом вордстат у ребят из Printbar очень своеобразный. Он будто бы все отображает, но при этом не всегда успевает. Например, сегодня будет релиз трека популярного исполнителя, вечером он станет хитом, и завтра уже все хотят найти трендовые принты. Из-за этого доля трафика проекта составляет 50% листинги и 50% карточки товаров. Отсюда важные условия:

на многое влияет название карточки
наличие карточки в индексе необходимо
существует нерелевантность карточки (в основном в Google)

Отчет из Google Data Studio + Яндекс Вордстат

Вордстат не всегда отражает реальность/актуальность и не понимает интент. Например, запросы про мерч с певцом “shaman одежда” вордстат не учитывает. Благодаря отчету по внутреннему поиску сайта учитываются только релевантные проекту запросы. Заметив реальный спрос, команда создает новый принт и новую карточку товара, которую пользователь может купить.

Как Printbar ищет семантику?

Внутренний поиск, вебмастера — ключевой инструмент
Парсинг конкурентов и выдачи
Сервисы keyso, moab, букварикс, overlead
Инфо сайты по фильмам, играм
Сайты с картинками
Мемы, ситуации и другой креатив

Найденные запросы проверяются в инструментах на предмет массовости желания и при соответствующих показателях запускается в работу.

Как собирать?

У проекта есть своя фишка. Чтобы потом не делить на группы большой массив данных, команда сразу их формирует. Собираются все коллекции через скрейпер, создается элементарная сцепка, например, [по возрасту — 27 лет: 27 лет футболки] или [Rap — 2Pac: 2Pac футболки] и тд — все это парсится, проверяется частотность, и в результате получается семантика готовая к загрузке в SEOWORK и другие инструменты. Такой метод можно использовать в любой тематике (металлопрокат, промышленное оборудование…).

План сбора

Генержка: берем “природа”, собираем весь словарь, нормализуем в py7.ru/tools/norm/
Комбинируем с продуктипами, коммерческими и тематическими масками
Парсим подсказки, wordstat, mutagen, overlead, word-keeper
Парсим рел.страницы (вдруг уже есть, а топа нет)
Через рел.страницы парсим еще в moab, keyso
Парсим инфо сайты любой тематики: кино, музыка, аниме, игры
Парсим нужные поля типа: автор, режиссер, актер, герой

Метрики

Что учитывается при работе с семантикой:

Частотность (в том числе за год)
Вебмастера: показы / клики
Данные внутри поиска: показы / количество запросов
Данные по контексту: показы
Данные ТОП10: наличие сайтов нашей тематики (иногда могут быть выше нас)
Данные специфических сайтов:
• количество просмотров аниме/сериалы
• количество подписчиков в группе ВКонтакте и тп

Поясним про последнее. Например, появляется какая-то малоизвестная музыкальная группа. В вордстате нет репрезентативных данных. Но параллельно с этим в официальном сообществе ВК этой муз. группы порядка 40 тыс подписчиков = пользователям интересно, а у дизайнера появилась задача отрисовать новый принт.

Как хранить?

Хранить 3+ млн фраз в постоянной обработке, а вместе с ними “нулевки” и запрещенки тяжело. В виду того, что нам не нужна классическая кластеризация, а все данные лежат на уровне коллекций, вопрос с хранением стоит остро. Для такого количества информации Printbar работает над созданием собственного сервиса.

Вывод:

Собирайте отчеты в pbi/gds и смотрите точки входа
Обогащайте доп. данными по семантике
Используйте вебмастера, там больше актуальности
Поиск по сайту - дает очень много инфы
Парсите сайты ближайших тематик, идеи для кластеров
Смотрите зарубежные сайты схожей тематики
Если доступ к статистике маркетплейсов, используйте
Разбирайте названия карточек и их характеристики
По возможности храните данные у себя
Комбинируйте фразы, парсите вглубь

Первый результат

Обновленное семантическое ядро вышло на 21 тыс запросов. Залили его в сеть и вот что получили практически сразу:

Решили критические тех. проблемы и систематизировали работу с IT в течение 3-х месяцев
Сформировали стратегию и бэклог задач в течение 2-х месяцев
К Новому году (2022) вышли на хороший трафик даже с учетом сезона

Поиск точек роста: DATAFORCE

Структура

В Print Bar есть Power BI, но его не хватает для полноценной аналитики. Выбор пал на DATAFORCE, потому что это наш инструмент)

В виду специфики у проекта есть 2 ключевых структуры: листинги и карточки товаров. Есть потребность мониторить отдельно как “худи”, так и в целом категорию “игры”. В DATAFORCE можно увидеть количество и листингов, и карточек, что критично для Print Bar.

Быстрый мониторинг на предмет какие коллекции и на каком продукте покупают, что именно приносит трафик. Или наоборот, что перестало приносить его — тогда аналитики решают, что с этим делать, оставлять или удалять.

Опять же, какой дизайн и на каком продукте покупают/приносит трафик? Для креативного eCommerce такого плана эти данные необходимы, поскольку на них завязана большая работа команды дизайнеров.

Карточки товаров

Стандарт: "спарсили названия товаров → создали теги → растем". Прием хорошо работает, но как этот процесс выглядит в Print Bar? Для роста трафика на сайте принтов большую роль играет нейминг карточек. Они уже имеют какое-то название, но часто возникает проблема дубликатов. Например, на 1 листинге может быть 40 карточек с одинаковым названием, что плодит неуникальность и прочие проблемы. Такие задачи Printbar решает, используя ренейминг в SEO-админ и впоследствии мониторит динамику трафика в DATAFORCE.

Performance

Отделам контекста, SMM, email тоже важно мониторить, что продается хорошо, куда идет трафик, а где он пропал, что конвертируется лучше и тд. Быстрая реакция на изменения не даст бизнесу потерять прибыль.

Практика

Старые карточки

В Google Data Studio нашли старые карточки товаров, которые тянутся из очень старой структуры сайта, но при этом приносили хороший трафик в Google. Однако на тот момент не удалось понять, сколько именно, потому что не удалось построить маску. Команда приняла решение сделать 301 редирект. Какая-то часть переехала в новую структуру, но в основном потеряли около 4,5 тыс трафика.

Дополненное представление в поиске Яндекс

Подключили API yml
На старте было где-то 1400 фидов, что равняется 53 млн офферов. Офферов действительно было много, но можно их тегать с помощью utm — удобно для внутренней аналитики. Был хороший прирост трафика
Со временем решили урезать количество фидов и сейчас около 250 = ~6,6 млн офферов — трафик постепенно начинает расти
Доля посетителей, совершивших заказ = ~3%

Дополнение от Яндекса интересное, есть свои особенности. Например, если у Printbar не будет карточки или листинга в индексе, но при этом человек сделает запрос с принтом и попадет в нужное название, то покажется ваш проект. Это позволяет всегда получать какую-то долю трафика.

61 показ

950 открытий

1 репост

8 комментариев

Написать комментарий...

Сергей Фром

15.12.2022

интересная специфика бизнеса, спасибо за хороший доклад и статью

Ответить

Развернуть ветку

Viktor Galich

15.12.2022

Как в описанном случае трекается платный трафик? Используете ли эти данные для формирования СЯ?

Ответить

Развернуть ветку

Евгений Горбунов

15.12.2022

Контекст (продажи) трекался в PBI. В data studio я только под seo формировал отчеты, но и другие каналы там были видны. В остальном такого запроса не поступало от отдела.
В планах было совмещение ядра контекста и seo для поиска не охваченных точек.

Ответить

Развернуть ветку

Viktor Galich

15.12.2022

понял, спасибо

Ответить

Развернуть ветку

Чайка О.

15.12.2022

Спасибо, интересно.

нам не нужна классическая кластеризация, а все данные лежат на уровне коллекций

Можно подробнее об этом?
Если не классическая кластеризация, то какая?
Что означает хранение коллекциями?

Ответить

Развернуть ветку

Евгений Горбунов

16.12.2022

Ольга, приветствую!
Классическая = собрали запросы, кластеризовали в любом сервисе по любому методу, залили эти кластеры.
Ориентир на топ - не работает, потому что его формирует по сути 2 сайта, все остальные партнеры. И у обоих сайтов - одна технология структуры.
Есть всегда четкая привязка товара к типу (футболка) и к коллекции (авто - мерседес).
Не классическая - распределение на более низкий уровень что и было реализовано (авто - мерседес - amg), а так же "теги" (можно собирать из текстовых сущностей), только кластеризация идет на основе текстовых вхождений названий товаров.

Ответить

Развернуть ветку

Чайка О.

16.12.2022

Добрый день, Евгений.
Спасибо за ответ.
О хранении спросила потому, что тоже попала в похожую тему. Пришла к выводу, что удобнее хранить данные в базе, а заполнять разделы по маркерам из текстовых сущностей.

Ответить

Развернуть ветку

Чайка О.

15.12.2022

Оказывается, ГДС уже Looker Studio.

Ответить

Развернуть ветку

Написать комментарий...

5 комментариев

Раскрывать всегда