Как оцифровывать данные и почему это актуально? Аналитика крупного e-commerce на примере “Детского мира”

На майском воркшопе, ведущий аналитик SEOWORK Владимир Кореков, демонстрировал алгоритм работы с товарными направлениями, начиная с парсинга сайта и вплоть до загрузки в платформу, а также выстраивал гипотезы для роста сайта в тематике e-commerce. Статья написана на основе вебинара, который можно посмотреть на YouTube-канале SEOWORK по ссылке.

Приготовьтесь, статья носит прикладной характер — будет много описаний действий и скриншотов!

В связи со сложившейся политической ситуацией ряд брендов покинул российский рынок, оставив после себя поле свободного трафика. В поисковой выдаче заметны изменения позиций eCommerce разных ниш. Из-за экономических изменений в конце февраля – начале марта спрос резко вырос, а видимость потеряла зарубежных игроков, что обрушило волну трафика на оставшиеся в России бренды.

Как мини-вывод — важно адаптировать e-comm не только с точки зрения SEO, но и не забывать проявлять маркетинговую активность, развивать свой бренд. Известность поможет стать номером 1 после ухода крупных популярных игроков.

В связи с возникшими возможностями для развития eCommerce важно объективно проанализировать имеющиеся данные собственного проекта. Один из возможных курсов работы над эффективностью eComm — полноценная аналитика товарных направлений. На основе известного игрока рынка в нише товаров для детей рассмотрим возможности для коррекции стратегии поискового маркетинга.

Оцифровка данных и загрузка в SEOWORK на примере крупного e-commerce “Детский мир”

“Детский мир” — один из крупнейших лидеров ниши товаров для детей. На его примере рассмотрим составление товарных направлений для проекта и последующей выгрузки в SEOWORK.

Семантика Детского мира
Семантика Детского мира

Мы имеем слепок семантики Детского мира — запросы и базовое распределение по посадочным страницам. Наша задача: определить категорию, товарное направление для всех страниц. Для выполнения поставленной цели обращаемся к сайту исследуемого e-commerce.

Товарная карточка на сайте Детского мира
Товарная карточка на сайте Детского мира

Сначала мы обращаем внимание на вложенность URL, однако она не всегда работает. У “Детского мира” собственная структурность, поэтому мы обращаемся к хлебным крошкам — именно там, как правило, отражается структура вложенности (раздел, подраздел, подраздел 2-го уровня и т.д.). Чтобы собрать хлебные крошки для каждой страницы, мы обращаемся к парсеру SEO Frog (“лягушка”) — самый известный дефолтный инструмент и язык запросов к документу XPath.

Код страницы сайта Детского мира
Код страницы сайта Детского мира

Нам нужно определить хлебные крошки в коде страницы. В данном случае это тег nav, класс r_2. Мы видим вложенность в nav, поэтому углубляемся дальше по кодовому пути и обращаемся к элементам li.

Код страницы сайта Детского мира
Код страницы сайта Детского мира

Проверяем – все элементы li удобно разделены по направлениям. Теперь мы можем задать получившийся путь //nav[@class=”r_2”]/ul/li в “лягушку”, а именно Configuration → Custom → Extraction.

Как оцифровывать данные и почему это актуально? Аналитика крупного e-commerce на примере “Детского мира”

Создаем новый XPath, придумываем понятное название и указываем вычисленный путь. После сканирования получаем нужную выгрузку и переходим в Excel.

Структурные сегменты Детского мира в Excel
Структурные сегменты Детского мира в Excel

Полученный из XPath файл с помощью Excel подчищаем и на основе исходного семантического ядра для каждой страницы подтягиваем соответствующее товарное направление. На выходе у нас получается связка из столбцов Запрос → URL → Категория.

Совет: последний столбик следует проверить на отсутствие пропущенных строк, чтобы впоследствии не возникло ошибок.

Если все в порядке, сохраняем готовую структуру и переходим к выгрузке файла в платформу SEOWORK.

Выгрузка в SEOWORK
Выгрузка в SEOWORK

Тип задания: Добавление запросов (Обновление страниц и категорий)

Проект: “Детский мир”

Название задания: Категории

Тип файла: XLSX

После добавляем файл через загрузку.

На примере “Детского мира” видно, что структура достаточно подробная и каждое направление делится еще на категории, подкатегории и т.д. Для более детального анализа и качественного мониторинга ниши можем оцифровать настолько подробно, насколько это нужно.

Создание товарного направления “Игрушки” и понятная аналитика получившихся данных

Товарное направление: Игрушки
Товарное направление: Игрушки

Внутри самой большой категории игрушек создадим категорию второго уровня.

  • Возьмем за основу “игрушки” и все страницы, которые содержат дальнейшую вложенность – этого будет достаточно.
  • Создаем отдельный лист в Excel и копируем туда из исходника путь URL → Игрушки и игры → Названия подкатегории игрушек (конструкторы, куклы и т.д.).
  • Используя нейминг в новом столбце собираем сегмент, соответствующий нужному пути, например, игрушки и игры > игрушечный транспорт.
  • Убираем лишние столбцы с дублирующей информацией и получаем конечную удобную связку URL → Подкатегория.
  • Получившийся файл также подгружаем в платформу, но уже в типе задания выбираем “Добавление группы страниц (Страницы)” и называем, например, “Товарные направления в игрушках”.
  • Загружаем и переходим к самому долгожданному — просмотру данных.
Аналитика в модуле Видимость: табличный вид
Аналитика в модуле Видимость: табличный вид

Когда у нас есть распределение страниц по категориям, мы можем просматривать информацию по общему количеству страниц, количеству запросов на каждую категорию, а также точечные данные по SEO-метрикам (спрос WS, “WS”, “!WS”; видимость %ТОП3, %ТОП5, трафик %PTraf и др.).

Детализированность данных позволяет обратить внимание не только на общее состояние сайта, но и в разрезе каждого направления и товара для поиска и развития точек роста и гипотез. По метрикам спроса можно выявить самые высокочастотные категории, по трафику — самые большие охваты.

Можно рассматривать и от обратного: вычислять категории с небольшим спросом и предполагать, что в этих направлениях меньше конкуренции, а значит можно достичь результатов быстрее и меньшими усилиями (гипотетически, конечно). Для работы с данными можно задать любой период и отследить спад или наоборот скачок в сравнении с предыдущим годом, например.

Аналитика в модуле BI: Спрос товарного направления Игрушки
Аналитика в модуле BI: Спрос товарного направления Игрушки

Данные имеют как табличный вид, так и динамичный образ в модуле BI. С момента загрузки проекта данные насыщают графики и позволяют отследить изменения по каждому направлению. Помимо динамики, можно фиксировать среднее значение по сегментам. Например, у Детского мира 53% всего спроса приходится на игрушки и детские игры.

Аналитика в модуле BI: Видимость товарного направления Игрушки
Аналитика в модуле BI: Видимость товарного направления Игрушки

Динамика отслеживается и по видимости каждого товарного направления. Углубившись в категорию “игрушки и игры”, мы можем рассмотреть подробнее “куклы и аксессуары”, “мягкие игрушки”, “детские конструкторы” и т.д., чтобы мониторить их изменения в спросе и видимости, выстраивать приоритет в рамках подкатегорий.

У Детского мира в разрезе среднего спроса заметно, что на “игровые наборы и фигурки” приходится 19% всего “игрушечного” спроса, но при этом видимость этой категории самая низкая.

Таким образом, уже сейчас можно выстроить приоритет по проработке задачи, т.к. направление заметно популярное среди пользователей, но при этом теряет в выдаче. После проработки велик шанс охватить весь приходящийся на подкатегорию спрос — потенциал для роста максимальный.

Средний спрос: Типы страниц
Средний спрос: Типы страниц

Полезно отслеживать информацию о спросе и видимости на определенные типы страниц. Полученные данные проиллюстрируют, на какую именно часть сайта приходится бОльшее количество спроса, а значит выделит приоритет по работе SEO-команды или подрядчика.

Как правило, у e-commerce проектов самые спросовые страницы — листинги и карточки товаров. “Детский мир” удерживает золотую середину для специфики своей ниши.

Аналитика элементов карточек товаров и построение гипотез

Аналогично тому, как мы с помощью XPath забирали информацию о всей структуре сайта, мы также можем собирать информацию о любом отдельном элементе, который нас интересует. Для примера мы рассмотрим корреляцию количества фото, отзывов, а также наличие оплаты частями с видимостью в поисковой выдаче.

Так же, как делали ранее, парсим в “лягушке” и преобразовываем полученную информацию в сегменты следующим образом:

URL → [карточка товара] оплата частями: есть / нет

URL → [карточка товара] количество фото: 1–4 / 5–10 / 11–30

URL → [карточка товара] количество отзывов: 1–5 / 6–25 / 26–100 / 100+

Аналогично загрузке предыдущих файлов добавляем в систему новые.

Средний спрос: Оплата частями
Средний спрос: Оплата частями

Теперь мы можем приступить к аналитике в разрезе конкретных элементов сайта. Динамика спроса в рамках оплаты частями не сильно информативно, поскольку она не дает данные, провоцирующие на новые точки роста, однако обратить внимание на общий процент спроса полезно. Заметно, что ⅔ спроса приходится на карточки, где нет оплаты частями.

Видимость: Оплата частями
Видимость: Оплата частями

В видимости элемента отлично иллюстрируется разница между наличием и отсутствием оплаты частями. Карточки товара, у которых присутствует исследуемый элемент, несмотря на меньший спрос, имеет видимость в два раза выше по сравнению с карточками без оплаты частями.

Это ценная дополнительная информация, из которой рождаются гипотезы, например, о прямом влиянии на видимость карточек товара. Однако не является аксиомой обязательного добавления оплаты частями на все карточки разных e-comm проектов.

В контексте Детского мира разница показательная, поэтому следует проверить возникшую гипотезу и попробовать добавить элемент на 20-40 карточек, а через время посмотреть на рост по метрикам видимости. И если корреляция повторится, то либо повторять эксперимент, либо масштабировать на весь проект.

Средний спрос: Количество фото
Средний спрос: Количество фото

По среднему спросу наблюдается примерное равенство.

Средняя видимость: Количество фото
Средняя видимость: Количество фото

На основе данных видимости наблюдаем: чем меньше фотографий, тем хуже ранжируются карточки. У карточек с 1–4 фото самый низкий показатель и самая большая видимость у карточек, которые имеют 11+ фотографий.

Далее для коррекции стратегии поискового маркетинга карточки с фото можно разбить на еще более мелкие сегменты, чтобы найти оптимальное количество фото и оптимизировать контентные издержки (не перегружать контент-мейкеров и перераспределить бюджет).

Средний спрос: Количество отзывов
Средний спрос: Количество отзывов

Аналогичная ситуация, спрос делит логичные доли.

Средняя видимость: Количество отзывов
Средняя видимость: Количество отзывов

Опять же, карточки с наименьшим количеством отзывом 1–5 ранжируются хуже всего, в то время как карточки с отзывами 100+ ранжируются лучше. Но не нужно воспринимать полученную аналитику как данность. С точки зрения отзывов, бывают и обратные корреляции, потому что они могут быть не уникальные, заспамленные, без разметки, с отрицательными рейтингами и т.д. При точечной проработке этого элемента появится более прикладной инсайт, нежели основанный только на количество отзывов.

Если есть возможность повышать количество отзывов, то ей нужно пользоваться, но не ограничивать себя в гонке за любым контентом пользователей. Следует смотреть на картину шире, искать закономерности, смотреть на данные от отзывов с фото и видеоконтентом. Контент на странице необходимо отслеживать.

Рекомендации по работе с e-comm проектом:

  • обязательно мониторить спрос своей ниши на все бренды/вертикали (адаптировать свою стратегию, исходя из изменений)
  • проводить такой же мониторинг по поисковой выдаче (наблюдать, какие конкуренты растут, какие падают, чей трафик освобождается или наоборот расширяется и есть ли риск отдать свой трафик другому)
  • делиться данными с бизнесом (бизнес-стратегия едина, поэтому важно делиться данными с бренд-менеджерами, контент-мейкерами и тд)
  • формировать стратегию замены и расширения
  • не инвестировать в SEO/контент, бренды/вертикали, которые в зоне риска потери трафика/продаж

Как SEOWORK может помочь:

  • мы предоставляем все данные по поисковой выдаче и спросу
  • предлагаем новый бесплатный BI раздел “Анализ ниш”, где видна вся матрица категорий брендов с еженедельными срезами спроса и выдачи
  • обучаем работе с данными для принятия решений
  • предоставляем услуги консалтинга по стратегии работы с ассортиментом
  • помогаем принимать бизнесу решение на стыке SEO + продукт + контент + маркетинг
1616
14 комментариев

Блин, отлично. Материал подготовлен шикарно, спасибо

1
Ответить

да, исполнение на 5+

1
Ответить

Полезно, спасибо.
Выгрузку по разным источникам как-нибудь типизируете?

1
Ответить

Спасибо за вопрос. Данные в этой статье из SEOWORK, они уже в нужном формате.

Ответить

Алгоритм хороший, но дороговато (имхо); есть более дешёвые варианты для решения таких задач.

1
Ответить

отличный был вокршоп)

1
Ответить

согласен, тоже зацепил

Ответить