Чистка семантического ядра по доменам конкурентов

Классическая задача SEO-специалиста – собрать семантику под категорию товаров на сайте. Разберем один из способов, как можно упростить эту работу.

Например, необходимо составить семантическое ядро для охотничьего интернет-магазина по категории «Луки».

Чистка семантического ядра по доменам конкурентов

По запросу «купить лук» в Яндекс.Вордстате – изобилие самых разных смыслов: лук-севок, семена лука, город великие луки, спортивный лук и т.д.

Чистка семантического ядра по доменам конкурентов

Потребуется проверка, чтобы оставить в списке только целевые фразы – это «лук для охоты», «спортивный лук», «лук для стрельбы» и т.д.

Рассмотрим вариант, как проверить семантическое ядро на тематичность без глубокого погружения и ручной перепроверки незнакомых словосочетаний в поисковой выдаче. Для этого понадобится Excel и сервис Arsenkin Tools – такого набора достаточно, чтобы не делать всю работу руками, а частично автоматизировать сбор и чистку СЯ от нерелевантных запросов.

Новые публикации — в Telegram

Шаг 1 – подобрать маски для категорийных запросов

Составьте стандартные фразы, по которым будет выполняться парсинг запросов в Яндекс.Вордстате – название категории плюс стандартные коммерческие маркеры.

Например, для категории «Лук»:

лук купить

лук цена

лук интернет магазин

лук с доставкой

лук москва

Необходимо создать рабочий файл Excel (скачать заполненный пример и пустой шаблон) и сохранить данный список на листе «маски».

Шаг 2 – скачать запросы из Яндекс.Вордстата

Откройте инструмент «Парсинг ключевых фраз» в Arsenkin Tools.

Выберите соответствующий «Тип проверки» и добавьте список масок в поле «Ключевые запросы»:

Чистка семантического ядра по доменам конкурентов

Доп. настройки можно указать следующие – Регион-Россия, Устройства-Все:

Чистка семантического ядра по доменам конкурентов

Через несколько минут будет готов файл с результатом из Яндекс.Вордстата – по пяти маскам получилось собрать более 3500 запросов:

Чистка семантического ядра по доменам конкурентов

Полученную выгрузку необходимо сохранить в рабочем файле на листе «все запросы».

Шаг 3 – найти целевые запросы

Отберите несколько основных фраз, по которым в Яндексе представлены адекватные результаты поиска. Можно опираться на собственное знание предметной области и живую выдачу Яндекса.

Например, 5 ключевиков по категории «Лук»:

лук спортивный

лук для стрельбы

лук со стрелами

лук для охоты

лук классический для спорта

Данный список необходимо сохранить в рабочем файле на листе «целевые запросы».

Шаг 4 – найти целевые домены

Составьте список из нескольких сильных конкурентов, которые представлены в топе Яндекса по запросам из шага 3.

Можно опираться на собственное знание ниши, а также смотреть топ-выдачу Яндекса (вручную или через «Анализ ТОП выдачи» в Arsenkin Tools).

Важно – подойдут только узконаправленные сайты, на которых одновременно не продаются и спортивные луки, и лук для огорода. Озон, Вайлдберриз, Яндекс.Маркет – не подходят, т.к. являются универсальными сайтами.

Например, по спортивным лукам – следующие 10 доменов:

bowmaster.ru

forest-home.ru

moskva.armory24.ru

ortmen.ru

ohotaktiv.ru

pnevmat24.ru

russvoin.ru

sarbaletom.ru

centershot.ru

sportstrelok.ru

Список конкурентов необходимо сохранить в рабочем файле на листе «целевые домены», проставив во втором столбце единицы:

Чистка семантического ядра по доменам конкурентов

Шаг 5 – выгрузить топ-50 по ядру

На шаге 2 были подобраны запросы с помощью парсинга Яндекс.Вордстата. Отправьте данный список на сбор топ-50 Яндекса.

Для этого понадобится инструмент «Анализ ТОП выдачи»:

Чистка семантического ядра по доменам конкурентов

В результате, по входному списку 3 500 запросов будет доступен к скачиванию файл с 173 000+ строками (количество запросов *50):

Чистка семантического ядра по доменам конкурентов

Данную выгрузку необходимо сохранить в рабочем файле на листе «топ50 Арсенкин».

Шаг 6 – разметить целевые домены в топ-50

На листе «топ50 Арсенкин» добавьте новый столбец «домен» и протяните в нем формулу, которая обрезает URL-адрес до домена:

=ПОДСТАВИТЬ(ПСТР(E2;ЕСЛИОШИБКА(НАЙТИ("//";E2)+2;1);ЕСЛИОШИБКА(НАЙТИ("/";E2;ЕСЛИОШИБКА(НАЙТИ("//";E2)+2;1))-ЕСЛИОШИБКА(НАЙТИ("//";E2)+2;1);ДЛСТР(E2)));"www.";"")

Чистка семантического ядра по доменам конкурентов

Далее, добавьте еще один столбец «целевой домен» и протяните в нем следующую формулу:

=ВПР(K2;'целевые домены'!A:B;2;0)

Данные в столбце L интерпретируются так: 1 – целевой домен в строке, #Н/Д – нецелевой:

Чистка семантического ядра по доменам конкурентов

Для дальнейших вычислений скопируйте все содержимое листа «топ50 Арсенкин» на новый лист «отбор топ50», но уже без формул, т.е. в формате простых значений (иконка 123):

Чистка семантического ядра по доменам конкурентов

На листе «отбор топ50» необходимо удалить все строки со значением «#Н/Д», чтобы остались только целевые домены («1»). В результате, 173к строк сократились до 3,9к:

Чистка семантического ядра по доменам конкурентов

Шаг 7 – посчитать количество целевых доменов по каждому запросу

На листе «все запросы» добавьте новый столбец «Счет целевых доменов» и протяните вниз формулу:

=СЧЁТЕСЛИ('отбор топ50'!D:D;'все запросы'!D2)

Чистка семантического ядра по доменам конкурентов

Далее, скопируйте содержимое всего листа на новый лист «результат» и оставьте только нужные столбцы – «Фраза», «Частота запросов» и «Счет целевых доменов».

Отсортируйте столбец С по убыванию.

В верхней части списка отобразятся релевантные запросы, по которым в топ-50 Яндекса представлено максимум целевых доменов:

Чистка семантического ядра по доменам конкурентов

Внизу таблицы будут нерелевантные запросы, по которым в топ-50 Яндекса не встречаются домены конкурентов:

Чистка семантического ядра по доменам конкурентов

После определения порога релевантности по столбцу С (например, 3 и более) удалите лишние строки:

Чистка семантического ядра по доменам конкурентов

В результате, СЯ из 3500 запросов уменьшилось до 543 запросов. После удаления дубликатов – осталось 523 запроса. Данный список подойдет для завершающей чистки СЯ (например, удалить запросы про б/у и ремонт) или сразу для кластеризации:

Чистка семантического ядра по доменам конкурентов

Скачать рабочий файл Excel:

Заключение

Такой формат проверки СЯ на тематичность является гибким по своим настройкам. Если результат оказался не вполне корректным, можно изменить/расширить список сайтов на вкладке «целевые домены». Или сократить используемую выгрузку топ-50 до топ-10. Также, можно анализировать не только домены в топе, но и содержание сниппетов (выгружались в шаге 5).

__

Дублирующиеся, а также очевидно неподходящие запросы можно сразу удалить на шаге 2, чтобы сэкономить лимиты сервиса на шаге 5. Лучше всего отталкиваться от текущих ресурсов по времени и бюджету на задачу.

__

Данный способ обработки в Excel подходит для небольшого СЯ на 1-5 тысяч запросов. Если в списке больше 10 000 запросов, и это регулярная массовая задача по проработке различных категорий, то для шагов 5-7 эффективнее настроить соответствующий алгоритм в Power Query и использовать его на разных тематиках.

Обсудить статью и найти больше материалов:

2
17 комментариев