88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

Всем привет. Последние годы я занимаюсь развитием с 0 (в частности, SEO продвижением) своих сайтов-агрегаторов. Я написал достаточно много статей про внутреннюю кухню развития таких сайтов (кому интересно все статьи в моём аккаунте vc.ru)

В данной статье на примере одного из своих агрегаторов msk.gde-mrt.ru (ниша - запись на МРТ и КТ), хотел показать, как я решал проблему так называемых малоинтересных страниц.

Всем, кто занимается сайтами-агрегаторами, либо похожими по структуре сайтами, может быть полезно.

Малоинтересные страницы

В документации яндекса ( ссылка ) можно увидеть, что сам Яндекс выделяет Малоценные И маловостребованные страницы.

Малоценная страница - страница может быть признана малоценной, если она является дублем или не содержит видимый роботу контент.

Маловостребованная - Робот Яндекса проверяет, насколько востребован контент страницы пользователями. Алгоритм оценивает каждую страницу, будет ли она показана по запросам на тех позициях, где пользователь сможет ее найти. Если страница без ошибок в HTML-коде, содержит контент, но в поиске нет пользователей и запросов, на которые она могла бы ответить, страница может быть исключена из поиска как маловостребованная.

В моём эксперименте меня интересовали именно Маловостребованные страницы. Проблема малоценных страниц решается через уникализацию контента, это отдельная история.

Почему вообще стоит решать эту проблему? Ответ прост:

Поисковики понижают общий рейтинг сайта за большое кол-во малоценных и маловостребованных страниц. Подробно про это писал другой автор в статье .

Итак, другими словами, маловостребованные страницы - это страницы, Семантическое ядро которых, равно нулю.

Может быть, вы удивитесь, но на сайтах агрегаторах таких страниц очень много. Забегая вперёд, на моём агрегаторе МРТ таких страниц было 88%, около 44 000 страниц). Почему так получается?

Всё достаточно просто.

Фундамент(ядро) сайта-агрегатора - это формирование страниц по шаблону через пересечение фильтров. Покажу на примере одного из своих агрегаторов https://msk.gde-mrt.ru/

Перед вами пример страницы листинга ( это типовая страница ) https://msk.gde-mrt.ru/mrt/ на которой выводятся все клиники, в которых можно сделать МРТ в Москве.

Title H1 текст и Description данной страницы создаются на базе шаблона, который прописывается в админке сайта один раз.

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

Таких уникальных страниц формируется тысячи и даже десятки тысяч. Каждый новый выбранный фильтр формирует новую уникальную для поискового робота страницу.

Например, я выбрал 2 фильтра и получил новую страницу https://msk.gde-mrt.ru/mrt/mrt-golovnogo-mozga/aviamotornaya/ с уникальными метаданными и уникальными объектами ( в моём случае это клиники)

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

При таком пересечение возникает одна глобальная проблема. Опять же посмотрим на примере моего конкретного агрегатора. У меня в карте сайта было около 50 000 страниц таких пересечений.

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

Назревает справедливый вопрос. А зачем вообще делать фильтр, если запросов под такую страницу нет?

Опять же покажу на примере. Посмотрим Скрин СЯ, отфильтрованный по метро Жулебино (метро - это фильтр, как вы помните)

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

По запросу МРТ желибно есть частотности, а вот, например, по запросу мрт печени жулебино запросов нет, частотности всех типов = 0.

Т.е. мы не можем просто “в лоб” убрать метро Жулебино, мы должны оставить только некоторые пересечения.

Задача была - оставить все эти фильтры на фронте, при этом удалить все страницы, которые не ищут. Прежде чем ниже опишу, каким элегантным решением мы закрыли эту проблему, покажу сколько конкретно на моём агрегаторе МРТ центров было таких страниц без частотностей:

88% из 50000 страниц не имели никакой частотности. На выходе, после решения данной проблемы, осталось чуть больше 6000 страниц.

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

Суть решения:

Каждый фильтр у меня настраивается в разделе Категории. Т.е. Метро Жулебино - это дочерняя категория Материнской Категории Метро. В админке нужно зайти в категорию метро Жулебино и проставить в специальной настройке только те категории, пересечения с которыми мы хотим оставить.

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

В скрине выше мы видим, что стоит галочка напротив МРТ, поэтому у нас есть полноценная страница https://msk.gde-mrt.ru/mrt/zhulebino/

А вот напротив МРТ печени галочки нет, и вуаля, мы получаем страницу https://msk.gde-mrt.ru/mrt/mrt-pecheni/?or[]=zhulebino

И для таких страниц мы в коде закрываем индексацию

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

У моего контент-менеджера заняло 2 дня руками проставить настройки для всех фильтров. В целом не критично. Рекомендую раз в период ( думаю раз в 3-5 месяцев вполне достаточно), перепроверять частотности и оживлять страницы, у которых появилась частотность).

Примерно ту же информацию я оформлял в видео формате, кому удобнее смотреть, чем читать

*****


Также я написал движок для агрегатора услуг. Если вам лень заморачиваться и писать свой движок, напишите мне в личку телеграм, скину вам информацию о своём готовом решении.

1818
35 комментариев

88% твоего контента в телеге это тупо продажа движка, минусую.

5

Кхм.
Ну вот деиндексировали вы страницы под МПК, вместо того, чтобы вывести из под фильтра - легче стало? Каковы результаты? Откуда вообще взялась идея деиндексации? Зачем вообще надо было изначально раскрывать фильтры?

3

А ведь можно было пф крутануть по страницам мпк,сгенерить текстовые описания по шаблону, и совсем скоро большая часть из них залетит в индекс. Но там самого по себе мусора очень много в фильтрах, будет канибализация и проблемы с ранжем.

1

Пока это просто эксперимент. Посмотрим. Ещё раз, в https://vc.ru/u/860617-artem-bolotov/363517-malocennaya-ili-malovostrebovannaya-stranica-kak-ispravit описано, что Яндекс пессимизирует сайт в целом за большое кол-во МПК, а в моём случае их было 88%, или 44 000 страниц.

Что имеете ввиду - вместо того, чтобы вывести из под фильтра?

спасибо за классную статью

2

В любом случае интересно посмотреть результаты эксперимента. НЧ запросы они же могут не быть сейчас в вордстате, а потом кто-то да и будет искать. Как вариант страницы оставить и пойти в обратном направлении увеличив массу страниц с различными фильтрами.

1

Ну вот да. Плюс есть ещё Гугл с его любовью к топонимам и логарифмическими частотками по ключам. Понятно, что там околонулевки, но сносить потенциально полезный контент только потому, что Яша закинул что-то под МПК (а причин могут быть десятки) - что-то как-то не это.

1