{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

88 % страниц моего агрегатора имели 0 частотность запросов. Как я убрал эти страницы

Всем привет. Последние годы я занимаюсь развитием с 0 (в частности, SEO продвижением) своих сайтов-агрегаторов. Я написал достаточно много статей про внутреннюю кухню развития таких сайтов (кому интересно все статьи в моём аккаунте vc.ru)

В данной статье на примере одного из своих агрегаторов msk.gde-mrt.ru (ниша - запись на МРТ и КТ), хотел показать, как я решал проблему так называемых малоинтересных страниц.

Всем, кто занимается сайтами-агрегаторами, либо похожими по структуре сайтами, может быть полезно.

Малоинтересные страницы

В документации яндекса ( ссылка ) можно увидеть, что сам Яндекс выделяет Малоценные И маловостребованные страницы.

Малоценная страница - страница может быть признана малоценной, если она является дублем или не содержит видимый роботу контент.

Маловостребованная - Робот Яндекса проверяет, насколько востребован контент страницы пользователями. Алгоритм оценивает каждую страницу, будет ли она показана по запросам на тех позициях, где пользователь сможет ее найти. Если страница без ошибок в HTML-коде, содержит контент, но в поиске нет пользователей и запросов, на которые она могла бы ответить, страница может быть исключена из поиска как маловостребованная.

В моём эксперименте меня интересовали именно Маловостребованные страницы. Проблема малоценных страниц решается через уникализацию контента, это отдельная история.

Почему вообще стоит решать эту проблему? Ответ прост:

Поисковики понижают общий рейтинг сайта за большое кол-во малоценных и маловостребованных страниц. Подробно про это писал другой автор в статье .

Итак, другими словами, маловостребованные страницы - это страницы, Семантическое ядро которых, равно нулю.

Может быть, вы удивитесь, но на сайтах агрегаторах таких страниц очень много. Забегая вперёд, на моём агрегаторе МРТ таких страниц было 88%, около 44 000 страниц). Почему так получается?

Всё достаточно просто.

Фундамент(ядро) сайта-агрегатора - это формирование страниц по шаблону через пересечение фильтров. Покажу на примере одного из своих агрегаторов https://msk.gde-mrt.ru/

Перед вами пример страницы листинга ( это типовая страница ) https://msk.gde-mrt.ru/mrt/ на которой выводятся все клиники, в которых можно сделать МРТ в Москве.

Title H1 текст и Description данной страницы создаются на базе шаблона, который прописывается в админке сайта один раз.

Таких уникальных страниц формируется тысячи и даже десятки тысяч. Каждый новый выбранный фильтр формирует новую уникальную для поискового робота страницу.

Например, я выбрал 2 фильтра и получил новую страницу https://msk.gde-mrt.ru/mrt/mrt-golovnogo-mozga/aviamotornaya/ с уникальными метаданными и уникальными объектами ( в моём случае это клиники)

При таком пересечение возникает одна глобальная проблема. Опять же посмотрим на примере моего конкретного агрегатора. У меня в карте сайта было около 50 000 страниц таких пересечений.

Назревает справедливый вопрос. А зачем вообще делать фильтр, если запросов под такую страницу нет?

Опять же покажу на примере. Посмотрим Скрин СЯ, отфильтрованный по метро Жулебино (метро - это фильтр, как вы помните)

По запросу МРТ желибно есть частотности, а вот, например, по запросу мрт печени жулебино запросов нет, частотности всех типов = 0.

Т.е. мы не можем просто “в лоб” убрать метро Жулебино, мы должны оставить только некоторые пересечения.

Задача была - оставить все эти фильтры на фронте, при этом удалить все страницы, которые не ищут. Прежде чем ниже опишу, каким элегантным решением мы закрыли эту проблему, покажу сколько конкретно на моём агрегаторе МРТ центров было таких страниц без частотностей:

88% из 50000 страниц не имели никакой частотности. На выходе, после решения данной проблемы, осталось чуть больше 6000 страниц.

Суть решения:

Каждый фильтр у меня настраивается в разделе Категории. Т.е. Метро Жулебино - это дочерняя категория Материнской Категории Метро. В админке нужно зайти в категорию метро Жулебино и проставить в специальной настройке только те категории, пересечения с которыми мы хотим оставить.

В скрине выше мы видим, что стоит галочка напротив МРТ, поэтому у нас есть полноценная страница https://msk.gde-mrt.ru/mrt/zhulebino/

А вот напротив МРТ печени галочки нет, и вуаля, мы получаем страницу https://msk.gde-mrt.ru/mrt/mrt-pecheni/?or[]=zhulebino

И для таких страниц мы в коде закрываем индексацию

У моего контент-менеджера заняло 2 дня руками проставить настройки для всех фильтров. В целом не критично. Рекомендую раз в период ( думаю раз в 3-5 месяцев вполне достаточно), перепроверять частотности и оживлять страницы, у которых появилась частотность).

Примерно ту же информацию я оформлял в видео формате, кому удобнее смотреть, чем читать

*****

Больше полезной информации про сайты агрегаторы я пишу в своём телеграмм канале Про сайты агрегаторы.

Также я написал движок для агрегатора услуг. Если вам лень заморачиваться и писать свой движок, напишите мне в личку телеграм, скину вам информацию о своём готовом решении.

0
35 комментариев
Написать комментарий...
OOSOBAA

88% твоего контента в телеге это тупо продажа движка, минусую.

Ответить
Развернуть ветку
Виктор Петров

Кхм.
Ну вот деиндексировали вы страницы под МПК, вместо того, чтобы вывести из под фильтра - легче стало? Каковы результаты? Откуда вообще взялась идея деиндексации? Зачем вообще надо было изначально раскрывать фильтры?

Ответить
Развернуть ветку
Артем Акулов

А ведь можно было пф крутануть по страницам мпк,сгенерить текстовые описания по шаблону, и совсем скоро большая часть из них залетит в индекс. Но там самого по себе мусора очень много в фильтрах, будет канибализация и проблемы с ранжем.

Ответить
Развернуть ветку
Виктор Петров

Ну вот и я про это. Чисто ботами можно из под МПК вывести на минимуме визитов, но если проблемы есть помимо посещений URL - всё равно вылетит. Но тут уже надо конкретно семантику и спрос оценивать

Ответить
Развернуть ветку
Евсеев Юра
Автор

Пока это просто эксперимент. Посмотрим. Ещё раз, в https://vc.ru/u/860617-artem-bolotov/363517-malocennaya-ili-malovostrebovannaya-stranica-kak-ispravit описано, что Яндекс пессимизирует сайт в целом за большое кол-во МПК, а в моём случае их было 88%, или 44 000 страниц.

Что имеете ввиду - вместо того, чтобы вывести из под фильтра?

Ответить
Развернуть ветку
Виктор Петров

Тут перепутаны причины и следствия. Под МПК влетают страницы, которые Яндекс не в состоянии оценить по причине отсутствия трафика. Нет трафа - нет ПФ, значит, страница малоценная и никому неинтересная. А откуда взяться трафику, если нет топов?
Не хочу учить плохому, но дайте траф-то на странички. Много не надо. Ну, и явные нулячки стоит деиндексировать, тут надо СЯ смотреть внимательно.

Ответить
Развернуть ветку
Евсеев Юра
Автор

Погодите, ещё раз. Если у запроса МРТ печени Мытищи ( условно ) частотсности все 0 (даже самая общая), причём тут трафик? это нам говорит, что с большой долей вероятности, такую страницу просто не ищут. И таких страниц много. И мы их делаем просто страницами, которые человек физически может выбрать в фильтре, но в индекс мы их закрываем.

В любом случае, посмотрим. Это больше опционная настройка. Я на этом агрегаторе тестирую. Может решение и не стоит свеч, будем смотреть)

Ответить
Развернуть ветку
Виктор Петров

Вы частотку как оценивали? В "Вордстат" смотреть не стоит, оценивайте хоть по Директу - и за год. Не может кластер быть нулячим - в Мытищах тоже живут люди, которым нужно МРТ печени.
Плюс есть ещё Гугл. Понятно, что частотка будет малой, но не факт, что страницу нужно вот так запросто выкидывать из индекса насовсем.
В вашем случае речь только о том, что на страничку вообще нет никакого трафика, Яндексу нечего оценивать. Ему всё равно, откуда траф - внутренний тоже годится.

Ответить
Развернуть ветку
Рустам Кагарманов

не все страницы с частотностью 0 будут под мпк, просто не нужно плодить дублей и ненужных страниц, которые реально никому не нужны никогда вообще

Ответить
Развернуть ветку
Faith no More

спасибо за классную статью

Ответить
Развернуть ветку
No name

В любом случае интересно посмотреть результаты эксперимента. НЧ запросы они же могут не быть сейчас в вордстате, а потом кто-то да и будет искать. Как вариант страницы оставить и пойти в обратном направлении увеличив массу страниц с различными фильтрами.

Ответить
Развернуть ветку
Виктор Петров

Ну вот да. Плюс есть ещё Гугл с его любовью к топонимам и логарифмическими частотками по ключам. Понятно, что там околонулевки, но сносить потенциально полезный контент только потому, что Яша закинул что-то под МПК (а причин могут быть десятки) - что-то как-то не это.

Ответить
Развернуть ветку
Евсеев Юра
Автор

Посмотрим, Виктор. Не говорю, что решение 100%. Пока я вижу в целом (как гипотеза) проблему очень большого кол-ва МПК. Всегда в моём движке можно изменить эту настройку и страницы опять появятся. Т.е. это легко настраивается.

Ответить
Развернуть ветку
Виктор Петров

Так решение-то - чего? Вы уверены, что сайт влетел под хостовый фильтр?
Проблема с МПК характерна для фактически всех новых агрегаторов

Ответить
Развернуть ветку
Евсеев Юра
Автор

Я же нигде не писал, что сайт под фильтром. Я под словом пессимизация подразумевал - понижение общего рейтинга. Фильтров у сайта нет.
Более того я консультировался с владельцами других агрегаторов и много кто убирает такие страницы без запросов.

Ответить
Развернуть ветку
Виктор Петров

Так это и есть фильтр. Если хост в принципе на всём объёме имеет мало посещений - фильтруется. Об этом в "Вебмастере" ничего писать не будут, это не наказание. У вас в топах что-то есть?

Ответить
Развернуть ветку
Евсеев Юра
Автор

Руслан, привет. Тут основное ядро, что у мен 44 000 страниц (88%) от всех страниц имеют СЯ састотностью 0. Есть гипотеза ( на базе вот этой статьи https://vc.ru/u/860617-artem-bolotov/363517-malocennaya-ili-malovostrebovannaya-stranica-kak-ispravit что яндекс за это наказывает. Ну и в целом ,а зачем эти страницы в таком объёме, если их никто не ищет? Плюс идёт нагрузка на робота, что тоже не любит Яндекс.

Ответить
Развернуть ветку
Максим Пряник

Ну такое эта статья, очень много автор нафантазировал.

Ответить
Развернуть ветку
Евсеев Юра
Автор

посмотрим, Максим. Время покажет. Пока это просто проверка гипотезы.

Ответить
Развернуть ветку
Aleks Cloud

Спасибо за статью. Понимаю о чем пишут Виктор и Артём, но очень интересно будет посмотреть результат ваших действий. Наверно стоило сначала дождаться результата, а потом уже выкладывать статью - так это было бы полноценное исследование. А теперь придется подписаться на вас, чтобы не пропустить продолжение)

Ответить
Развернуть ветку
Виктор Петров

Да тут вилами по воде получится в любом случае - если не учитывать в расчётах десятки параметров. А это даже у Яндекса не получается по причине кривости самой идеи. Посчитал ПФ, подкинул вверх. пересчитал текстовые, почесал репу - и подвинул вниз. А потом обновил хостовые за период - и аккуратно убрал за топ-100.
Мусору, конечно, на сайте не место, но записывать в мусор только потому, что Яше на время привиделась "малая популярность" - это перебор.

Ответить
Развернуть ветку
Aleks Cloud

Прекрасно вас понимаю. Но все же интересен будет конечный эффект на практике. А вдруг чего и получится? Понимаю, что сейчас это всего лишь гипотеза, но если гипотезы не проверять, то они так и останутся гипотезами)

Ответить
Развернуть ветку
No name

Привет! Тема, конечно, очень интересная. У меня очень много таких малополезных страниц. Примерно 80%. Яндекс тоже их то добавляет, то удаляет из индекса.
Если думать про краулинговый бюджет, то для моего агрегатора норма индексировать страницу за 1-3 дня. МПК пока не влияет и значит можно создавать ещё страницы.

Ответить
Развернуть ветку
Anatol Seibel

Есть устоявшийся термин "зомби-страницы", можно по нему погуглить, найдется еще кейсов и разного интересного.

Ответить
Развернуть ветку
Виктор Петров

Этот термин из буржа эпохи Google Fred. К нынешним алгоритмам и Яндексу в частности отношение имеет очень отдалённое, хотя людям головы забивает наотличненько.

Ответить
Развернуть ветку
Евсеев Юра
Автор

Спасибо, погуглю!

Ответить
Развернуть ветку
Евсеев Юра
Автор

Ваше право. Если внимательнее почитаете канал там очень много бесплатной полезной информации. Так же можете изучить мой ютюб канал https://www.youtube.com/channel/UC5PlylV_IZEBQzAKlBNnmHQ Есть подкасты с гостями, которые делали агрегаторы и рассказывали про свой опыт, если мои наработки.
Движок тоже продаётся плавно, но это точно не 88%)

Ответить
Развернуть ветку
Рустам Кагарманов

В целом интересно было вообще почитать про подобную тему узконишевых агрегаторов, я и сам в свое время накидал себе тематики для подобных сайтов где парсишь данные и генеришь из них кучу страниц на разные город и тп. Так и не занялся этим.

Ответить
Развернуть ветку
Евсеев Юра
Автор

я много пишу в своём канале про агрегаторы. Запрыгивайте https://t.me/agregatorss

Ответить
Развернуть ветку
Рустам Кагарманов

спасибо

Ответить
Развернуть ветку
Слегка Придурковатый

Эм. Ну закрыл ты 88% страниц от индексации. И... что?

Ответить
Развернуть ветку
Евсеев Юра
Автор

Посмотрим, пока просто эксперимент. Отталкиваюсь от рекомендаций самого Яндекса. Плюс я в начале статьи приводил статью https://vc.ru/u/860617-artem-bolotov/363517-malocennaya-ili-malovostrebovannaya-stranica-kak-ispravit Где описывается, что Яндекс пессимизирует сайте за большое кол-во МПК, а в моём случае это 44 000 страниц.

Ответить
Развернуть ветку
Александр Поспелов

Интересный материал. Тема статьи не очень, а управление категориями для сайта агрегатора от вас бы послушал.

Взять 1 проект, разобрать приоритетность категорий. Какие усилия на приоритетные категории, какие на второстепенные, выводы о бесполезных категорияй (как в этой статье)

Ответить
Развернуть ветку
Всеволод Козлов

Юрий, приветствую!

На своих проектах применяю такой же подход, без накруток (считаю это "костылями-времянками").

Тема 100% рабочая!

Ответить
Развернуть ветку
Евсеев Юра
Автор

Круто! Спасибо, Всеволод, что поделился! Надеюсь и у меня сработает!

Ответить
Развернуть ветку
32 комментария
Раскрывать всегда