Внутренняя перелинковка в SEO: актуальные практики

Оптимизация структуры сайта — это фундаментальный процесс превращения хаоса в порядок, где физическая структура ссылок (веб-граф) идеально отражает логическую взаимосвязь тем и понятий (семантический граф). Это делает сайт удобным для людей и понятным для поисковых систем. Один из главных инструментов оптимизации структуры – внутренняя семантическая перелинковка.

Робот впадает в депрессию, сопоставляя клубок ереси из реального проекта с типовым графом. 
Робот впадает в депрессию, сопоставляя клубок ереси из реального проекта с типовым графом. 

Исходные тезисы и термины

  • Технически веб-граф должен соответствовать семантическому графу.

  • Сайт должен максимально полно закрывать все потребности целевой аудитории и быть понятным для поисковых роботов.

  • Основными средствами работы со структурой являются углубленная проработка семантики и перелинковка.

  • Внутренняя перелинковка — это связывание страниц одного и того же сайта между собой с помощью гиперссылок.

    Её главные цели — улучшить навигацию для пользователей и помочь поисковым системам лучше понять структуру сайта и значимость его страниц для SEO-продвижения.

  • Релевантный и формирующий контекст ссылочный текст (анкоры) улучшает кликабельность ссылок и помогает связать страницы в единые семантические узлы (кластеры).

Веб-граф – это фактическая, физическая структура вашего сайта. Это то, как страницы связаны между собой ссылками прямо сейчас. Пользователь или поисковый робот, попадая на сайт, перемещается именно по этому графу. Часто этот граф формируется хаотично: добавляются новые страницы, ставятся случайные ссылки, и в итоге получается запутанная паутина.

Семантический граф — это модель представления знаний в виде сети, где узлы представляют собой комплексные понятия и сущности, объединяемые общими пользовательскими намерениями, а ребра — отношения между ними. Применительно к сайту каждый узел – это одна отдельная посадочная страница, а в качестве рёбер выступают ссылки.

Семантический кластер – это группа страниц, которые полностью раскрывают одну конкретную тему или отвечают на один большой запрос пользователя. Не надо путать семантические кластеры с группами поисковых запросов из семантического ядра – это разные сущности.

Пример: кластер на тему «Ремонт iPhone».

  • Центральная страница (хаб): «Ремонт iPhone в Москве» (общая услуга).
  • Вспомогательные узлы кластера: «Замена экрана iPhone», «Замена аккумулятора iPhone», «Ремонт камеры iPhone», «Цены на ремонт iPhone».

Все эти страницы тесно связаны по смыслу. Внутри идеального семантического графа они образуют плотную группу, даже если технически разнесены по разным разделам сайта («Каталог», «Услуги», справочные материалы, статьи и т.п.). Однако стоит ли группировать узлы веб-графа только и исключительно на базе ключевых слов? Чтобы не допустить стандартных ошибок, рассмотрим этот вопрос подробнее.

Семантический граф — не список запросов

Семантический граф часто ошибочно понимается как привычное «семантическое ядро», список поисковых запросов, по которым сайт должен быть виден в поиске и, желательно, иметь высокие позиции. Более того: ключевые слова, описывающие контент сайта, очень многие путают с поисковыми запросами.

Причина проста: поисковая система работает с числами, а оптимизаторы видят слова, ссылки, хосты, и делают выводы на базе каких-то статистических данных, не способных отразить картину целиком. Там, где поисковая система оперирует матрицами, включающими в себя смыслы, оптимизаторы работают с ключевыми словами, определяемыми статистически и логически.

Безусловно, слова, входящие в поисковые запросы, могут быть ключевыми. А могут и не быть. И конечно же, ключевые слова из запросов – это далеко не все ключевые слова, которые могут и должны присутствовать в контенте сайта, чтобы поисковые системы смогли сделать правильные выводы об этом контенте. Семантический кластер может включать и те страницы, которые не соответствуют поисковым запросам – просто потому, что большинство пользователей понятия не имеет, что именно нужно спрашивать. И чем сложнее тема, тем реже реальная семантика будет пересекаться с ключевыми словами из поисковых запросов.

Фрагмент семантического графа из сферы услуг юристов по недвижимости. Целевая аудитория формулирует свои запросы намного более простыми словами.
Фрагмент семантического графа из сферы услуг юристов по недвижимости. Целевая аудитория формулирует свои запросы намного более простыми словами.

Пример из практики. Студия дизайна интерьера предлагает услуги стоимостью в цену новой квартиры, сопровождая коммерческое предложение только фотографиями из портфолио без детализации, что именно входит в пакет услуг, описания проектной документации и её сути, подробного описания этапов работ, в принципе, даже не упоминая основные понятия из этой сферы. На сайте нет ничего о дизайн-проектах, обмерных планах, вскользь упоминается 3D-визуализация. Всё это – термины, известные профессионалам и присутствующие в Графе Знаний, но не известные целевой аудитории.

Достаточно ли этого для потенциального клиента, который считает каждый рубль? Может ли сайт считаться полноценным ресурсом для поисковых систем, оценивающих тематическую авторитетность, экспертность, полноту соответствия пользовательским интентам? – Конечно, нет. И оптимизатор, знающий тему лишь по запросам из «Вордстат» и видимости конкурентов в поиске, может этого никогда не понять без полноценного углубления в семантику.

А что насчёт конверсии? – Каждый раз, натыкаясь на сайте на незнакомый термин и смысловой пробел, посетитель может либо прервать свои коммуникации с сайтом, либо уйти в поиск – и остаться на том сайте, где требуемая информация есть. И хорошо, если ваш сайт покажется ему более привлекательным с точки зрения условий покупки и вообще привлечёт больше – настолько, чтобы он вернулся, получив искомую информацию. Гораздо правильнее предоставить ему возможность получить эту информацию здесь и сейчас: сразу на посадочной странице или по ссылке на ваш же контент на отдельной странице, где тема глубоко и внятно разобрана.

Отбираем претендентов на перелинковку

Традиционный способ внутренней перелинковки по списку анкоров подразумевает, что ссылка может быть проставлена с любой страницы, где есть соответствующее ключевое слово. Этот подход нельзя считать эффективным.

В «сливе» факторов ранжирования Google от 2024 года можно найти такую метрику, как PageRank_NS (Nearest Seed PageRank): актуальную формулу PageRank, учитывающей семантическую кластеризацию контента. В отличие от традиционной формулы, оценивавшей только количество и характер ссылок, новая формула учитывает и семантический анализ. Чем выше семантическая связь между страницами – тем весомее и естественнее ссылка, объединяющая эти страницы. Неестественные ссылки не только неэффективны, они могут рассматриваться и как токсичные.

Чтобы выжать из внутренней перелинковки максимум, будем исходить из следующего:

  • Для перелинковки будем использовать только семантически близкие страницы (нижний порог релевантности можно обозначить в 0,6 – 0,8 в зависимости от сайта, тематики, характера контента и используемой векторной модели). Из списка семантически близких исключим страницы, не способные ранжироваться по каким-то эффективным запросам и не попадающим в конверсионную цепочку даже гипотетически.

  • Семантическую близость будем определять на векторных вложениях (эмбеддингах), извлеченных из зоны основного контента. Сквозные блоки и навигация исключаются.

  • Для удобства и простоты в качестве ссылочных анкоров возьмём n-граммы, содержащие самые весомые ключевые слова и не являющиеся уже частью какого-то ссылочного текста. Сделать это можно очень просто с помощью Screaming Frog SEO Spider (вкладка “n-grams”).

Практическое применение

Настраиваем Screaming Frog SEO Spider: добавляем в исключаемые фрагменты все сквозные блоки, в Exclude, если надо – ненужные для анализа разделы. Подключаем модель для извлечения векторных вложений. Начинаем сканирование.

По завершении сканирования и анализа скана выгружаем список всех вложений индексируемых страниц, претендующих на использование в перелинковке. Средствами SFSS (начиная с версии 22) или средствами Python сопоставляем векторные вложения запросов, целевой страницы и всех прочих страниц, участвующих в анализе. Получаем список наиболее релевантных запросам страниц.

Примерно вот такую табличку нужно получить как результат анализа. Как видно из показателей семантической релевантности, некоторые страницы даже больше соответствуют запросу, чем целевая и релевантная страница с точки зрения поисковых систем. 
Примерно вот такую табличку нужно получить как результат анализа. Как видно из показателей семантической релевантности, некоторые страницы даже больше соответствуют запросу, чем целевая и релевантная страница с точки зрения поисковых систем. 

Полученный список можно использовать в качестве сегмента в SEO Spider (сегменты можно настроить как до сканирования, так и после).

Определяем тип интересующей энграммы (двухсловник, трехсловник и т.п.) и задаём в поиске лемматизированную форму. В SFSS очень удобно реализован поиск по энграммам: можно задействовать регулярные выражения с заданными леммами (включает, не включает, совпадает и т.п.).

Выделяем интересующие страницы, анкоры, получаем список соответствующих URL
Выделяем интересующие страницы, анкоры, получаем список соответствующих URL

SFSS показывает список страниц, содержащих такую словоформу. Выгружаем табличку для дальнейшей работы.

Поиск и фильтрация словоформ в SFSS реализован очень удобно
Поиск и фильтрация словоформ в SFSS реализован очень удобно

Теперь можно оценить контент, в котором SFSS обнаружил ключевые слова, которые потенциально можно сделать ссылками, и приступать к работе.

Если вы не работаете с векторными вложениями – можно обойтись и без сегментирования по семантическим связям. В этом случае вы просто выделяете все URL, которые должны быть проанализированы, и находите те, где встречаются заданные ключевые слова в обычном тексте, не в тексте анкоров.

Кроме того, в процессе поиска энграмм можно рассмотреть и контент страниц с высокой релевантностью по смыслу, но не содержащий никаких интересных ключевых слов, которые можно использовать для перелинковки. Возможно, контент стоит немного довести до ума, или использовать в качестве анкоров шинглы большего объёма (см. ниже).

Разумеется, этот способ хорош только для тех страниц, где есть какой-то достаточно объёмный текстовый контент и совершенно не годится для товарных листингов без вспомогательного текста. Для страниц такого типа по-прежнему стоит использовать традиционные способы перелинковки: теги, «похожие товары» и т.п.

Шинглы как анкоры: прорабатываем контекст

Использование ключевых слов в качестве текста ссылок (анкоров) — базовая практика в SEO. Ссылка с текстом «купить ноутбук», ведущая на соответствующую страницу каталога, прямо сообщает поисковой системе о содержании целевой страницы. Это хорошо и правильно, но в современных реалиях этого часто недостаточно. Обычные n-граммы (короткие последовательности из 2-3 слов) всё же нельзя считать внятным и полным описанием контента. Они слишком общие и не могут создать полноценный семантический контекст.

Когда задача стоит шире, чем просто ранжирование по одному запросу, — например, когда речь идёт о построении семантического ядра и связывании страниц сайта в понятные для поисковика тематические кластеры, — на первый план выходят более развернутые по смыслу текстовые фрагменты: шинглы.

Шингл — это не просто набор слов или субсловных единиц, а осмысленный фрагмент текста, который обеспечивает для ссылки более объёмный и весомый контекст. Здесь работает простой принцип: чем короче и популярнее токен (слово), тем более общее и размытое значение он имеет, и тем хуже он описывает конкретный контент.

  • Пример: анкор «ремонт» слишком общий. Анкор «ремонт квартир» уже лучше. Но анкор-шингл «узнайте, из каких этапов состоит ремонт однокомнатной квартиры» даёт поисковику и пользователю исчерпывающую информацию о том, что их ждёт на целевой странице.

Поисковые системы для понимания смысла ссылки анализируют не только сам анкор, но и окружающий его текст (так называемый «околоссылочный текст») — то, что идёт до ссылки, и то, что после. Использование шингла в качестве анкора, по сути, «встраивает» этот необходимый контекст прямо в тело ссылки, делая сигнал для поисковой системы максимально чистым, сильным и однозначным. Это помогает избежать двусмысленности и точнее позиционировать страницу.

Несмотря на все преимущества, у этого способа есть одна фундаментальная проблема: он требует ручного, вдумчивого подхода. Намного проще и логичнее писать тексты таких ссылок, как и окружающий их контекст, с нуля, а не пытаться найти подходящий фрагмент в уже опубликованных на сайте материалах.

Попытка «выдернуть» готовую фразу с другой страницы и сделать её ссылкой часто приводит к слабым и неестественным конструкциям. Текст на странице-доноре пишется для своих целей, и редко когда в нём найдётся идеальный, грамматически и логически завершённый фрагмент для ссылки.

Работа с шинглами для перелинковки — это часть процесса создания или редактирования контента. Автор, размещая ссылку, не просто выделяет ключевое слово, а органично вплетает в текст целое предложение или его часть, которое:

  • Естественно смотрится в текущем абзаце

  • Точно и развернуто описывает содержание страницы, на которую ведёт

  • Побуждает пользователя перейти по ссылке

Этот метод более трудозатратен, но он окупается созданием прочной семантической структуры сайта, улучшением поведенческих факторов (пользователи лучше понимают, куда кликают) и построением более доверительных отношений с поисковыми системами в долгосрочной перспективе.

Резюме

Рассмотренная методика оптимизации структуры сайта с помощью внутренней перелинковки не включает в себя подробную проработку семантического ядра и конверсионной цепочки, подразумевающей анализ пользовательских сигналов для проработки навигации. В качестве основы взяты текстово-семантические метрики, с помощью который можно воспроизвести лексические и семантические связи между узлами веб-графа в отличие от методов, основанных на лексических метриках.

Практическая реализация может быть дополнена техниками, основанными на вовлечении в кластер страниц, рассматриваемых поисковыми системами как релевантные, если речь идёт не о страницах-«каннибалах», случайных страницах и т.п.

11
19 комментариев