Меньше слов, больше контекста

Меньше слов, больше контекста

В SEO копирайтинге много разговоров о том, что количество слов в статьях должно быть больше, чем у конкурентов. В то время, как это может быть правдой в некоторых случаях, чаще размер статьи в некоторой мере просто напросто коррелирует с количеством информации, свободной для извлечения из текста.

Текст — это неструктурированная база знаний. Как уже упоминал в своих статьях мой коллега Виктор Петров, Google не «читает» текст в буквальном смысле. В множествах патентов описаны алгоритмы различных уровней, анализирущие сначала отдельные слова, высчитывая co-occurrences, проводя так называемый плотный поиск и многое другое.

Все эти процессы применяются к вэб-источнику поэтапно. Сначала используются самые дешевые алгоритмы с точки зрения вычислительной мощи, в основном нацеленные на отсеивание вэб-источников и отдельных страниц, характеризующиеся как спам. Лишь после того, как сайт подаст алгоритму сигналы о наличии уникальной и правдивой информации, подключатся более дорогостоящие алгоритмы. Говоря о вычислительной мощи, в будущем я обязательно вернусь к концепту cost of information retrieval как к фундаментальному фактору ранжирования вэб-источников.

Для чего Google собирает контекстуальную информацию?

Контекстуальный поиск — понятие не новое, но с переключением поисковых систем на семантику количество собираемых контекстов увеличилось на порядок. Фокусируясь на смыслах слов, ежели простому сопоставлению ключевиков с информацией на конкретных документах, поисковые системы, начали улучшать точность, достоверность и актуальность предоставляемых результатов.

Контекстуальный поиск — это поисковая технология, фокусирующаяся на намерении пользователя и контексте поискового запроса для извлечения наиболее релевантных результатов.

Иными словами, контекстуальный поиск — это поиск под один и тот же запрос с учетом разных контекстов. Самый простой пример — запрос «погода». Результат будет меняться в зависимости от времени суток, геолокации и так далее.

Контекстуальная поисковая система также «понимает» разные контексты внутри вэб-страниц, различных разделах, текстах и изображениях, истории поисковых запросов, последние попытки поиска. Все это для наиболее точного сопоставления информации и его последующего отображения.

Контекстуальный поиск ставит контекст момента ввода поискового запроса в центр оценки результатов.

Google собирает информацию о поисковом поведении (история запросов), предпочтениях пользователя, исторических данных о кликах и скроллинге с целью предсказать и выявить направление взгляда пользователя. В зависимости от этих и других факторов, SERP может меняться.

Если ваш документ насыщен различными перспективами и контекстными слоями, удовлетворяя большее количество запросов схожих доменов, то для семантической и конекстуальной поисковой системы он будет считаться приоритетным.

Запрос или ключевик?

Ключевые слова в контексте SEO корректнее называть запросами. Запрос — больше, чем ключевик, так как включает в себя контексты, связанные с форматом написания, модальностью, подтекстом и так далее.

Query augmentation (дополнение или расширение запроса) — один из способов, как поисковые системы «дорабатывают» запросы, превращая их в вопросы. Например, «окна рядом« после аугментации будет храниться в виде вопроса «где купить окна в населенном пункте А?". »Вред плесени» может интерпретироваться как »какие отрицательные эффекты на здоровье оказывает плесень?"

Как Google определяет «воду»?

Семантическая близость — следующий важный элемент в написании документов. Семантическая близость подразумевает наличие контекстуальной схожести между сущностями, изложенными в тексте.

Это значит, что в статье о помидорах могут возникать такие слова как огурцы, рассада, салат, масло, семена, и другие. Если же в этом тексте вдруг откуда ни возьмись находится слово «тиски« или »вертолет», то поисковая система значительно снизит оценку релевантности документа. Вы, конечно, можете найти косвенную связь между помидорами и тисками в том или ином контексте, но в таком случае, информация должна будет соответствовать правде, быть интегрированной в дискурс и предоставлять релевантность относительно основного контекста.

Что лишнее в моем SEO-контенте?

Важно понимать, что любое добавленное слово в тексте — это дополнительные токены, которые поисковику нужно обработать и оценить. Ошибочно считать, что количество слов делает текст «богаче». Куда важнее плотность, релевантность и правдивость информации, изложенная в логичной последовательности.

Если есть возможность написать «А любит Б» вместо «К тому же, очевидно, что А, конечно же, любит Б», то лучше выбрать первое.

Любое неконтекстуальное слово (выбивающееся из контекста, семантически отдаленное от остальных) может сигнализировать о низком качестве контента. Если возникает необходимость использовать контекстуально отдаленное от основного концепта слово, поясните его отношение к контексту. Убедитесь, что в SERPs данное слово действительно имеет отношение к основному контексту именно с точки зрения Google.

Что мне это даст?

Данные советы помогут увеличить релевантность, полезность, и не дать контенту выбиться из консенсуса базы знаний Google. Это значит, каждая статья сможет удовлетворить больше релевантных между собой запросов, предоставляя Google большую «уверенность» в текстах.

• Если у вас есть вопросы по этой статье, оставляйте комментарии или пишите в мой ТГ Дамир Билалов

Подпишитесь на мой VC — будет еще много статей по теме семантической оптимизации.

66
3 комментария

Статья интересная, буду пробовать ваши советы. Наконец-то что-то интересное в этом разделе а то запарили сео компании которые из статьи в статью пишут одно и тоже...

1
Ответить

Благодарю

Ответить

Любое неконтекстуальное слово (выбивающееся из контекста, семантически отдаленное от остальных) может сигнализировать о низком качестве контента. Я бы ещё добавил, что тут есть и проблема ложно определяемой предметной области. 40-50 терминов считается минимальным объёмом. А весомые слова из несоответствующего домена знаний могут здорово навредить. Плохо, если сайт продавца оценивается как сайт медицинских услуг из-за плохо сформированного контекста.
Все разговоры про LSI обычно ограничиваются инструментарием типа "Акварель-генератор" - хорошим, но очень ограниченным. Ещё бы: там данные - только парсинг одной и той же размазанной рерайтами статьи.

1
Ответить