SEO не работает?! Потому что вы не знаете, что такое BM25, maxfreq и TR!

В этой статье мы рассмотрим ключевые концепции Текстовой Релевантности (TR) и 'maxfreq' в контексте SEO, а также их взаимосвязь с алгоритмом BM25, который играет важную роль в современных методах поисковой оптимизации. Читать всем, кто хочет продвигать свой сайт!

Понимание Текстовой Релевантности (TR) и 'maxfreq'

Текстовая релевантность является мерой соответствия содержания документа конкретному поисковому запросу или теме. Она критична для SEO, поскольку определяет, насколько страница полезна и релевантна запросу пользователя. 'Maxfreq', или частота самого часто встречающегося слова, помогает определить плотность ключевых слов в документе. Например, слово, встречающееся 10 раз в 100-словном тексте, имеет более высокую плотность, чем то же слово в тексте на 1000 слов.

Смотрим бесплатно в <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2Fparty_pr%2F42&postId=1008289" rel="nofollow noreferrer noopener" target="_blank">сервисе </a>(ссылка внизу поста) на самое частое слово в документе - пылесос. Плотность 1.65% - в пределах нормы.
Смотрим бесплатно в сервисе (ссылка внизу поста) на самое частое слово в документе - пылесос. Плотность 1.65% - в пределах нормы.

Взаимосвязь с Алгоритмом BM25

Алгоритм BM25, основные принципы которого используется многими поисковыми системами, представляет собой усовершенствованную модель оценки релевантности документа к поисковому запросу. Он учитывает не только частоту ключевых слов, но и общее количество слов в документе, а также частоту встречаемости ключевых слов во всей базе данных. Таким образом, BM25 обеспечивает более точную оценку релевантности, чем традиционные методы, основанные только на плотности ключевых слов.

Формула BM25 выглядит следующим образом:

score(D, Q) = Σ (IDF(q) * ((f(q, D) * (k1 + 1)) / (f(q, D) + k1 * (1 - b + b * |D| / avgdl))))

где:

  • f(q, D) - частота слова 'q' в документе 'D'.
  • |D| - длина документа (количество слов).
  • avgdl - средняя длина документа в коллекции.
  • IDF(q) - обратная документная частота слова 'q'.
  • k1 и b - параметры алгоритма, обычно k1 = 1.2, b = 0.75.

Тестовый Расчет:

Предположим, что в документе на 100 слов слово "SEO" встречается 3 раза, средняя длина документов в коллекции - 150 слов, и обратная документная частота (IDF) для "SEO" равна 1.5. Тогда расчет будет следующим:

score(D, "SEO") = 1.5 * ((3 * (1.2 + 1)) / (3 + 1.2 * (1 - 0.75 + 0.75 * 100 / 150)))

= 1.5 * ((4.2) / (3 + 1.2 * (0.25 + 0.5)))

= 1.5 * 4.2 / 3.9

= 1.5 * 1.08

= 1.62 (итоговые данные)

Этот расчет демонстрирует, как BM25 оценивает релевантность документа к запросу, учитывая частоту ключевых слов и длину документа по сравнению со средней длиной документов в коллекции.

Нахождение Баланса в Плотности Ключевых Слов

Найти баланс между достаточной частотой ключевых слов и избеганием их перегрузки ('keyword stuffing') важно для SEO. Рекомендуется поддерживать плотность ключевых слов в пределах 1-3%, при этом я предпочитаю ориентироваться на уровень около 1.5-2%. Но в целом можно и от 1 до 2%, надо смотреть конкурентов по запросам.

Для улучшения текстовой релевантности без излишнего повторения одних и тех же слов, полезно включать синонимы и тематические вариации ключевых слов. Это не только помогает избежать 'keyword stuffing', но и делает текст более естественным и читаемым как для пользователя, так и для алгоритмов поисковых систем.

Рассмотрите страницы конкурентов, которые хорошо ранжируются по вашим целевым запросам. Анализируйте их контент на предмет стиля, структуры и плотности ключевых слов, чтобы понять, какие методы работают в вашей нише. Анализировать бесплатно можно с помощью сервиса, который я привел в своем телеграм-канале. Вот ссылка на пост. Подписывайтесь, у меня много интересного по SEO, трафику, рекламе, кейсы, антикейсы и так далее. Есть подробная навигация по каналу. И, что самое главное, без инфоциганщины, я ничего не впариваю, типа консультаций, курсов и т.д.,, а просто веду канал для души!

Вот еще некоторый список моих статей по SEO:

77
11 комментариев

чет как-то сложно, но лайк влеплю за старания

1
Ответить

ну на самом деле если разобраться, то все становится понятным. Смотрите конкурентов в ТОП 10 сервисом, считаете сколько у них процентов вхождений, делаете также

1
Ответить

Если бы сео специалисты это все еще делали, они просто скидывают непонятные отчеты и берут бабки каждый месяц непонятно за что..

1
Ответить

спецы разные, не стоит всех под 1 гребёнку. Но в целом на рынке так, многие хотят урвать кусок за счет клиента, а работать не хотят)

1
Ответить

Делаем :)

Ответить

Максимально полезно и без воды.

1
Ответить

Дада. Раньше в SEO был баян - теперь некие формулы неких весов.

Ответить