SEO-выводы из утечки кода поисковика «Яндекс»

Единственный мем который пришел в голову

Я был в восторге, когда узнал об утечке исходного кода «Яндекса». И после анализа этих данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

(Upd.) В самой утечке было около 40 Гб, но я изучал только файл в котором описаны все 1992 фактора ранжирования. Кому интересно название файла - factors_gen.txt

(Upd. 2) вот ссылка на сам файл

#1 Возраст ссылок имеет значение

Одним из открытий стало то, что возраст ссылок является фактором ранжирования. Это означает, что старые ссылки считаются алгоритмом Яндекса более надежными и авторитетными. Поэтому важно построить ссылочный профиль, в котором будут присутствовать как старые, так и новые ссылки.

#2 Платный трафик и органический трафик влияют на ранжирование

Еще одним ключевым моментом стало то, что трафик и процент органического трафика являются факторами ранжирования. Это означает, что если вы платите за PPC, это может потенциально повлиять на рейтинг в поисковиках. Поэтому очень важно отслеживать объем платного трафика вашего сайта и стараться максимизировать органический трафик.

#3 Цифры в URL-адресах могут быть вредными

Я был удивлен, когда узнал, что наличие цифр в URL-адресах может негативно сказаться на рейтинге. Это следует иметь в виду при создании URL-адресов для ваших страниц.

#4 Слишком большое количество слешей в URL может повредить рейтингу

Слишком большое количество слешей в URL-адресах также может негативно сказаться на рейтинге. Поэтому очень важно, чтобы ваши URL были чистыми и лаконичными.

#5 Жесткая оптимизация равна PR=0

Если вы пытаетесь "обмануть" систему чрезмерной оптимизацией, Яндекс поймет это. Утечка исходного кода показывает, что жесткая оптимизация может привести к PR (рангу страницы) 0. Поэтому важно использовать более целостный подход к SEO и сосредоточиться на создании качественного контента и построении сильного ссылочного профиля.

#6 Ошибки хостинга могут навредить

Надежность вашего хостинга также является фактором ранжирования. Чем меньше у вас ошибок 40x/50x, тем лучше для вашего органического трафика. Поэтому очень важно выбрать надежного хостинг-провайдера и следить за производительностью своего сайта.

#7 Отдельный фактор ранжирования для Википедии

Интересно, что существует отдельный фактор ранжирования для поднятия Википедии. Это показывает важность присутствия ссылок на авторитетных сайтах, таких как Википедия.

#8 Поведенческие факторы имеют огромное значение

Многие факторы ранжирования связаны с поведением пользователей, такие как высокий CTR, last-click, время на сайте и показатель отказов. И согласно моему анализу, эти факторы оказывают гораздо большее влияние на ранжирование в Яндексе, чем в Google. Поэтому важно следить за поведением пользователей на вашем сайте и при необходимости вносить улучшения.

#9 Возраст документа и последнее обновление

Возраст вашего документа и время его последнего обновления также являются факторами ранжирования. Это означает, что поддержание свежести и актуальности вашего контента имеет решающее значение для поддержания хороших позиций в рейтинге.

#10 Средняя позиция домена по всем запросам имеет значение

Средняя позиция домена по всем запросам является фактором ранжирования. Это означает, что поддержание хороших позиций по целевым ключевым словам важно для общего успеха.

#11 Глубина сканирования

Если вы хотите, чтобы ваши важные страницы хорошо ранжировались, убедитесь, что они находятся всего в одном или нескольких кликах от главной страницы. Чем ближе, тем лучше.

#12 Страницы-сироты

Не забывайте о страницах-сиротах - они не связаны ни с какими другими страницами вашего сайта. Используйте такой инструмент, как Screaming Frog, чтобы выявить их включить их в структуру сайта.

#13 Обратные ссылки

Обратные ссылки с главной страницы сайта более ценны, чем ссылки с внутренних страниц. Это простая логика - главная страница обычно является самой авторитетной и надежной на сайте.

#14 Количество поисковых запросов

Чем больше поисковых запросов получает ваш сайт или URL, тем выше он будет ранжироваться. Все просто - больше трафика = выше рейтинг.

#15 Трафик из Википедии

Трафик, поступающий из Википедии, также может повлиять на рейтинг. Поэтому убедитесь, что у вас есть сильное присутствие на этой популярной платформе.

#16 Последний URL-адрес поисковой сессии

Если пользователь находит на вашем сайте то, что ищет, это может положительно сказаться на ранжировании. Например если пользователь искал “купить пластиковые окна в Москве” и после вашего сайта не вернулся в поиск = повышение позиций.

#17 Закладки

Поощряйте пользователей делать закладки на ваш сайт - чем больше закладок получит ваш URL, тем выше будет значение фактора ранжирования.

#18 Короткие видеоролики

Существуют специальные факторы ранжирования для платформ коротких видео, таких как TikTok, Shorts и Reels. Убедитесь, что у вас есть активное участие на этих платформах.

#19 Карты JS-API

Интеграция API карты, например, Google Maps, в вашу страницу является фактором ранжирования. В таких нишах, как путешествия, наличие полезной и функциональной карты может поднять позиции в поисковиках.

#20 Ключевые слова в URL

Включение ключевых слов в URL является еще одним фактором ранжирования. Оптимальным считается включение до трех слов из поискового запроса.

#21 Возвращение пользователей

Хорошая новость для разработчиков продуктов - удержание пользователей является фактором ранжирования. Чем больше пользователей возвращаются на ваш сайт, тем лучше это скажется на вашем SEO. У Яндекса есть несколько факторов ранжирования для измерения показателя, поэтому если на ваш сайт возвращаются = сайт поднимется в ПС

#22 Заглавные буквы в Title

Когда в последний раз вы видели полностью заглавный заголовок сайта в верхней части Google? Не часто, верно? Оказывается, процент заглавных букв в теге является фактором ранжирования. Поэтому для лучшего ранжирования сохраняйте заголовки в нижнем регистре.

#23 Прямой трафик

Сочетание прямого и органического трафика полезно для ранжирования. Если весь ваш трафик поступает из органического поиска, это подозрительно и может негативно повлиять на ваше ранжирование. Помните, что процент прямого трафика также является фактором ранжирования.

#24 Сломанные встроенные видео

Качество контента всегда является ключевым фактором ранжирования, и на этот раз речь идет о встроенных видео на вашем сайте. Внедрение видео - это хорошая практика для SEO, но если видео не работает, это может повредить вашим позициям в рейтинге. Поэтому убедитесь, что все ваши встроенные видео работают и актуальны.

#25 Верифицированные аккаунты в социальных сетях

Поиск по бренду имеет важное значение для SEO, и наличие в топ-10 только ваших доменов и верифицированных социальных сетей - идеальный вариант. У Яндекса есть фактор ранжирования по верифицированным аккаунтам в социальных сетях, поэтому убедитесь, что они у вас заведены для получения лучших позиций.

#26 Анкоры в обратных ссылках

Ключевые слова в анкорах обратных ссылок являются фактором ранжирования. Если слова в анкорах совпадают с ключевыми словами, это еще лучше. А если они находятся в одной ссылке, это еще более выгодно, особенно если порядок слов одинаковый.

#27 Соотношение хороших и плохих обратных ссылок

Соотношение «хороших» и «плохих» обратных ссылок является фактором ранжирования, хотя до сих пор нет четких критериев, что такое «хорошая» обратная ссылка. По опыту могу предположить, что обратные ссылки с высококачественных сайтов соответствующих вашей тематике будут считаться «хорошими».

#28 Качество текстов на сайте

Качество текстов на сайте также является фактором ранжирования. Страницы с низкокачественным контентом будут влиять на весь домен, поэтому убедитесь, что весь ваш контент высокого качества.

#29 Количество рекламы на странице

Меньше - лучше, когда речь идет о рекламе на вашей странице, поскольку количество рекламы на странице является фактором ранжирования. Поэтому постарайтесь свести количество рекламы к минимуму, если она не от Яндекса. Если у вас на сайте реклама Яндекса, то это положительный фактор.

#30 Фактор случайности

Хотите верьте, хотите нет, но для случайности существует отдельный фактор ранжирования, хотя все и так давно знали об “одноруком бандите”. Иногда страницы оказываются на вершине просто для проверки поведенческих факторов, так что если вы ломаете голову над тем, почему определенная страница ранжируется, это может быть просто случайность.

#31 JS из Google Analytics

Неудивительно, что JS из Google Analytics является фактором ранжирования в Яндексе. В конце концов, "говносайты" реже используют GA, чем хорошие.

#32 Обратные ссылки с 100 лучших сайтов

Наконец, обратные ссылки со 100 лучших сайтов по PageRank также влияют на ранжирование. Это не совсем новость, но ее всегда полезно иметь в виду.

Выводы

Спасибо, Яндекс, за предоставленную нам информацию о твоих главных факторах ранжирования. Не то чтобы нам нужны были еще какие-либо дополнительные причины одержимости SEO, но мы их принимаем. Мы обязательно доведем наши URL до совершенства и будем избегать этих надоедливых слешей как чумы. Кому нужен сон, когда есть шанс занять более высокое место на Яндексе?

Но если серьезно, спасибо за смех. Мы ценим отдельный фактор ранжирования для поднятия рейтинга Википедии и фактор случайности для проверки поведенческих. И давайте не будем забывать о том, что качество наших текстов влияет на весь домен. Мы определенно будем внимательно следить за этим.

Итак, спасибо Яндексу за утечку этой сокровищницы информации. Теперь мы все можем продолжить бесконечную погоню за лучшими позициями в рейтинге.

Если вам понравилась эта статья и поставьте большой палец вверх!

0
48 комментариев
Написать комментарий...
Артем Сухов

Но ведь в утечке яндекса не было ничего про ранжирование и релевантность поисковых запросов. Базы данных с таблицами весов никуда не утекли, а без них понять что точно влияет на ранжирование и как - невозможно.
То что вы описали в статье - сборная солянка всего, на что часто обращают внимание seo-специалисты. И обращали внимание на это за годы до утечки

Ответить
Развернуть ветку
Artem Petrenkov

https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8

Похоже, что какие-то коэффициенты всё-таки утекли. Если верить примечанию, то взяты из того же самого исходного кода. Я лично не скачивал и проверить не могу.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Ну это всего лишь мое понимания и моя интерпретация того что было в сливе и касалось поиска.

Ответить
Развернуть ветку
Иван

Автор действительно скачал 80 Gb кодов (вроде столько было), развернул их, и пошел читать исходные код. Где качали, ссылку дайте. На чем код, на C? Автор скажите пожалуйста, вы сами анализировали код, или пересказываете нам с других форумов информацию? Ваши фразы "моя интерпретация", "анализ данных" - наводят на мысль что вы таки исходный код не смотрели.
Но все равно статья полезная. Спасибо.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Действительно сам изучал. Всего слив на 40 с чем-то гигов. Но там же не только поиск, там все. Сам файл в котором описываются 1992 фактора ранжирования весит всего 1,3 мегабайта

Ответить
Развернуть ветку
Иван

Ну тогда еще раз спасибо! Вот прямо по актуальной для меня теме, ушел статью в Википедию писать по одному важному вопросу. Ну и в тексте тогда четко надо обозначить, потратил лично ... часов на изучение исходного кода! Самой статье +1.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пётр Гришечкин
Автор
Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Dmitriy Pavlov

Жаль, что не указали, что пункты взяли из Твиттера Alex Buraks

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

С чего вы взяли?

Ответить
Развернуть ветку
Владимир Кича

У меня тоже создалось такое впечатление. По памяти 1 в 1.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Ну он тоже SEO специалист, у него тоже большой опыт. Может мы просто пришли к одинаковым выводам. Ушел искать что у него в Твиттере.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Artem Petrenkov

Есть вероятность, что когда начнут злоупотреблять ссылками на коммерческие сайты в Википедии, этот фактор могут опустить до нуля, а то и сделать отрицательным.

По #31: а что, если наличие GA — отрицательный фактор? ))

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Artem Petrenkov

Надеюсь, рано или поздно Гугл и Яндекс прикрутят анализ смысла текста на соответствие целевому запросу, и шлаковые сеошные тексты про историю пластиковых окон со времён Древнего Вавилона будут жёстко опускать в рейтинге.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Друзья, пожалуйста не путайте СЕОшников и SEO специалистов.

Набивка страницы ключами, покупка ссылок, клоакинг - это про СЕОшников.

Работа с продуктом, изучение потребностей пользователя, исследдование ключевых слов - это про SEO специалистов.

Ответить
Развернуть ветку
Artem Petrenkov

Тогда вы тоже должны быть заинтересованы в подобных фильтрах со стороны поисковиков, не так ли?

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Так анализ текста уже есть, вы просто видимо не в теме, у Яндекса например это алгоритм БМ25

Ответить
Развернуть ветку
Artem Petrenkov

Судя по https://habr.com/ru/post/162937/ и https://ru.wikipedia.org/wiki/Okapi_BM25 он вычисляется на основе частотности слов, а потому это далеко не анализ смысла.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Ну по сути да, но любой смысл вытекает из частотности слов. Нельзя написать текст про "галоши" не используя часто слово "галоши" и некоторые другие слова, которые мы SEO специалисты назваем SLI ключи. Тут к сожалению особо другого выхода нет. Ну по крайней мере я его не виду.

Ответить
Развернуть ветку
Artem Petrenkov

Так речь не о том, что в статье про галоши не должно использоваться слово "галоши". Я о том, что сеошники и копирайтеры грешат наполнением статей "водой", не относящейся к сути вопроса. То есть в условном тексте про материал галошей может быть десяток абзацев про историю галошей, как в них ходили в XIX веке и что думали о них поэты и писатели того времени. Естественно, там будут упоминаться и слово "галоши", и слова, обозначающие материал, но по смыслу эти абзацы будут совершенно нецелевыми. Поэтому и нужен высокоуровневый анализ смысла текстов на основе нейронных сетей, например.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Отличный пример)
Да сам не люблю такие статьи-небоскребы. Я в работе стараюсь отдавать ТЗ на небольшие текста, и в моем ТЗ прописано что высшая цель текста - ответить на вопрос пользователя. Прилагаю кусочек из ТЗ

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Алексей Сеовектор

Все ясно. Если не платишь деньги в сервисы Яндекса, то 1 фактор тянет за собой 32 или сколько там их, а если не платишь, то в ход идут все 32 фактора. Я кстати давно это заметил. Клиент год крутил Директ и в органике у него рост, правда, когда престал лить деньги, то и органика тоже уходит ))

Ответить
Развернуть ветку
Иван Иванов

На удивление мало коммерческих факторов ранжирования. Нашёл только:

FI_QUERY_COMMERCIALITY_MX | Мера 'коммерческости' запроса. Является комплексно рассчитываемым фактором MatrixNet формулой по словарю закупок в директе + по логам пользовательских запросов + доп. интентные словари. Запросы с интентом купить фактор стремится в ->1 товарные запросы ->0.6 с интентом не купить, обзоры и тп -> 0

И это всё?
А где все эти: слово купить на странице, наличие телефона в шапке, контакты, наличие корзины, форма быстрого поиска товаров?..
То есть по факту это всё ерунда и маркетинг?

Ответить
Развернуть ветку
D.

Уже каждый может добавить кнопку купить, корзину, телефон и тд. Нужны дополнительные метрики качества, чтобы ранжировать лучшие результаты по запросу.

Ответить
Развернуть ветку
Ker1a

и хуйло хуйлом назвать не можна )

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Чайка О.

1. Всегда полезнее читать первоисточник, чем интерпретацию. Даже для того, чтобы избежать путаницы в терминологии.
2. Это я не всё понимаю, или особой ценности в "сливе" нет? Фактически мы всё это уже знали раньше — частично благодаря сообществу SEO-специалистов, частично - тому же Яндексу (он довольно много предоставлял информации о своих критериях).
Нет, я понимаю, что тут вся инфа в одном месте, что облегчает задачу познания новичкам, но иметь перечень факторов - это лишь часть успеха. Это как закон и правоприменение, которые тоже отличаются.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Да, конечно это только часть успеха и да, это просто перечень. Но если раньше о многих мы просто догадывались, то теперь знаем точно. Разумеется это не "ультимативный гайд по SEO".
Как я писал выше, это лишь то что я вынес для себя из этого файла, не более)

Ответить
Развернуть ветку
Чайка О.

"просто догадывались" — это обесценивает огромную работу нашего сеошного сообщества. Это не догадки, а знание, полученное эмпирическим путём. Собственно, так мы, в основном, и познаём мир.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Простите, но когда SEO специалистов называют СЕОшниками я прям обижаюсь.

Окей не догадки, а знания достигнутые эмпирически

Ответить
Развернуть ветку
Чайка О.
называют СЕОшниками

Зависит от контекста и интонации. "SEO-текст" тоже разное может называть.

Ответить
Развернуть ветку
Александр Сергеевич

Честно сказать, что в 2009 году, что на сегодняшний день разницы в продвижении сайтов в ТОП поисковиков особой нет. Теми методами, которыми пользовался в то время, пользуюсь и сейчас. А вот много "/" в урл, что то непонятно. К примеру на сайте, есть категории, есть подкатегории - уже три слэша в урл набирается и что это плохо? Ведь это структура сайта.

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Ну тут думаю это объясняется тем что чем глубже страница - тем она менее значима. Не с просто SEO специалисты говорят уже много лет "не зарывайте важные страницы глубже 3 уровня вложенности"

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Друг, я вообще не понял что ты написал)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Не, я понял что это какой-то наезд на SEO. Только смысла не увидел. Кто они, почему эти они улучшают счастье пользователя?
Почему по твоему SEO не улучшают счастье пользователя. Дай нормальный ответ, а то как пук в пустоту получилось)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Пётр Гришечкин
Автор

Слушай, если ты пропустил тама запятую или какой-то предлог, из-за чего предложение стало нечитаемым — не вини в этом меня)

А вообще без SEO ты бы наврятли нашел любую нужную тебе вещь в интернете.

И кстати, перед тем как называть кого-то немощным, лучше почитай правила сообщества, в котором участвуешь.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Умница

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Александр Сергеевич

Вы пишите, что возраст ссылок имеет значение. О каких ссылках Вы имеете ввиду, о внутренних или внешних?

Ответить
Развернуть ветку
Пётр Гришечкин
Автор

Так как в коде говорится о LR (link Rank) - думаю это о внешних ссылках

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
yesYouStp

а википедии их внутренней был слив? там описание почти всех их факторов и проблематика

Ответить
Развернуть ветку
Alligator

+ про Википедию еще пол года догадывались

Ответить
Развернуть ветку
45 комментариев
Раскрывать всегда