{"id":14270,"url":"\/distributions\/14270\/click?bit=1&hash=a51bb85a950ab21cdf691932d23b81e76bd428323f3fda8d1e62b0843a9e5699","title":"\u041b\u044b\u0436\u0438, \u043c\u0443\u0437\u044b\u043a\u0430 \u0438 \u0410\u043b\u044c\u0444\u0430-\u0411\u0430\u043d\u043a \u2014 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u0433\u043e\u0440\u0435","buttonText":"\u041d\u0430 \u043a\u0430\u043a\u043e\u0439?","imageUuid":"f84aced9-2f9d-5a50-9157-8e37d6ce1060"}

В сливе кода Яндекса нашли факторы ранжирования

В интернете оказались фрагменты исходного кода многих сервисов Яндекса — это называют самым масштабным сливом в истории компании.

Привет, это PR-CY! Мы создатели сервиса, который помогает улучшить сайт и выйти в топ. Он ищет проблемные URL, проверяет SEO сайта и следит за позициями. В блоге делимся кейсами, советами и иногда новостями. Как сейчас)

Недавно слили исходный код, принадлежащий Яндексу, и, что самое интересное, в этой базе нашли факторы ранжирования поисковой системы.

Сеошники, которые оптимизируют сайты под Яндекс

В публичный доступ попали 1922 фактора ранжирования: 244 из них неиспользуемые (unused), а 988 отмененные (deprecated), в остатке 690 факторов.

Все находится в файле, включающим название, ссылку на внутреннюю Вики с закрытым доступом, AntiSeoUpperBound и описание.

Интересно почитать, что нашли в слитом коде, но все-таки это не прикладной список, который нужно брать на вооружение. Как минимум, мы не знаем настоящую актуальность данных и степень влияния каждого фактора на оценку алгоритмом.

Что может влиять на ранжирование сайта в Яндексе

Список большой, но вот часть факторов:

  • PageRank;
  • пессимизация (сильная сводит PageRank до нуля);
  • обратные ссылки (с главных страниц важнее, чем с внутренних);
  • баланс хороших и плохих ссылок;
  • анкоры обратных ссылок;
  • возраст ссылок;
  • трафик и процент органического трафика;
  • наличие трафика из Википедии;
  • средняя позиция домена по всем запросам;
  • надежность хоста (чем меньше ошибок 40x/50x, тем лучше);
  • возраст документа, дата его последнего обновления;
  • количество / в URL (много — плохо);
  • цифры в URL (цифры — плохо);
    *мы тоже не знаем почему, какие и насколько это важно 🤷‍♂
  • ключевые слова в URL (оптимально до трех слов);
  • уровень вложенности URL;
  • пользовательские факторы: CTR, last-click, добавление в закладки;
  • количество поисковых запросов;
  • наличие карт js-api на странице (например, Google Maps);
  • встроенное видео на странице (наличие — хорошо, поврежденное — плохо);
  • количество рекламы на странице;
  • качество текста;
  • и другие факторы. Например, случайность попадания в топ, чтобы проверить, как пользователи реагируют на результат. Поэтому не спешите связывать внезапный рост позиций с тем, что вы делали на странице до этого, это может быть совпадением. 🤷‍♂

📖 Ссылки, где почитать подробнее:
Больше пунктов с подробностями в материале Liftweb.
И на зарубежном сайте, где сделали поиск по всем факторам.

Официальный комментарий компании Яндекс

Яндекс выложили пресс-релиз на своем офицальном сайте с объяснением ситуации. По ссылке весь текст с пояснением, извинениями и планами, а здесь цитаты, которые мы выбрали:

«Опубликованные фрагменты действительно взяты из нашего внутреннего репозитория <...>. При этом содержимое архива соответствует устаревшей версии репозитория — она отличается от актуальной версии, которая используется нашими сервисами».
«Сложившаяся ситуация — повод провести масштабный аудит всего содержимого репозитория».

«Зафиксированы случаи, когда логику работы сервисов корректировали не алгоритмическим способом, а «костылями» <...>. Через такие «костыли» исправляли отдельные ошибки системы рекомендаций, которая отвечает за дополнительные элементы поисковой выдачи, и регулировали настройки поиска по картинкам и видео».

«Некоторые части кода содержали слова, которые никак не влияли на работу сервисов, но сами по себе оскорбительны для людей разных рас и национальностей».

«Мы исходим из того, что любой внутренний диалог, документ или исходный код при определённых обстоятельствах может стать публичным. И если это случится, нам не должно быть стыдно.

Сейчас нам очень стыдно, и мы приносим извинения нашим пользователям и партнёрам».

Будет интересно почитать ваши комментарии о причине такого масштабного слива и о самих факторах ранжирования: какие-то вас удивили или весь перечень посредственный?

Оцените пост, подпишитесь на блог и попробуйте сервис для анализа сайта. :) Ваши PR-CY.

0
46 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Sergio Molotkoni

Ссылки с морд , работали и работают 😂👌

Ответить
Развернуть ветку
Чайка О.

Положа руку на сердце — что нового вы узнали из этого списка факторов? :)
Такое множество факторов, работающих в совокупности, не позволяет гарантировать точное влияние на результат каждого из них.
Недавно читала исследования одного сеошника по гуглу: в одном случае фактор А работает в плюс, в другом он же - в минус/никак.
*
Вероятно, наибольшую ценность имеет сам код, но для тех, кто может им воспользоваться.

Ответить
Развернуть ветку
Алексей Сеовектор

ничего нового. еще раз подтвердилось, что самый главный фактор - это бабки. все эти факторы ранжирования заточены не облегчать жизнь, а усложнять, а иначе их не было бы столько

Ответить
Развернуть ветку
Вадимов Вадим

Плюс всеми этими факторами рулит нейросеть со своей логикой.

Ответить
Развернуть ветку
Андрей Сергеевич

Извините, а вы что предыдущую статью Петра Гришечкина отрерайтили? Один в один с его статьей.

Ответить
Развернуть ветку
Elena Zhmurina, PR-CY

Нет, впервые его вижу, честно сказать.
Этот пост собран из новостей с разных источников, их все друг у друга рерайтят, потому что ну это новость, там ничего не придумаешь от себя))

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Игорь

Там больше 600 критериев, это просто становится бессмысленно пытаться хитрить, нормальный сайт надо делать просто. Ну пару заметок конечно можно вынести для себя, но не более.

Ответить
Развернуть ветку
Alex R

есть проблема, у каждого свое понимание "нормальный сайт" и не всегда коррелирует с пониманием Яндекса.

Ответить
Развернуть ветку
Андрей Сергеевич

Это нужно искать чужие комментарии, потом рерайтить их, а после этого выкладывать в статью. Через некоторое время, уверен, они это сделают)

Ответить
Развернуть ветку
Elena Zhmurina, PR-CY

Честно сказать, не думаю, что получится по-настоящему полезный документ, даже если мы просидим над 600 факторами и оставим для каждого свое мнение. У нас может быть какое-то мнение, а толку, если мы точно не знаем, как Яндекс использует факторы сейчас и как это все работает в алгоритмах в совокупности)

Ответить
Развернуть ветку
Чайка О.

Ну так чё читать других-то? Пока есть тема, надо про себя напомнить.

Ответить
Развернуть ветку
Elena Zhmurina, PR-CY

Вроде бы нет ничего плохого в том, чтобы разные площадки освещали новости) Люди ведь не на все площадки подписаны.

Ответить
Развернуть ветку
Alexey

Слишком мало разобрано того, что влияет на ранжирование. Вот тут можно посмотреть дефолтные веса по каждому фактору https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8

Ответить
Развернуть ветку
Дмитрий Кузнецов
цифры в URL (цифры — плохо)

Привет форумам и Вордпрессу с настройками по умолчанию.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Алексей

А без них было бы на 0,3% лучше. Как там ваши выводы?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alex R

Весь вопрос в нише и конкуренции. условно с НЧ запросами проблем может не быть.

Ответить
Развернуть ветку
yesYouStp

слить то слили, но почему Яндекс не выкатит иски к тем, кто это публикует? например проект на heroku или вот PR-CY блог

Я понимаю, когда это публикует ноу-нейм или вообще аноним, но когда люди пилят на этом проекты и про это рассказывают компании, выглядит как недопущение юристов или даже просто отстутсвие логики у яндекса, там даже юристы не нужны. Это как слили эротические фотки и хакер их публикует по сети. Анонимный хакер = ок, но когда это делает ООО Рога и копыта, то эти копыта неплохо бы штрафануть

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Alex R

угу, и будет и эффект Стрейзенд. когда самый последний сеошник узнает через новости на первом канале. Желаю "успехов" Яндексу , только подстегнет сеошников искать и копировать.

Ответить
Развернуть ветку
Нет

Это не самый масштабный слив, это фатальный слив.

Ответить
Развернуть ветку
Игорь

А можно поподробнее пожалуйста? Почему фатальный?

Ответить
Развернуть ветку
Нет

Севис популярный, основной доход - реклама. Абуз алгоритмов портит выдачу, меньше пользы для пользователя, больше для сиюминутных прихотей бизнеса. Пользователи спрыгивают к конкурентам. Хотя, постой, в России же эра монополий и отсутствие конкуренции. Хорошо, не фатальный. Просто больше го*а будет в выдаче не первых позициях.

Ответить
Развернуть ветку
Игорь

Оптимизировать сайт по 600+ критериям? Кажется это будет хороший сайт... Это уже не абуз получается.

Ответить
Развернуть ветку
Нет

Ага, помним сайты оптимизированные по критериям)

Ответить
Развернуть ветку
Игорь

Помним сайты оптимизированные по 10-20 главным критериям. Это было очень давно, те времена канули в лету. Движки поисковые были совсем другие и намного проще, по этому лет 10-15 назад такой слив был бы золотой жилой, а сейчас он почти ничего не изменит.

Ответить
Развернуть ветку
Нет

Так движок и остался набором костылей, весь список не которых просто держали в секрете.

Ответить
Развернуть ветку
Игорь

А вы смотрели что там? Там костыли типа, если это прон, а запрос про другое, то не показывать вообще. То есть это местечковые костыли, которые в некоторых конкретных случаях правят поведение. А в статьях, которые сейчас тиражируют ученый изнасиловал журналиста.
И движок изменился с тех времен очень сильно, это факт, я бы сказал, что он вообще другой.

Ответить
Развернуть ветку
Нет

Смотрел, пример с ключевиками: бонусы раздают за наличие ключевых слов в урле, заголовке и первом абзаце. Если раньше сеошники гадали где лучше размещать ключевые слова, то сейчас это однозначно видно.

Ответить
Развернуть ветку
Игорь

Вы же понимаете, что эти весы меняются? И меняет их нейросеть. То есть фактически, сегодня вы подогнали сайт по какому то количеству факторов, получили от силы +5% к выдаче, через месяц это уже -5%. И свежего слитого кода нет, да и хороший вопрос насколько этот свежий тоже. Я к тому, что волшебной пилюли, как 15 лет назад уже больше нет и не будет.

Ответить
Развернуть ветку
Нет
И меняет их нейросеть

Камон, какая нейросеть? Хватит лапшу на уши вешать.

И свежего слитого кода нет

Большие компании не могут менять кодовую базу в кратчайшие сроки. Они этим принципиально отличаются от стартапов. Если бы я хотел похоронить свой большой бизнес - я бы сказал: "а давайте все перепишем". Нет, это так не работает. Текущие алгоритмы настраивались годами и менять их прийдется постепенно, годами.

Ответить
Развернуть ветку
Чайка О.

Хех, про приоритетные зоны документа известно давно )
Так что гадать не приходится, это всё уже маст хэв.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Zachemonitashatpushku
Плюс бесплатный курс программирования

К слову, качество кода там и по слухам было не везде айс. А сейчас видно много такого, что лучше бы не воспроизводить

Ответить
Развернуть ветку
Alex R

есть небольшая проблема. вы знакомы с комбинаторикой? имея даже определенное количество элементов, на перебор в таком количестве может растянуться на сотни лет. условно поменяет яндекс коэффициенты или добавит новый фактор, и что будете делать со своими выводами?

Ответить
Развернуть ветку
Нет

То есть, они их меняют не для того чтобы сделать выдачу удобней для пользователя, а просто так, потому что левая нога зачесалась?

Ответить
Развернуть ветку
Александр Ничипоренко

Предчувствую месаги от Яндекса, если мы просим у вас денег, не верьте! Нас взломали!

Ответить
Развернуть ветку
Слегка Придурковатый

Ну да, конечно, обратные ссылки.

Главный фактор, влияющий на выдачу - это накрутка ПФ.

Ответить
Развернуть ветку
Александр Сергеевич

Говорите, цифры в URL плохо? А вот ссылка на данную Вашу статью и она нходится в ТОП ПС https://vc.ru/seo/595361-v-slive-koda-yandeksa-nashli-faktory-ranzhirovaniya И что это означает, что цифры плохо иметь в URL?

Ответить
Развернуть ветку
Elena Zhmurina, PR-CY

Понимаю ваши вопросы, у меня похожий. Но такой пункт был в доке Яндекса 🤷‍♂️

Ответить
Развернуть ветку
Александр Сергеевич

Больше всего вранья я получал от Платона Щукина, когда просели позиции моего сайта в выдаче Яндекс. Он пытался объяснить мне, что с моим сайтом всё в порядке, продолжайте развивать, публиковать новые материалы. Общем ответы от Платона всё на отвалите ... . В итоге, на деле всё было по-другому.

Ответить
Развернуть ветку
Lester White

помянем яндекс

Ответить
Развернуть ветку
Нет

Прикольный (даже не коммент в коде), а самый натуральный дескрипшн для бизнес-команды (я так полагаю), называющий бесплатные хостинги бомжатниками.

Ответить
Развернуть ветку
43 комментария
Раскрывать всегда