В сливе кода Яндекса нашли факторы ранжирования
В интернете оказались фрагменты исходного кода многих сервисов Яндекса — это называют самым масштабным сливом в истории компании.
Недавно слили исходный код, принадлежащий Яндексу, и, что самое интересное, в этой базе нашли факторы ранжирования поисковой системы.
В публичный доступ попали 1922 фактора ранжирования: 244 из них неиспользуемые (unused), а 988 отмененные (deprecated), в остатке 690 факторов.
Все находится в файле, включающим название, ссылку на внутреннюю Вики с закрытым доступом, AntiSeoUpperBound и описание.
Интересно почитать, что нашли в слитом коде, но все-таки это не прикладной список, который нужно брать на вооружение. Как минимум, мы не знаем настоящую актуальность данных и степень влияния каждого фактора на оценку алгоритмом.
Что может влиять на ранжирование сайта в Яндексе
Список большой, но вот часть факторов:
- PageRank;
- пессимизация (сильная сводит PageRank до нуля);
- обратные ссылки (с главных страниц важнее, чем с внутренних);
- баланс хороших и плохих ссылок;
- анкоры обратных ссылок;
- возраст ссылок;
- трафик и процент органического трафика;
- наличие трафика из Википедии;
- средняя позиция домена по всем запросам;
- надежность хоста (чем меньше ошибок 40x/50x, тем лучше);
- возраст документа, дата его последнего обновления;
- количество / в URL (много — плохо);
- цифры в URL (цифры — плохо);
*мы тоже не знаем почему, какие и насколько это важно 🤷♂ - ключевые слова в URL (оптимально до трех слов);
- уровень вложенности URL;
- пользовательские факторы: CTR, last-click, добавление в закладки;
- количество поисковых запросов;
- наличие карт js-api на странице (например, Google Maps);
- встроенное видео на странице (наличие — хорошо, поврежденное — плохо);
- количество рекламы на странице;
- качество текста;
- и другие факторы. Например, случайность попадания в топ, чтобы проверить, как пользователи реагируют на результат. Поэтому не спешите связывать внезапный рост позиций с тем, что вы делали на странице до этого, это может быть совпадением. 🤷♂
📖 Ссылки, где почитать подробнее:
Больше пунктов с подробностями в материале Liftweb.
И на зарубежном сайте, где сделали поиск по всем факторам.
Официальный комментарий компании Яндекс
Яндекс выложили пресс-релиз на своем офицальном сайте с объяснением ситуации. По ссылке весь текст с пояснением, извинениями и планами, а здесь цитаты, которые мы выбрали:
Будет интересно почитать ваши комментарии о причине такого масштабного слива и о самих факторах ранжирования: какие-то вас удивили или весь перечень посредственный?
Оцените пост, подпишитесь на блог и попробуйте сервис для анализа сайта. :) Ваши PR-CY.
Комментарий недоступен
Ссылки с морд , работали и работают 😂👌
Положа руку на сердце — что нового вы узнали из этого списка факторов? :)
Такое множество факторов, работающих в совокупности, не позволяет гарантировать точное влияние на результат каждого из них.
Недавно читала исследования одного сеошника по гуглу: в одном случае фактор А работает в плюс, в другом он же - в минус/никак.
*
Вероятно, наибольшую ценность имеет сам код, но для тех, кто может им воспользоваться.
ничего нового. еще раз подтвердилось, что самый главный фактор - это бабки. все эти факторы ранжирования заточены не облегчать жизнь, а усложнять, а иначе их не было бы столько
Плюс всеми этими факторами рулит нейросеть со своей логикой.
Извините, а вы что предыдущую статью Петра Гришечкина отрерайтили? Один в один с его статьей.
Нет, впервые его вижу, честно сказать.
Этот пост собран из новостей с разных источников, их все друг у друга рерайтят, потому что ну это новость, там ничего не придумаешь от себя))
Комментарий недоступен
Там больше 600 критериев, это просто становится бессмысленно пытаться хитрить, нормальный сайт надо делать просто. Ну пару заметок конечно можно вынести для себя, но не более.
есть проблема, у каждого свое понимание "нормальный сайт" и не всегда коррелирует с пониманием Яндекса.
Это нужно искать чужие комментарии, потом рерайтить их, а после этого выкладывать в статью. Через некоторое время, уверен, они это сделают)
Честно сказать, не думаю, что получится по-настоящему полезный документ, даже если мы просидим над 600 факторами и оставим для каждого свое мнение. У нас может быть какое-то мнение, а толку, если мы точно не знаем, как Яндекс использует факторы сейчас и как это все работает в алгоритмах в совокупности)
Ну так чё читать других-то? Пока есть тема, надо про себя напомнить.
Вроде бы нет ничего плохого в том, чтобы разные площадки освещали новости) Люди ведь не на все площадки подписаны.
Слишком мало разобрано того, что влияет на ранжирование. Вот тут можно посмотреть дефолтные веса по каждому фактору https://gist.github.com/lord-alfred/97400a79f10f3bb13bb4bcd42268b1f8
Привет форумам и Вордпрессу с настройками по умолчанию.
Комментарий недоступен
А без них было бы на 0,3% лучше. Как там ваши выводы?
Комментарий недоступен
Весь вопрос в нише и конкуренции. условно с НЧ запросами проблем может не быть.
слить то слили, но почему Яндекс не выкатит иски к тем, кто это публикует? например проект на heroku или вот PR-CY блог
Я понимаю, когда это публикует ноу-нейм или вообще аноним, но когда люди пилят на этом проекты и про это рассказывают компании, выглядит как недопущение юристов или даже просто отстутсвие логики у яндекса, там даже юристы не нужны. Это как слили эротические фотки и хакер их публикует по сети. Анонимный хакер = ок, но когда это делает ООО Рога и копыта, то эти копыта неплохо бы штрафануть
Комментарий недоступен
угу, и будет и эффект Стрейзенд. когда самый последний сеошник узнает через новости на первом канале. Желаю "успехов" Яндексу , только подстегнет сеошников искать и копировать.
Это не самый масштабный слив, это фатальный слив.
А можно поподробнее пожалуйста? Почему фатальный?
Севис популярный, основной доход - реклама. Абуз алгоритмов портит выдачу, меньше пользы для пользователя, больше для сиюминутных прихотей бизнеса. Пользователи спрыгивают к конкурентам. Хотя, постой, в России же эра монополий и отсутствие конкуренции. Хорошо, не фатальный. Просто больше го*а будет в выдаче не первых позициях.
Оптимизировать сайт по 600+ критериям? Кажется это будет хороший сайт... Это уже не абуз получается.
Ага, помним сайты оптимизированные по критериям)
Помним сайты оптимизированные по 10-20 главным критериям. Это было очень давно, те времена канули в лету. Движки поисковые были совсем другие и намного проще, по этому лет 10-15 назад такой слив был бы золотой жилой, а сейчас он почти ничего не изменит.
Так движок и остался набором костылей, весь список не которых просто держали в секрете.
А вы смотрели что там? Там костыли типа, если это прон, а запрос про другое, то не показывать вообще. То есть это местечковые костыли, которые в некоторых конкретных случаях правят поведение. А в статьях, которые сейчас тиражируют ученый изнасиловал журналиста.
И движок изменился с тех времен очень сильно, это факт, я бы сказал, что он вообще другой.
Смотрел, пример с ключевиками: бонусы раздают за наличие ключевых слов в урле, заголовке и первом абзаце. Если раньше сеошники гадали где лучше размещать ключевые слова, то сейчас это однозначно видно.
Вы же понимаете, что эти весы меняются? И меняет их нейросеть. То есть фактически, сегодня вы подогнали сайт по какому то количеству факторов, получили от силы +5% к выдаче, через месяц это уже -5%. И свежего слитого кода нет, да и хороший вопрос насколько этот свежий тоже. Я к тому, что волшебной пилюли, как 15 лет назад уже больше нет и не будет.
Камон, какая нейросеть? Хватит лапшу на уши вешать.
И свежего слитого кода нетБольшие компании не могут менять кодовую базу в кратчайшие сроки. Они этим принципиально отличаются от стартапов. Если бы я хотел похоронить свой большой бизнес - я бы сказал: "а давайте все перепишем". Нет, это так не работает. Текущие алгоритмы настраивались годами и менять их прийдется постепенно, годами.
Хех, про приоритетные зоны документа известно давно )
Так что гадать не приходится, это всё уже маст хэв.
Комментарий недоступен
К слову, качество кода там и по слухам было не везде айс. А сейчас видно много такого, что лучше бы не воспроизводить
есть небольшая проблема. вы знакомы с комбинаторикой? имея даже определенное количество элементов, на перебор в таком количестве может растянуться на сотни лет. условно поменяет яндекс коэффициенты или добавит новый фактор, и что будете делать со своими выводами?
То есть, они их меняют не для того чтобы сделать выдачу удобней для пользователя, а просто так, потому что левая нога зачесалась?
Предчувствую месаги от Яндекса, если мы просим у вас денег, не верьте! Нас взломали!
Ну да, конечно, обратные ссылки.
Главный фактор, влияющий на выдачу - это накрутка ПФ.
Говорите, цифры в URL плохо? А вот ссылка на данную Вашу статью и она нходится в ТОП ПС https://vc.ru/seo/595361-v-slive-koda-yandeksa-nashli-faktory-ranzhirovaniya И что это означает, что цифры плохо иметь в URL?
Понимаю ваши вопросы, у меня похожий. Но такой пункт был в доке Яндекса 🤷♂️
Больше всего вранья я получал от Платона Щукина, когда просели позиции моего сайта в выдаче Яндекс. Он пытался объяснить мне, что с моим сайтом всё в порядке, продолжайте развивать, публиковать новые материалы. Общем ответы от Платона всё на отвалите ... . В итоге, на деле всё было по-другому.
помянем яндекс
Прикольный (даже не коммент в коде), а самый натуральный дескрипшн для бизнес-команды (я так полагаю), называющий бесплатные хостинги бомжатниками.