{"id":14284,"url":"\/distributions\/14284\/click?bit=1&hash=82a231c769d1e10ea56c30ae286f090fbb4a445600cfa9e05037db7a74b1dda9","title":"\u041f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0444\u0438\u043d\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0430 \u0442\u0430\u043d\u0446\u044b \u0441 \u0441\u043e\u0431\u0430\u043a\u0430\u043c\u0438","buttonText":"","imageUuid":""}

Самые большие мифы SEO в Интернете

Статья публикуется с разрешения Билла Славски и SEMrush. Оригинал статьи находится по этой ссылке. Если у вас возникнут вопросы после прочтения, можете задать их под этим постом в Facebook. Я обязательно помогу перевести, так что не стесняйтесь. Билл очень открытый и приятный в общении человек. Уверена, вы получите огромное удовольствие от знакомства с ним.

​Bill Slawski

Я занимаюсь продвижением веб-сайтов с 1996 года, и начал заниматься SEO вскоре после того как впервые наткнулся на Altavsita.digital.com. У меня степень доктора юриспруденции и бакалавра английского языка. В течение 8 лет я был модератором/администратором в Cre8asiteforums, где помимо прочего обсуждались SEO, веб-дизайн и удобство веб-сайтов. Я читаю патенты и официальные документы, связанные с поиском, и пишу о них в своих блогах: SEO by the Sea и Go Fish Digital Blog. Каждый год я выступаю на нескольких отраслевых мероприятиях.

Билл Славски написал эту статью после некоторых дискуссий о мифах в SEO, чтобы помочь людям в нашей отрасли избежать дезинформации о SEO и поисковых системах в целом.

Выстраивание методик для разбора споров в SEO

Лучшее место узнать об Интернете — сам Интернет. Но помимо огромного банка полезной информации, в онлайне предостаточно и дезинформации. Чтобы успешно обучаться SEO в Интернете, необходимо обзавестись методиками, которые помогут вам выявлять дезинформацию. Можно учиться на авторитетных ресурсах, чтобы писать и спорить на темы, касающиеся нашей отрасли. Если вы натыкаетесь на спор о SEO в Интернете, нужно в первую очередь разобраться в том, как люди спорят и обмениваются информацией.

Я причисляю себя к тем, кто учится всю жизнь, и стараюсь не делиться информацией, которую считаю неправильной или вводящей в заблуждение. Для этого я заручился помощью некоторых методик. Эта статья начинается с описания этих методик и примеров их применения. Я также расскажу о нескольких ресурсах, специализирующихся на достоверности, проверке фактов и приведении аргументов, а также способах подкрепления этих аргументов доказательствами.

После этого мы поговорим о некоторых темах, которые успели обрасти мифами. Надеюсь, эта статья поможет вам получить максимум из информации, которую вы встречаете в Интернете, и избежать обучения на тех ресурсах, которые распространяют дезинформацию. Я всегда подразумеваю эти методики, когда пишу о патентах и других документах, а также обращаюсь к другим страницам в Интернете или привожу собственные аргументы о SEO.

Две стороны одной медали

Когда я был маленький, мои родители были подписаны на две газеты, которые мне казались очень забавными. Они публиковали новости о тех местах, где жил и я, но одна газета рассказывала историю совершенно иначе. Иногда эти истории были вообще не похожи друг на друга.

Могли отличаться действующие лица или политика, а иной раз и сама история. Часто факты совпадали, но отнюдь не всегда. Чтение местных новостей с двух разных ракурсов позволило мне осознать, что у людей могут быть разные точки зрения об одних и тех же фактах.. И сегодня я всегда стараюсь смотреть на одну и ту же историю глазами двух разных источников.

Иногда это касается не просто новостей или политики. Этот урок остается со мной по сей день. Например, мне нравится читать статьи о UX от двух известных и уважаемых исследователей, Джареда Спула и Якоба Нильсена, которые иногда не соглашаются друг с другом, но каждый обосновывает свои утверждения, приводит доводы, и в целом стоит чтения. Оба автора написали о том, будут ли посетители скролить веб-страницы. Нильсен сказал, что нет, а Спул сказал, что при определенных обстоятельствах — будут. Через несколько лет Нильсен обновил свое исследование, сказав, что посетители научились скролить веб-страницы.

Выслушивайте обе стороны — можете и не соглашаться с одной из них, но попытки понять каждую могут принести пользу — особенно, если обе стороны приводят веские аргументы, подкрепленные доказательствами.

Бритва Оккама

О ней я узнал от родителей. Они не упоминали термин бритва Оккама, но они указывали на мои неправдоподобные истории или оправдания.

Когда произошедшему может быть два или больше объяснений, обычно правдивей то, которое требует меньше спекуляций.

Когда я в течение 8 лет был модератором и администратором в Cre8asiteforums, мне задавали множество вопросов о SEO. Часто спрашивали о том, был ли очередной апдейт Google причиной потери трафика на веб-сайте. В ответ я спрашивал, делали ли они какие-то изменения на своем веб-сайте или, возможно, их конкуренты улучшили что-то на своих веб-сайтах, или их идеальная аудитория изменила свой подход к поиску. Эти вопросы были вполне обоснованы и их стоило задавать, поскольку подобные вещи могут вызывать падение позиций и трафика.

Аудит сайта (то, чем они могут управлять) мог показать, что нужно изменить, чтобы вернуть трафик на сайты. Рассмотрение их проблемы с ранжированием/трафиком с точки зрения тех вещей, которые они контролировали и на которые имело смысл обратить внимание в первую очередь, имело больший смысл, чем спекуляции на тему возможного негативного влияния изменений, сделанных Google.

На чем строятся хорошие аргументы

Каждый день в Интернете публикуется множество статей в блогах, а также обучающих материалов и руководств. Прежде чем я смогу полагаться на изложенную в них информацию, мне нужно выяснить, насколько хорошо она аргументирована. Здесь скептицизм не помешает. Далее я привожу некоторые методики и вопросы, о которых узнал в колледже и юридической школе и на которые полагаюсь, когда читаю то, что написали другие люди.

Один из таких вопросов: насколько эта история или анализ в статье вообще вероятны и аргументированы. Относится ли это к тем вещам, которые можно использовать на веб-сайте клиента, не протестировав на собственном контенте (зачастую это хороший первый шаг).

Когда некто делает утверждение, в идеале он должен подкрепить его некоторым анализом. Они могут сказать что-то простое, например, “У Google есть об этом патент”. Если они это пишут, чтобы затем описать, что это за патент, и как он работает, нет проблем. Если они делают заявление наподобие “Google использует что-то вроде версии TrustRank от Yahoo” и затем ссылаются на патент Google, в котором говорится о том, как Google может увеличить ранг некоторых результатов, основываясь на доверии к примечаниям в пользовательских системах поиска, и это единственная аргументация их утверждения, просто ссылка на этот патент, то это недостаточный анализ. Особенно, если вы перейдете по ссылке, прочитаете патент и увидите, что весь описанный процесс — это не что иное, как версия TrustRank от Yahoo, который не используется в ранжировании страниц, а только в идентификации интернет-спама.

Запомните! Необходимо подкреплять аргументы соответствующими доказательствами.

Если кто-то выпускает инструмент и называет его “Ключевые слова LSI”, но не говорит ничего о том, как этот инструмент работает или где-то на сайте описывает процесс, у которого нет ничего общего с технологией латентно-семантического индексирования, у вас должны появиться вопросы. Почему они назвали свой инструмент таким образом? Зачем они заставляют людей поверить, что они используют технологию, которую на самом деле не используют? Зачем они целенаправленно вводят людей в заблуждение, используя название, которое подразумевает использование технологии, которую они не используют?

Когда кто-то указывает на то, что Google демонстрирует анти-консервативные предпочтения или пристрастие к брендам, ищите фактический анализ таких заключений. Если это просто ничем не подтвержденные обвинения, ставьте под сомнение истинность таких утверждений — они могут оказаться ложным умозаключением.

Как избежать ложных умозаключений в аргументации

Впервые я узнал о ложных умозаключениях на уроках английского языка в колледже. Наш профессор хотел, чтобы мы умели различать, когда кто-то делает целенаправленно вводящие в заблуждение аргументы, что было неплохим уроком. Подобные примеры можно сплошь и рядом наблюдать в политических дебатах на телевидении или сообщениях политиков в социальных сетях. К сожалению, подобную аргументацию иногда можно увидеть и в статьях и сообщениях в социальных сетях про SEO.

Если вы видите, что кто-то использует один из аргументов, с указанными ниже ложными заключениями, ставьте под вопрос их выводы.

Скользкая дорожка — аргумент, начинающийся с предупреждения не делать относительно небольшой первый шаг, потому что он может привести к серии связанных событий, заканчивающихся чем-то в значительной степени более серьезным.

Необоснованное обобщение — заключение, сделанное на основании логически необоснованных и недостаточных доказательств или предубеждений.

Post hoc — (с латыни “после этого, значит, из-за этого”) неспособность определить причину и следствие из-за видимой взаимосвязи между двумя неизвестными, основанной на корреляции или ассоциации между ними.

Наследованное заблуждение — вывод, основанный на чьей-то истории, происхождении или источнике, а не на настоящем значении или контексте.

Предполагаемый вывод — аргумент, допускающий истинность последующего заключения.

Порочный круг — аргумент, в котором вывод закладывается в одной из предпосылок.

Ложная дилемма — представляются два варианта, тогда как в действительности их может быть больше двух, затем указывается на ложность одного из них, из чего возникает вывод, что второй является истиной.

Ad Hominem — аргумент, некорректно направленный не на рассматриваемую тему, а скорее на нападение на характер или мотивы другого человека, который оспаривает того, кто приводит этот аргумент или связан с темой.

Эффект толпы — аргумент, что мнение большинства всегда правильное и ему нужно верить.

Отвлекающий маневр — вносится тема, которая не имеет отношения к рассматриваемой, чтобы отвлечь или перенаправить внимание людей. Люди спрашивали меня, внесла ли поисковая система патент только для того, чтобы отбросить назад конкурентов и заставить их работать над технологией, над которой эта поисковая система работать даже не собиралась. Это типичный пример отвлекающего маневра. В большинстве случаев, когда мне задавали подобный вопрос, не было никаких явных предпосылок так полагать. Некоторые слухи, которые я слышал о том, что поисковая система может над чем-то работать, возможно, также были отвлекающими маневрами.

Подмена тезиса — аргумент, который создает впечатление, что другой аргумент был опровергнут, когда этого в действительности не произошло.

Моральное равенство — попытка нарисовать сравнение между двумя вещами, часто различными и даже не связанными, чтобы показать, что одна из них так же плоха, как и другая, или точно так же хороша.

Доказательства и аргументы

В юридической школе я еще узнал о доказательных методах. Подготовка к занятиям и сами занятия в юридической школе сильно отличались от колледжа, но мы проводили много времени, рассматривая доказательства и методы аргументации.

Неспособность обосновать — когда в зал суда приводят свидетеля, чтобы он дал показания по предмету, в котором специализируется, его спрашивают о его квалификации в таких вопросах, и такой опрос относится к обоснованию. Он устанавливает квалификацию свидетеля и достоверность доказательств. Если аргумент базируется на чьей-то квалификации или другом доказательстве, то нужно сначала обосновать эту квалификацию или достоверность.

Пример: Как-то раз на одном из занятий по доказательству в юридической школе к нам пришел гостевой лектор. Его представили как кого-то, кто выпустился одним из худших в своем юридическом классе, и он пустил по кругу копию выписки своих оценок, чтобы доказать это. Это не было обоснованием его квалификации, а его тщательные приготовления к суду — были.

Из кармана пиджака он достал копию Федеральных правил о доказательствах и сказал нам, что у него было несколько копий этих правил, которые он всегда носил с собой. Он все время изучал их в течение нескольких лет своей практики и был очень успешным юристом. Он показал свое знание этих правил, ответил на вопросы и рассказал о нескольких стратегиях, которые он изучил на реальном опыте в зале суда (включая то, как отвечать на вопросы судьи и не выглядеть при этом идиотом). Он также работал прокурором в соседнем городке, и его знание доказательств было очень полезным в уголовных делах, которые он вел. Он знал о доказательствах все и смог и убедить нас в этом. Это было обоснованием его квалификации.

К размышлению

Когда кто-то пытается вас в чем-либо убедить, как они подкрепляют свою квалификацию? Показывают ли они что-то из своего образования или опыта? Делятся ли они тематическими исследованиями или рекомендациями? Насколько их образование соответствует тому, о чем они рассказывают? Есть ли у них опыт работы? Могут ли они ответить на вопросы в той области, в которой они утверждают, что разбираются? Приводят ли они веские аргументы или допускают ложные умозаключения для подтверждения своей точки зрения?

Или они просто говорят вам, что являются экспертом или что кто-то еще называет их экспертом? (маловато для обоснования).

На занятиях по доказательствам нам сказали, что 13-летний подросток, с пяти лет торгующий бейсбольными карточками, вполне может считаться экспертным свидетелем по бейсбольным карточкам, даже в таком возрасте, без высшего образования или даже опыта работы, если может показать свою квалификацию в этом вопросе.

С чужих слов — одно из правил доказательств: кто и о чем дает показания. Если кто-то приводит чужие слова или действия для подтверждения истинности неких утверждений, а человек, от чьего лица говорят, может и сам привести свои утверждения, такое доказательство нужно ставить под сомнение.

Например, кто-то утверждает, что Google демонстрирует пристрастность к брендам и “даже бывший CEO Google, Эрик Шмидт, заявлял, что Google доверяет брендам”. Использование утверждений Эрика Шмидта о предпочтении брендов является аргументацией с чужих слов. Или когда нам говорят, что “журнал Forbes назвал Джона Доу лучшим SEO-специалистом в мире”, это тоже с чужих слов.

Находите заслуживающие доверия источники информации — у себя в блоге я часто публикую информацию о патентах, которые нахожу на веб-сайтах USPTO и WIPO, потому что патенты — это юридически зарегистрированные документы, предназначенные для охраны интеллектуальной собственности компаний, которые эти патенты подают, их не создают для маркетингового информирования общественности.

Это доверенные источники, обеспечивающие меня первоклассной информацией для исследования. Иногда я пишу об официальных документах, которые нахожу в Google Scholar и Google Research Publications, поскольку эти документы часто являются рецензированными публикациями, которые часто пишут для презентаций на академических конференциях, и их источники заслуживают доверия.

Я исследую информацию об авторах этих патентов в Интернете, а также о изобретателях, перечисленных в этих патентах, чтобы посмотреть их профили в том же LinkedIn, и узнать какие еще патенты или документы они написали. Мне хочется узнать, над чем еще они работали, и если они к написанному им патенту опубликовали сопроводительный официальный документ, то это отлично дополнит статью блога об этом патенте.

Вопросы, которые стоит задать

Какова профессиональная подготовка авторов статей и документов, которые вы читаете? Что еще они написали? Каков их предыдущий опыт работы и образование? Насколько этот опыт релевантен? Можете ли вы считать их специалистами в теме, на которую они пишут?

В SEO-сообществе есть блоги, публикуемые годами, редактируемые и соблюдающие журналистские стандарты — все это способствует доверию к их публикациям. Авторами этих блогов часто являются люди, которые написали несколько публикаций в прошлом, и по их предыдущим публикациям можно получить представление об информативности и достоверности их слов.

Могут ли они предоставить обратную связь о том, что они написали, помимо комментариев? Можно ли с ними связаться каким-то другим способом? Участвуют ли они в конференциях и встречах? Работают ли они на компанию, о которой вы слышали?

Несколько полезных онлайн-ресурсов

Рекомендации Стэнфорда по надежности в Интернете (Stanford Guidelines for Web Credibility) — проект Стэнфордского университета, который за 3 года и с помощью более чем 4500 участников установил и протестировал научно обоснованные показатели надежности веб-сайтов. Раньше я показывал эти рекомендации клиентам, потому что они были полезны и для них, и для посетителей их веб-сайтов.

Poynter — это ресурс для журналистов о предоставлении информации или проверке фактов, а также для всех тех, кого интересует информирование общественности. Здесь раскрываются вопросы этики, доверия и журналистики, это хороший источник для интересующихся такими вопросами.

Factcheck.org — обращается к общественным процедурным вопросам на локальном, штатном и федеральном уровнях. Этот ресурс проверяет факты на лету и позволяет получить хорошее представление о полезности информации, которую вы потребляете каждый день.

Аргумент — определение того, чем является аргумент, а также способов его составления от писательского центра в университете Северной Каролины в Чапел-Хилл.

Если кто-то собирается делать публикацию о том, как заниматься SEO определенным способом, то было бы полезно, если бы он смог предоставить аргументы и доказательства в подтверждение своих слов, а также рассмотреть возможные контр-аргументы. Если вы пишете подобные публикации в блоге, использование таких методов станет для вас полезным.

Как написать аргументированное эссе шаг за шагом — более подробное описание того, что должен содержать аргумент и как он может рассматривать вопросы и быть убедительно и правдоподобно написан.

How to Write an Essay:Доказательство и цитирование — Видео Ариэля Биссетта, описывающее с академической точки зрения важность подтверждающих доказательств и документации, когда вы пишете эссе. Если то, что вы читаете, не включает подтверждающего доказательства с отсылкой к этому доказательству, это не может служить убедительным аргументом.

Основание для аргумента — статья от сайта о блогах, критическом мышлении и социальной ответственности. Здесь где описываются важные элементы аргумента и обсуждаются примеры хороших и плохих аргументов в блогах.

Эффективное использование доказательств — хороший аргумент включает доказательство, и в этой статье подробно рассматривается, какое доказательство можно включить в то, что вы пишете. Обеспечение доказательства в подтверждение аргумента в той манере, как это описывается в этой статье, поможет сделать ваш аргумент убедительным. Используете ли вы подобные доказательства в ваших статьях?

Мифы в SEO

Существуют темы, вокруг которых построено множество SEO-мифов. Я собираюсь написать о некоторых достоверных вещах в отношении некоторых из них, а также о недоработках в аргументации этих SEO-мифов. Я не буду описывать все связанные с ними заблуждения, потому что это займет слишком много места.

Все вышеописанное о заблуждениях при аргументации и о построении убедительных аргументов должно помочь вам в определении недостоверных статей, которые скорее относятся к области мифов в SEO, а не являются источником полезной информации.

Как понять Google

Google — самая популярная поисковая система в мире, используемая многими бизнесами в Северной Америке и Европе для привлечения целевых посетителей на свои веб-сайты. Она находится в центре внимания не только SEO-кампаний, но и множества разнообразных мифов По этой причине часто в интересах SEO-специалистов разузнать как можно больше о Google с точки зрения бизнес-аналитики. К счастью, Google предоставляет о себе много информации. Здесь я укажу некоторые ресурсы, которые рекомендую к прочтению.

В первую очередь рекомендую книгу In The Plex Стивена Леви. В ней хорошо описаны первые дни Google. Она мне очень понравилась. Из нее я узнал несколько имен из патентов и документов, о которых ранее писал, и эта книга очеловечила для меня Google. Я считаю, что представлять Google как бизнес, который наполняют люди, старающиеся построить нечто полезное, — правильное представление о компании.

Google теперь котируется на бирже, и публикует, хоть и слегка суховатые, ежегодные финансовые отчеты для своих акционеров, в которых часто обсуждаются цели и направления, которые направляют компанию. Самые свежие отчеты публикуются от имени холдинговой компании, под именем которой Google работает — Alphabet. В 2004 основатели Google написали ““Справочник владельца” для акционеров Google”. Стоит ознакомиться, если вы хотите получить представление, во что Google хочет эволюционировать.

Ресурсы Google

Google работает над тем, чтобы обеспечить информацией пользователей поисковой системы и задействовать евангелистов разработки веб-страниц, которые бы делились информацией на таких ресурсах, как Twitter. На них стоит подписаться: Джон Мюллер, Гари Илиш и Дэнни Салливан. Они активны и отвечают на вопросы о Google, которые им задают, а Дэнни Салливан в своих твитах освещает новые инициативы. В Twitter есть и другие аккаунты Google, на которые тоже стоит подписаться, чтобы следить за их заявлениями.

Google также делится информацией о том, что они делают, и новыми апдейтами в нескольких блогах. Вам следует следить за публикациями в них, а также новостями и объявлениями, которые они делают о новых возможностях, которые могут появляться в Google. Зачастую это позволяет читателям подготовиться и предупредить клиентов о намечающихся изменениях.

В Google также есть форумы поддержки, где сотрудники Google и волонтеры отвечают на вопросы, возникающие у владельцев сайтов в связи с проблемами, с которыми они сталкиваются в Интернете. Вы можете найти их (и задать свои вопросы) здесь.

В сообществе веб-мастеров Google также проводятся встречи Office Hours Hangouts. Можно поучаствовать в этих встречах и задать свои вопросы. Они проходят на YouTube здесь.

Возможности для общения

Google может являться целью усилий многих кампаний по SEO, но они хотят взаимодействовать с владельцами веб-сайтов и специалистами по SEO. Они предоставляют несколько способов связи с ними и отвечают на вопросы в соц. сетях, видео-трансляциях, на форумах поддержки, делятся информацией с помощью публикаций в блоге, на страницах поддержки и разработки. На эти стоит взглянуть:

В Google действует собственная внутренняя политика, правила, и бизнес мотивации, но с помощью этих ресурсов, которые они предоставляют, можно понять их лучше. Они отвечают на вопросы разными способами.

Латентно-семантическое индексирование (LSI)

В конце 1980х, еще до создания всемирной паутины, исследователи из Bell Labs опубликовали документ и подали патент на подход в индексации, который мог работать с небольшим статистическим массивом данных. В патенте приводился пример данных из восьми книг и говорилось, что каждый раз когда в корпус данных, проиндексированных с использованием LSI, будет добавляться новая информация, нужно будет заново делать индексирование.

В сети содержится намного больший корпус информации, которая постоянно изменяется с добавлением новой информации, ее удалением и обновлением. Эта технология была создана до Интернета и не предназначалась для индексирования чего-то похожего на Интернет. В некоторых патентах Google она иногда упоминается как подход к индексированию, но не обязательно в качестве такого, который они могут использовать для данных, которые они индексируют. Например в патенте Компьютерный поиск информации с использованием латентной семантической структуры.

Google использует технологии первичной обработки естественного языка, такие как BERT (BERT: Предварительная подготовка глубоких двунаправленных трансформаторов для понимания языка), которые они предоставляют в открытый доступ, и другие, которые подготавливают документы для других подходов, например ответы на вопросы и понимание тональности документов. Они разработали подход к вектору представления слова, который лежит в основе недавнего алгоритма Google, называемого RankBrain (о нем речь ниже).

Эти новейшие подходы — это технологии, которые были разработаны с пониманием размера и природы корпуса данных в индексе сети.

Что нужно знать о фразе “ключевые слова LSI”

Есть современный инструмент, который использует в названии “ключевые слова LSI” (LSI keywords), но при этом не похоже, чтобы он использовал LSI. Он предоставляет не ключевые слова, а скорее связанные слова, которые будут добавлены на страницу, содержащую ключевое слово, которое вы уже выбрали. Страница с описанием инструмента LSI Keywords не говорит, что использует технологию LSI в том виде, в котором она была изобретена и запатентована в конце 1980х, разработанную как подход к индексированию, а не как инструмент ключевых слов.

Я слышал предположения некоторых людей, что под “ключевыми словами LSI” они подразумевают просто добавление синонимов или семантически связанных слов на страницу. Но это совсем не одно и то же. LSI — это процесс, который использует внутреннюю (или латентную) структуру страницы, чтобы понять семантику того, как слова могут быть связаны друг с другом. Я также слышал, что некоторые люди утверждают, будто подсказки по запросу, которые появляются под выдачей, также используют “ключевые слова LSI”. И это может опять не соответствовать действительности.

Google показал нам, что они переписывают запросы пользователей, чтобы показать страницы, по их мнению, отвечающие ситуативным или информационным нуждам пользователя, с содержанием, которое по сути означает то же самое. В этом и есть идея Google Hummingbird (“Колибри”). Я писал о патенте, который вышел за две недели до того, как Google объявил об обновлении Колибри. В нем используются некоторые примеры, которые они приводили в своем объявлении, и они объясняют, как переписываются запросы: (Идентификация синонимов на основе сопутствующих терминов). Ничто в том патенте не описывает, как оптимизировать веб-страницу под обновление Колибри.

TF-IDF

Как и LSI, TF-IDF является устаревшим методом индексирования, который был разработан до появления всемирной паутины. В нем рассматривается частота появления термина в документе, а также насколько часто этот же термин появляется во всем корпусе проиндексированных документов. Это дает нам представление о том, насколько страница может быть посвящена определенному термину, а также насколько общим или распространенным этот термин может быть в корпусе документов. Он также не включает в себя очень общие слова, у которых часто может быть мало смысла, их еще называют стоп-слова, например, “и”, “или”, “к”.

Скорее всего метод индексирования TF-IDF был заменен в ранних поисковых системах на более продвинутый алгоритм, называемый BM25. Я встречал упоминание TF-IDF как название части процесса для идентификации модификаций запросов, которые показаны внизу поисковых результатов в Google. Я никогда не встречал, чтобы кто-либо открытым текстом заявлял, что это часть алгоритма индексации страниц в сети.

Для людей, которые делают страницы в Интернете, создаются специальные инструменты. Эти инструменты, например, собирают запросы, по которым страница может быть проиндексирована, и пропускают их через алгоритм TF-IDF для тех страниц, которые высоко ранжируются по этим запросам, чтобы вы могли создать страницы, способные конкурировать с ними в топе.

Я видел, как люди аргументируют эффективность таких инструментов. Они также заявляют, что эти инструменты позволяют их пользователям использовать семантически связанные термины и что это скорее всего происходит благодаря их инструменту. Кто-то привел в пример попытку заставить страницу высоко ранжироваться по фразе “Что означает SEO?” (What does SEO Stand for?) Недостатком этого утверждения в его контексте является то, что слова “означает” и “SEO” не имеют друг для друга особого значения. Более частое включение слов “означает” и “SEO” на одной странице может помочь этой странице занять более высокие позиции по запросу “что означает SEO”, но вряд ли поможет с ранжированием по другим запросам.

TrustRank

Концепция TrustRank (рейтинга доверия) впервые упоминается в совместном документе исследователей Yahoo и Стэнфордского университета под названием Борьба с веб-спамом с помощью TrustRank. Целью процесса, описанного в документе, была идентификация спамных страниц в сети. Вот выдержка из документа:

“Страницы, содержащие веб-спам, используют различные техники, чтобы достичь более высоких позиций, чем они заслуживают, в результатах поисковых систем. Хоть эксперты и могут идентифицировать спам, использование ручного труда для оценки множества страниц — слишком дорого. Вместо этого мы предлагаем технику полуавтоматического отделения надежных, хороших страниц от спамных. Сначала мы отбираем небольшую выборку начальных страниц для оценки экспертом. После того, как мы вручную установим надежные начальные страницы, мы используем ссылочную структуру сети, чтобы обнаружить другие вероятно хорошие страницы.

В этом документе мы обсуждаем возможные способы внедрения начального отбора и обнаружения хороших страниц. Мы представляем результаты экспериментов, осуществляемых во всемирной паутине, проиндексированной AltaVista, и оцениваем наши техники. Наши результаты показывают, что мы можем эффективно отфильтровать спам из значительной части Интернета, основываясь на хорошем начальном наборе из менее чем 200 сайтов”.

Неувязки

Поскольку этот документ о TrustRank был сначала опубликован на веб-сайте Стэнфорда, многие связали его с Google, ведь Google был основан исследователями и студентами Стэнфорда. Но он не связан с Google.

Google упоминал “Trust” (доверие) как нечто, на что они могут обращать внимание при ранжировании веб-страниц, но это совсем не то же самое, что TrustRank у Yahoo.

TrustRank не поможет ранжировать страницы в Интернете, несмотря на то, что некоторые авторы и утверждают, что это подход к ранжированию, используемый для ранжирования контента в результатах поиска. Прочтения выдержки из документа или документа полностью будет достаточным, чтобы показать, что для таких аргументов нет обоснований в источнике материала о TrustRank.

Google разработал подход, основывающийся на людях, строящих пользовательские системы поиска в Google и отбирающих и отмечающих определенные веб-сайты в контекстных файлах, предназначенных для этих пользовательских поисковых запросов, в качестве источников поисковых систем. В рамках этого подхода такие страницы и сайты учитываются как доверенные эксперты по темам, которые эти поисковые системы охватывают. Это совершенно другой подход по сравнению с TrustRank от Yahoo. Я ссылался на него как на TrustRank от Google на своем сайте и приложил все силы, чтобы объяснить, как он совершенно отличается от того, что описал и запатентовал Yahoo (таким образом, защитив от копирования в Google свой метод фильтрации спама из результатов поиска).

В своем руководстве для специалистов по оценке качества (прим. переводчика: у нас чаще встречается термин “руководство для асессоров”) Google также объясняет, что хочет, чтобы их специалисты оценивали веб-сайты, основываясь на чем-то, что они называют “E-A-T”, сокращенно экспертиза (Expertise), авторитетность (Authoritativeness) и достоверность (Trustworthiness). Те, кто работает в SEO, многие годы рекомендовали владельцам сайтов строить такие веб-сайты, которым посетители смогут доверять (смотрите ранее упомянутые рекомендации от Стэнфорда). Что касается руководства для специалистов по оценке качества, глава поиска Google, Бен Гомес сказал:

“Вы можете рассматривать руководство для специалистов по оценке как то, куда мы бы хотели направить поисковый алгоритм”, — Бен Гомес, вице-президент поиска, ассистента и новостей в Google, сказали CNBC:

“Вам не говорят, как алгоритм ранжирует результаты, но вам по сути показывают, что алгоритм должен делать”.

Так что достоверность, упомянутая в руководстве для специалистов по оценке качества, ничего общего не имеет с TrustRank или оценкой веб-страниц, но Google хотел бы видеть страницы, которые люди могли бы посчитать достоверными, в результатах поиска.

Если кто-то говорит вам, что Google использует TrustRank для ранжирования веб-страниц таким же образом, как это делает Yahoo с разработанным ими TrustRank, они вводят вас в заблуждение сразу несколькими способами:

  1. TrustRank не ранжирует веб-страницы.

  2. Запатентованный Google подход на основании доверия ничего общего с TrustRank от Yahoo не имеет.

  3. Google ссылается на достоверность в своем руководстве для специалистов по оценке качества, но опять-таки, это не относится к TrustRank, так что не имеет отношения к этому аргументу.

Будьте осторожны, когда читаете о TrustRank. Некоторые статьи о TrustRank включают факты, которые легко проверить, вперемешку с необоснованными обобщениями (у Google есть патент о Trust...) и совершенно неподтвержденными доказательствами (в руководстве для специалистов по оценке качества упоминается достоверность), чтобы подкрепить аргумент, будто Google использует что-то наподобие TrustRank от Yahoo в ранжировании веб-страниц (чего не делает даже сам TrustRank). Эти недостатки в таких аргументах делают их SEO-мифами.

RankBrain

У Google длинная история разработки подходов к переписыванию запросов (ранее они ссылались на них как на “расширяющиеся запросы”), начиная еще с 2003 года — самый старый из патентов об использовании синонимов запросов, который я видел от Google: Улучшение поисковых запросов на основе семантической информации о запросах. Так они находят термины, которые могут быть заменой или синонимами исходных запросов, которые пользователи используют для выполнения поиска.

Обновление Колибри от Google в 2013 году ввело подход к переписыванию запросов, при котором Google мог переписать запрос “хорошие места с итальянскими блюдами?” на “хорошие рестораны с итальянскими блюдами?”

Google представил новый апдейт, который назвал RankBrain, в интервью с Джеком Кларком из Bloomberg News, который интервьюировал человека из команды Google Brain, разработавшей апдейт RankBrain.

Во время интервью нам сказали, что это был подход к переписыванию запросов, основанный на технологии Word Vector, разработанной командой Google Brain. Я нашел патент от участников команды Google Brain, в котором говорилось о подходе Word Vector, описанном в этой публикации: Цитирование в основе векторов Google Brain Word.

Google опубликовал по крайней мере один патент о подходе к переписыванию запросов, где в качестве изобретателя значится участник команды Google Brain и который использует большое количество данных из истории поиска и веб-страниц: Использование концепций в качестве контекстов для подстановок терминов запроса. Мы не можем быть уверены, что этот патент используется в RankBrain, но он достаточно похож, чтобы рассматривать такую возможность. Он перепишет такой запрос как [головоломка New York Times] в [кроссворд-головоломка New York Times], поскольку часто люди хотят увидеть кроссворд, когда ищут [головоломка New York Times]. Нам сказали, что RankBrain направлен на уменьшение неясности в запросах.

Можно ли оптимизировать страницы под RankBrain?

Представители Google говорят, что веб-страницы нельзя оптимизировать под RankBrain. Поскольку RankBrain занимается переписыванием запросов, в этом есть смысл. Но есть люди, написавшие целые статьи, где описывают методы, которые, по их утверждению, помогут вашим страницам ранжироваться “под RankBrain”. Как часть процесса они упоминают машинное обучение, однако не предоставляют на эту тему никаких подробностей.

Некоторые статьи об оптимизации страниц под RankBrain описывают рекомендации по улучшению качества контента веб-страниц, увеличению времени, которое посетители могли бы на них провести, а также увеличению вероятности, что кто-то выберет одну из этих страниц в результатах поиска. Все эти вещи полезны, но они не являются оптимизацией страницы под RankBrain, и с этой точки зрения, вводят в заблуждение, что делает их очередным SEO-мифом.

Существует много веб-сайтов, которые предлагают информацию по улучшению текстов и UX на вашем сайте. Они указывают вам, что такие улучшения потенциально помогут удержать посетителей дольше или дать им более приятный опыт взаимодействия, что может привести к тому, что вашу страницу станут рекомендовать к посещению другим людям. Больше посещений из результатов поиска благодаря более привлекательному и убедительному заголовку или сниппету означает больший эффект от топа для страниц. Но все эти вещи не являются оптимизацией ваших страниц под подход переписывания запросов RankBrain. А если кто-то говорит вам, что являются, то было бы хорошо проверить, чем они обосновывают свои аргументы для такого заявления.

Заключение: мифы, эксперты и гуру

В Интернете много информации и дезинформации. В том числе на тему создания веб-сайтов и их оптимизации под поисковые системы. Будьте осторожны с такими мифами в SEO.

Существуют люди, которые называют себя экспертами и гуру. Они с радостью поведают вам, что на пьедестал их возвели другие люди. Будьте осторожны с подобными самовосхвалениями и пошлыми банальностями.

Если вы читаете нечто о том, как делать SEO и оптимизировать веб-страницу или как что-либо может являться фактором ранжирования, который используют поисковые системы, обращайте внимание на аргументы, которые используются для подкрепления этих утверждений.

Есть ли у них неоспоримые подкрепляющие доказательства в подтверждение всех приведенных ними аргументов? Если они предлагают лишь не подкрепленное фактическими доказательствами мнение, признают ли они это? Обеспечили ли они основание для высказывания своего мнения, показав свой опыт или квалификацию? Есть ли у них история написания и представления, успехи в кейсах или награды?

Если вы читаете о SEO, чтобы узнать о вещах, которые хотели бы проверить сами, и то, что вы читаете, предлагает вам протестировать его и задать о нем вопросы, — оно имеет для вас ценность.

Если вы пишете о SEO, приводите ли вы веские аргументы, подкрепленные неоспоримыми подкрепляющими доказательствами, или лишь предлагаете необоснованные обобщения и ничем не подкрепленные спекуляции?

0
3 комментария
IAmTruе

Статья нудная. Лучше бы ссылку на оригинал опубликовали, зачем этот перевод? Хоть перевели бы без ошибок

Ответить
Развернуть ветку
Olesia Korobka
Автор

Дмитрий, а вы, кстати, заметили, что есть не только ссылка на оригинал, но еще и получено разрешение от правообладателей?) Т.е. всё официально) Учитесь)

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Алекс Кучеров

Спасибо за перевод статьи. Отличный повод задуматься. В очередной раз.

Ответить
Развернуть ветку
0 комментариев
Раскрывать всегда