{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

SLT

30 мар 2023 30.03.2023

Специфический способ наказать за копирование контента: бэклинки и бан, но это не точно

Если ваш контент постоянно заимствуется конкурентами, то вы можете наказать воришек. О нетривиальном способе будет полезно узнать тем, кто при работе с проектом задействует копирайтеров и контент-менеджеров, далёких от знаний html и css.

Большинству SEO-специалистов известны стандартные способы защиты авторского контента:

будь первым проиндексированным (первоисточником),
купи анкоров с пассажами из твоего текста,
напиши в Google по DMCA, в хостинг-компанию и т. д.,
приложи подорожник (зачеркнуто) знак © и укажи правила использования контента,
есть вагон свободного времени - отправь заказное письмо со свежей статьей себе и пиши досудебку.

Вызывают улыбку JS-уловки, при которых нельзя скопировать контент или, когда в конец скопированного текста добавляется: … подробнее читайте на нашем сайте ...

Но наша история более изощренная

Всё началось с того, что один из продвигаемых нами сайтов просел в Yandex. Просел в строго определенных кластерах, т.е. какие-то группы ключевых запросов продолжают расти дальше, а какие-то резко упали в один день. На графике ниже можно увидеть, как проседание отразилось на посещаемости сайта. Google среагировал, но не так ярко, можно списать на колебания спроса:

Пошли искать причину и выяснили, что на сайте много невидимых ссылок, которые ведут на сайт конкурента. Предположение о взломе не подтвердилось, и тогда мы стали копать дальше. Обнаружили, что при копировании почти любой информации на сайте конкурента к скопированному элементу добавляется невидимый блок ссылок, вот такой:

Контент-менеджеры клиента, перенося информацию с сайта конкурента, не подозревали, что в нагрузку получали такие «подарки».

Копировали информацию двух видов:

технические характеристики товаров,
описание продуктов, которое полностью переписывалось до нужного уровня уникальности.

При редактировании материала использовался редактор в WYSIWIG-режиме, когда текст отображается «как в Word-е», без html-кода и, соответственно, скрытых ссылок. Что позволило получить конкуренту с пару десятков беклинков с нашего сайта.

Негативное влияние для донора при размещении невидимых ссылок сильное (и в основном под Yandex), а вот какой толк от невидимых ссылок для акцептора? Непонятно. Подобные ссылки воспринимаются поисковиками как спам. Тем более, что в код поместили всевозможные «спамные» css-конструкции: невидимая ссылка в 1 пиксель, находящаяся далеко за пределами экрана.

Мы бы поняли конкурента, если бы невидимые ссылки вели на какой-нибудь сомнительный, чисто «мужской» сайт, чтобы хорошенько так испортить карму текстовых воришек. Но нет.

Стоит отдать должное, в момент публикации этой статьи скрипт конкурента уже не добавлял невидимые ссылки, а лишь подставлял тривиальное и видимое: «… подробнее читайте на нашем сайте...»

Существует теория, что то, что не дано маленьким и молодым можно большим и старым (в SEO, конечно же ^_^). Поэтому мы запустили эксперимент по получению невидимых ссылок на сайт-новичок. Поделимся результатами в следующей статье.

В любом случае, мы разобрали скрипт на составляющие – возможно, кого-то из специалистов логика работы скрипта наведёт на мысли – зачем так делается? И они поделятся ими в комментариях ;)

Чисто академический интерес :)

Сам скрипт можно скачать с нашего Telegram-канала (скрипт небольшой и опубликован прямо в посте).

Есть две версии скрипта:

в формате ES6 модуля;
в формате скрипта, подключаемого на html-странице.

Логика работы скрипта заключается в следующем:

В скопированном фрагменте (если быть точным - в выделенном и скопированном фрагменте) ищется жирный текст (содержание тега <strong>). Если он есть, то он используется в качестве анкора невидимой ссылки.
Если жирного текста нет, то берётся значение тега <h1>.
Если и его нет, то берётся значение доменного имени (а-ля естественная ссылка).
Невидимая ссылка генерируется с атрибутами rel="nofollow" target="_blank". Атрибут href ведёт на текущую страницу, с которой был скопирован текст.
Если в скопированном тексте несколько слов в теге <strong>, то в качестве анкора будет браться первое слово.

Видно основательный SEO-подход в алгоритмах скрипта. Но вот вопрос – зачем такие ссылки? Будем признательны за ваши идеи в комментариях.

12K показов

2.5K открытий

4 репоста

74 комментария

Написать комментарий...

Показать всё . Вы видите только часть дискуссии

Борис Д

31.03.2023

Визуальный редактор типа tinymce используете? Я давно использую Wagtail (мощная надстройка над джанго), там есть потоковое поле (StreamField), в котором контент составлявляется автором из блоков как из кубиков (блоки содержат свои данные, логику и шаблоны). Там есть блок Paragraph с визуальным редактором, но... с минимумом функций и полной очисткой от всего лишнего при копипасте.

Так вот... постоянно приходится бодаться с контент-менеджерами из-за этих ограничений и затруднений в копипасте контента.

А у wagtail это специально такой жесткий принцип: автор содержимого только вводит текст, картинки, данные, но не занимается никаким дизайном. Хочешь текст обвести в красную рамочку и не доволен, что нет возможности? Сначала скажи, что это за текст, который ты хочешь обвести? Какую смысловую нагрузку он несет? Если это например текст с предупреждением, то пиши ТЗ и я создам блок Warning, который будет иметь свое поведение, данные, шаблон и дизайн (и дизайном займется дизайнер). Тогда любой контент будет четко структкрирован и единообразно оформлен, а главное - будет возможна автоматическая обработка любых авторских текстов. Лепота... И никакие левые и мусорные вставки невозможны - html код идеален. Но контент-менеджеры воспринимают все эти ограничения в штыки, я устал уже бодаться.

Ответить

Развернуть ветку

Святослав Волков

31.03.2023

Добрый день, Борис! 👋
Наши контент-менеджеры используют Quill, а кто не боится кода CodeMirror. А вот контент-менеджеры клиентов обычно Tinymce – здесь ваша дедукция не подвела (= Таких клиентов немного, но они есть, и мы тоже с ними бодаемся.
Мне кажется, что модульная идеология нашего плагина-редактора Quill (мы его хорошенько переписали и адаптировали) близка к вашему подходу собирать контент из кубиков.
Желаю вам сил победить контент-менеджеров ✊, которые не хотят соглашаться на такую крутую штуку управления контентом!

Ответить

Развернуть ветку

Показать 74 комментария . Вы видите только часть дискуссии

Написать комментарий...

71 комментарий

Раскрывать всегда