{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

Специфический способ наказать за копирование контента: бэклинки и бан, но это не точно

Если ваш контент постоянно заимствуется конкурентами, то вы можете наказать воришек. О нетривиальном способе будет полезно узнать тем, кто при работе с проектом задействует копирайтеров и контент-менеджеров, далёких от знаний html и css.

Большинству SEO-специалистов известны стандартные способы защиты авторского контента:

  • будь первым проиндексированным (первоисточником),

  • купи анкоров с пассажами из твоего текста,

  • напиши в Google по DMCA, в хостинг-компанию и т. д.,

  • приложи подорожник (зачеркнуто) знак © и укажи правила использования контента,

  • есть вагон свободного времени - отправь заказное письмо со свежей статьей себе и пиши досудебку.

Вызывают улыбку JS-уловки, при которых нельзя скопировать контент или, когда в конец скопированного текста добавляется: … подробнее читайте на нашем сайте ...

Но наша история более изощренная

Всё началось с того, что один из продвигаемых нами сайтов просел в Yandex. Просел в строго определенных кластерах, т.е. какие-то группы ключевых запросов продолжают расти дальше, а какие-то резко упали в один день. На графике ниже можно увидеть, как проседание отразилось на посещаемости сайта. Google среагировал, но не так ярко, можно списать на колебания спроса:

Пошли искать причину и выяснили, что на сайте много невидимых ссылок, которые ведут на сайт конкурента. Предположение о взломе не подтвердилось, и тогда мы стали копать дальше. Обнаружили, что при копировании почти любой информации на сайте конкурента к скопированному элементу добавляется невидимый блок ссылок, вот такой:

Контент-менеджеры клиента, перенося информацию с сайта конкурента, не подозревали, что в нагрузку получали такие «подарки».

Копировали информацию двух видов:

  • технические характеристики товаров,

  • описание продуктов, которое полностью переписывалось до нужного уровня уникальности.

При редактировании материала использовался редактор в WYSIWIG-режиме, когда текст отображается «как в Word-е», без html-кода и, соответственно, скрытых ссылок. Что позволило получить конкуренту с пару десятков беклинков с нашего сайта.

Негативное влияние для донора при размещении невидимых ссылок сильное (и в основном под Yandex), а вот какой толк от невидимых ссылок для акцептора? Непонятно. Подобные ссылки воспринимаются поисковиками как спам. Тем более, что в код поместили всевозможные «спамные» css-конструкции: невидимая ссылка в 1 пиксель, находящаяся далеко за пределами экрана.

Мы бы поняли конкурента, если бы невидимые ссылки вели на какой-нибудь сомнительный, чисто «мужской» сайт, чтобы хорошенько так испортить карму текстовых воришек. Но нет.

Стоит отдать должное, в момент публикации этой статьи скрипт конкурента уже не добавлял невидимые ссылки, а лишь подставлял тривиальное и видимое: «… подробнее читайте на нашем сайте...»

Существует теория, что то, что не дано маленьким и молодым можно большим и старым (в SEO, конечно же ^_^). Поэтому мы запустили эксперимент по получению невидимых ссылок на сайт-новичок. Поделимся результатами в следующей статье.

В любом случае, мы разобрали скрипт на составляющие – возможно, кого-то из специалистов логика работы скрипта наведёт на мысли – зачем так делается? И они поделятся ими в комментариях ;)

Чисто академический интерес :)

Сам скрипт можно скачать с нашего Telegram-канала (скрипт небольшой и опубликован прямо в посте).

Есть две версии скрипта:

  • в формате ES6 модуля;

  • в формате скрипта, подключаемого на html-странице.

Логика работы скрипта заключается в следующем:

  • В скопированном фрагменте (если быть точным - в выделенном и скопированном фрагменте) ищется жирный текст (содержание тега <strong>). Если он есть, то он используется в качестве анкора невидимой ссылки.

  • Если жирного текста нет, то берётся значение тега <h1>.
  • Если и его нет, то берётся значение доменного имени (а-ля естественная ссылка).
  • Невидимая ссылка генерируется с атрибутами rel="nofollow" target="_blank". Атрибут href ведёт на текущую страницу, с которой был скопирован текст.
  • Если в скопированном тексте несколько слов в теге <strong>, то в качестве анкора будет браться первое слово.

Видно основательный SEO-подход в алгоритмах скрипта. Но вот вопрос – зачем такие ссылки? Будем признательны за ваши идеи в комментариях.

0
74 комментария
Написать комментарий...
Борис Д

Визуальный редактор типа tinymce используете? Я давно использую Wagtail (мощная надстройка над джанго), там есть потоковое поле (StreamField), в котором контент составлявляется автором из блоков как из кубиков (блоки содержат свои данные, логику и шаблоны). Там есть блок Paragraph с визуальным редактором, но... с минимумом функций и полной очисткой от всего лишнего при копипасте.

Так вот... постоянно приходится бодаться с контент-менеджерами из-за этих ограничений и затруднений в копипасте контента.

А у wagtail это специально такой жесткий принцип: автор содержимого только вводит текст, картинки, данные, но не занимается никаким дизайном. Хочешь текст обвести в красную рамочку и не доволен, что нет возможности? Сначала скажи, что это за текст, который ты хочешь обвести? Какую смысловую нагрузку он несет? Если это например текст с предупреждением, то пиши ТЗ и я создам блок Warning, который будет иметь свое поведение, данные, шаблон и дизайн (и дизайном займется дизайнер). Тогда любой контент будет четко структкрирован и единообразно оформлен, а главное - будет возможна автоматическая обработка любых авторских текстов. Лепота... И никакие левые и мусорные вставки невозможны - html код идеален. Но контент-менеджеры воспринимают все эти ограничения в штыки, я устал уже бодаться.

Ответить
Развернуть ветку
Святослав Волков

Добрый день, Борис! 👋
Наши контент-менеджеры используют Quill, а кто не боится кода CodeMirror. А вот контент-менеджеры клиентов обычно Tinymce – здесь ваша дедукция не подвела (= Таких клиентов немного, но они есть, и мы тоже с ними бодаемся.
Мне кажется, что модульная идеология нашего плагина-редактора Quill (мы его хорошенько переписали и адаптировали) близка к вашему подходу собирать контент из кубиков.
Желаю вам сил победить контент-менеджеров ✊, которые не хотят соглашаться на такую крутую штуку управления контентом!

Ответить
Развернуть ветку
71 комментарий
Раскрывать всегда