{"id":14289,"url":"\/distributions\/14289\/click?bit=1&hash=892464fe46102746d8d05914a41d0a54b0756f476a912469a2c12e8168d8a933","title":"\u041e\u0434\u0438\u043d \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b \u043f\u0440\u043e\u0434\u0430\u0436\u0438 \u043d\u0430 5%, \u0430 \u0441\u0440\u0435\u0434\u043d\u0438\u0439 \u0447\u0435\u043a \u2014 \u043d\u0430 20%","buttonText":"","imageUuid":""}

Специфический способ наказать за копирование контента: бэклинки и бан, но это не точно

Если ваш контент постоянно заимствуется конкурентами, то вы можете наказать воришек. О нетривиальном способе будет полезно узнать тем, кто при работе с проектом задействует копирайтеров и контент-менеджеров, далёких от знаний html и css.

Большинству SEO-специалистов известны стандартные способы защиты авторского контента:

  • будь первым проиндексированным (первоисточником),

  • купи анкоров с пассажами из твоего текста,

  • напиши в Google по DMCA, в хостинг-компанию и т. д.,

  • приложи подорожник (зачеркнуто) знак © и укажи правила использования контента,

  • есть вагон свободного времени - отправь заказное письмо со свежей статьей себе и пиши досудебку.

Вызывают улыбку JS-уловки, при которых нельзя скопировать контент или, когда в конец скопированного текста добавляется: … подробнее читайте на нашем сайте ...

Но наша история более изощренная

Всё началось с того, что один из продвигаемых нами сайтов просел в Yandex. Просел в строго определенных кластерах, т.е. какие-то группы ключевых запросов продолжают расти дальше, а какие-то резко упали в один день. На графике ниже можно увидеть, как проседание отразилось на посещаемости сайта. Google среагировал, но не так ярко, можно списать на колебания спроса:

Пошли искать причину и выяснили, что на сайте много невидимых ссылок, которые ведут на сайт конкурента. Предположение о взломе не подтвердилось, и тогда мы стали копать дальше. Обнаружили, что при копировании почти любой информации на сайте конкурента к скопированному элементу добавляется невидимый блок ссылок, вот такой:

Контент-менеджеры клиента, перенося информацию с сайта конкурента, не подозревали, что в нагрузку получали такие «подарки».

Копировали информацию двух видов:

  • технические характеристики товаров,

  • описание продуктов, которое полностью переписывалось до нужного уровня уникальности.

При редактировании материала использовался редактор в WYSIWIG-режиме, когда текст отображается «как в Word-е», без html-кода и, соответственно, скрытых ссылок. Что позволило получить конкуренту с пару десятков беклинков с нашего сайта.

Негативное влияние для донора при размещении невидимых ссылок сильное (и в основном под Yandex), а вот какой толк от невидимых ссылок для акцептора? Непонятно. Подобные ссылки воспринимаются поисковиками как спам. Тем более, что в код поместили всевозможные «спамные» css-конструкции: невидимая ссылка в 1 пиксель, находящаяся далеко за пределами экрана.

Мы бы поняли конкурента, если бы невидимые ссылки вели на какой-нибудь сомнительный, чисто «мужской» сайт, чтобы хорошенько так испортить карму текстовых воришек. Но нет.

Стоит отдать должное, в момент публикации этой статьи скрипт конкурента уже не добавлял невидимые ссылки, а лишь подставлял тривиальное и видимое: «… подробнее читайте на нашем сайте...»

Существует теория, что то, что не дано маленьким и молодым можно большим и старым (в SEO, конечно же ^_^). Поэтому мы запустили эксперимент по получению невидимых ссылок на сайт-новичок. Поделимся результатами в следующей статье.

В любом случае, мы разобрали скрипт на составляющие – возможно, кого-то из специалистов логика работы скрипта наведёт на мысли – зачем так делается? И они поделятся ими в комментариях ;)

Чисто академический интерес :)

Сам скрипт можно скачать с нашего Telegram-канала (скрипт небольшой и опубликован прямо в посте).

Есть две версии скрипта:

  • в формате ES6 модуля;

  • в формате скрипта, подключаемого на html-странице.

Логика работы скрипта заключается в следующем:

  • В скопированном фрагменте (если быть точным - в выделенном и скопированном фрагменте) ищется жирный текст (содержание тега <strong>). Если он есть, то он используется в качестве анкора невидимой ссылки.

  • Если жирного текста нет, то берётся значение тега <h1>.
  • Если и его нет, то берётся значение доменного имени (а-ля естественная ссылка).
  • Невидимая ссылка генерируется с атрибутами rel="nofollow" target="_blank". Атрибут href ведёт на текущую страницу, с которой был скопирован текст.
  • Если в скопированном тексте несколько слов в теге <strong>, то в качестве анкора будет браться первое слово.

Видно основательный SEO-подход в алгоритмах скрипта. Но вот вопрос – зачем такие ссылки? Будем признательны за ваши идеи в комментариях.

0
74 комментария
Написать комментарий...
Слегка Придурковатый

А картинки ваши контент-менеджеры таким макаром не вставляют? А то будет забавно, когда в один прекрасный момент все тыренные вами картинки превратятся, например, в другие забавные картинки сомнительного содержания.

Ответить
Развернуть ветку
Святослав Волков

Это было бы забавно, но нет (= Нам же их еще в .*webp конвертировать в погоне за красивым GPSI.
Знаете (в промышленности чаще) фото у конкурентов ну такое себе. Да и ИИ часто не сгенерируешь, поэтому хлеб фотографа никто не отнимет.

Ответить
Развернуть ветку
badResistor
Нам же их еще в .*webp конвертировать

А это является проблемой?

https://stackoverflow.com/questions/68987106/how-to-make-ffmpeg-convert-a-png-sequence-into-a-webp-sequence-instead-of-makin

Ответить
Развернуть ветку
Святослав Волков

Мы по нашей инструкции генерируем *.webp автоматически https://seolt.ru/blog/webp-ispolzuem-na-saite , которая предполагает наличие оригинальных медиа-материалов на сервере.

Ответить
Развернуть ветку
badResistor

да, похоже ваш вариант cwebp тоже самое что и мой, просто обертка над библиотекой гуугла(webp их разработка как я понял) разная.

Ответить
Развернуть ветку
71 комментарий
Раскрывать всегда