{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Специфический способ наказать за копирование контента: бэклинки и бан, но это не точно

Если ваш контент постоянно заимствуется конкурентами, то вы можете наказать воришек. О нетривиальном способе будет полезно узнать тем, кто при работе с проектом задействует копирайтеров и контент-менеджеров, далёких от знаний html и css.

Большинству SEO-специалистов известны стандартные способы защиты авторского контента:

  • будь первым проиндексированным (первоисточником),

  • купи анкоров с пассажами из твоего текста,

  • напиши в Google по DMCA, в хостинг-компанию и т. д.,

  • приложи подорожник (зачеркнуто) знак © и укажи правила использования контента,

  • есть вагон свободного времени - отправь заказное письмо со свежей статьей себе и пиши досудебку.

Вызывают улыбку JS-уловки, при которых нельзя скопировать контент или, когда в конец скопированного текста добавляется: … подробнее читайте на нашем сайте ...

Но наша история более изощренная

Всё началось с того, что один из продвигаемых нами сайтов просел в Yandex. Просел в строго определенных кластерах, т.е. какие-то группы ключевых запросов продолжают расти дальше, а какие-то резко упали в один день. На графике ниже можно увидеть, как проседание отразилось на посещаемости сайта. Google среагировал, но не так ярко, можно списать на колебания спроса:

Пошли искать причину и выяснили, что на сайте много невидимых ссылок, которые ведут на сайт конкурента. Предположение о взломе не подтвердилось, и тогда мы стали копать дальше. Обнаружили, что при копировании почти любой информации на сайте конкурента к скопированному элементу добавляется невидимый блок ссылок, вот такой:

Контент-менеджеры клиента, перенося информацию с сайта конкурента, не подозревали, что в нагрузку получали такие «подарки».

Копировали информацию двух видов:

  • технические характеристики товаров,

  • описание продуктов, которое полностью переписывалось до нужного уровня уникальности.

При редактировании материала использовался редактор в WYSIWIG-режиме, когда текст отображается «как в Word-е», без html-кода и, соответственно, скрытых ссылок. Что позволило получить конкуренту с пару десятков беклинков с нашего сайта.

Негативное влияние для донора при размещении невидимых ссылок сильное (и в основном под Yandex), а вот какой толк от невидимых ссылок для акцептора? Непонятно. Подобные ссылки воспринимаются поисковиками как спам. Тем более, что в код поместили всевозможные «спамные» css-конструкции: невидимая ссылка в 1 пиксель, находящаяся далеко за пределами экрана.

Мы бы поняли конкурента, если бы невидимые ссылки вели на какой-нибудь сомнительный, чисто «мужской» сайт, чтобы хорошенько так испортить карму текстовых воришек. Но нет.

Стоит отдать должное, в момент публикации этой статьи скрипт конкурента уже не добавлял невидимые ссылки, а лишь подставлял тривиальное и видимое: «… подробнее читайте на нашем сайте...»

Существует теория, что то, что не дано маленьким и молодым можно большим и старым (в SEO, конечно же ^_^). Поэтому мы запустили эксперимент по получению невидимых ссылок на сайт-новичок. Поделимся результатами в следующей статье.

В любом случае, мы разобрали скрипт на составляющие – возможно, кого-то из специалистов логика работы скрипта наведёт на мысли – зачем так делается? И они поделятся ими в комментариях ;)

Чисто академический интерес :)

Сам скрипт можно скачать с нашего Telegram-канала (скрипт небольшой и опубликован прямо в посте).

Есть две версии скрипта:

  • в формате ES6 модуля;

  • в формате скрипта, подключаемого на html-странице.

Логика работы скрипта заключается в следующем:

  • В скопированном фрагменте (если быть точным - в выделенном и скопированном фрагменте) ищется жирный текст (содержание тега <strong>). Если он есть, то он используется в качестве анкора невидимой ссылки.

  • Если жирного текста нет, то берётся значение тега <h1>.
  • Если и его нет, то берётся значение доменного имени (а-ля естественная ссылка).
  • Невидимая ссылка генерируется с атрибутами rel="nofollow" target="_blank". Атрибут href ведёт на текущую страницу, с которой был скопирован текст.
  • Если в скопированном тексте несколько слов в теге <strong>, то в качестве анкора будет браться первое слово.

Видно основательный SEO-подход в алгоритмах скрипта. Но вот вопрос – зачем такие ссылки? Будем признательны за ваши идеи в комментариях.

0
74 комментария
Написать комментарий...
Игорь Субботин

Какой интересный поворот сюжета, в тот момент, когда я приготовился читать, как вы пострадали от воровства контента - вдруг обнаружилось, что воришки - это вы 😂

Ответить
Развернуть ветку
Святослав Волков

Ты должен был бороться со злом, а не примкнуть к нему!😊 А если по чесноку, то копировали параметры. Тексты меняли, неуникальные страницы не продвинуть в поиске.

Ответить
Развернуть ветку
Никнейм

Просто не освоили ещё ChatGPT.

Ответить
Развернуть ветку
Michael Myers

Тада, это тоже прикольнуло)

Ответить
Развернуть ветку
Aleksandra Campbell

первая гифка просто топ 😂

Ответить
Развернуть ветку
Антон Глоба

В свое время мой интернет-магазин всплыл в поиске во многом благодаря уникальными карточками товаров.
Каково было моё удивление, когда я увидел описание товара на сайте федерального конкурента , в котором даже не удалили внизу сео-строчку. «Если нужен тренажер приходи в магазин ....»

Ответить
Развернуть ветку
badResistor

Почти всегда при копировании любого текста или кода использую временный буфер ввиде notepad++ либо geany

Ответить
Развернуть ветку
Святослав Волков

Это хорошее правило, badResistor! Теперь о нем знают и контент-менеджеры наших клиентов.

Ответить
Развернуть ветку
9 комментариев
Никита Румянцев
Ответить
Развернуть ветку
Иннокентий Фефилов

Они думали, что такие ссылки работают. Поэтому так сделали. А потом узнали, что толку от этого нет. Или может по самим бьет.

Ответить
Развернуть ветку
Rusakov

Да, я тоже думаю это был сеошный эксперимент, который дал какие-то результаты/их отсутствие и был окончен.
Было бы забавно, если бы здесь рассказали о результатах исполнители с той стороны.

Ответить
Развернуть ветку
2 комментария
Святослав Волков

Да, Иннокентий, согласен. Самим интересно какой результат - запустили эксперимент, расскажем об этом.

Ответить
Развернуть ветку
1 комментарий
Rusakov

Тебя посодют, а ты не воруй!
[Голосом Папанова из "Берегись автомобиля"]

Ответить
Развернуть ветку
Света Ганичева

Это отличный кейс еще на тему "мы сами все напишем, вы главное дайте гарантии на результат".

Ответить
Развернуть ветку
Алина Зиборова

А интерес к скрипту точно только академический? Ну-да, делать я этого, конечно, же не буду ;)

Ответить
Развернуть ветку
Rusakov

Я замышляю шалость и только шалость...

Ответить
Развернуть ветку
1 комментарий
Иннокентий Фефилов

Дак тут палка в две стороны стрельнут может. При чем на эксперименту не стрельнет, а на деле бабахнет.

Ответить
Развернуть ветку
Michael Myers

Она может и невидимая и акцептору ничего не принесёт, зато поисковику видимо принесло и ваш сайт попустил.

Чем плохо «подробнее на сайте и тд»? Бывает парсят и вообще не смотрят ни на что, а тут ссылка появляется на источник.

Все методы защиты от воровства, все это фигня, только в суд, а этим никто не хочет заниматься.

«Кто первый индексируется» - в яндексе может, а в гугле где-то писали, что более авторитетный домен и будет считаться первоисточником.

Ответить
Развернуть ветку
Святослав Волков

Да, защититься от воровства контента никак не выходит, кроме досудебки, а если не получилось, то и судебного разбирательства. Но вот такой "скрытый" сюрприз встретили в первые.

В Google, кстати, раньше жалобы на DMCA помогали, давно не использовали, не знаем как сейчас.

Ответить
Развернуть ветку
13 комментариев
Игорь Субботин

Насчëт - кто первый индексируется - и у гугла, и у яндекса есть инструменты для владельцев сайтов, позволяющие запрашивать индексацию свежих страниц (хотя в теории это, конечно, может и не сработать).

Ответить
Развернуть ветку
1 комментарий
В А

Самого главного то не спросили: на сколько клиента то развели, с этим тупокопированием? И куда дели бабло, небось на шлюх всё слили?)

Ответить
Развернуть ветку
Иннокентий Фефилов

В статье же написано, что контент таскали сотрудники клиента, а не подрядчик.

Вы просто взяли и оскорбили людей.

Ответить
Развернуть ветку
Валдис Фет

Так из всех . Под плинтус ...

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Thea Girl

Мне нравится пустую ссылку перед началом текста ставить.
Даже если СЕО толку нет, то хотя бы видишь кто стыбрил.. по ссылкам входящим :)

Статья и фоточка супер!

Ответить
Развернуть ветку
Святослав Волков

Как я понимаю, даже когда текст полностью будет переписан - вы все равно получите входящую ссылку и сможете понять, кто использует ваши тексты в качестве материала для рерайта. У вас весьма специфический подход :)

Спасибо за добрые слова, передадим нашим ребятам! ^_^

Ответить
Развернуть ветку
Слегка Придурковатый

А картинки ваши контент-менеджеры таким макаром не вставляют? А то будет забавно, когда в один прекрасный момент все тыренные вами картинки превратятся, например, в другие забавные картинки сомнительного содержания.

Ответить
Развернуть ветку
Иннокентий Фефилов

Вы внимательно прочитайте. Контент-менеджеры клиента, а не их.

Ответить
Развернуть ветку
Святослав Волков

Это было бы забавно, но нет (= Нам же их еще в .*webp конвертировать в погоне за красивым GPSI.
Знаете (в промышленности чаще) фото у конкурентов ну такое себе. Да и ИИ часто не сгенерируешь, поэтому хлеб фотографа никто не отнимет.

Ответить
Развернуть ветку
3 комментария
Борис Д

Визуальный редактор типа tinymce используете? Я давно использую Wagtail (мощная надстройка над джанго), там есть потоковое поле (StreamField), в котором контент составлявляется автором из блоков как из кубиков (блоки содержат свои данные, логику и шаблоны). Там есть блок Paragraph с визуальным редактором, но... с минимумом функций и полной очисткой от всего лишнего при копипасте.

Так вот... постоянно приходится бодаться с контент-менеджерами из-за этих ограничений и затруднений в копипасте контента.

А у wagtail это специально такой жесткий принцип: автор содержимого только вводит текст, картинки, данные, но не занимается никаким дизайном. Хочешь текст обвести в красную рамочку и не доволен, что нет возможности? Сначала скажи, что это за текст, который ты хочешь обвести? Какую смысловую нагрузку он несет? Если это например текст с предупреждением, то пиши ТЗ и я создам блок Warning, который будет иметь свое поведение, данные, шаблон и дизайн (и дизайном займется дизайнер). Тогда любой контент будет четко структкрирован и единообразно оформлен, а главное - будет возможна автоматическая обработка любых авторских текстов. Лепота... И никакие левые и мусорные вставки невозможны - html код идеален. Но контент-менеджеры воспринимают все эти ограничения в штыки, я устал уже бодаться.

Ответить
Развернуть ветку
Святослав Волков

Добрый день, Борис! 👋
Наши контент-менеджеры используют Quill, а кто не боится кода CodeMirror. А вот контент-менеджеры клиентов обычно Tinymce – здесь ваша дедукция не подвела (= Таких клиентов немного, но они есть, и мы тоже с ними бодаемся.
Мне кажется, что модульная идеология нашего плагина-редактора Quill (мы его хорошенько переписали и адаптировали) близка к вашему подходу собирать контент из кубиков.
Желаю вам сил победить контент-менеджеров ✊, которые не хотят соглашаться на такую крутую штуку управления контентом!

Ответить
Развернуть ветку
Андрей Сергеевич

Получается, что это вас наказали?

Ответить
Развернуть ветку
Святослав Волков

Получается клиент попался на уловку конкурента.

Клиент брал информацию у конкурентов, переписывал ее, делая уникальной и вместе с этим, не ведая того, что ссылался на сайте конкурента.
Как понимаю, с подобной проблемой могут столкнуться все, кто использует визуальные редакторы на сайте и не смотрит в код скопированного блока.
❗❗❗ Даже полное переписывание информации, что и делалось, не спасало от удаления скрытых ссылок.

Ответить
Развернуть ветку
2 комментария
Виктор Петров

Когда мало того, что вор, но и парсить не умеешь.
куда катится мир

Ответить
Развернуть ветку
Viktor Kvyat

А как такое: Не копирование, а пересказ очень близкий к тесту)

Ответить
Развернуть ветку
Святослав Волков

Обратите внимание, на "хитрый" скрипт, Viktor, даже при полностью переписанном материале - скрытые ссылки остаются. Так что всегда нужно зрить в корень, т.е. в код.

Ответить
Развернуть ветку
Максим Кульгин

Ребята - вы простите, но ведь то, что вы делаете звучит мягко говоря плохо. Вы воруете контент? Настолько тупо, что даже ссылки захватываете ?

Ответить
Развернуть ветку
Святослав Волков

Добрый день, Максим. Приятно, что читаете нашу колонку на VC 🤗 Но жалко, что не внимательно. Мы не видим ничего плохого в копировании параметров одних и тех же товаров одного производителя, например, параметров телефонов или стройматериалов (откуда их еще взять). Также не видим ничего плохого в подходе контент-менеджеров клиента, когда они копируют описание товара, переписывают его и публикуют уже уникальный материал.
Наши контенщики такой метод не используют, генерируют сразу через ChatGPT4 с глубокой проверкой редактора.

Ответить
Развернуть ветку
2 комментария
Nasha Rasha

Какой интересный способ наказать за копирование контента! А я всегда думал, что достаточно просто сказать воришкам 'пожалуйста, не копируйте', и все наладится. Но нет, оказывается, нужно купить анкоров и отправить заказное письмо, чтобы все стало хорошо. Благодарим за ценные советы, будем пробовать!

Ответить
Развернуть ветку
Святослав Волков

Надеюсь администрация VC обратит внимание на сгенерированый через ИИ контент. Вы бы хоть проверяли, что пишите.

Ответить
Развернуть ветку
71 комментарий
Раскрывать всегда