Специфический способ наказать за копирование контента: бэклинки и бан, но это не точно
Если ваш контент постоянно заимствуется конкурентами, то вы можете наказать воришек. О нетривиальном способе будет полезно узнать тем, кто при работе с проектом задействует копирайтеров и контент-менеджеров, далёких от знаний html и css.
Большинству SEO-специалистов известны стандартные способы защиты авторского контента:
будь первым проиндексированным (первоисточником),
купи анкоров с пассажами из твоего текста,
напиши в Google по DMCA, в хостинг-компанию и т. д.,
приложи подорожник (зачеркнуто) знак © и укажи правила использования контента,
- есть вагон свободного времени - отправь заказное письмо со свежей статьей себе и пиши досудебку.
Вызывают улыбку JS-уловки, при которых нельзя скопировать контент или, когда в конец скопированного текста добавляется: … подробнее читайте на нашем сайте ...
Но наша история более изощренная
Всё началось с того, что один из продвигаемых нами сайтов просел в Yandex. Просел в строго определенных кластерах, т.е. какие-то группы ключевых запросов продолжают расти дальше, а какие-то резко упали в один день. На графике ниже можно увидеть, как проседание отразилось на посещаемости сайта. Google среагировал, но не так ярко, можно списать на колебания спроса:
Пошли искать причину и выяснили, что на сайте много невидимых ссылок, которые ведут на сайт конкурента. Предположение о взломе не подтвердилось, и тогда мы стали копать дальше. Обнаружили, что при копировании почти любой информации на сайте конкурента к скопированному элементу добавляется невидимый блок ссылок, вот такой:
Контент-менеджеры клиента, перенося информацию с сайта конкурента, не подозревали, что в нагрузку получали такие «подарки».
Копировали информацию двух видов:
технические характеристики товаров,
- описание продуктов, которое полностью переписывалось до нужного уровня уникальности.
При редактировании материала использовался редактор в WYSIWIG-режиме, когда текст отображается «как в Word-е», без html-кода и, соответственно, скрытых ссылок. Что позволило получить конкуренту с пару десятков беклинков с нашего сайта.
Негативное влияние для донора при размещении невидимых ссылок сильное (и в основном под Yandex), а вот какой толк от невидимых ссылок для акцептора? Непонятно. Подобные ссылки воспринимаются поисковиками как спам. Тем более, что в код поместили всевозможные «спамные» css-конструкции: невидимая ссылка в 1 пиксель, находящаяся далеко за пределами экрана.
Мы бы поняли конкурента, если бы невидимые ссылки вели на какой-нибудь сомнительный, чисто «мужской» сайт, чтобы хорошенько так испортить карму текстовых воришек. Но нет.
Стоит отдать должное, в момент публикации этой статьи скрипт конкурента уже не добавлял невидимые ссылки, а лишь подставлял тривиальное и видимое: «… подробнее читайте на нашем сайте...»
Существует теория, что то, что не дано маленьким и молодым можно большим и старым (в SEO, конечно же ^_^). Поэтому мы запустили эксперимент по получению невидимых ссылок на сайт-новичок. Поделимся результатами в следующей статье.
В любом случае, мы разобрали скрипт на составляющие – возможно, кого-то из специалистов логика работы скрипта наведёт на мысли – зачем так делается? И они поделятся ими в комментариях ;)
Чисто академический интерес :)
Сам скрипт можно скачать с нашего Telegram-канала (скрипт небольшой и опубликован прямо в посте).
Есть две версии скрипта:
в формате ES6 модуля;
- в формате скрипта, подключаемого на html-странице.
Логика работы скрипта заключается в следующем:
В скопированном фрагменте (если быть точным - в выделенном и скопированном фрагменте) ищется жирный текст (содержание тега <strong>). Если он есть, то он используется в качестве анкора невидимой ссылки.
- Если жирного текста нет, то берётся значение тега <h1>.
- Если и его нет, то берётся значение доменного имени (а-ля естественная ссылка).
- Невидимая ссылка генерируется с атрибутами rel="nofollow" target="_blank". Атрибут href ведёт на текущую страницу, с которой был скопирован текст.
- Если в скопированном тексте несколько слов в теге <strong>, то в качестве анкора будет браться первое слово.
Видно основательный SEO-подход в алгоритмах скрипта. Но вот вопрос – зачем такие ссылки? Будем признательны за ваши идеи в комментариях.
Какой интересный поворот сюжета, в тот момент, когда я приготовился читать, как вы пострадали от воровства контента - вдруг обнаружилось, что воришки - это вы 😂
Ты должен был бороться со злом, а не примкнуть к нему!😊 А если по чесноку, то копировали параметры. Тексты меняли, неуникальные страницы не продвинуть в поиске.
Просто не освоили ещё ChatGPT.
Тада, это тоже прикольнуло)
первая гифка просто топ 😂
В свое время мой интернет-магазин всплыл в поиске во многом благодаря уникальными карточками товаров.
Каково было моё удивление, когда я увидел описание товара на сайте федерального конкурента , в котором даже не удалили внизу сео-строчку. «Если нужен тренажер приходи в магазин ....»
Почти всегда при копировании любого текста или кода использую временный буфер ввиде notepad++ либо geany
Это хорошее правило, badResistor! Теперь о нем знают и контент-менеджеры наших клиентов.
Они думали, что такие ссылки работают. Поэтому так сделали. А потом узнали, что толку от этого нет. Или может по самим бьет.
Да, я тоже думаю это был сеошный эксперимент, который дал какие-то результаты/их отсутствие и был окончен.
Было бы забавно, если бы здесь рассказали о результатах исполнители с той стороны.
Да, Иннокентий, согласен. Самим интересно какой результат - запустили эксперимент, расскажем об этом.
Тебя посодют, а ты не воруй!
[Голосом Папанова из "Берегись автомобиля"]
Это отличный кейс еще на тему "мы сами все напишем, вы главное дайте гарантии на результат".
А интерес к скрипту точно только академический? Ну-да, делать я этого, конечно, же не буду ;)
Я замышляю шалость и только шалость...
Дак тут палка в две стороны стрельнут может. При чем на эксперименту не стрельнет, а на деле бабахнет.
Она может и невидимая и акцептору ничего не принесёт, зато поисковику видимо принесло и ваш сайт попустил.
Чем плохо «подробнее на сайте и тд»? Бывает парсят и вообще не смотрят ни на что, а тут ссылка появляется на источник.
Все методы защиты от воровства, все это фигня, только в суд, а этим никто не хочет заниматься.
«Кто первый индексируется» - в яндексе может, а в гугле где-то писали, что более авторитетный домен и будет считаться первоисточником.
Да, защититься от воровства контента никак не выходит, кроме досудебки, а если не получилось, то и судебного разбирательства. Но вот такой "скрытый" сюрприз встретили в первые.
В Google, кстати, раньше жалобы на DMCA помогали, давно не использовали, не знаем как сейчас.
Насчëт - кто первый индексируется - и у гугла, и у яндекса есть инструменты для владельцев сайтов, позволяющие запрашивать индексацию свежих страниц (хотя в теории это, конечно, может и не сработать).
Самого главного то не спросили: на сколько клиента то развели, с этим тупокопированием? И куда дели бабло, небось на шлюх всё слили?)
В статье же написано, что контент таскали сотрудники клиента, а не подрядчик.
Вы просто взяли и оскорбили людей.
Так из всех . Под плинтус ...
Комментарий недоступен
Мне нравится пустую ссылку перед началом текста ставить.
Даже если СЕО толку нет, то хотя бы видишь кто стыбрил.. по ссылкам входящим :)
Статья и фоточка супер!
Как я понимаю, даже когда текст полностью будет переписан - вы все равно получите входящую ссылку и сможете понять, кто использует ваши тексты в качестве материала для рерайта. У вас весьма специфический подход :)
Спасибо за добрые слова, передадим нашим ребятам! ^_^
А картинки ваши контент-менеджеры таким макаром не вставляют? А то будет забавно, когда в один прекрасный момент все тыренные вами картинки превратятся, например, в другие забавные картинки сомнительного содержания.
Вы внимательно прочитайте. Контент-менеджеры клиента, а не их.
Это было бы забавно, но нет (= Нам же их еще в .*webp конвертировать в погоне за красивым GPSI.
Знаете (в промышленности чаще) фото у конкурентов ну такое себе. Да и ИИ часто не сгенерируешь, поэтому хлеб фотографа никто не отнимет.
Визуальный редактор типа tinymce используете? Я давно использую Wagtail (мощная надстройка над джанго), там есть потоковое поле (StreamField), в котором контент составлявляется автором из блоков как из кубиков (блоки содержат свои данные, логику и шаблоны). Там есть блок Paragraph с визуальным редактором, но... с минимумом функций и полной очисткой от всего лишнего при копипасте.
Так вот... постоянно приходится бодаться с контент-менеджерами из-за этих ограничений и затруднений в копипасте контента.
А у wagtail это специально такой жесткий принцип: автор содержимого только вводит текст, картинки, данные, но не занимается никаким дизайном. Хочешь текст обвести в красную рамочку и не доволен, что нет возможности? Сначала скажи, что это за текст, который ты хочешь обвести? Какую смысловую нагрузку он несет? Если это например текст с предупреждением, то пиши ТЗ и я создам блок Warning, который будет иметь свое поведение, данные, шаблон и дизайн (и дизайном займется дизайнер). Тогда любой контент будет четко структкрирован и единообразно оформлен, а главное - будет возможна автоматическая обработка любых авторских текстов. Лепота... И никакие левые и мусорные вставки невозможны - html код идеален. Но контент-менеджеры воспринимают все эти ограничения в штыки, я устал уже бодаться.
Добрый день, Борис! 👋
Наши контент-менеджеры используют Quill, а кто не боится кода CodeMirror. А вот контент-менеджеры клиентов обычно Tinymce – здесь ваша дедукция не подвела (= Таких клиентов немного, но они есть, и мы тоже с ними бодаемся.
Мне кажется, что модульная идеология нашего плагина-редактора Quill (мы его хорошенько переписали и адаптировали) близка к вашему подходу собирать контент из кубиков.
Желаю вам сил победить контент-менеджеров ✊, которые не хотят соглашаться на такую крутую штуку управления контентом!
Получается, что это вас наказали?
Получается клиент попался на уловку конкурента.
Клиент брал информацию у конкурентов, переписывал ее, делая уникальной и вместе с этим, не ведая того, что ссылался на сайте конкурента.
Как понимаю, с подобной проблемой могут столкнуться все, кто использует визуальные редакторы на сайте и не смотрит в код скопированного блока.
❗❗❗ Даже полное переписывание информации, что и делалось, не спасало от удаления скрытых ссылок.
Когда мало того, что вор, но и парсить не умеешь.
куда катится мир
А как такое: Не копирование, а пересказ очень близкий к тесту)
Обратите внимание, на "хитрый" скрипт, Viktor, даже при полностью переписанном материале - скрытые ссылки остаются. Так что всегда нужно зрить в корень, т.е. в код.
Ребята - вы простите, но ведь то, что вы делаете звучит мягко говоря плохо. Вы воруете контент? Настолько тупо, что даже ссылки захватываете ?
Добрый день, Максим. Приятно, что читаете нашу колонку на VC 🤗 Но жалко, что не внимательно. Мы не видим ничего плохого в копировании параметров одних и тех же товаров одного производителя, например, параметров телефонов или стройматериалов (откуда их еще взять). Также не видим ничего плохого в подходе контент-менеджеров клиента, когда они копируют описание товара, переписывают его и публикуют уже уникальный материал.
Наши контенщики такой метод не используют, генерируют сразу через ChatGPT4 с глубокой проверкой редактора.
Какой интересный способ наказать за копирование контента! А я всегда думал, что достаточно просто сказать воришкам 'пожалуйста, не копируйте', и все наладится. Но нет, оказывается, нужно купить анкоров и отправить заказное письмо, чтобы все стало хорошо. Благодарим за ценные советы, будем пробовать!
Надеюсь администрация VC обратит внимание на сгенерированый через ИИ контент. Вы бы хоть проверяли, что пишите.