Все эти парадоксы мне представляются достаточно странными и наводят на печальные мысли о том, что сервисы проверки контента работают не так хорошо, как мы привыкли думать. А также, что SEO-специалистам, возможно, следует меньше доверять подобным системам. Учитывая, что для этого сервиса не очень много альтернатив, прошу читателей поделиться собственным опытом использования Text.ru и других систем определения уникальности.
Мне не хотелось бы, чтобы этот пост воспринимался как попытка утопить Text.ru в пользовательском хейте. Я просто задаю вопросы, которые, думаю, появляются у всех, кто столкнулся с подобными парадоксальными результатами. Буду признателен за описания вашего опыта работы и странных результатах в системах проверки контента.
Разве это новость? Ушлые копирайтеры из стопроцентной копипасты могут сделать уникальный текст по пузомеркам текст.ру (и каких-нибудь адвего), поменяв чуть ли не десяток символов/слов.
Мне, как заказчику, подобные сервисы практически не нужны. Ну, разве что мельком глянуть, чтоб там не было уж откровенной копипасты.
Впрочем, поисковики хавают и копипасту, никакого в этом откровения нет.
Поисковики хавают копипасту при определённых условиях. Мой пост о другом. В нашем случае есть 2 уникальных текста, которые при совмещении становятся неуникальными, при этом принцип по которым их уникальность оценивается не прозрачен. Поменяв 10 символов или 10 слов, если объём текста не 10 слов, нельзя сделать текст уникальным по меркам текст.ру и любой другой системы , если настаиваете на обратном - докажите. Ушлым копирайтерам нужно уметь ставить задачу и формировать требования в ТЗ, ну и нанимать нужно не авторов из серии 5 копеек за пучек, и будет всё хорошо.
Автор скрыл текст из публичного просмотра, но это пофиг, текст ру показывает ресурсы на которых есть совпадения, что он в вашем случае показывает?
https://text.ru/antiplagiat/61327beeac602
Сорри, он просто был скрыт по умолчанию.
А теперь, для чистоты эксперимента, возьмите ваш 100% текст и отправьте его на проверку еще раз. В инкогнито и не заходя в аккаунт.
В целом нет ничего удивительного, если представлять как работают подобного рода алгоритмы: текст бьётся на небольшие последовательности слов (шингл) → каждая последовательность отправляется в поиск, таким образом формируется список документов для сравнения → каждая последовательность ищется в этих документах
Расширив исходный текст вы увеличиваете кол-во и разнообразие шинглов → увеличивается вероятность, что набор документов для сравнения будет больше/разнообразнее → больше вероятность что будут совпадения с вашим текстом.
Сделать это так как вы говорите нельзя, так как на сервисе ограничена бесплатная проверка, и проверять что-то незалогинившись в приличных объёмах нельзя. Между тем, я склонен считать, что вы правы и дело в шинглах.
Возможно вы объясните мне следующий парадокс с заспамленностью. У нас есть 2 новости, которые отличаются исключительно порядком слов и больше ничем. Отличие в заспамленности состаляет 3 %
Давно уже не использую этот сервис. Лет 5 наверное. Проблемы начались когда он начал подчеркивать одно слово (!?). Как может быть слово уникальным? Для этого надо изобрести новый язык.
Также были случаи когда подсвечивал слова, которых не было в документе на который он ссылался.
Но раз в год конечно же из-за такого "сервиса" прилетает разгневанный клиент. Приходится показывать на примерах, что это за калькулятор. Конечно клиент сразу видит, что все это притянуто за уши и успокаивается.