(function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); for (var j = 0; j < document.scripts.length; j++) {if (document.scripts[j].src === r) { return; }} k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)}) (window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym"); ym(41218439, "init", { defer: true, clickmap:true, trackLinks:true, accurateTrackBounce:true }); ym(41218439, 'hit', window.location.href);

Кейс Okko: борьба за трафик с “пиратскими” сайтами

Как определить в поисковой выдаче сайты с пиратским контентом? Именно на эту задачу приходится тратить множество часов специалистам из okko.tv. Мы постарались максимально оптимизировать этот процесс и сократить затраты компании, используя платформу SEOWORK.

Кейс, который мы описали в этой статье, будет актуален не только для онлайн-кинотеатров, эта проблема затрагивает и другие сайты с уникальным контентом, защищенным авторскими правами: видео, книги или софт.

Сайты с пиратским контентом быстро индексируются и выходят в ТОП-10, таким образом забирают трафик у первоисточника по нашей семантике. С этим и старается бороться Okko ― коллеги находят проекты, которые нарушают DMCA и отправляют жалобы в Google, после удаления таких проектов, позиции кинотеатра естественным образом улучшаются. Изначально все делалось вручную: выгружали слепки ТОП-100, искали сайты с нелицензионным контентом, формировали списки и отправляли жалобы в соответствующие инстанции. Этот процесс занимал много времени у специалистов, которое можно было потратить значительно эффективнее.

Мы предложили алгоритм для детекции пиратов с использованием готовых фильтров “Новички” и “Лидеры” в модуле “Конкуренты”, который значительно сокращает трудозатраты на эту задачу.

Суть алгоритма — создать списки сайтов "не пиратов" (партнерские сайты, которые забирают контент на законных основаниях) и "пиратов". После этого - смэтчить подоменно с сайтами в слепках ТОП-10.

Разметка “не пиратов”

Мы будем использовать модуль “Конкуренты”, где отображаются все сайты, которые ранжируются по нашему семантическому ядру. Таких находится 1760 сайтов — разбирать список вручную долго и сложно.

Достаточно выгрузить 100 сайтов лидеров по видимости (ТОП-100 сайтов) и разметить их вручную "пират" / "не пират". Большинство сайтов из ТОП-100 будут “не пиратами”.

Дополнительно - в файле выгрузки можно отфильтровать сайты по столбцу “конкурент” и “тип”. Если конкурент определен как “Прямой” - автоматически проставляем метку “не пират”. Если у сайта присутствует какая-то разметка в “Типе” - так же автоматически проставляем метку “не пират”. Эти данные подтягиваются с нашей БД, т.е. если сайт размечен, значит он либо есть у нас в системе, либо это один из популярных сайтов предварительно размеченных Сеоворком.

Разметка “пиратов”

Следом воспользуемся новым готовым фильтром "Новички". Благодаря этим фильтрам мы можем быстро найти сайты конкурентов, которых ранее не было видно по отслеживаемым запросам в ТОП-10.

После применения этих фильтров получаем список сайтов, практически все из которых пираты (дополнительно стоит их бегло просмотреть, но там даже из названий доменов понятно, что это какое-то очередное зеркало).

Объединяем полученные списки “не пиратов” и “пиратов”.

Выгрузка слепков ТОП-10 + мэтчинг

Сюда же следует добавить слепки ТОП-100 выдачи по запросам, где Окко в ТОП-10 и находим соответсвия с полученными данными по нашим спискам. Это также можно сделать с помощью инструментов в SEOWORK.

Из полученных слепков ТОП-100 оставляем для анализа только ТОП-10 по каждому запросу, где вытаскиваем из урлов выдачи в отдельный столбец название доменов и мэтчим их с нашими списками "не пират" или "пират".

Сайты, которые оказались по итогу неразмеченными (таких на выходе получается немного, т.к. первые 2 шага по разметке “пират” и “не пират” покрывают большинство сайтов в наших слепках ТОП-10), можно оценить по сроку жизни домена и посещаемости (молодые и щуплые сайты тоже пометим пиратами).

Таким образом мы разметили практически все сайты, которые как-то могут повлиять на значимые позиции Okko, а остаток неразмеченных доменов можно посмотреть и разметить вручную, после всех итераций таковых останется очень мало или не остается вовсе.

Итог

По итогу на выходе мы получим размеченный файл ("не пират"/"пират") по всем слепкам ТОП-10, где присутствует Окко. Из полученных слепков можно легко составить жалобу DMCA на сайты, которые мы разметили “пиратами” + прилагая к заявке сайты “не пираты”.

Полезен ли вам такой кейс?

Кейс подготовлен ведущим аналитиком SEOWORK Сергеем Горобий

0
26 комментариев
Написать комментарий...
Ray Smith

Минус. Лучше делайте хороший сервис, за который захочется платить а не вот это вот все: "фильм не входит в подписку гони бабло", "у нас лицензия кончилось, мы удалили сериал", "скачать нельзя".
Принципиально не пользовался онлайн-парашей и не собираюсь.

Ответить
Развернуть ветку
SEOWORK
Автор

Кейс не универсален и нужен определенной группе пользователей, если вам не не актуален, не беда. 
Сервис у нас уже хороший! 

Ответить
Развернуть ветку
Ray Smith

За борьбу с пиратством всегда минус.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Alex Ondre
Ответить
Развернуть ветку
Alex Ondre
Ответить
Развернуть ветку
Alex Ondre

Я как-то попробовал их очкком попользоватсья. Подписка досталась каким-то образом от сбера вроде. Дикие тормоза и лаги. Перемотал фильм и ждёшь минуту пока прогрузится. Каждый фильм кроме фильмов из 1960-х за дополнительную плату. Нет бы купить серверов чтобы нагрузку распределить, CDN по регионам сделать, а они на эту DMCA тратятся и на зп людям которые в роскомпозор и гугл жалобы строчат, да и наверняка клевещат чтобы конурентов задавить. Ушёл обратно к пиратам, даже имея у них подписку.

Ответить
Развернуть ветку
В А

Вот и вся суть!

Ответить
Развернуть ветку
Артем Акулов

Давно понятно, что окко, иви и подобные не могут в конкурентное seo. Только виджеты у яши требуют для отжимания трафика и консервации в топе. Оказывается пираты с бюджетом несколько сотен баксов куда эффективнее и умнее в продвижке.

Ответить
Развернуть ветку
Сергей Горобий

Вы сильно путаете понятия) Скорее всего, либо вы не привыкли платить за контент, либо у вас у самого пиратский сайт кинотеатра и вас лишают заработка.

Не понятно, где пираты эффективнее и умнее в продвижении:) Методика продвижения пиратов понятна и проста, ничего заумного здесь нет - ворованный контент, который транслируется бесплатно, привлечет намного больше пользователей, чем официальный контент, который не посмотреть в свободном доступе без оплаты (привет поведенческие) + все инструменты черно-серого seo, которые помогают на старте до поведенческих взлететь повыше.

Как раз таки продвигать сайты с лицензированным контентом гораздо сложнее и тут в ход идут всевозможные инструменты и идеи. Жалобы DMCA - лишь один из инструментов выигрывать ТОПы. Почему бы им не воспользоваться, если есть такая возможность? Вы бы не воспользовались на месте иви или окко?)

Переходите на белую сторону)

Ответить
Развернуть ветку
Артем Акулов
Скорее всего, либо вы не привыкли платить за контент, либо у вас у самого пиратский сайт кинотеатра и вас лишают заработка.

Ну наконец то эксперт подъехал, всё обо всём знает и про всех)) Классика рунета ахахах.

В рунетовских сервисах кино и сериалов по-мудацки сделаны подписки, что поделать. Это недоступно, то недоступно, это удалено, здесь допом плати. В Европе с российской учеткой вообще просмотр недоступен на смарт тв. Бред. Поэтому пользуюсь исключительно нетфликсом и амазон прайм.

Оптимизация их сайтов также дерьмовая местами. Никто им не мешает подкрутить поведение и стоять выше конкурентов. Но это же работать надо, думать, соображалку включать. Куда проще пользоваться единственным инструментом продвижения - кидать dmca всем подряд и просить привилегий в поиске))) Чистейший раша бизнес во всей красе.

Ответить
Развернуть ветку
В А

Раз на тебя кинули любую жалобу, значит - виновен. И сайт сразу летит вниз. Этим многие пользуются

Ответить
Развернуть ветку
Alex Ondre

Чего стоит конфликт Рамблера и Nginx с Сысоевым, когда Рамблер настрочил dmca жалобу без всяких доказательств, а прокурорша приказала устроить маски-шоу.

Ответить
Развернуть ветку
Alex Ondre

Была подписка. Тормоза - пздц, и везде допы как о портовой шлюхи. Ушёл к пиратам обратно.))

Ответить
Развернуть ветку
Evgeny Nasekin

А как сайты из топ-100 размечались на пират/не пират? На интуиции? Может примеры есть какие-то.

Ответить
Развернуть ветку
Alex Ondre

Да они всех банят, конкуренты же, суд и роскомпозор разберётся потом через год, и пофиг что у сайта есть лицензии на контент.

Ответить
Развернуть ветку
Сергей Горобий

Если у сайта действительно есть лицензия на контент, то он и не подпадет никак под вышеописанные нами фильтры. Такой сайт будет расти в видимости органично, без резких скачков и нетипичного поведения (все лицензионные трансляторы показывают определенные паттерны в связке "динамика видимости + пузомерки", это легко отследить и такие сайты размечаются "не пиратами"). В придачу ко всему, разговор о жалобе DMCA в Гугл (а не в суд), при которой Гугл вас уведомит и попросит предоставить лицензии. После предоставления лицензий вас сразу же разблокируют (далее все последующие заявки на ваш сайт будут разворачивать обратно, если вы единожды подтвердили лицензии).

Ответить
Развернуть ветку
Сергей Горобий

Часть сайтов уже была размечена внутри Сеоворка по типу конкурента (об этом в статье написано). Остаток же доменов мэтчился по маскам пиратов (у самых популярных пиратов узнаваемые маски доменов) + отсекались новореги + дополнительно пробивались и изучались пузомерки, выбивающиеся по статистике домены дополнительно изучались и отсматривались (но до этой стадии пираты практически не доходят, основа отсекается по маскам и новорегам).

Ответить
Развернуть ветку
В А

Как  определить в поисковой выдаче сайты с пиратским контентом? Именно на эту задачу приходится тратить множество часов специалистам из okko.tv

Да, ёпта, набрать в поиске что ищите и моментально получить результат!

Ответить
Развернуть ветку
Сергей Горобий

Если вы работаете с небольшим сайтом, где достаточно посмотреть вручную выдачу по 10-20 запросам, то да, безусловно. Для сайтов, продвигаемых по сотням тысяч запросов, ваша комментарий неактуален)

Ответить
Развернуть ветку
В А

Ещё как актуален) сайтов то не сотни тысяч, а десятки. Сайты которые стоят на 20 странице в поиске никому не интересны и у них нет трафика. Смысл его искать? Писать жалобы в надежде получить трафик - не самая лучшая идея. Пользователю нужна халява. Там, в конторе, наверняка это понимают, но, чтобы люди не сидели без дела, им дали такое глупое задание.

Ответить
Развернуть ветку
Michael

И кто побеждает?) Пираты прыгают по зеркалам в пару кликов и продолжают собирать трафик. К тому же на этих сайтах контента (фильмов) больше + ПФ там в разы лучше. Вот и результат. 

Ответить
Развернуть ветку
SEOWORK
Автор

Хотелось бы написать - добро. Да, вы правы, пиратским сайтам значительно проще, но это не значит, что этим не надо заниматься

Ответить
Развернуть ветку
Дмитрий Александрович

Отпишусь тут о личном опыте взаимодействия с деятелями скорее всего как раз из okko.tv

Есть у меня в закромах один старый фан-сайт, посвященный сериалу, который когда-то мне очень нравился. Сайт абсолютно не интересен в коммерческом плане, ничем не монетизируется и представляет ценность разве что для меня как память и для киберсквоттеров (из-за возраста домена).

Так вот, когда появились новости о внезапном выпуске продолжения данного сериала, то "правообладатели" внезапно зашевелились и начали одолевать меня абузами. Сначала в Яндексе попытались выпилить из результатов поиска страницу, на которой была выложена для скачивания серия книг (не сериал!), по мотивам которых был снят сериал. А потом и вовсе ошизели и в Гугле подали DMCA-абузу на _пустую_ страницу со словом "Скачать" в заголовке.

Ну логика конечно железная: сайт посвящен сериалу + на сайте есть страница "Скачать" + сайт начал расти в поиске на фоне возобновления интереса к теме у людей => КАРАУЛ НАШИ АВТОРСКИЕ ПРАВА ВАПАСНОСТЕ!!!1

А зайти ручками на саму страницу и убедиться, что она полностью пустая (и всегда такой была, это легко проверяется через вебархив) и на ней не выложено ни одной ссылки на скачивание - ну не, это сложно, это работать надо. Зачем нам работать, когда можно спарсить выдачу, по каким-то поверхностным маркерам пометить в эксельке "пиратов", массово отправить абузы - и пускай дальше вебмастера тратят свое время и доказывают, что не верблюды.

Ответить
Развернуть ветку
Дмитрий Александрович

Внимательнее пересмотрел свои DMCA-абузы, описываемый мною опыт относится не к okko.tv, а к украинским недоделкам из компании Vindex.

Но механизмы ими используются такие же, как описывалось в этой статье - парсинг выдачи и автоматизированное раскидывание маркеров "пират - не пират".

Ответить
Развернуть ветку
Цифровая гигиена 2.0

Пиратам — бой!

Ответить
Развернуть ветку
23 комментария
Раскрывать всегда