{"id":14285,"url":"\/distributions\/14285\/click?bit=1&hash=346f3dd5dee2d88930b559bfe049bf63f032c3f6597a81b363a99361cc92d37d","title":"\u0421\u0442\u0438\u043f\u0435\u043d\u0434\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438\u043b\u0438 \u043f\u0443\u0442\u0435\u0448\u0435\u0441\u0442\u0432\u0438\u044f","buttonText":"","imageUuid":""}

Через месяц парсинг сайтов в России будет практически запрещен: полный обзор спора ВК v. «Дабл» и его последствия

Остался месяц, чтобы обжаловать решение суда по спору ВК против «Дабл». Если жалоба не будет подана, российская судебная практика пополнится решением, которое фактически запретит парсинг сайтов в России, но с некоторыми оговорками.

Что такое парсинг сайтов

Парсингом (parsing) называют процесс синтаксического анализа или же разбор данных.

В контексте веб-разработки парсинг сайтов – это процесс автоматизированного анализа HTML-кода сайта, в результате которого мы получаем необходимые для нас данные в систематизированном виде. С такими данными можно дальше удобно работать: передавать их, обрабатывать.

Какое-то время использовалось только понятие парсинга. Позже появились понятия «краулинг» (crawling) и «скрейпинг» (scraping). В целом все они выполняют одну и ту же цель – автоматизированное получение данных и представление их в систематизированном виде. Поэтому часто эти понятия не разделяют и используют одно – парсинг.

Далее объясняется на примере, что такое парсинг сайтов. Если вы знакомы с этим, ничего нового скорее всего там для себя вы не найдете.

Чтобы понять практическое значение парсинга сайтов, приведем небольшой пример HTML-кода:

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Пример HTML-кода</title> </head> <body> <h1>Внизу необходимые данные</h1> <div> <span>Белый</span> <p>Цель 1</p> </div> <div> <span>Синий</span> <p>Цель 2</p> </div> <div> <span>Красный</span> <p>Цель 3</p> </div> <div> <span>Белый</span> <p>Цель 4</p> </div> <div> <span>Красный</span> <p>Цель 5</p> </div> <div class=”hidden”>Этот элемент не отображается на сайте</div> </body> </html>

Предположим, что это HTML-код некоего сайта, из которого мы хотим извлечь определенные данные. Допустим, нам необходимы имена пользователей, которые в примере условно обозначены как «Цель» внутри HTML-тэга «p».

Таких целей у нас всего 5, но нам нужны не все, а лишь только те, что отвечают необходимым для нас параметрам (это необязательно, просто для примера). Допустим, это может быть определенный пол, возраст, город проживания человека и все прочее, что указано на сайте (либо в его коде, если отображение определенных элементов отключено на сайте – они есть, выполняют свою функцию, но обычный пользователь их не видит).

Итак, нам необходимо получить все цели, цвет которых красный. Для этого парсер обращается к странице, получает его HTML-код, «проходится» по нему, находит необходимые для него тэги (условно «span» и «p»), сравнивает их значения, и если внутри тэга «span» указан цвет «красный», парсер сохраняет цель из тэга «p». В нашем случае это цель 3 и цель 5.

Таким образом парсер может пройтись по большому количеству страниц и собрать необходимые данные за сравнительно небольшой промежуток времени.

Что сделал Дабл и почему это является парсингом

Дабл (https://doubledata.ru/) собирали (а может быть собирают и сейчас) данные пользователей российской социальной сети ВКонтакте (https://vk.com/) («ВК»). Затем эти данные использовались для предоставления скоринговых услуг банкам.

Как именно собирались данные? С помощью нескольких программ, разработанных Дабл:

  • Double Search – ищет информацию о людях, в том числе в соцсетях. Программа переходит по различным ссылкам, как поисковые роботы Google, с целью индексирования страниц. В данном случае индексирование позволяет (быстрее и удобнее) в будущем по запросу пользователя находить данные о людях – ссылки на их социальные сети.
  • Social Link – программа для просмотра результатов перехода по ссылкам, то есть страницы в соцсетях, в том числе из Double Search.
  • Social Attributes – анализирует содержимое страницы социальной сети с выдачей числовых коэффициентов.

Почему это парсинг? Потому что ПО Дабл обращается к сайту ВКонтакте, анализирует определенные его страницы, получает необходимые данные и затем их сохраняет. В результате мы получаем индекс – таблицы ключевых слов с метаданными. Могу предположить, что такая таблица состояла из ФИО, возраста, города, ссылки на страницу, фотографии и вся прочая открытая информация, которую пользователи загружают о себе. Такая информация и есть наши цели, которые мы «получали» из примера HTML-кода выше.

Что не понравилось ВКонтакте?

ВК считают, что такие действия Дабл нарушают исключительные права ВК на базу данных пользователей социальной сети.

Базы данных в силу пп. 4 п. 1 ст. 1304 ГК РФ относятся к объектам смежных прав в части их охраны от несанкционированного извлечения и повторного использования составляющих их содержание материалов.

То есть ВКонтакте строили социальную сеть, собирали базу данных пользователей, а затем кто-то приходит и просто ее ворует. Если коротко, то со стороны социальной сети это выглядит так. ВК просили взыскать компенсацию в размере 1 рубля (хотя минимальная компенсация ст. 1311 ГК РФ установлена в размере 10 000 рублей), обязать Дабл прекратить собирать данные и уничтожить их.

Максимально подробный обзор дела ВК против Дабл со всеми ссылками на законы и судебные акты читайте здесь.

Далее чуть подробнее разберем решения судов каждой инстанции, чтобы понимать, будет ли все-таки запрещен парсинг сайтов в России?

Решения судов по спору ВК и Дабл

Первая инстанция

Самым первым решением ВК было полностью отказано в удовлетворении их требований, потому что:

  • ВК не доказан факт создания базы данных, соответствующей признакам ст. 1260 ГК РФ;
  • У ВК нет исключительного права на базу данных;
  • Не доказано извлечение материалов из базы данных.

Важно понимать, что факт создания вами базы данных не гарантирует вам получения исключительных прав на нее. Без исключительных прав на базу данных, вы не сможете кому-либо запретить ее неправомерное использование.

Исключительное право на базу данных у ее изготовителя возникает при наличии существенных финансовых, материальных, организационных и иных затрат на создание (включая обработку или представление соответствующих материалов) базы данных (п. 1 ст. 1334 ГК РФ).

Презумпция существенности затрат – база данных должна содержать не менее 10 000 самостоятельных информационных элементов. Странно, что суд не учел наличие 406 901 079 пользователей в базе данных ВК (на 13 января 2017 г.), о чем будет указано судами вышестоящих инстанций.

Апелляционная инстанция

Суд второй инстанции принял противоположное решение, то есть в пользу ВК, поскольку:

  • ВК доказан факт создания базы данных, соответствующей признакам ст. 1260 ГК РФ;
  • У ВК есть исключительные права на базу данных;
  • Извлечение материалов из базы данных доказано.

Кассационная инстанция

Суд третьей инстанции (Суд по интеллектуальным правам) отменил оба предыдущих решения и направил дело на новой рассмотрение в суд первой инстанции, поскольку для правильного разрешения спора требуется оценка доказательств и установление фактических обстоятельств, что не относится к полномочиям суда кассационной инстанции в силу статьи 286 Арбитражного процессуального кодекса Российской Федерации.

Кассационный суд указал на ошибки, которые необходимо исправить, в том числе:

  • Апелляционный суд неверно квалифицировал нарушение Дабл;
  • Необходимо изучить как работает ПО Дабл;
  • ВК может требовать взыскания компенсации ниже низшего предела.

Вновь первая инстанция

Суд первой инстанции снова встает на сторону Дабл, поскольку ПО Дабл является поисковой системой (сравнивается с Google или, например, Yandex), а их действия не запрещены. Также Дабл собирает лишь открытую информацию, которую пользователи сами обозначали таковой путем настроек приватности.

Вновь вторая инстанция

Суд второй инстанции снова отменяет решение первой и встает на сторону ВК, поскольку ПО Дабл не является поисковой системой (в обычном понимании термина). Дабл имеет коммерческие интересы, использует базу данных несоответствующим образом.

Интересно, что первая и вторая инстанции все равно остаются при своем.

Запрещен ли парсинг сайтов в России? Последствия спора

Если мы посмотрим на решение данного спора – да, парсинг сайтов в РФ запрещен. Единственная и логическая оговорка – такой парсинг должен нарушать чьи-либо права.

Практически во всех случаях администраторы более-менее крупных сайтов смогут заявить, что путем парсинга нарушаются их исключительные права на базу данных, так как любой такой сайт содержит в себе различные базы данных: пользователи, статьи и прочее.

Здесь администратору сайта для защиты своих прав в части баз данных необходимо будет доказать следующее (см. статьи 1334 и 1335.1. ГК РФ):

  • Наличие исключительного права на базу данных (если в ней более 10 000 самостоятельных элементов (материалов), то исключительные права имеются, пока не доказано обратное – презумпция существенности затрат при создании базы данных);
  • Наличие неправомерного использования базы данных.

База данных – это составное произведение. Составным произведение является также и интернет-сайт (ст. 1260 ГК РФ). Это значит, что администраторы сайтов могут защищаться от парсеров при отсутствии у них исключительного права на базу данных или нарушений в части баз данных. Более того, никто не мешает администратору сайта составить грамотные правила пользования сайтом, в которых будет установлен запрет на парсинг его сайта.

У Дабл остался месяц, чтобы подать жалобу в вышестоящую инстанцию. Если этого не сделать, можно ожидать увеличения споров в отношении парсинга сайтов.

В то же время стоит учитывать, что в России не прецедентное право, поэтому такое решение суда не может быть единственным аргументом в похожих кейсах – необходимо в первую очередь опираться на законы, а решение суда может лишь усилить позицию стороны.

Скорее всего, учитывая, что ВК попросили всего лишь компенсацию в размере 1 рубля, данный спор имеет стратегическое значение, поскольку наличие положительного решения суда позволит в будущем взыскивать гораздо большие суммы по похожим спорам, ну или хотя бы увеличит шансы на победу.

В данной заметке были освещены основные вопросы, рассматриваемые в деле. С подробным разбором кейса ВК-Дабл можете ознакомиться здесь.

А что за рубежом?

В иностранных юрисдикциях тоже не все так однозначно.

В качестве интересного кейса можно рассмотреть HIQ LABS, INC. против LINKEDIN CORPORATION. Здесь апелляционный суд в США подтвердил, что автоматизированный сбор общедоступной информации с сайтов законен.

Но 14 июня 2021 года Верховным судом дело передано на новое рассмотрение.

С обзорами других кейсов, преимущественно американской и международной практики, можно ознакомиться в разделе кейсов на нашем сайте.

Другие статьи по теме судов и кейсов:

Подписывайтесь на мой блог, чтобы не пропустить новые материалы. На ближайшее время планируется публикация еще одной статьи из рубрики «Что думают российские суды о...».

Автор заметки – Василий Агатеев, юрист фирмы Buzko Krasnov, оказывающей услуги по российскому и американскому праву.

0
135 комментариев
Написать комментарий...
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Арсений

Это получение информации из открытых источников. Имхо абсолютно нормальная история.
Не нравится - делайте регистрацию, закрывайте инфо.
Интернет должен быть свободным.

Ответить
Развернуть ветку
12 комментариев
Ivan Pogoreloff

Ну, тут все сложно. Вот есть список экстремистских материалов на сайте минюста. Он доступен в двух формах - веб-страницы и документ вордовский с таблицами. Разобрать документ в принципе невозможно, поскольку его форматировала бешеная мартышка. Остаются страницы. Является ли кражей то, что компенсирует лень государства в деле предоставлении доступа к этой информации в машино-читаемом виде?

Ну и про сайты поставщиков написали ниже. 99% поставщиков не дают API.

Ответить
Развернуть ветку
7 комментариев
Хозяин

Ну здесь у ВК парсят данные, которые  по-хорошему тоже не его а, вообще-то принадлежат пользователям. Так и провайдеры связи могут заявить право собственности на данные на том основании что они через их каналы передаются.
Споры жаб и гадюк.

Ответить
Развернуть ветку
Андрей Чураев

Автоматизацию доступа к открытым данным, агрегирование их и обработку (вместо человека) нельзя назвать кражей

Ответить
Развернуть ветку
1 комментарий
Nikolay Vavilov

А ножи используются, чтобы резать продукты, но для кого-то это оружие преступления.

Лучше, если бы вместо парсера сидело 100 операторов, и делали бы тоже -самое?

Ответить
Развернуть ветку
4 комментария
EpiSH

В отношении данных физических лиц - сбор открытых данных для чего угодно (от проведения безобидного статистического исследования до вполне конретной базы для мошенников, например по открытым телефонным номерам). В отношении товаров - сбор описаний и характеристик, часто это делают на сайтах собственных поставщиков, потому что у поставщика нет API, а с ассортиментом нужно работать почти в реальном времени. По мне так парсинг ни чем не вредеден. Вредно когда соцсети личные данные кому попало наружу светят, а пользователи их охотно предоставляют и открывают, тогда эти данные обязательно утекут, хоть парсингом, хоть ручками перепишут.

Ответить
Развернуть ветку
7 комментариев
Влад Охотников

При чем здесь кража контента? Парсинг это сбор необходимой информации по определённым параметрам. Используется к примеру для тонкой настройки рекламной компании внутри вконтакте. То есть у самого рекламного кабинета нет таких тонких настроек, как у парсера. Просто пример, с помощью парсера вы можете собрать информацию о людях лайкнувших и(или) прокоментировавших посты в нужной вам группе. Или например вы можете собрать с нужных вам групп только тех людей, у которых день рождение в такой то день или в такой то период. Можно спарсить людей, у которых есть дети, указанные в вк, чтобы предложить им что то в виде рекламы, к новогодним праздникам. Можно спарсить людей, состоящих в группе конкурентов и проявляющих активность на страницах в тех группах, так называемая активная аудитория и предложить им аналогичный товар от конкурента. Вариантов тысячи. Самому в контакте это тоже удобно, так как рекламщики после извлечения базы, вставляют её в рекламный кабинет вконтакте и платят вконтакте деньги за рекламу. Можно ли использовать базу не правомерно? Конечно можно. Например я могу спарсить продавцов с сайта Авито с их телефонами по определённым параметрам, например только тех, кто продаёт любые автомобили. Или тех, кто продаёт только автомобили лада или мерседес. После этого можно устроить обзвон таких людей или смс рассылку с предложением чего либо... Вот это не совсем правильно и законно. Однако ничего не мешает желающему обзвонить, в ручную открывать нужные объявления, и звонить по каждому номеру, номера же в открытом доступе. Хотя конечно массовую рассылку так не сделать... Парсер просто вытаскивает и систематизирует открытую информацию... 

Ответить
Развернуть ветку
Степан Позняк

Если есть нужда получать данные с какого-либо сервиса, то если нет API для взаимодействия с данными из него, то приходится пользоваться парсингом.
Допустим, нужно сделать сводку из 10 самых популярных сайтов с прогнозами погоды. Ручками каждый день их перебивать - идея плохая. Конечно для погоды парсинг используют редко (хотя бы потому, что API для получения данных почти всегда есть), но суть именно такая

Ответить
Развернуть ветку
1 комментарий
Александр Мазуров

Парсинг используется для чего угодно, и для кражи контента в том числе.  Но мне кажется данная судебная практика без иска работать не будет. Т.к. доказать ещё нужно, что произошла кража контента. 

Ответить
Развернуть ветку
3 комментария
Игорь Агафонов

Парсинг зачастую используется для анализа несортированных данный сайта. То есть если хочется узнать какую-то статистику, найти товар по определенным качествам, построить модель по статистике, то нужна локальная база, и её можно получить только парсингом. Да даже банально у сайта может быть кривой интерфейс, не позволяющий, например, найти все дубликаты товара.

Ответить
Развернуть ветку
Andrey Kolkov

Это не их данные, а данные пользователей сети, которые они в их базе данных лишь хранят для показа другим людям. А собственность у ВК лишь на структуру таблиц и метаданные, которые они сами в таблицах генерируют.

Ответить
Развернуть ветку
Alexander Podgayko
Ответить
Развернуть ветку
Шапка Ландквиста

ОХУЕТЬ
я это прочитала
2021 год, судьи там накуренные, что ли?

Ответить
Развернуть ветку
3 комментария
Амбиент Музыкантов

"Суд второй инстанции снова отменяет решение первой и встает на сторону ВК, поскольку ПО Дабл не является поисковой системой (в обычном понимании термина). Дабл имеет коммерческие интересы, использует базу данных несоответствующим образом"

Можно подумать, Яндекс и Гугл не имеют коммерческих интересов.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
1 комментарий
Никита Хисматов

Вот бы понять, чем поисковая система отличается от парсера. Не верю, что Яндекс/Гугл не подстраиваются под крупные проекты, и на каждый сайт смотрят как на сферический в вакууме.

Ответить
Развернуть ветку
Рунетлекс

А зачем такой кликбейт в заголовке? Очевидно же, что будут обжаловать, решение промежуточное, рубятся уже не первый год. 

Ответить
Развернуть ветку
Roman Buzko

Чтобы парсилось поисковиками лучше)

Ответить
Развернуть ветку
1 комментарий
Dee

Почему Дабл не стали вытягивать данные "легальным" методом через API? 

По западу можно также вспомнить кейс Craigslist, который закончился не так радужно для их оппонентов

https://newmedialaw.proskauer.com/2017/04/17/craigslist-garners-60-million-judgment-against-radpad-in-scraping-dispute/

а также Craigslist против 3taps

http://www.dmlp.org/sites/dmlp.org/files/2013-04-30-Order%20Granting%20in%20Part%20and%20Denying%20in%20Part%20Motions%20to%20Dismiss,%20Granting%20Motion%20to%20Bifurcate.pdf

Тоже не в пользу парсеров.

Ответить
Развернуть ветку
V R

Ну потому видимо через API нужно платить ? :-) 

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
2 комментария
Макс Лакостов

Пьяным управлять транспортным средством тоже запрещено. И тем не менее. 
А если я наберу штат голодных китайцев и они мне вручную соберут данные? Докажите, что база получена парсингом... 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
7 комментариев
Mihael Isaev

Парсинг глазами китайцев 😁 

Ответить
Развернуть ветку
Vitaliy Nechaev

А что не узбеков? ) Китайцы то подороже будут, да и голодных среди них уже мало

Ответить
Развернуть ветку
5 комментариев
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Andrey Kolkov

Китайцы уже далеко не голодные, там уровень жизни выше, чем у нас...

Ответить
Развернуть ветку
1 комментарий
Al Pr

Ну наконец-то запретят поисковые системы, даёшь старые добрые каталоги интернета, ой а они тоже должны быть запрещены!
Записал на листик адрес сайта - уголовник!
Записал адрес иностранными буквами - шпиён!

"Они стали много дышать - требую ввести налог на воздух" (с)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Vitaliy Nechaev

Последнее придется доказать. Если парсят по вопросу, до обращения идут через распределенную сеть проксей, чтобы как раз сильно не палится. 

Ответить
Развернуть ветку
3 комментария
Макс Лакостов

1. Обзоры судебной практики вполне себе могут быть основанием принятия решения. Особенно если прецедент был в суде более высокой инстанции. 

Ответить
Развернуть ветку
1 комментарий
Олег Лукин

Мне кажется, что не стоит путать сбор и использование данных. 

Ответить
Развернуть ветку
Vasilii Petrov

А причем тут "парсинг"? На мой взгляд, там играет роль сам факт создания базы данных, а не способ, каким они были получены.

Ответить
Развернуть ветку
Vasily Agateev
Автор

При том, что Дабл получали данные именно с помощью парсинга ВК.

Такой парсинг они считают правомерным действием, так как, например, с их точки зрения он не отличается от того, что делают поисковые боты Гугла. 

ВК же считает, что ПО Дабл нельзя сравнивать с поисковыми системами, поскольку последние освобождаются от ответственности за нарушение исключительных прав правообладателей не в силу статуса «поисковика», а благодаря распространению на них положений ст. 1253.1 ГК РФ – поисковики являются информационными посредниками. 

Также Дабл считают, что извлечения данных там в принципе не было, хотя парсинг, да и любое обращение к сайту, уже является извлечением базы данных в смысле ст. 1334 ГК РФ.

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Tiberius Lartius

Воровать можно. Попадаться нет.

Ответить
Развернуть ветку
2 комментария
Кай Айну

Если страница закрыта, то ВК имеет исключительное право доступа к информации, если открыта то сам пользователь дал право смотреть и собирать данные всем кто сможет.

Ответить
Развернуть ветку
Анон Плиз

Там еще может быть закрыта от поисковиков. Oh wait, Дабл - не поисковик, оказывается))

Ответить
Развернуть ветку
Семен Смирнов

Смотреть - да
Собирать - нет

Ответить
Развернуть ветку
1 комментарий
Бюро Переводов

Как вообще можно запретить парсинг? Парсинг можно делать не с белого ip, а с прокси, с любым гео, под любым фейковым профилем (вымышленными фио, возрастом, браузером, куки и т.д.) забанят один ip, один профиль, зайти с другого и продолжить. Существует софт, позволяющий генерить эти профиля сотнями тысяч. Закрывать инфу как то только. Регистрация - не выход. Можно зарегать фейковый профиль и парсить с него. Так многие и делают, кстати.
Вы упускаете суть.
Решается вопрос больших денег рекламного бизнеса. Это к программерам и арбитражникам не имеет отношения. 
Если Вконтакте выирают дело, то они закроют информацию для официально работающих площадок по поиску и сегментации целевой аудитории. Таких как Сегменто Таргет, Пейпер Нинзя, и т.д. Различных маркет плейсов в том числе. А значит будут монопольно использовать эти данные, привлекая миллиарды денег рекламодателей, которых до этого не было)

Ответить
Развернуть ветку
Николай М

Простите. Но, статья просто ни о чём. Заголовок никак не соответствует содержанию. У нас не прецедентное право как в США. Судебное решение по одному спору не может распространяться на подобные. Это если говорить о судебном решении. 

По поводу парсинга личных данных (персональных данных) - огорчу. С 1 марта в России "парсить" персональные данные (а к таковым полным ходом относятся все данные со страницы пользователя соц сетей) можно только если субъект, чьи данные вы парсите, дал на это согласие и это согласие отображено на сайте, с которого вы парсите. Если такого согласия нет, значит вы можете только ознакомиться с данными на сайте. А "скачать" себе или уж тем более "продать" кому-то или разместить на своем сайте - запрещено. 

Статья 10.1 ФЗ "О персональных данных".

Ответить
Развернуть ветку
Игорь
Простите. Но, статья просто ни о чём. Заголовок никак не соответствует содержанию. У нас не прецедентное право как в США. Судебное решение по одному спору не может распространяться на подобные. Это если говорить о судебном решении.

Как я уже писал хоть у нас не прецедентное право, но судебная практика всё равно учитывается при рассмотрении аналогичных споров (учитывается, а не тупо следуется по ней). Да, обязательны к применению лишь Пленумы ВС РФ и Обзоры практики утверждённые Пленумом/Президиумом, но на практике судьи часто смотрят и на практику вышестоящих судов. Конечно всё от обстоятельств дела зависит, но практика играет роль же. Конечно не так что один суд так вынес так и будет, но тем не менее на последующие решения судов может влиять (тут уже от обстоятельств дела зависит и суда). 

Ответить
Развернуть ветку
Лев Щенин

Интересно, что ответит Максим Кульгин - главный специалист по парсингу в Санкт-Петербурге ?

Ответить
Развернуть ветку
Feudor Mcuncle

Я все думал - что же кроме битвы жабы с гадюкой мне это напоминает...
Олдфаги поймут ;)

https://www.kinopoisk.ru/film/258028/#!watch-film/4d24e3d3d9eeb6b596c821283c3be2f1/kp

На пикче реакция VK на парсинг ;)

Ответить
Развернуть ветку
Анон Плиз

По Даблу: не понял, почему они не заикнулись о п.1 ст. 1335.1 ГК РФ, обозначив, что используют несущественную часть БД? 🤔

По ВК: они поставили вопрос о том, как осуществлялся парсинг, с авторизацией на сайте или без таковой (т.е. действительно как обычный поисковик)? Если без авторизации - почему суд постановил, что это не поисковик? 🤔

Ответить
Развернуть ветку
Vasily Agateev
Автор

Про несущественность Дабл говорили, даже был подсчитан процент:

"Исходя из экспертных заключений следует, что при индексировании страниц ВК в индекс ПО Double Search перемещается несущественный объем данных с сайта ВК - 1,27 % полей от общего количества полей пользовательских карточек ВК (при подсчете количества полей) или 1,42% от общего объема данных карточек ВК (при подсчете в мегабайтах)."

Но суд указал, что такое использование БД противоречит нормальному ее использованию:

"Пункт 3 статьи 1335.1 ГК РФ устанавливает запрет на неоднократное извлечение или использование материалов, составляющих несущественную часть базы данных, если такие действия противоречат нормальному использованию базы данных и ущемляют необоснованным образом законные интересы изготовителя базы данных.

Ответчик [Дабл] по существу признает, что им неоднократно использовались материалы, составляющие несущественную часть базы данных истца. Использование истцом материалов базы данных истца подтверждается заключением судебной экспертизы. Такое использование осуществлялось ответчиком в коммерческих целях, что предполагает неоднократность использования, при этом фактический объем использования при отсутствии признака существенности правового значения не имеет, значим сам факт использования."

Про ВК - вероятнее всего без авторизации, потому что Дабл заявляли, что не являются пользователем социальной сети. 

Ответить
Развернуть ветку
1 комментарий
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Игорь

Повлияет. Несмотря на то что у нас не прецедентное право суды всё равно учитывают сложившующся судебную практику (не слепо следуют, а учитывают, разница если что большая). Я уж не говорю о том что Пленумы и Обзоры ВС утверждённые Пленумом/Президиумом обязательны к применению.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Месье Никита

Потому что миллион говносайтов генерируют тысячи вебмастеров. С кем бодаться будете?

Ответить
Развернуть ветку
Семен Смирнов
В контексте веб-разработки парсинг сайтов – это процесс автоматизированного анализа HTML-кода сайта, в результате которого мы получаем необходимые для нас данные в систематизированном виде

Но они же не html парсили, а открытое api использовали

Ответить
Развернуть ветку
Vasily Agateev
Автор

Разве? Поделитесь источником? Из того, что было описано в части работы ПО Дабл, я склоняюсь к выводу, что это был именно парсинг, а не использование API. К тому же ни в одном судебном акте не говорилось про API - если бы оно использовалось, об этом скорее всего бы упомянули, как аргумент в пользу Дабл, поскольку API как раз и предусмотрено для того, чтобы получать данные.

upd: плюс Дабл заявляли, что не являются пользователем соцсети, соответственно, они не могли использовать API.

Ответить
Развернуть ветку
1 комментарий
Против Спама

Разве в России прецедентное право? 

Ответить
Развернуть ветку
Против Спама

Поисковики тоже занимаются парсингом. Запретить парсинг, в том числе работу поисковиков - это бред сивой кобылы. 

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Andrey Kolkov

А если они по ipv6 заходят сколько банить будешь?

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Slava Void

А то что данные ввиде страницы чужой я загружаю к себе в браузер, это тоже кража информации из БД?

Ответить
Развернуть ветку
Andrey Kolkov

А если ты не загружаешь, то эти данные никто не сможет увидеть и смысл тогда этих данных обесценивается)

Ответить
Развернуть ветку
Alexander D

Раз парсинг запрещён, надо в первую очередь забанить Гугл и Яндекс.

Ответить
Развернуть ветку
Andrey Kolkov

Там моя информация имеется, я ее ВК не дарил и не продавал, мою запись пусть вычеркнут из этих 10 тысяч необходимых, потому что эти данные лишь мои. А собственность вк именно на структуру бызы данных, где мои записи хранятся, а не на сами мои данные. Мои открытые данные общедоступны, что выражено настройками приватности.

Ответить
Развернуть ветку
LR

Может я не в тему сюда пишу, но вдруг кто-то подскажет. Не гневайтесь сильно) Если парсится RSS лента через обычный плагин, то есть  новости с одного канала автоматом публикуются на другой частный сайт.  Этот канал не запрещает перепечатку в любом виде. Это будет нарушением по новым правилам? Или вообще я не тему? 

Ответить
Развернуть ветку
Вадим Маракулин

База данных должна быть со своей защитой данных, если это надо, а если программа может прочесть хтмл код так это блог или веб страница это не воровство а чтение, смешно даже.

Ответить
Развернуть ветку
Вадим Маракулин

Вот и оставляй после этого свои сведени о банковских счетах да телефоны то да номера карт да паспортов а они уже у кого то, вот зачем они нужны? В принципе их можно показывать, они открытые, ничего же не будет. Всякие такие вещи приходится где-то показывать, давать сведения, чтобы зарплату, например переводили.нц, всё равно, как-то неловко может быть, лишним то банкам лучше уж и не знать бы, ну короче говоря блогеры принимают сведения дл денежных переводов и думают что это вполне защищено от посторонних глаз а кто-то может и это прочесть, я имею ввиду некоторые регистрационные данные, предназначенные только для блога в котором происходит регистрация, но никто не гарантирует что эти сведения и так не станут известны кому-то ещё кроме блога ВК. Потому лучше и не давать много сведений имеющих важность и иметь несколько банковских карт, одни для зарплаты, другие для развлечений с компьютерами и интернетом.

Ответить
Развернуть ветку
Андрей Сергеевич Б.

Заголовок громкий!!!, я даже забыл кофе на плите... хоть и дело к ночи. Парсинг будет всегда, ) как же без него. Личные данные конечно собирать нехорошо, это факт! Тут я согласен. Про авторские права ... тоже интересно было бы узнать подробнее. 

Ответить
Развернуть ветку
Герман Ткачев

Опять Вовка и его дружки пугаются что посчитают их дворцы и дачи? 

Ответить
Развернуть ветку
Dmitry Mind

абсурд...

Ответить
Развернуть ветку
Александр Еремеев

Кейсов, кейсов, кейсов…
Вы попснюк, батенька.
Дела.
Споры.

1. Статья актуальная, но эти Ваши «кейсы» тошнотворны.
2. Нехрен копаться в чужих сайтах, изучать их структуру, алгоритмы работы и использовать их для своих целей!
Вы разрешение у владельца спросили?!
Кроме того, алгоритмы могут быть уникальными!
А «разбираясь» в них - Вы просто воруете эти алгоритмы.
Лично я за тотальную и поголовную идентификацию пользователей в сети.
И если кто-то ворует мою интеллектуальную собственность, то он должен быть призван к ответу.
А если он ворует ее через Tor, анонимайзеры или VPN, то к ответу должен быть привлечён вледалец IP, с которого осуществлялись действия!
Чтобы неповадно было «ананомизироваться».

Ответить
Развернуть ветку
132 комментария
Раскрывать всегда