Через месяц парсинг сайтов в России будет практически запрещен: полный обзор спора ВК v. «Дабл» и его последствия

Остался месяц, чтобы обжаловать решение суда по спору ВК против «Дабл». Если жалоба не будет подана, российская судебная практика пополнится решением, которое фактически запретит парсинг сайтов в России, но с некоторыми оговорками.

5353

Комментарий недоступен

15

Это получение информации из открытых источников. Имхо абсолютно нормальная история.
Не нравится - делайте регистрацию, закрывайте инфо.
Интернет должен быть свободным.

93

Ну, тут все сложно. Вот есть список экстремистских материалов на сайте минюста. Он доступен в двух формах - веб-страницы и документ вордовский с таблицами. Разобрать документ в принципе невозможно, поскольку его форматировала бешеная мартышка. Остаются страницы. Является ли кражей то, что компенсирует лень государства в деле предоставлении доступа к этой информации в машино-читаемом виде?

Ну и про сайты поставщиков написали ниже. 99% поставщиков не дают API.

24

Ну здесь у ВК парсят данные, которые  по-хорошему тоже не его а, вообще-то принадлежат пользователям. Так и провайдеры связи могут заявить право собственности на данные на том основании что они через их каналы передаются.
Споры жаб и гадюк.

22

Автоматизацию доступа к открытым данным, агрегирование их и обработку (вместо человека) нельзя назвать кражей

17

А ножи используются, чтобы резать продукты, но для кого-то это оружие преступления.

Лучше, если бы вместо парсера сидело 100 операторов, и делали бы тоже -самое?

10

В отношении данных физических лиц - сбор открытых данных для чего угодно (от проведения безобидного статистического исследования до вполне конретной базы для мошенников, например по открытым телефонным номерам). В отношении товаров - сбор описаний и характеристик, часто это делают на сайтах собственных поставщиков, потому что у поставщика нет API, а с ассортиментом нужно работать почти в реальном времени. По мне так парсинг ни чем не вредеден. Вредно когда соцсети личные данные кому попало наружу светят, а пользователи их охотно предоставляют и открывают, тогда эти данные обязательно утекут, хоть парсингом, хоть ручками перепишут.

7

При чем здесь кража контента? Парсинг это сбор необходимой информации по определённым параметрам. Используется к примеру для тонкой настройки рекламной компании внутри вконтакте. То есть у самого рекламного кабинета нет таких тонких настроек, как у парсера. Просто пример, с помощью парсера вы можете собрать информацию о людях лайкнувших и(или) прокоментировавших посты в нужной вам группе. Или например вы можете собрать с нужных вам групп только тех людей, у которых день рождение в такой то день или в такой то период. Можно спарсить людей, у которых есть дети, указанные в вк, чтобы предложить им что то в виде рекламы, к новогодним праздникам. Можно спарсить людей, состоящих в группе конкурентов и проявляющих активность на страницах в тех группах, так называемая активная аудитория и предложить им аналогичный товар от конкурента. Вариантов тысячи. Самому в контакте это тоже удобно, так как рекламщики после извлечения базы, вставляют её в рекламный кабинет вконтакте и платят вконтакте деньги за рекламу. Можно ли использовать базу не правомерно? Конечно можно. Например я могу спарсить продавцов с сайта Авито с их телефонами по определённым параметрам, например только тех, кто продаёт любые автомобили. Или тех, кто продаёт только автомобили лада или мерседес. После этого можно устроить обзвон таких людей или смс рассылку с предложением чего либо... Вот это не совсем правильно и законно. Однако ничего не мешает желающему обзвонить, в ручную открывать нужные объявления, и звонить по каждому номеру, номера же в открытом доступе. Хотя конечно массовую рассылку так не сделать... Парсер просто вытаскивает и систематизирует открытую информацию... 

2

Если есть нужда получать данные с какого-либо сервиса, то если нет API для взаимодействия с данными из него, то приходится пользоваться парсингом.
Допустим, нужно сделать сводку из 10 самых популярных сайтов с прогнозами погоды. Ручками каждый день их перебивать - идея плохая. Конечно для погоды парсинг используют редко (хотя бы потому, что API для получения данных почти всегда есть), но суть именно такая

Парсинг используется для чего угодно, и для кражи контента в том числе.  Но мне кажется данная судебная практика без иска работать не будет. Т.к. доказать ещё нужно, что произошла кража контента. 

Парсинг зачастую используется для анализа несортированных данный сайта. То есть если хочется узнать какую-то статистику, найти товар по определенным качествам, построить модель по статистике, то нужна локальная база, и её можно получить только парсингом. Да даже банально у сайта может быть кривой интерфейс, не позволяющий, например, найти все дубликаты товара.

Это не их данные, а данные пользователей сети, которые они в их базе данных лишь хранят для показа другим людям. А собственность у ВК лишь на структуру таблиц и метаданные, которые они сами в таблицах генерируют.