Через месяц парсинг сайтов в России будет практически запрещен: полный обзор спора ВК v. «Дабл» и его последствия
Остался месяц, чтобы обжаловать решение суда по спору ВК против «Дабл». Если жалоба не будет подана, российская судебная практика пополнится решением, которое фактически запретит парсинг сайтов в России, но с некоторыми оговорками.
Что такое парсинг сайтов
Парсингом (parsing) называют процесс синтаксического анализа или же разбор данных.
В контексте веб-разработки парсинг сайтов – это процесс автоматизированного анализа HTML-кода сайта, в результате которого мы получаем необходимые для нас данные в систематизированном виде. С такими данными можно дальше удобно работать: передавать их, обрабатывать.
Какое-то время использовалось только понятие парсинга. Позже появились понятия «краулинг» (crawling) и «скрейпинг» (scraping). В целом все они выполняют одну и ту же цель – автоматизированное получение данных и представление их в систематизированном виде. Поэтому часто эти понятия не разделяют и используют одно – парсинг.
Далее объясняется на примере, что такое парсинг сайтов. Если вы знакомы с этим, ничего нового скорее всего там для себя вы не найдете.
Чтобы понять практическое значение парсинга сайтов, приведем небольшой пример HTML-кода:
Предположим, что это HTML-код некоего сайта, из которого мы хотим извлечь определенные данные. Допустим, нам необходимы имена пользователей, которые в примере условно обозначены как «Цель» внутри HTML-тэга «p».
Таких целей у нас всего 5, но нам нужны не все, а лишь только те, что отвечают необходимым для нас параметрам (это необязательно, просто для примера). Допустим, это может быть определенный пол, возраст, город проживания человека и все прочее, что указано на сайте (либо в его коде, если отображение определенных элементов отключено на сайте – они есть, выполняют свою функцию, но обычный пользователь их не видит).
Итак, нам необходимо получить все цели, цвет которых красный. Для этого парсер обращается к странице, получает его HTML-код, «проходится» по нему, находит необходимые для него тэги (условно «span» и «p»), сравнивает их значения, и если внутри тэга «span» указан цвет «красный», парсер сохраняет цель из тэга «p». В нашем случае это цель 3 и цель 5.
Таким образом парсер может пройтись по большому количеству страниц и собрать необходимые данные за сравнительно небольшой промежуток времени.
Что сделал Дабл и почему это является парсингом
Дабл (https://doubledata.ru/) собирали (а может быть собирают и сейчас) данные пользователей российской социальной сети ВКонтакте (https://vk.com/) («ВК»). Затем эти данные использовались для предоставления скоринговых услуг банкам.
Как именно собирались данные? С помощью нескольких программ, разработанных Дабл:
- Double Search – ищет информацию о людях, в том числе в соцсетях. Программа переходит по различным ссылкам, как поисковые роботы Google, с целью индексирования страниц. В данном случае индексирование позволяет (быстрее и удобнее) в будущем по запросу пользователя находить данные о людях – ссылки на их социальные сети.
- Social Link – программа для просмотра результатов перехода по ссылкам, то есть страницы в соцсетях, в том числе из Double Search.
- Social Attributes – анализирует содержимое страницы социальной сети с выдачей числовых коэффициентов.
Почему это парсинг? Потому что ПО Дабл обращается к сайту ВКонтакте, анализирует определенные его страницы, получает необходимые данные и затем их сохраняет. В результате мы получаем индекс – таблицы ключевых слов с метаданными. Могу предположить, что такая таблица состояла из ФИО, возраста, города, ссылки на страницу, фотографии и вся прочая открытая информация, которую пользователи загружают о себе. Такая информация и есть наши цели, которые мы «получали» из примера HTML-кода выше.
Что не понравилось ВКонтакте?
ВК считают, что такие действия Дабл нарушают исключительные права ВК на базу данных пользователей социальной сети.
Базы данных в силу пп. 4 п. 1 ст. 1304 ГК РФ относятся к объектам смежных прав в части их охраны от несанкционированного извлечения и повторного использования составляющих их содержание материалов.
То есть ВКонтакте строили социальную сеть, собирали базу данных пользователей, а затем кто-то приходит и просто ее ворует. Если коротко, то со стороны социальной сети это выглядит так. ВК просили взыскать компенсацию в размере 1 рубля (хотя минимальная компенсация ст. 1311 ГК РФ установлена в размере 10 000 рублей), обязать Дабл прекратить собирать данные и уничтожить их.
Максимально подробный обзор дела ВК против Дабл со всеми ссылками на законы и судебные акты читайте здесь.
Далее чуть подробнее разберем решения судов каждой инстанции, чтобы понимать, будет ли все-таки запрещен парсинг сайтов в России?
Решения судов по спору ВК и Дабл
Первая инстанция
Самым первым решением ВК было полностью отказано в удовлетворении их требований, потому что:
- ВК не доказан факт создания базы данных, соответствующей признакам ст. 1260 ГК РФ;
- У ВК нет исключительного права на базу данных;
- Не доказано извлечение материалов из базы данных.
Важно понимать, что факт создания вами базы данных не гарантирует вам получения исключительных прав на нее. Без исключительных прав на базу данных, вы не сможете кому-либо запретить ее неправомерное использование.
Исключительное право на базу данных у ее изготовителя возникает при наличии существенных финансовых, материальных, организационных и иных затрат на создание (включая обработку или представление соответствующих материалов) базы данных (п. 1 ст. 1334 ГК РФ).
Презумпция существенности затрат – база данных должна содержать не менее 10 000 самостоятельных информационных элементов. Странно, что суд не учел наличие 406 901 079 пользователей в базе данных ВК (на 13 января 2017 г.), о чем будет указано судами вышестоящих инстанций.
Апелляционная инстанция
Суд второй инстанции принял противоположное решение, то есть в пользу ВК, поскольку:
- ВК доказан факт создания базы данных, соответствующей признакам ст. 1260 ГК РФ;
- У ВК есть исключительные права на базу данных;
- Извлечение материалов из базы данных доказано.
Кассационная инстанция
Суд третьей инстанции (Суд по интеллектуальным правам) отменил оба предыдущих решения и направил дело на новой рассмотрение в суд первой инстанции, поскольку для правильного разрешения спора требуется оценка доказательств и установление фактических обстоятельств, что не относится к полномочиям суда кассационной инстанции в силу статьи 286 Арбитражного процессуального кодекса Российской Федерации.
Кассационный суд указал на ошибки, которые необходимо исправить, в том числе:
- Апелляционный суд неверно квалифицировал нарушение Дабл;
- Необходимо изучить как работает ПО Дабл;
- ВК может требовать взыскания компенсации ниже низшего предела.
Вновь первая инстанция
Суд первой инстанции снова встает на сторону Дабл, поскольку ПО Дабл является поисковой системой (сравнивается с Google или, например, Yandex), а их действия не запрещены. Также Дабл собирает лишь открытую информацию, которую пользователи сами обозначали таковой путем настроек приватности.
Вновь вторая инстанция
Суд второй инстанции снова отменяет решение первой и встает на сторону ВК, поскольку ПО Дабл не является поисковой системой (в обычном понимании термина). Дабл имеет коммерческие интересы, использует базу данных несоответствующим образом.
Интересно, что первая и вторая инстанции все равно остаются при своем.
Запрещен ли парсинг сайтов в России? Последствия спора
Если мы посмотрим на решение данного спора – да, парсинг сайтов в РФ запрещен. Единственная и логическая оговорка – такой парсинг должен нарушать чьи-либо права.
Практически во всех случаях администраторы более-менее крупных сайтов смогут заявить, что путем парсинга нарушаются их исключительные права на базу данных, так как любой такой сайт содержит в себе различные базы данных: пользователи, статьи и прочее.
Здесь администратору сайта для защиты своих прав в части баз данных необходимо будет доказать следующее (см. статьи 1334 и 1335.1. ГК РФ):
- Наличие исключительного права на базу данных (если в ней более 10 000 самостоятельных элементов (материалов), то исключительные права имеются, пока не доказано обратное – презумпция существенности затрат при создании базы данных);
- Наличие неправомерного использования базы данных.
База данных – это составное произведение. Составным произведение является также и интернет-сайт (ст. 1260 ГК РФ). Это значит, что администраторы сайтов могут защищаться от парсеров при отсутствии у них исключительного права на базу данных или нарушений в части баз данных. Более того, никто не мешает администратору сайта составить грамотные правила пользования сайтом, в которых будет установлен запрет на парсинг его сайта.
У Дабл остался месяц, чтобы подать жалобу в вышестоящую инстанцию. Если этого не сделать, можно ожидать увеличения споров в отношении парсинга сайтов.
В то же время стоит учитывать, что в России не прецедентное право, поэтому такое решение суда не может быть единственным аргументом в похожих кейсах – необходимо в первую очередь опираться на законы, а решение суда может лишь усилить позицию стороны.
Скорее всего, учитывая, что ВК попросили всего лишь компенсацию в размере 1 рубля, данный спор имеет стратегическое значение, поскольку наличие положительного решения суда позволит в будущем взыскивать гораздо большие суммы по похожим спорам, ну или хотя бы увеличит шансы на победу.
В данной заметке были освещены основные вопросы, рассматриваемые в деле. С подробным разбором кейса ВК-Дабл можете ознакомиться здесь.
А что за рубежом?
В иностранных юрисдикциях тоже не все так однозначно.
В качестве интересного кейса можно рассмотреть HIQ LABS, INC. против LINKEDIN CORPORATION. Здесь апелляционный суд в США подтвердил, что автоматизированный сбор общедоступной информации с сайтов законен.
Но 14 июня 2021 года Верховным судом дело передано на новое рассмотрение.
С обзорами других кейсов, преимущественно американской и международной практики, можно ознакомиться в разделе кейсов на нашем сайте.
Другие статьи по теме судов и кейсов:
Подписывайтесь на мой блог, чтобы не пропустить новые материалы. На ближайшее время планируется публикация еще одной статьи из рубрики «Что думают российские суды о...».
Автор заметки – Василий Агатеев, юрист фирмы Buzko Krasnov, оказывающей услуги по российскому и американскому праву.
Комментарий недоступен
Это получение информации из открытых источников. Имхо абсолютно нормальная история.
Не нравится - делайте регистрацию, закрывайте инфо.
Интернет должен быть свободным.
Ну, тут все сложно. Вот есть список экстремистских материалов на сайте минюста. Он доступен в двух формах - веб-страницы и документ вордовский с таблицами. Разобрать документ в принципе невозможно, поскольку его форматировала бешеная мартышка. Остаются страницы. Является ли кражей то, что компенсирует лень государства в деле предоставлении доступа к этой информации в машино-читаемом виде?
Ну и про сайты поставщиков написали ниже. 99% поставщиков не дают API.
Ну здесь у ВК парсят данные, которые по-хорошему тоже не его а, вообще-то принадлежат пользователям. Так и провайдеры связи могут заявить право собственности на данные на том основании что они через их каналы передаются.
Споры жаб и гадюк.
Автоматизацию доступа к открытым данным, агрегирование их и обработку (вместо человека) нельзя назвать кражей
А ножи используются, чтобы резать продукты, но для кого-то это оружие преступления.
Лучше, если бы вместо парсера сидело 100 операторов, и делали бы тоже -самое?
В отношении данных физических лиц - сбор открытых данных для чего угодно (от проведения безобидного статистического исследования до вполне конретной базы для мошенников, например по открытым телефонным номерам). В отношении товаров - сбор описаний и характеристик, часто это делают на сайтах собственных поставщиков, потому что у поставщика нет API, а с ассортиментом нужно работать почти в реальном времени. По мне так парсинг ни чем не вредеден. Вредно когда соцсети личные данные кому попало наружу светят, а пользователи их охотно предоставляют и открывают, тогда эти данные обязательно утекут, хоть парсингом, хоть ручками перепишут.
При чем здесь кража контента? Парсинг это сбор необходимой информации по определённым параметрам. Используется к примеру для тонкой настройки рекламной компании внутри вконтакте. То есть у самого рекламного кабинета нет таких тонких настроек, как у парсера. Просто пример, с помощью парсера вы можете собрать информацию о людях лайкнувших и(или) прокоментировавших посты в нужной вам группе. Или например вы можете собрать с нужных вам групп только тех людей, у которых день рождение в такой то день или в такой то период. Можно спарсить людей, у которых есть дети, указанные в вк, чтобы предложить им что то в виде рекламы, к новогодним праздникам. Можно спарсить людей, состоящих в группе конкурентов и проявляющих активность на страницах в тех группах, так называемая активная аудитория и предложить им аналогичный товар от конкурента. Вариантов тысячи. Самому в контакте это тоже удобно, так как рекламщики после извлечения базы, вставляют её в рекламный кабинет вконтакте и платят вконтакте деньги за рекламу. Можно ли использовать базу не правомерно? Конечно можно. Например я могу спарсить продавцов с сайта Авито с их телефонами по определённым параметрам, например только тех, кто продаёт любые автомобили. Или тех, кто продаёт только автомобили лада или мерседес. После этого можно устроить обзвон таких людей или смс рассылку с предложением чего либо... Вот это не совсем правильно и законно. Однако ничего не мешает желающему обзвонить, в ручную открывать нужные объявления, и звонить по каждому номеру, номера же в открытом доступе. Хотя конечно массовую рассылку так не сделать... Парсер просто вытаскивает и систематизирует открытую информацию...
Если есть нужда получать данные с какого-либо сервиса, то если нет API для взаимодействия с данными из него, то приходится пользоваться парсингом.
Допустим, нужно сделать сводку из 10 самых популярных сайтов с прогнозами погоды. Ручками каждый день их перебивать - идея плохая. Конечно для погоды парсинг используют редко (хотя бы потому, что API для получения данных почти всегда есть), но суть именно такая
Парсинг используется для чего угодно, и для кражи контента в том числе. Но мне кажется данная судебная практика без иска работать не будет. Т.к. доказать ещё нужно, что произошла кража контента.
Парсинг зачастую используется для анализа несортированных данный сайта. То есть если хочется узнать какую-то статистику, найти товар по определенным качествам, построить модель по статистике, то нужна локальная база, и её можно получить только парсингом. Да даже банально у сайта может быть кривой интерфейс, не позволяющий, например, найти все дубликаты товара.
Это не их данные, а данные пользователей сети, которые они в их базе данных лишь хранят для показа другим людям. А собственность у ВК лишь на структуру таблиц и метаданные, которые они сами в таблицах генерируют.
Цитаты великих судей
Ссылка на акт если что https://kad.arbitr.ru/Document/Pdf/3ee7c57f-7557-49d2-8f75-fe1d71d34f16/9f85fa41-cda4-4970-8b42-c510e379d61d/A40-197742-2020_20210713_Reshenija_i_postanovlenija.pdf
ОХУЕТЬ
я это прочитала
2021 год, судьи там накуренные, что ли?
"Суд второй инстанции снова отменяет решение первой и встает на сторону ВК, поскольку ПО Дабл не является поисковой системой (в обычном понимании термина). Дабл имеет коммерческие интересы, использует базу данных несоответствующим образом"
Можно подумать, Яндекс и Гугл не имеют коммерческих интересов.
Комментарий недоступен
Вот бы понять, чем поисковая система отличается от парсера. Не верю, что Яндекс/Гугл не подстраиваются под крупные проекты, и на каждый сайт смотрят как на сферический в вакууме.
А зачем такой кликбейт в заголовке? Очевидно же, что будут обжаловать, решение промежуточное, рубятся уже не первый год.
Чтобы парсилось поисковиками лучше)
Почему Дабл не стали вытягивать данные "легальным" методом через API?
По западу можно также вспомнить кейс Craigslist, который закончился не так радужно для их оппонентов
https://newmedialaw.proskauer.com/2017/04/17/craigslist-garners-60-million-judgment-against-radpad-in-scraping-dispute/
а также Craigslist против 3taps
http://www.dmlp.org/sites/dmlp.org/files/2013-04-30-Order%20Granting%20in%20Part%20and%20Denying%20in%20Part%20Motions%20to%20Dismiss,%20Granting%20Motion%20to%20Bifurcate.pdf
Тоже не в пользу парсеров.
Ну потому видимо через API нужно платить ? :-)
Комментарий недоступен
Пьяным управлять транспортным средством тоже запрещено. И тем не менее.
А если я наберу штат голодных китайцев и они мне вручную соберут данные? Докажите, что база получена парсингом...
Комментарий недоступен
Парсинг глазами китайцев 😁
А что не узбеков? ) Китайцы то подороже будут, да и голодных среди них уже мало
Комментарий недоступен
Китайцы уже далеко не голодные, там уровень жизни выше, чем у нас...
Ну наконец-то запретят поисковые системы, даёшь старые добрые каталоги интернета, ой а они тоже должны быть запрещены!
Записал на листик адрес сайта - уголовник!
Записал адрес иностранными буквами - шпиён!
"Они стали много дышать - требую ввести налог на воздух" (с)
Комментарий недоступен
Последнее придется доказать. Если парсят по вопросу, до обращения идут через распределенную сеть проксей, чтобы как раз сильно не палится.
1. Обзоры судебной практики вполне себе могут быть основанием принятия решения. Особенно если прецедент был в суде более высокой инстанции.
Мне кажется, что не стоит путать сбор и использование данных.
А причем тут "парсинг"? На мой взгляд, там играет роль сам факт создания базы данных, а не способ, каким они были получены.
При том, что Дабл получали данные именно с помощью парсинга ВК.
Такой парсинг они считают правомерным действием, так как, например, с их точки зрения он не отличается от того, что делают поисковые боты Гугла.
ВК же считает, что ПО Дабл нельзя сравнивать с поисковыми системами, поскольку последние освобождаются от ответственности за нарушение исключительных прав правообладателей не в силу статуса «поисковика», а благодаря распространению на них положений ст. 1253.1 ГК РФ – поисковики являются информационными посредниками.
Также Дабл считают, что извлечения данных там в принципе не было, хотя парсинг, да и любое обращение к сайту, уже является извлечением базы данных в смысле ст. 1334 ГК РФ.
Комментарий недоступен
Воровать можно. Попадаться нет.
Если страница закрыта, то ВК имеет исключительное право доступа к информации, если открыта то сам пользователь дал право смотреть и собирать данные всем кто сможет.
Там еще может быть закрыта от поисковиков. Oh wait, Дабл - не поисковик, оказывается))
Смотреть - да
Собирать - нет
Как вообще можно запретить парсинг? Парсинг можно делать не с белого ip, а с прокси, с любым гео, под любым фейковым профилем (вымышленными фио, возрастом, браузером, куки и т.д.) забанят один ip, один профиль, зайти с другого и продолжить. Существует софт, позволяющий генерить эти профиля сотнями тысяч. Закрывать инфу как то только. Регистрация - не выход. Можно зарегать фейковый профиль и парсить с него. Так многие и делают, кстати.
Вы упускаете суть.
Решается вопрос больших денег рекламного бизнеса. Это к программерам и арбитражникам не имеет отношения.
Если Вконтакте выирают дело, то они закроют информацию для официально работающих площадок по поиску и сегментации целевой аудитории. Таких как Сегменто Таргет, Пейпер Нинзя, и т.д. Различных маркет плейсов в том числе. А значит будут монопольно использовать эти данные, привлекая миллиарды денег рекламодателей, которых до этого не было)
Простите. Но, статья просто ни о чём. Заголовок никак не соответствует содержанию. У нас не прецедентное право как в США. Судебное решение по одному спору не может распространяться на подобные. Это если говорить о судебном решении.
По поводу парсинга личных данных (персональных данных) - огорчу. С 1 марта в России "парсить" персональные данные (а к таковым полным ходом относятся все данные со страницы пользователя соц сетей) можно только если субъект, чьи данные вы парсите, дал на это согласие и это согласие отображено на сайте, с которого вы парсите. Если такого согласия нет, значит вы можете только ознакомиться с данными на сайте. А "скачать" себе или уж тем более "продать" кому-то или разместить на своем сайте - запрещено.
Статья 10.1 ФЗ "О персональных данных".
Как я уже писал хоть у нас не прецедентное право, но судебная практика всё равно учитывается при рассмотрении аналогичных споров (учитывается, а не тупо следуется по ней). Да, обязательны к применению лишь Пленумы ВС РФ и Обзоры практики утверждённые Пленумом/Президиумом, но на практике судьи часто смотрят и на практику вышестоящих судов. Конечно всё от обстоятельств дела зависит, но практика играет роль же. Конечно не так что один суд так вынес так и будет, но тем не менее на последующие решения судов может влиять (тут уже от обстоятельств дела зависит и суда).
Интересно, что ответит Максим Кульгин - главный специалист по парсингу в Санкт-Петербурге ?
Я все думал - что же кроме битвы жабы с гадюкой мне это напоминает...
Олдфаги поймут ;)
https://www.kinopoisk.ru/film/258028/#!watch-film/4d24e3d3d9eeb6b596c821283c3be2f1/kp
На пикче реакция VK на парсинг ;)
По Даблу: не понял, почему они не заикнулись о п.1 ст. 1335.1 ГК РФ, обозначив, что используют несущественную часть БД? 🤔
По ВК: они поставили вопрос о том, как осуществлялся парсинг, с авторизацией на сайте или без таковой (т.е. действительно как обычный поисковик)? Если без авторизации - почему суд постановил, что это не поисковик? 🤔
Про несущественность Дабл говорили, даже был подсчитан процент:
"Исходя из экспертных заключений следует, что при индексировании страниц ВК в индекс ПО Double Search перемещается несущественный объем данных с сайта ВК - 1,27 % полей от общего количества полей пользовательских карточек ВК (при подсчете количества полей) или 1,42% от общего объема данных карточек ВК (при подсчете в мегабайтах)."
Но суд указал, что такое использование БД противоречит нормальному ее использованию:
"Пункт 3 статьи 1335.1 ГК РФ устанавливает запрет на неоднократное извлечение или использование материалов, составляющих несущественную часть базы данных, если такие действия противоречат нормальному использованию базы данных и ущемляют необоснованным образом законные интересы изготовителя базы данных.
Ответчик [Дабл] по существу признает, что им неоднократно использовались материалы, составляющие несущественную часть базы данных истца. Использование истцом материалов базы данных истца подтверждается заключением судебной экспертизы. Такое использование осуществлялось ответчиком в коммерческих целях, что предполагает неоднократность использования, при этом фактический объем использования при отсутствии признака существенности правового значения не имеет, значим сам факт использования."
Про ВК - вероятнее всего без авторизации, потому что Дабл заявляли, что не являются пользователем социальной сети.
Комментарий недоступен
Повлияет. Несмотря на то что у нас не прецедентное право суды всё равно учитывают сложившующся судебную практику (не слепо следуют, а учитывают, разница если что большая). Я уж не говорю о том что Пленумы и Обзоры ВС утверждённые Пленумом/Президиумом обязательны к применению.
Комментарий недоступен
Потому что миллион говносайтов генерируют тысячи вебмастеров. С кем бодаться будете?
Но они же не html парсили, а открытое api использовали
Разве? Поделитесь источником? Из того, что было описано в части работы ПО Дабл, я склоняюсь к выводу, что это был именно парсинг, а не использование API. К тому же ни в одном судебном акте не говорилось про API - если бы оно использовалось, об этом скорее всего бы упомянули, как аргумент в пользу Дабл, поскольку API как раз и предусмотрено для того, чтобы получать данные.
upd: плюс Дабл заявляли, что не являются пользователем соцсети, соответственно, они не могли использовать API.
Разве в России прецедентное право?
Поисковики тоже занимаются парсингом. Запретить парсинг, в том числе работу поисковиков - это бред сивой кобылы.
Комментарий недоступен
А если они по ipv6 заходят сколько банить будешь?
Комментарий недоступен
А то что данные ввиде страницы чужой я загружаю к себе в браузер, это тоже кража информации из БД?
А если ты не загружаешь, то эти данные никто не сможет увидеть и смысл тогда этих данных обесценивается)
Раз парсинг запрещён, надо в первую очередь забанить Гугл и Яндекс.
Там моя информация имеется, я ее ВК не дарил и не продавал, мою запись пусть вычеркнут из этих 10 тысяч необходимых, потому что эти данные лишь мои. А собственность вк именно на структуру бызы данных, где мои записи хранятся, а не на сами мои данные. Мои открытые данные общедоступны, что выражено настройками приватности.
Может я не в тему сюда пишу, но вдруг кто-то подскажет. Не гневайтесь сильно) Если парсится RSS лента через обычный плагин, то есть новости с одного канала автоматом публикуются на другой частный сайт. Этот канал не запрещает перепечатку в любом виде. Это будет нарушением по новым правилам? Или вообще я не тему?
База данных должна быть со своей защитой данных, если это надо, а если программа может прочесть хтмл код так это блог или веб страница это не воровство а чтение, смешно даже.
Вот и оставляй после этого свои сведени о банковских счетах да телефоны то да номера карт да паспортов а они уже у кого то, вот зачем они нужны? В принципе их можно показывать, они открытые, ничего же не будет. Всякие такие вещи приходится где-то показывать, давать сведения, чтобы зарплату, например переводили.нц, всё равно, как-то неловко может быть, лишним то банкам лучше уж и не знать бы, ну короче говоря блогеры принимают сведения дл денежных переводов и думают что это вполне защищено от посторонних глаз а кто-то может и это прочесть, я имею ввиду некоторые регистрационные данные, предназначенные только для блога в котором происходит регистрация, но никто не гарантирует что эти сведения и так не станут известны кому-то ещё кроме блога ВК. Потому лучше и не давать много сведений имеющих важность и иметь несколько банковских карт, одни для зарплаты, другие для развлечений с компьютерами и интернетом.
Заголовок громкий!!!, я даже забыл кофе на плите... хоть и дело к ночи. Парсинг будет всегда, ) как же без него. Личные данные конечно собирать нехорошо, это факт! Тут я согласен. Про авторские права ... тоже интересно было бы узнать подробнее.
Опять Вовка и его дружки пугаются что посчитают их дворцы и дачи?
абсурд...
Кейсов, кейсов, кейсов…
Вы попснюк, батенька.
Дела.
Споры.
1. Статья актуальная, но эти Ваши «кейсы» тошнотворны.
2. Нехрен копаться в чужих сайтах, изучать их структуру, алгоритмы работы и использовать их для своих целей!
Вы разрешение у владельца спросили?!
Кроме того, алгоритмы могут быть уникальными!
А «разбираясь» в них - Вы просто воруете эти алгоритмы.
Лично я за тотальную и поголовную идентификацию пользователей в сети.
И если кто-то ворует мою интеллектуальную собственность, то он должен быть призван к ответу.
А если он ворует ее через Tor, анонимайзеры или VPN, то к ответу должен быть привлечён вледалец IP, с которого осуществлялись действия!
Чтобы неповадно было «ананомизироваться».