Таких целей у нас всего 5, но нам нужны не все, а лишь только те, что отвечают необходимым для нас параметрам (это необязательно, просто для примера). Допустим, это может быть определенный пол, возраст, город проживания человека и все прочее, что указано на сайте (либо в его коде, если отображение определенных элементов отключено на сайте – они есть, выполняют свою функцию, но обычный пользователь их не видит).
Комментарий недоступен
Это получение информации из открытых источников. Имхо абсолютно нормальная история.
Не нравится - делайте регистрацию, закрывайте инфо.
Интернет должен быть свободным.
Ну, тут все сложно. Вот есть список экстремистских материалов на сайте минюста. Он доступен в двух формах - веб-страницы и документ вордовский с таблицами. Разобрать документ в принципе невозможно, поскольку его форматировала бешеная мартышка. Остаются страницы. Является ли кражей то, что компенсирует лень государства в деле предоставлении доступа к этой информации в машино-читаемом виде?
Ну и про сайты поставщиков написали ниже. 99% поставщиков не дают API.
Ну здесь у ВК парсят данные, которые по-хорошему тоже не его а, вообще-то принадлежат пользователям. Так и провайдеры связи могут заявить право собственности на данные на том основании что они через их каналы передаются.
Споры жаб и гадюк.
Автоматизацию доступа к открытым данным, агрегирование их и обработку (вместо человека) нельзя назвать кражей
А ножи используются, чтобы резать продукты, но для кого-то это оружие преступления.
Лучше, если бы вместо парсера сидело 100 операторов, и делали бы тоже -самое?
В отношении данных физических лиц - сбор открытых данных для чего угодно (от проведения безобидного статистического исследования до вполне конретной базы для мошенников, например по открытым телефонным номерам). В отношении товаров - сбор описаний и характеристик, часто это делают на сайтах собственных поставщиков, потому что у поставщика нет API, а с ассортиментом нужно работать почти в реальном времени. По мне так парсинг ни чем не вредеден. Вредно когда соцсети личные данные кому попало наружу светят, а пользователи их охотно предоставляют и открывают, тогда эти данные обязательно утекут, хоть парсингом, хоть ручками перепишут.