Ещё год назад Crawlee выпустил полнофункциональную библиотеку для парсинга, ориентированную на разработчиков, использующих Node. js. Она с открытым исходным кодом, имеет полную поддержку TypeScript, основана на топовых популярных библиотеках Node. js, таких как Got Scraping, Cheerio, Puppeteer и Playwright, получила 7,5 тыс. звездочек на GitHub. Все основные возможности, необходимые в парсинге, присутствуют: ротация отпечатков, очереди URL, автомасштабирование, работа с хранилищами данных и прочее.
"Будущее парсинга... индустрия данных живет и развивается..". Много альтернативно одаренных людей среди фанатов парсинга. Как бы и в мыслях нет почитать про API Economy, подумать и написать, что данные лучше бы получать по API, что открытые API становятся мировым трендом, что индустрия данных уже пожила и развилась в API Economy, и когда-нибудь в будущем это прикончит парсинг повсеместно. Если бы не было сейчас, или не станет в будущем, искуственных препонов для свободного использования API, то нафиг парсинг, извращение какое-то рыться в сайтах.
Знаю довольно много людей, которые парсят сайты билетных операторов И они даже не пробовали заключить договор и пользоваться API, например нашим - https://bil24.pro/api.html . Заметьте, для того чтобы начать, не нужно ровно никакой регистрации Все данные для доступа к тестовой зоне есть в документации. Но..."Мыши плакали, кололись, но продолжали есть кактус". Видимо девиз "вся жизнь борьба и преодоление" - это про парсинг)
https://bil24.pro/images/slide8_v2_31.png
парсер - свой, апи - чужое. вроде простые вещи
расскажите про тренды аполо или тем кто нейронки на стаковерфлоу обучает.
пц я понимаю желание продать свой продукт, но зачем за дурачков то считать клиентов. Вполне есть другие способы рекламы
Сам парсю, но не люблю когда парсят меня, поэтому блочу наглецов. Наверное это что-то из психиатрии :)
Аналогично ))
Аналогично! Но я бы не сказал, что психически неуравновешен, просто каждый должен развивать свои проекты и проводить анализ статистики.
Ну это база)) Сам могу себе это позволить, а другим нельзя
Отличная статья. Как поступаете с тем, что многие сайты в пользовательском соглашении пишут, что нельзя парсить? Игнорируете и парсите, или объясняете клиентам "нас просят не парсить, мы не парсим"?