Лучшие инструменты для самостоятельного парсинга веб-сайтов — исчерпывающий список

Меня зовут Максим Кульгин и моя компания xmldatafeed занимается парсингом сайтов в России порядка четырех лет. Ежедневно мы парсим более 500 крупнейших интернет-магазинов в России и на выходе мы отдаем данные в формате Excel/CSV и делаем готовую аналитику для маркетплейсов.

3131

"в формате Excel/CSV"  мне кажется в серьезных компаниях такие форматы не нужны, там будет нужен json xml либо целиковая база данных реляционная. Или вы так не умеете?

1
Ответить

умеем. но чаще просят CSV/XML. из опыта

1
Ответить

имхо обычно достаточно выгрузки dump.sql

Ответить

Как раз наоборот. Да, у CSV есть боль с массивами, но остальные форматы содержат нехеровое кол-во утиля.
Парсить в базу это последнее до чего можно додуматься.

Ответить