Меня зовут Максим Кульгин, моя компания xmldatafeed занимается парсингом сайтов в России порядка четырёх лет. Ежедневно мы парсим более 500 крупнейших интернет-магазинов в России. Теперь делимся опытом.
А как технически реализовано? Скачиваете целую веб страницу, а потом разбираете её с помощью регулярных выражений? Извините за тупой вопрос, я программист не настоящий.
так и есть. страницу без картинок, а дальше html разбор синтаксиса, поиск нужных селекторов в коде