Моя компания занимается парсингом сайтов в России уже более трёх лет, ежедневно мы парсим порядка 500 крупнейших интернет-магазинов в России. Направление парсинга перспективно, т.к. информации все больше и всегда есть задача ее структурировать для последующего анализа.
Бесполезная и вредная подборка. Тупо скопировали список всех книг, которые смогли найти в каталоге. Новичка они только отпугнут. Какой-то Data Science, R. Зачем это всё? Давай те уж и книги по базам данных добавим, ведь где-то это надо спарсенное хранить.
PhantomJS - серьёзно? Автор его уже не поддерживает.
Статья ради статьи.