Разберем на конкретном примере по получению информации с сайта Минюста, а именно, нам необходим перечень действующих адвокатов Российской Федерации. Кнопки «выгрузить списочно всех адвокатов» — конечно же, нет. На официальном сайте http://lawyers.minjust.ru/ выводится по 20 адвокатов на 1 странице, всего 74 754 страниц, итого на выходе мы должны получить чуть меньше 150 тыс. адвокатов.
А есть это не в виде картинок, а в виде текста, что бы скопипстить?
Да, есть, направим!
Автор - the best of the best) Часы потраченные в течение всей жизни на попытку сходу решить проблему, не разбираясь в тонкостях HTML, XML, JavaScript и т.д.) А ларчик оказывается просто открывался... Просто 10 баллов из 5 за статью.
p.s. Впервые регистрируюсь на сайте, чтобы оставить комментарий.
Тем не менее предложенный способ простой, если нет времени разбираться в тонкостях работы, но более профессионально и надежно все таки парсить через использование HTML-элементов на сайте.
Для желающих рекомендую статьи, по ним можно сориентироваться по данному вопросу.
Что то в эфире тишина, и кода нет :-(