Вот уж верно подметил один бубнящий под нос исполнитель:
Москва не Россия.
Живу в Подмосковье. Услугами Яндекс-чего? :)
Может кто знает, чем можно таблички из PDF вынуть более-менее корректно? Хотя бы разбивку по столбцам?
Век живи - век учись. Про зипованный XML не знал, спасибо.
Если говорить о получении объектов - да, инструмент интересный, но очень уж узко специализированный. А вдруг xlsx захочу парсить?
win32com с поддержкой Office VBA Reference, пусть и "толще", но простор гораздо больший даёт.
Как бы то ни было, регулярные выражения вида r"tag>(.*?)</tag" выручают как с xml так и с html.
Не могу сказать, что такой способ намного более эффективен, но в своё время гнал их в HTML Word`ом и там уже разбирал по кускам.
Планирование в ИТ на 10 лет вперёд - абсурдная вещь.
Оценка востребованности ИМХО очень субъективна.
Правительство таким занимается.
Но и там лишь примерные вехи развития отрасли, дорожные карты, общие планы внедрения. Не конкретика.