Сергей Бирюков

с 2020

1 подписчик

29 подписок

в посте

Названы 9 самых востребованных языков программирования в 1-м квартале 2021 года на западе 17.04.2021

Планирование в ИТ на 10 лет вперёд - абсурдная вещь.
Оценка востребованности ИМХО очень субъективна.
Правительство таким занимается.
Но и там лишь примерные вехи развития отрасли, дорожные карты, общие планы внедрения. Не конкретика.

Ответить

Сергей Бирюков

в посте

Про молоко, часть 2 13.04.2021

Вот уж верно подметил один бубнящий под нос исполнитель:
Москва не Россия.
Живу в Подмосковье. Услугами Яндекс-чего? :)

Ответить

Сергей Бирюков

в посте

Сравнение использования PyTesseract и PDF модулей и библиотек для распознавания сканов pdf 28.03.2021

Может кто знает, чем можно таблички из PDF вынуть более-менее корректно? Хотя бы разбивку по столбцам?

Ответить

Сергей Бирюков

в посте

Анализ документов Word с использованием Python 09.12.2020

Век живи - век учись. Про зипованный XML не знал, спасибо.
Если говорить о получении объектов - да, инструмент интересный, но очень уж узко специализированный. А вдруг xlsx захочу парсить?
win32com с поддержкой Office VBA Reference, пусть и "толще", но простор гораздо больший даёт.

Как бы то ни было, регулярные выражения вида r"tag>(.*?)</tag" выручают как с xml так и с html.

Ответить

Сергей Бирюков

в посте

Анализ документов Word с использованием Python 08.12.2020

Не могу сказать, что такой способ намного более эффективен, но в своё время гнал их в HTML Word`ом и там уже разбирал по кускам.

Ответить