Из названия понятно, что необходимо просмотреть весь пакет документов и выделить наиболее часто встречающиеся шаблоны, а потом уже работать с оставшимися документами, не подходящими к выделенным шаблонам. Отметим, что необходимо привести все документы к единому формату. Например, если вся нужная информация в документах находится в табличной форме, имеет смысл выделить таблицы и перевести их в формат xlsx. Далее для обработки каждого вида шаблона был написан отдельный код.