Проанализировав базу документов, мы выяснили, что приблизительно 66% файлов, передаваемых вместе с претензией, имеют редактируемый формат. Для извлечения текста достаточно использовать библиотеку для парсинга из PDF, такие как PDFium или PyPDF2. Однако продукт должен уметь не только для загружать текстовую информацию, но и определять все ли пункты заполнены, в решении должна присутствовать модель, извлекающая визуальную информацию. Это задача уже посложнее.