Методом пристального взгляда выцепляли в документах нужные слова, за которыми следовали искомые данные, изменяющиеся от документа к документу. Например, после слов «взыскать с» должно идти ФИО, которое нам нужно. Или «задолженность по договору займа №», и дальше идет номер, который будет зафиксирован. Такие паттерны встроили в логику распознавания на уровне кода, загрузили тестовую пачку документов и смотрели, что не распозналось. Повторяли вышеописанные действия, пока не вывели схемы для распознавания подавляющего большинства документов.
Отличное решение. Также важно отметить что для паспортов (РФ и загранов) есть хорошая система от Smart Engines
Привет!
Да, SmartEngines мощные ребята с крутым продуктом.
Правда, у нас пока не было возможностей попробовать их решения на боевых задачах. Но руки чешутся попробовать и внедрить :)