По первому кейсу: а где гарантии что ocr все правильно распознает? Зная, какие бывают сканы, зачастую ocr не справляется. Человек всегда может подправить тест. А робот? По второму кейсу: можно сделать скрипт на vba, который справится с этой задачей. На любом форуме по Экселю есть спецы, которые за недорого смогут это реализовать.
обычно же сервисы по распознанию возвращают некий показатель, типа качество распознования. И если он меньше какого-то порога - можно просто такие документы браковать или на ручной разбор отправлять. Ну и плюс кросс-проверки делать можно (например брать суммы из 2-х мест и сравнивать их).
По первому кейсу: а где гарантии что ocr все правильно распознает? Зная, какие бывают сканы, зачастую ocr не справляется. Человек всегда может подправить тест. А робот?
По второму кейсу: можно сделать скрипт на vba, который справится с этой задачей. На любом форуме по Экселю есть спецы, которые за недорого смогут это реализовать.
обычно же сервисы по распознанию возвращают некий показатель, типа качество распознования. И если он меньше какого-то порога - можно просто такие документы браковать или на ручной разбор отправлять.
Ну и плюс кросс-проверки делать можно (например брать суммы из 2-х мест и сравнивать их).
По первому кейсу - для этого и прикладывается скан на всякий случай. Вы правы, ни один разработчик OCR не гарантирует 100% распознавания. Чаще 94-96%.