Решение. Первый вариант — нанять человека, который сделает работу примерно за 10 лет. Это при условии, что он будет прогонять документы через сервис оптического распознавания текста (OCR), например, от «Яндекса», Microsoft или ABBYY. Если обойтись без OCR и вручную перебивать текст из скринов в карточки «Битрикса», процесс займет лет 150, наверное.
Тьфу, Скрипты ж обычные
Есть говорить совсем грубо, то да.
Но основное преимущество данной технологии заключается в том, что позволяет взаимодействовать с пользовательском интерфейсом также, как это делал бы человек, каждый раз находя нужные элементы заново без заранее запрограммированных координат, картинок (если есть необходимость, можно и их использовать) и API, что очень тяжело реализовать в консоли или же на это уйдет ума времени и никак не 60 заявленных часов.
если честно - то да, обычные скрипты.
Но к ним есть реально удобный инструментарий по разработке: выдергивание элекинов интерфейса (без привязки к координатам), вытаскивание таблиц с веб-сайтов практически при помощи мыши.
ТАк что написание таких скриптов - просто, как сайт на Тильде сделать
где именно?
По первому кейсу: а где гарантии что ocr все правильно распознает? Зная, какие бывают сканы, зачастую ocr не справляется. Человек всегда может подправить тест. А робот?
По второму кейсу: можно сделать скрипт на vba, который справится с этой задачей. На любом форуме по Экселю есть спецы, которые за недорого смогут это реализовать.
обычно же сервисы по распознанию возвращают некий показатель, типа качество распознования. И если он меньше какого-то порога - можно просто такие документы браковать или на ручной разбор отправлять.
Ну и плюс кросс-проверки делать можно (например брать суммы из 2-х мест и сравнивать их).
По первому кейсу - для этого и прикладывается скан на всякий случай. Вы правы, ни один разработчик OCR не гарантирует 100% распознавания. Чаще 94-96%.