7 лет назад в интернете дали работу: вручную вбить десятки машинописных паспортов в базу. Пишу заказчику: "эх, вот бы программу, которая сама распознаёт и вбивает". А он на это отвечает в стиле рекламы Hochland. А сейчас вот и до рукописных добрались.
Я приложил пример обработки которую реализовывал, но у меня был все же печатный текст.
У них рукописный ввод - другие алгоритмы OCR, вполне допускаю что им определение skew angle и прочие оптимизации ( zoom, перевод в черно-белый формат, чистка от артефактов и тд ) просто не нужны.
Вот тут можно глянуть примеры наклонного текста, для иллюстрации проблемы: https://www.pyimagesearch.com/2017/02/20/text-skew-correction-opencv-python/
Круто. След шаг - почерк врача
Комментарий недоступен
Молодцы. Проделана нужная и полезная работа
7 лет назад в интернете дали работу: вручную вбить десятки машинописных паспортов в базу. Пишу заказчику: "эх, вот бы программу, которая сама распознаёт и вбивает". А он на это отвечает в стиле рекламы Hochland. А сейчас вот и до рукописных добрались.
параграф вообще-то с этого и начинал. а fine reader существует с 90-х. уж один-единственный шрифт распознать давно не проблема
"параграф вообще-то с этого и начинал."
Не получилось. Newton.
Комментарий недоступен
только кириллицу может распознать или другие алфавиты тоже?
Комментарий недоступен
Работа сделана огромная, слов нет, молодцы.
Только интересно, а какой % действующих паспортов заполнен вручную?
Комментарий недоступен
паспорта меняют в 25 и 45, а в начале 2000-х их заполняли вручную (хотя может, не везде?). исходя из этих цифр порядка 5% и будет
Смотрю картинка слева наклонена и сразу с наложением определенных блоков - т.е предварительное убирание наклона и чистку от артефактов вы не делаете?
Комментарий недоступен
может и делают, и просто тут координаты блоков пересчитаны на исходное изображение. блоки-то все одинаково наклонены!
Я приложил пример обработки которую реализовывал, но у меня был все же печатный текст.
У них рукописный ввод - другие алгоритмы OCR, вполне допускаю что им определение skew angle и прочие оптимизации ( zoom, перевод в черно-белый формат, чистка от артефактов и тд ) просто не нужны.
Вот тут можно глянуть примеры наклонного текста, для иллюстрации проблемы: https://www.pyimagesearch.com/2017/02/20/text-skew-correction-opencv-python/
может и не нудны, но на картинка как раз все блоки одинаково наклонены. наклон в данном случае очень просто посчитать по прямым линиям
Сбор копий паспортов незаконен в принципе. Это как помогать незаконным торговцам органами или рабами в сортировке оных.
Всегда есть дыры в правовом поле.
Комментарий недоступен
🔥🔥🔥
я бы уволился на первой же неделе