ReHand – распознавание рукописного текста
Всем привет! Недавно создал экспериментальный проект по распознаванию рукописного текста.
На сайте используется связка из трех нейросетей. Сайт способен обнаруживать и распознавать рукописные слова, исправлять ошибки в тексте, при этом сохраняя смысл.
Сайт: rehand.ru
Дополнительные настройки помогут значительно улучшить результат. Вы можете включить автоматическое выравнивание текста, корректировку орфографии и умную обработку текста.
В будущем, планируется возможность создание пользователем шаблонов для сегментации отдельных областей различных категорий изображений. Пользователь сможет выбрать какие места изображения нужно распознать и получать на выходе структурированные данные.
*мы можем обработать, много различных изображений с различным рукописным почерком, но бывают исключения, где наш прототип программы до сих пор не справляется и может выдать плохой результат.
Ниже приведу примеры распознаваний школьных тетрадей и бланков ЕГЭ/ОГЭ
Пример 1:
Пример 2:
Очень надеялся найти в статье ответы на вопрос "Зачем?" и сравнение с кучей уже существующих OCR-сервисов и инструментов.
исправлять ошибки в тексте, при этом сохраняя смысл.К сожалению, не нашел.
На самом деле, это очень вредная фича.
Важно понимать, что вы исправляете не ошибки, а то, что система посчитала ошибкой.
Как результат, полученный текст нужно основательно вычитывать и сверять с оригиналом, что бы убедиться что "автозамена" нигде не налажала.
Это, как правило, выливается в ещё более трудозатратный процесс, чем просто транскрибация рукописного текста.
Особенно больно и актуально это становится, когда на вход прилетает текст, по своей специфике и тематике не схожий с корпусом обучения.
Там уверенность OCR начинает падать, а правильность гипотез автозамены ползёт вниз по экспоненте.
Мой совет - не занимайтесь автозаменой, никогда.
Подсвечивать ошибки и предлагать варианты - да, исправлять автоматически - нет.
То же самое в ситуациях, когда уверенность нейросетки в правильности распознавания не абсолютна (допустимый трэшхолд надо замерять имперически).
Ну и отдельный вопрос:
Как работает на миксах языков, англицизмах, смеси из языкового и символьного текста?
И вообще, метрик нехватает.
Даёшь автозамену "что бы" на "чтобы" на уровне сетевых протоколов? Глаза болят уже от этой детской ошибки.