ReHand – распознавание рукописного текста
Всем привет! Недавно создал экспериментальный проект по распознаванию рукописного текста.
На сайте используется связка из трех нейросетей. Сайт способен обнаруживать и распознавать рукописные слова, исправлять ошибки в тексте, при этом сохраняя смысл.
Сайт: rehand.ru
Дополнительные настройки помогут значительно улучшить результат. Вы можете включить автоматическое выравнивание текста, корректировку орфографии и умную обработку текста.
В будущем, планируется возможность создание пользователем шаблонов для сегментации отдельных областей различных категорий изображений. Пользователь сможет выбрать какие места изображения нужно распознать и получать на выходе структурированные данные.
*мы можем обработать, много различных изображений с различным рукописным почерком, но бывают исключения, где наш прототип программы до сих пор не справляется и может выдать плохой результат.
Ниже приведу примеры распознаваний школьных тетрадей и бланков ЕГЭ/ОГЭ
Пример 1:
Пример 2:
Впечатляет как работает, почти нет ошибок и нераспознанных слов.
Я так понимаю если слово не распознано, то оно просто пропускается.
построен город, город среднеевропейского типаНо совершенно неожиданно то, что слово может быть удвоено как «город» во втором тексте.
Это проблема нейросети, которая детектит слова на картинки, она может выделить слово два раза. Скоро дообучим и результат должен улучшиться :)
Дообучите её на пробел после точки ещё, пожалуйста.