{"id":14293,"url":"\/distributions\/14293\/click?bit=1&hash=05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","hash":"05c87a3ce0b7c4063dd46190317b7d4a16bc23b8ced3bfac605d44f253650a0f","title":"\u0421\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u043e\u0432\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441 \u043d\u0435 \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0432 \u043d\u0438 \u043a\u043e\u043f\u0435\u0439\u043a\u0438","buttonText":"","imageUuid":""}

ReHand – распознавание рукописного текста

Всем привет! Недавно создал экспериментальный проект по распознаванию рукописного текста.

На сайте используется связка из трех нейросетей. Сайт способен обнаруживать и распознавать рукописные слова, исправлять ошибки в тексте, при этом сохраняя смысл.

Сайт: rehand.ru

Дополнительные настройки помогут значительно улучшить результат. Вы можете включить автоматическое выравнивание текста, корректировку орфографии и умную обработку текста.

В будущем, планируется возможность создание пользователем шаблонов для сегментации отдельных областей различных категорий изображений. Пользователь сможет выбрать какие места изображения нужно распознать и получать на выходе структурированные данные.

*мы можем обработать, много различных изображений с различным рукописным почерком, но бывают исключения, где наш прототип программы до сих пор не справляется и может выдать плохой результат.

Ниже приведу примеры распознаваний школьных тетрадей и бланков ЕГЭ/ОГЭ

Пример 1:

Данную мысль можно обосновать еще одним аргументом.В произведении К.Г.Паустовского Настя, главная героиня Настя, сама занята и не может навещать старую мать.Что касается Катерины Петровны, то она не винит дочь.Удивительно, насколько безгранично любящим может быть сердце матери.Когда же Настя, осознав величину возможной потери, приезжает в деревню, оказывается слишком поздно. Нужно. Таким образом, можно сделать вывод, что проявлять свои чувства и говорить слова любви своим родителям вовремя, что потом может быть слишком поздно.

rehand.ru

Пример 2:

Почему важно сохранять памятники архитектуры? Этой проблеме посвящён текст Владимира Алексеевича Солоухина.Отвечая на вопрос, автор пишет о разрушении множества исторических сооружений в Москве, Спасовой башни и Страстного монастыря Христа Спасителя. Писатель сравнивает, какие грандиозные постройки украшали столицу раньше и какие унылые, обыкновенные здания стоят там сейчас. Этот пример показывает, что город теряет одну из важнейших удивительных частей, когда исчезают В. В.ст.Солоучин делает вывод из своих рассуждений: «На месте уникального города Москвы построен город, город среднеевропейского типа, не выделяющийся ничем особенным.Смысл этого высказывания в том, что памятники, сооружения старины хранят в себе историю и украшают улицы, поражая воображение людей. Позиция автора очевидна.Писатель считает, что памятники архитектуры — это наша гордость. Они являлись важной частью жизни наших предков. В. В.п.Солоучин пишет: «Разружая старину, мы всегда обрываем корни.

rehand.ru

Как вам результат?

0
164 комментария
Написать комментарий...
Липовый мёд

Распознай:

Ответить
Развернуть ветку
Yoo MeRxx
Автор

лишь, дымишь, дышишь, лишишься, слышишь, симпшлялы, шиания.

Ответить
Развернуть ветку
Липовый мёд

Херово распознало. Лилии, ..., шиншиллы, ишемия.

Ответить
Развернуть ветку
user0564335

нормально распознало, больше 60% проблемных слов. В реальных текстах не все слова такие. А с этими и людям будет сложно, тем более учитывая вариативность почерков. Априори результат очень даже хороший. Хотелось бы посмотреть на сервис, работающий лучше или на человека, который может это делать с лучшей (или хотя бы той же) скоростью и точностью

Ответить
Развернуть ветку
Липовый мёд

Проблемных слов? Это обычные слова, проблема в сервисе, который их не распознает.

Ответить
Развернуть ветку
user0564335

нет, с точки зрения распознавания (как человеком, так и машиной), слова совсем не обычные, так как в них подряд стоят несколько символов которые записываются очень похоже. В реальности такие слова в текстах не так часто встречаются, да и сервис не претендует на 100% точность и замену человека. Проблему вы сами себе придумали.

Сервис не направлен на широкое повседневное применение. Это инструмент, который в определённых областях поможет освободить человека от ЧАСТИ рутинной работы. Решений, которые бы со 100% точностью распознавали рукописные тексты не существует и никогда не будет существовать. И человек не всегда на такое способен, с некоторыми словами и особенно запущенными случаями с почерками вам никакой контекст не поможет

Ответить
Развернуть ветку
Липовый мёд

Вы высасываете аргументы из пальца. То слова неправильные, то буквы похожие - знаете, как говорится, плохому танцору и ноги мешают... И это вы еще не видели рецептов от некоторых врачей, чей стиль рукописного письма не может распознать никто, кроме особо одаренных фармацевтов. Зачем потребителю сервис, который не может корректно распознать текст?

Ответить
Развернуть ветку
user0564335

Может потому что это не для потребителя, а B2B/B2G? Направление ресурса как бы подсказывает.
Зачем - уже описал, чтобы сократить рутинный ручной труд. Сократить, а не избавится от него, потому что избавиться невозможно

Ответить
Развернуть ветку
Липовый мёд

Ну как можно было распознать "мышь" вместо "лилии"? Там и близко нет мягкого знака, есть подобия рукописных букв "л", "и", "ш". Следовательно, ваш алгоритм распознавания работает криво, его стоит поправить, а не препираться в комментах.

Во-вторых:

это не для потребителя, а B2B/B2G

Как раз для B2C сегмента периодические ошибки были бы некритичны, а в B2B/B2G каждая ошибка - уже очень серьезно. Тем более стоит привести в порядок алгоритм. Вот впарят этот сервис какому-нибудь министерству, у него неправильно распознается, документ некорректный, как следствие юридические коллизии, как следствие проблемы - и кто за эти проблемы будет отдуваться на швабре, догадайтесь с трех раз?

Ответить
Развернуть ветку
user0564335

как это получилось объяснить могу, но не буду, ибо как об стенку горох. Скажу за себя: я свой почерк месячной давности разобрать не всегда могу и контекст не всегда помогает, чего в таком случае ждать от машины? Почерк у меня не худший, такая проблема изредка с отдельными словами наблюдается.

Сегменту B2C такая технология в целом не нужна. А если кому-то и нужна, то точность не будет играть критичной роли. А касательно B2B и B2G ещё раз повторяю: этот сервис (как и любой другой аналогичный) не гарантирует 100% точности и не сможет её гарантировать. Машины пока не способны так многослойно мыслить и разбирать контекст, сколько алгоритмы не дорабатывай. Эта технология призвана не заменить человека, а облегчить ему работу. Или тебе с нуля нужно сидеть и текст читать, разбирать что там куда и перепечатывать, или просто сверить готовое и при необходимости пару ошибок поправить - это колоссальная экономия времени в промышленных масштабах.

Со шваброй аналогия так вообще тупая. Решения принимать должен не этот сервис распознавания текста, а человек. И на человеке лежит ответственность за это решение. Его проблемы проверить как распозналось, ибо распознавалось для того чтоб ему не надо было это печатать руками

Ответить
Развернуть ветку
161 комментарий
Раскрывать всегда