ReHand – распознавание рукописного текста

Всем привет! Недавно создал экспериментальный проект по распознаванию рукописного текста.

На сайте используется связка из трех нейросетей. Сайт способен обнаруживать и распознавать рукописные слова, исправлять ошибки в тексте, при этом сохраняя смысл.

Сайт: rehand.ru

Дополнительные настройки помогут значительно улучшить результат. Вы можете включить автоматическое выравнивание текста, корректировку орфографии и умную обработку текста.

В будущем, планируется возможность создание пользователем шаблонов для сегментации отдельных областей различных категорий изображений. Пользователь сможет выбрать какие места изображения нужно распознать и получать на выходе структурированные данные.

*мы можем обработать, много различных изображений с различным рукописным почерком, но бывают исключения, где наш прототип программы до сих пор не справляется и может выдать плохой результат.

Ниже приведу примеры распознаваний школьных тетрадей и бланков ЕГЭ/ОГЭ

Пример 1:

Данную мысль можно обосновать еще одним аргументом.В произведении К.Г.Паустовского Настя, главная героиня Настя, сама занята и не может навещать старую мать.Что касается Катерины Петровны, то она не винит дочь.Удивительно, насколько безгранично любящим может быть сердце матери.Когда же Настя, осознав величину возможной потери, приезжает в деревню, оказывается слишком поздно. Нужно. Таким образом, можно сделать вывод, что проявлять свои чувства и говорить слова любви своим родителям вовремя, что потом может быть слишком поздно.

rehand.ru

Пример 2:

Почему важно сохранять памятники архитектуры? Этой проблеме посвящён текст Владимира Алексеевича Солоухина.Отвечая на вопрос, автор пишет о разрушении множества исторических сооружений в Москве, Спасовой башни и Страстного монастыря Христа Спасителя. Писатель сравнивает, какие грандиозные постройки украшали столицу раньше и какие унылые, обыкновенные здания стоят там сейчас. Этот пример показывает, что город теряет одну из важнейших удивительных частей, когда исчезают В. В.ст.Солоучин делает вывод из своих рассуждений: «На месте уникального города Москвы построен город, город среднеевропейского типа, не выделяющийся ничем особенным.Смысл этого высказывания в том, что памятники, сооружения старины хранят в себе историю и украшают улицы, поражая воображение людей. Позиция автора очевидна.Писатель считает, что памятники архитектуры — это наша гордость. Они являлись важной частью жизни наших предков. В. В.п.Солоучин пишет: «Разружая старину, мы всегда обрываем корни.

rehand.ru

Как вам результат?

0
161 комментарий
Написать комментарий...
Vasya Pupkin

Очень крутой и нужный сервис, успехов.

Ответить
Развернуть ветку
Andrey Lavrov

Обязательно нужен режим «как курица лапой»)))

Ответить
Развернуть ветку
5 комментариев
Yoo MeRxx
Автор

Спасибо :)

Ответить
Развернуть ветку
Илитный Иксперт

Врачебный почерк распознает?

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Смотря насколько врачебный

Ответить
Развернуть ветку
5 комментариев
Роман Эмиров

это нужен бот-аптекарь, только они понимают врачебный почерк

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Shoo

Очень надеялся найти в статье ответы на вопрос "Зачем?" и сравнение с кучей уже существующих OCR-сервисов и инструментов.
К сожалению, не нашел.

исправлять ошибки в тексте, при этом сохраняя смысл.

На самом деле, это очень вредная фича.
Важно понимать, что вы исправляете не ошибки, а то, что система посчитала ошибкой.
Как результат, полученный текст нужно основательно вычитывать и сверять с оригиналом, что бы убедиться что "автозамена" нигде не налажала.
Это, как правило, выливается в ещё более трудозатратный процесс, чем просто транскрибация рукописного текста.
Особенно больно и актуально это становится, когда на вход прилетает текст, по своей специфике и тематике не схожий с корпусом обучения.
Там уверенность OCR начинает падать, а правильность гипотез автозамены ползёт вниз по экспоненте.

Мой совет - не занимайтесь автозаменой, никогда.
Подсвечивать ошибки и предлагать варианты - да, исправлять автоматически - нет.
То же самое в ситуациях, когда уверенность нейросетки в правильности распознавания не абсолютна (допустимый трэшхолд надо замерять имперически).

Ну и отдельный вопрос:
Как работает на миксах языков, англицизмах, смеси из языкового и символьного текста?

И вообще, метрик нехватает.

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Автозамены и исправления можно отключить

Ответить
Развернуть ветку
1 комментарий
user0564335

разве много OCR предлагают качественное распознавание рукописного русскоязычного текста, написанного не печатным почерком?

Что точность тут не 100% вроде как очевидно и никакой OCR такого гарантировать не может, так что в любом случае использовать результаты не проверяя, полагаясь на один OCR, нельзя.

Мне кажется, это инструмент скорее для помощи определённым специалистам (проверяющим экзамены, работающим с заявлениями и документами). И да, время от времени ошибки придётся исправлять вручную, но если автокоррекция и правда учитывает контекст, то делать это придётся не так уж часто. Зато люди освободятся от рутинного вглядывания в кривой почерк и его перепечатывания, а в оригинал будут заглядывать только в случае, если у результата низкая уверенность или очевидно, что по смыслу в тексте должно было стоять что-то другое

Ответить
Развернуть ветку
1 комментарий
Дмитрий Савчук

Даёшь автозамену "что бы" на "чтобы" на уровне сетевых протоколов? Глаза болят уже от этой детской ошибки.

Ответить
Развернуть ветку
Михаил Октябрьский

99 р в день мне кажется дороговато

Ответить
Развернуть ветку
Чайка О.

Не кажется.

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Снизил цену до 49₽ за день

Ответить
Развернуть ветку
7 комментариев
Yoo MeRxx
Автор

Цены будут корректироваться. Сейчас проверяем, как сервер справляется с нагрузкой

Ответить
Развернуть ветку
2 комментария
Невероятный Блондин
как вам результат?

Никак.
Зачем-то потребовал регистрацию.

У всех подобных сервисов обычно свободный доступ с ограничением количества в день по айпи, и безлимитом за деньги.

У вас я даже тупо тест не могу сделать

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Пока так. После регистрации можно будет бесплатно протестировать

Ответить
Развернуть ветку
8 комментариев
Kirill Sokol

Сделайте нейросеть распознающую почерк врача - озолотитесь!

Ответить
Развернуть ветку
Липовый мёд

Распознай:

Ответить
Развернуть ветку
Yoo MeRxx
Автор

лишь, дымишь, дышишь, лишишься, слышишь, симпшлялы, шиания.

Ответить
Развернуть ветку
23 комментария
Антон Назаров

фармацевтам работу облегчать))

Ответить
Развернуть ветку
turbo indeets

ну хз, там сплошные /////

Ответить
Развернуть ветку
Алексей Коротков

Очень интересная и может быть виральная тема. А вот брать плату мне кажется рано.

Я понимаю, что всё стоит денег, кстати, привлечение клиентов и внимания тоже. Я бы сделал на начальный период сервис бесплатным, чтобы многим хотелось туда что-то засунуть, распознать и например поделиться с друзьями. Понимаю, что сервера и т.п. стоит денег, но так вы можете получить большие охваты и сэкономить на маркетинге, по сути перемоете из одного бюджета в др. Кстати, еще получите очень много разных текстов и тестирование сервиса.

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Возможность протестировать сервис - есть. После регистрации можно бесплатно загрузить изображение и получить результат. На данном этапе, это вынужденная мера. А так согласен с вами!

Ответить
Развернуть ветку
Speedwagon MMXXII

Хороший проект, поддержал лайком и репостом.

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Саша Павлов

Сервис реально крутой! Удачи

Ответить
Развернуть ветку
вапроапеноапоап

Сервис, прям скажем, сыроват, особенно с учётом цен; однако "Сущ. Смерть...", "молоко полуобъебное" и "зоо пирожки" в дешифровке заводского меню повеселили.

В целом, с цифрами справляется неплохо, ну, окромя зоопирожков, а вот с текстом - бида.

Ответить
Развернуть ветку
Alexey Poimtsev

Оок ;)

Ответить
Развернуть ветку
Alexey Poimtsev
Ответить
Развернуть ветку
1 комментарий
Дмитрий Башкиров

Что все критикуют? Молодцы, что сделали такой сервис, это действительно работа с технологиями, а не Telegram Bot или Landing Page Росграмма.

У меня, например, есть примеры для внедрения такого решения. Например, есть электронный архив организации, в которой есть тысячи старых документов, в том числе с элементами рукописного письма.

Или, я раньше вёл тетрадки по проекту с письмом ручным или записывал материал с курсом, с радостью бы оцифровал, когда решение будет точнее.

Работать в этом направлении имеет смысл, точно.

Ответить
Развернуть ветку
Дмитрий Башкиров

100₽ в день просто поддержка автора. С маркетингом беда, но это временно.

Ответить
Развернуть ветку
Владимир Кича

А распознает дореволюционный рукописный? В государственных архивах очень много отсканированных старых документов (метрических книг, переписей, приказов), которые на данный момент вручную переводят в цифровые документы.

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Нужно смотреть примеры. А так вполне возможно адаптировать нашу нейросеть под данную задачу

Ответить
Развернуть ветку
Denis Mingulov

как минимум 2 фирмы переводят аналогичным способом, но продается это только напрямик архивам

Ответить
Развернуть ветку
СлавалС

почитал каменты и делаю вывод что русские все таки жадные.
99р в день?да это просто наглость :)
имея кое как сделанную функциональность денег хотят супер много, с такой бизнес моделью: выход на рынок неподготовленным, да еще и по высокой цене - вряд ли разовьется во что-то серьезное

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Спасибо за комментарий! Если посмотреть на другие, зарубежные сервисы, то они в основном берут за количество. То есть если нужно распознать 100 изображение, то нужно заплатить 1 бакс, к примеру. А у нас безлимит на день. Также хочу подметить, что мы скоро скорректируем цену за использование, цена сейчас - временная мера

Ответить
Развернуть ветку
3 комментария
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Artem Visotsky

кругом гэбня, да? )

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Artem Visotsky

Такие бракоделы снижают общий уровень трибуны.

Ответить
Развернуть ветку
Artem Visotsky

Кнопка загрузить не работает.
Пользовательского соглашения нет.
Шляпа какая то а не проект в трибуне.

Ответить
Развернуть ветку
Gerge Thunder

Круто

Ответить
Развернуть ветку
Александр Смирнов

Крутой!
А вы тестировали сервис с рукописным вводом информации стилусом в планшет?

Ответить
Развернуть ветку
Dave Zeitung

Во, мне кажется это полезно было бы

Ответить
Развернуть ветку
Vasiliy Leytman

Только русский?

Ответить
Развернуть ветку
Ильдарио Котэ
Ответить
Развернуть ветку
Ильдарио Котэ
Ответить
Развернуть ветку
1 комментарий
Adam Kallen

Очень круто, молодцы, обязательно воспользуюсь!!! Мне нравится. Развивайте сервис дальше, мне кажется это то что нужно.

Ответить
Развернуть ветку
KermitFrog

Если будет толково работать, доведут до ума то сервис не плохой, однако в наше время когда ручное письмо уходит в прошлое...

Ответить
Развернуть ветку
Artem Visotsky

кому это нужно и зачем?

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Распознавание рукописных текстов может пригодится много кому. От обычных учителей, до сканирования документов в крупных компаниях. В будущем, мы планируем внедрить возможность пользователю создавать шаблоны, для структурированного распознавания однотипных документов-сканов.

Ответить
Развернуть ветку
9 комментариев
Илья Козлов
Ответить
Развернуть ветку
Никита Гордеев

Проект еще живой?

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Да, сегодня проходили тех.работы

Ответить
Развернуть ветку
Labeling

Впечатляет как работает, почти нет ошибок и нераспознанных слов.

Я так понимаю если слово не распознано, то оно просто пропускается.
Но совершенно неожиданно то, что слово может быть удвоено как «город» во втором тексте.

построен город, город среднеевропейского типа
Ответить
Развернуть ветку
Yoo MeRxx
Автор

Это проблема нейросети, которая детектит слова на картинки, она может выделить слово два раза. Скоро дообучим и результат должен улучшиться :)

Ответить
Развернуть ветку
1 комментарий
Лимита

Отлично, молодец, нужная штука.

Ответить
Развернуть ветку
Igor Lopatin

Да че вы с этим врачебным почерком? Во всех более-менее современных клиниках все результаты и консультации выдают только в печатном виде, никто от руки уже не пишет.

Ответить
Развернуть ветку
Александр Смирнов

Если отъехать от мегаполисов километров на 30 - нет

Ответить
Развернуть ветку
Дарья Хохлова

крутой сервис)

Ответить
Развернуть ветку
Оксана Бакиева

Давно подобное искала

Ответить
Развернуть ветку
Александр

Да да конечно) я даже сам свои каракули не могу разобрать )))

Ответить
Развернуть ветку
Ильдарио Котэ

Работает на ура

Ответить
Развернуть ветку
Медовар

Почерк врачей распознает?:)

Ответить
Развернуть ветку
Медовар
Ответить
Развернуть ветку
1 комментарий
Медовар

Не особо ))

Ответить
Развернуть ветку
Двадцать Один

Добрый день, у меня стартап, в котором требуется OCR, однако Яндекс Гугл меня не совсем устраивают.
Вы распознаете только рукописный текст? Или есть решения для печатаного?

Ответить
Развернуть ветку
Yoo MeRxx
Автор

Здравствуйте, мы планируем интеграцию с печатаными OCR в скором будущем

Ответить
Развернуть ветку
2 комментария
Николай Кравченко

Очень хорошо лучшие успехов в дальнейшем,

Ответить
Развернуть ветку
Алексей Кирпиченко

охват 3 калеки конечно

Ответить
Развернуть ветку
Вадим Д.

Режим распознавания почерка врачей есть? Это мега-преимущество: сами врачи первыми и прибегут (-:
А если серьёзно — успеха проекту, вещь нужная и крайне полезная!

Ответить
Развернуть ветку
Кирилл Павловский

Очень крутой сервис , так держать ребята !)

Ответить
Развернуть ветку
Дэн Дэльтаплан
Ответить
Развернуть ветку
S-ed

Что-то у вас интерфейс сломан...

Ответить
Развернуть ветку
Markus Shebarov

Сервис, действительно, стоящий
Пушка

Ответить
Развернуть ветку
Сергей Негерев

Сколько человек создавали сервис?

Ответить
Развернуть ветку
Yoo MeRxx
Автор

1

Ответить
Развернуть ветку
Энтони Майлс

У вас опечатка на сайте:

Ответить
Развернуть ветку
Nanon Trit

Отличное дело!)

Ответить
Развернуть ветку
Аккаунт удален

Комментарий недоступен

Ответить
Развернуть ветку
Павел CRM Цапюк

Доктора в панике! Теперь наконец все узнают, что за херню они нам пишут

Ответить
Развернуть ветку
Zloy Marketolog

Врачебный почерк слабо?)

Ответить
Развернуть ветку
Zloy Marketolog

И нафига так делать? Вы разместили "живой" интерфейс и не даете им пользоваться. 🤦🤦🤦

Ответить
Развернуть ветку
Иван Молодчинин

Надеюсь шутки про почерк врачей всё ещё актуальны

Ответить
Развернуть ветку

Комментарий удален модератором

Развернуть ветку
Family Ties

Здравствуйте!Давно искал такой сервис. Есть область для широкого применения этого сервиса. Но нужно дообучить модель распознавать дореволюционную кириллицу.Буду признателен, если сможем детальнее пообщаться на эту тему. Мой контакт: [email protected]

Андрей.

Ответить
Развернуть ветку
Анатолий Матвеев

Добрый день. Проект рабочий? Есть проект в который ищем подобное решение. Если есть интерес, скиньте контакт телеграмм в личку.

Ответить
Развернуть ветку
Shatlyk Jumayev
Ответить
Развернуть ветку
Nek Lik
Ответить
Развернуть ветку
Павел pawellcom

Круто, а есть такое для текста на немецком? Есть задача распознать и перевести исторические письма, нужно для написания книги. Тут https://rehand.ru/ только русский и английский.

Ответить
Развернуть ветку
Анна
Ответить
Развернуть ветку
Дмитрий Панин

ОТЛИЧНАЯ ПРОГА!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Очень круто!!!!!!!!!!!! Чуть подешевле было бы если возможно - цены бы ей не было!!!!!!!! А так ОЧЕНЬ КРУТАЯ! Спасибо Вам

Ответить
Развернуть ветку
158 комментариев
Раскрывать всегда