ReHand – распознавание рукописного текста
Всем привет! Недавно создал экспериментальный проект по распознаванию рукописного текста.
На сайте используется связка из трех нейросетей. Сайт способен обнаруживать и распознавать рукописные слова, исправлять ошибки в тексте, при этом сохраняя смысл.
Сайт: rehand.ru
Дополнительные настройки помогут значительно улучшить результат. Вы можете включить автоматическое выравнивание текста, корректировку орфографии и умную обработку текста.
В будущем, планируется возможность создание пользователем шаблонов для сегментации отдельных областей различных категорий изображений. Пользователь сможет выбрать какие места изображения нужно распознать и получать на выходе структурированные данные.
*мы можем обработать, много различных изображений с различным рукописным почерком, но бывают исключения, где наш прототип программы до сих пор не справляется и может выдать плохой результат.
Ниже приведу примеры распознаваний школьных тетрадей и бланков ЕГЭ/ОГЭ
Пример 1:
Данную мысль можно обосновать еще одним аргументом.В произведении К.Г.Паустовского Настя, главная героиня Настя, сама занята и не может навещать старую мать.Что касается Катерины Петровны, то она не винит дочь.Удивительно, насколько безгранично любящим может быть сердце матери.Когда же Настя, осознав величину возможной потери, приезжает в деревню, оказывается слишком поздно. Нужно. Таким образом, можно сделать вывод, что проявлять свои чувства и говорить слова любви своим родителям вовремя, что потом может быть слишком поздно.
Пример 2:
Почему важно сохранять памятники архитектуры? Этой проблеме посвящён текст Владимира Алексеевича Солоухина.Отвечая на вопрос, автор пишет о разрушении множества исторических сооружений в Москве, Спасовой башни и Страстного монастыря Христа Спасителя. Писатель сравнивает, какие грандиозные постройки украшали столицу раньше и какие унылые, обыкновенные здания стоят там сейчас. Этот пример показывает, что город теряет одну из важнейших удивительных частей, когда исчезают В. В.ст.Солоучин делает вывод из своих рассуждений: «На месте уникального города Москвы построен город, город среднеевропейского типа, не выделяющийся ничем особенным.Смысл этого высказывания в том, что памятники, сооружения старины хранят в себе историю и украшают улицы, поражая воображение людей. Позиция автора очевидна.Писатель считает, что памятники архитектуры — это наша гордость. Они являлись важной частью жизни наших предков. В. В.п.Солоучин пишет: «Разружая старину, мы всегда обрываем корни.
Очень крутой и нужный сервис, успехов.
Обязательно нужен режим «как курица лапой»)))
Спасибо :)
Врачебный почерк распознает?
Смотря насколько врачебный
это нужен бот-аптекарь, только они понимают врачебный почерк
Это тянет на отдельный стартап)
Очень надеялся найти в статье ответы на вопрос "Зачем?" и сравнение с кучей уже существующих OCR-сервисов и инструментов.
исправлять ошибки в тексте, при этом сохраняя смысл.К сожалению, не нашел.
На самом деле, это очень вредная фича.
Важно понимать, что вы исправляете не ошибки, а то, что система посчитала ошибкой.
Как результат, полученный текст нужно основательно вычитывать и сверять с оригиналом, что бы убедиться что "автозамена" нигде не налажала.
Это, как правило, выливается в ещё более трудозатратный процесс, чем просто транскрибация рукописного текста.
Особенно больно и актуально это становится, когда на вход прилетает текст, по своей специфике и тематике не схожий с корпусом обучения.
Там уверенность OCR начинает падать, а правильность гипотез автозамены ползёт вниз по экспоненте.
Мой совет - не занимайтесь автозаменой, никогда.
Подсвечивать ошибки и предлагать варианты - да, исправлять автоматически - нет.
То же самое в ситуациях, когда уверенность нейросетки в правильности распознавания не абсолютна (допустимый трэшхолд надо замерять имперически).
Ну и отдельный вопрос:
Как работает на миксах языков, англицизмах, смеси из языкового и символьного текста?
И вообще, метрик нехватает.
Автозамены и исправления можно отключить
разве много OCR предлагают качественное распознавание рукописного русскоязычного текста, написанного не печатным почерком?
Что точность тут не 100% вроде как очевидно и никакой OCR такого гарантировать не может, так что в любом случае использовать результаты не проверяя, полагаясь на один OCR, нельзя.
Мне кажется, это инструмент скорее для помощи определённым специалистам (проверяющим экзамены, работающим с заявлениями и документами). И да, время от времени ошибки придётся исправлять вручную, но если автокоррекция и правда учитывает контекст, то делать это придётся не так уж часто. Зато люди освободятся от рутинного вглядывания в кривой почерк и его перепечатывания, а в оригинал будут заглядывать только в случае, если у результата низкая уверенность или очевидно, что по смыслу в тексте должно было стоять что-то другое
Даёшь автозамену "что бы" на "чтобы" на уровне сетевых протоколов? Глаза болят уже от этой детской ошибки.
99 р в день мне кажется дороговато
Не кажется.
Снизил цену до 49₽ за день
Цены будут корректироваться. Сейчас проверяем, как сервер справляется с нагрузкой
Никак.
Зачем-то потребовал регистрацию.
У всех подобных сервисов обычно свободный доступ с ограничением количества в день по айпи, и безлимитом за деньги.
У вас я даже тупо тест не могу сделать
Пока так. После регистрации можно будет бесплатно протестировать
Сделайте нейросеть распознающую почерк врача - озолотитесь!
Распознай:
лишь, дымишь, дышишь, лишишься, слышишь, симпшлялы, шиания.
фармацевтам работу облегчать))
ну хз, там сплошные /////
Очень интересная и может быть виральная тема. А вот брать плату мне кажется рано.
Я понимаю, что всё стоит денег, кстати, привлечение клиентов и внимания тоже. Я бы сделал на начальный период сервис бесплатным, чтобы многим хотелось туда что-то засунуть, распознать и например поделиться с друзьями. Понимаю, что сервера и т.п. стоит денег, но так вы можете получить большие охваты и сэкономить на маркетинге, по сути перемоете из одного бюджета в др. Кстати, еще получите очень много разных текстов и тестирование сервиса.
Возможность протестировать сервис - есть. После регистрации можно бесплатно загрузить изображение и получить результат. На данном этапе, это вынужденная мера. А так согласен с вами!
Хороший проект, поддержал лайком и репостом.
Комментарий недоступен
Сервис реально крутой! Удачи
Сервис, прям скажем, сыроват, особенно с учётом цен; однако "Сущ. Смерть...", "молоко полуобъебное" и "зоо пирожки" в дешифровке заводского меню повеселили.
В целом, с цифрами справляется неплохо, ну, окромя зоопирожков, а вот с текстом - бида.
Оок ;)
Что все критикуют? Молодцы, что сделали такой сервис, это действительно работа с технологиями, а не Telegram Bot или Landing Page Росграмма.
У меня, например, есть примеры для внедрения такого решения. Например, есть электронный архив организации, в которой есть тысячи старых документов, в том числе с элементами рукописного письма.
Или, я раньше вёл тетрадки по проекту с письмом ручным или записывал материал с курсом, с радостью бы оцифровал, когда решение будет точнее.
Работать в этом направлении имеет смысл, точно.
100₽ в день просто поддержка автора. С маркетингом беда, но это временно.
А распознает дореволюционный рукописный? В государственных архивах очень много отсканированных старых документов (метрических книг, переписей, приказов), которые на данный момент вручную переводят в цифровые документы.
Нужно смотреть примеры. А так вполне возможно адаптировать нашу нейросеть под данную задачу
как минимум 2 фирмы переводят аналогичным способом, но продается это только напрямик архивам
почитал каменты и делаю вывод что русские все таки жадные.
99р в день?да это просто наглость :)
имея кое как сделанную функциональность денег хотят супер много, с такой бизнес моделью: выход на рынок неподготовленным, да еще и по высокой цене - вряд ли разовьется во что-то серьезное
Комментарий недоступен
Спасибо за комментарий! Если посмотреть на другие, зарубежные сервисы, то они в основном берут за количество. То есть если нужно распознать 100 изображение, то нужно заплатить 1 бакс, к примеру. А у нас безлимит на день. Также хочу подметить, что мы скоро скорректируем цену за использование, цена сейчас - временная мера
Комментарий недоступен
кругом гэбня, да? )
Комментарий недоступен
Такие бракоделы снижают общий уровень трибуны.
Кнопка загрузить не работает.
Пользовательского соглашения нет.
Шляпа какая то а не проект в трибуне.
Круто
Крутой!
А вы тестировали сервис с рукописным вводом информации стилусом в планшет?
Во, мне кажется это полезно было бы
Только русский?
Очень круто, молодцы, обязательно воспользуюсь!!! Мне нравится. Развивайте сервис дальше, мне кажется это то что нужно.
Если будет толково работать, доведут до ума то сервис не плохой, однако в наше время когда ручное письмо уходит в прошлое...
кому это нужно и зачем?
Распознавание рукописных текстов может пригодится много кому. От обычных учителей, до сканирования документов в крупных компаниях. В будущем, мы планируем внедрить возможность пользователю создавать шаблоны, для структурированного распознавания однотипных документов-сканов.
Проект еще живой?
Да, сегодня проходили тех.работы
Впечатляет как работает, почти нет ошибок и нераспознанных слов.
Я так понимаю если слово не распознано, то оно просто пропускается.
построен город, город среднеевропейского типаНо совершенно неожиданно то, что слово может быть удвоено как «город» во втором тексте.
Это проблема нейросети, которая детектит слова на картинки, она может выделить слово два раза. Скоро дообучим и результат должен улучшиться :)
Отлично, молодец, нужная штука.
Да че вы с этим врачебным почерком? Во всех более-менее современных клиниках все результаты и консультации выдают только в печатном виде, никто от руки уже не пишет.
Если отъехать от мегаполисов километров на 30 - нет
крутой сервис)
Давно подобное искала
Да да конечно) я даже сам свои каракули не могу разобрать )))
Работает на ура
Почерк врачей распознает?:)
Не особо ))
Добрый день, у меня стартап, в котором требуется OCR, однако Яндекс Гугл меня не совсем устраивают.
Вы распознаете только рукописный текст? Или есть решения для печатаного?
Здравствуйте, мы планируем интеграцию с печатаными OCR в скором будущем
Очень хорошо лучшие успехов в дальнейшем,
охват 3 калеки конечно
Режим распознавания почерка врачей есть? Это мега-преимущество: сами врачи первыми и прибегут (-:
А если серьёзно — успеха проекту, вещь нужная и крайне полезная!
Очень крутой сервис , так держать ребята !)
Что-то у вас интерфейс сломан...
Сервис, действительно, стоящий
Пушка
Сколько человек создавали сервис?
1
У вас опечатка на сайте:
Отличное дело!)
Комментарий недоступен
Доктора в панике! Теперь наконец все узнают, что за херню они нам пишут
Врачебный почерк слабо?)
И нафига так делать? Вы разместили "живой" интерфейс и не даете им пользоваться. 🤦🤦🤦
Надеюсь шутки про почерк врачей всё ещё актуальны
Комментарий удален модератором
Здравствуйте!Давно искал такой сервис. Есть область для широкого применения этого сервиса. Но нужно дообучить модель распознавать дореволюционную кириллицу.Буду признателен, если сможем детальнее пообщаться на эту тему. Мой контакт: [email protected]
Андрей.
Добрый день. Проект рабочий? Есть проект в который ищем подобное решение. Если есть интерес, скиньте контакт телеграмм в личку.