Как нейросети и люди распознают документы с точностью 99% и в 2–3 раза дешевле штатных сотрудников

Самые крутые нейросети распознают до 96% полей в документе. Если текст рукописный, точность может упасть до 20%: нейросети не сильны в военных билетах, трудовых книжках и извещениях о ДТП.

5656

Чем-то подобным занимался. Интересно что используете для OCR? А ещё как происходит работа с документами с переменным layout, когда положение полей меняется из-за размера контента, и многостраничными?

В Dbrain используем OCR собственной разработки. Изображения обрабатываем каскадом нейросетевых алгоритмов, поэтому умеем распознавать документы переменного формата.