А расскажите-ка об МЛ стеке. Ну, там, "для OCR используем Tesseract", "сущности с изображения вытаскиваем с помощью LayoutLM", и т.п. В пределах допустимого, разумеется 😀 Любопытно, на каких технологиях сейчас IDP работает.
мы хотим сделать такую статью на хабре вначале года. LayoutLM мы правда используем, а вот Tesseract совсем старый и скучный. В OCR у нас очень много архитектур, часть число CV, часть знают информацию про язык
А расскажите-ка об МЛ стеке. Ну, там, "для OCR используем Tesseract", "сущности с изображения вытаскиваем с помощью LayoutLM", и т.п. В пределах допустимого, разумеется 😀 Любопытно, на каких технологиях сейчас IDP работает.
мы хотим сделать такую статью на хабре вначале года. LayoutLM мы правда используем, а вот Tesseract совсем старый и скучный. В OCR у нас очень много архитектур, часть число CV, часть знают информацию про язык