Сервис распознавания документов SotaOCR для PDF и LATEX
Ну наконец-то готов релизить OCR сервис
Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.
- Очень хороша в таблицах
- Специально натренирована на математические формулы в LATEX формате.
- Отдает честные границы объектов (LLM это делает как бог на душу положит).
- Знает много языков
Ограничения:
- плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.
Подписывайтесь на Telegram Глеб Кудрявцев про AI кодинг.
Начать дискуссию