Сервис распознавания документов SotaOCR для PDF и LATEX

Ну наконец-то готов релизить OCR сервис

Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.

  • Очень хороша в таблицах
  • Специально натренирована на математические формулы в LATEX формате.
  • Отдает честные границы объектов (LLM это делает как бог на душу положит).
  • Знает много языков

Ограничения:

  • плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю

В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.

Подписывайтесь на Telegram Глеб Кудрявцев про AI кодинг.

Начать дискуссию