Проблемы OCR сеток с распознаванием текстов и советы по улучшению

Добавлю, что OCR сетки очень плохо справляются с чеками, этикетками, составами продуктов и т.д. мелким плохоразличимым шрифтом. Они чисто для сканов книжных страниц и документов. Если вам распознавать кривые-косые тексты, то тут нужно использовать VL модели. Мне лично грок нравится, но вполне неплохо работают квены, gemini flash, и еще куча других.

Подписывайтесь на Telegram Глеб Кудрявцев про AI кодинг.