Запуск про-режима в Sotaocr: отладка модели и кванты
Все хочу запустить наконец про-режим в sotaocr.
Целый день убил на отладку модели.
Полноразмерная слишком жирная для карточки, а с квантом обнаружился прикол, с которым я и возился.
Оказалось (внезапно!), что у этой модельки аж две составляющих.
- визуальная
- ллм-ная
И прикол в том, что рабочие кванты у них разные. Если ллм часть можно запускать на q8 и аж даже на q4, то вот качество детектора координат bbox сильно деградирует при любом малейшем квантовании оригинала. И стандартный q8 ее напрочь ломает.
Убил кучу времени, чтобы понять, что же не так и почему она дает кривое распознавание.
Но в итоге смог сделать хороший пресет и даже выложил публично тут
А на картинке попросил гопоту сделать нормальное объяснение механики того, что происходило, если вы хотите вникнуть в тематику поглубже.
Подписывайтесь на Telegram Глеб Кудрявцев про AI.