Gleb Kudryavtcev

+2431
с 2014
203 подписчика
29 подписок

Если вам кажется, что модели могут все — отвечаю, не все. Попробуйте сделать эффективный 3d движок, офигеете, как топовая моделька от каждой из топовых лаб путается в трех соснах на контексте всего в 100к. Я, пожалуй, свои эксперименты в этом направлении прекращу — еще все очень сыро.

Эффективные 3D движки и их ограничения в моделировании

Не знаю, просто наблюдением поделиться захотелось. Если вы не долбанутый, то очень даже можете завести свой свой бизнес. Но блогером вам точно не стать. Это как рост меньше двух метров в басктболе. Нормальная кукуха — можно даже не пытаться.

Добавлю, что OCR сетки очень плохо справляются с чеками, этикетками, составами продуктов и т.д. мелким плохоразличимым шрифтом. Они чисто для сканов книжных страниц и документов. Если вам распознавать кривые-косые тексты, то тут нужно использовать VL модели. Мне лично грок нравится, но вполне неплохо работают квены, gemini flash, и еще куча других.

Я paddleocr-vl-1.5 Q8 сломал таким чеком

Добавлю, что OCR сетки очень плохо справляются с чеками, этикетками, составами продуктов и т.д. мелким плохоразличимым шрифтом. Они чисто для сканов книжных страниц и документов. Если вам распознавать кривые-косые тексты, то тут нужно использовать VL модели. Мне лично грок нравится, но вполне неплохо работают квены, gemini flash, и еще куча других.

Напоминаю, а то вдруг вы не в курсе. Если вам OCR делать, то лучшая моделька на сегодняшний момент https://huggingface.co/PaddlePaddle/PaddleOCR-VL-1.5

Запускается даже на 3060…

1

Есть такое явление — называется The Ralph Loop, оно же петля Ральфа.

Но это умное название, а реальное название должно быть — макака-кодинг. Это когда агента запускаешь снова и снова пока он не сделает то, что нужно.

Еще осенью взял себе Macbook m4 pro 48 гб, в тч чтобы элитно запускать локальные модельки.

Докладываюсь:

Вообще конечно очень круто писать 3d движок, моделька на реальном эльфийском разговаривает 😁

Согласен с диагнозом: это выглядело как z-fighting из-за копланарного наложения transition-геометрии и базовых поверхностей.

ПАЦАНЫ, Я СЕГОДНЯ СИДЕЛ КОРОЧЕ В ДИСКОРДЕ И УВИДЕЛ ЧЕЛА КОТОРЫЙ СКАЗАЛ ЧТО УСТАНОВИЛ КЛЕШНЮ И ТОТ ЧИТАЕТ ЕГО ПОЧТУ, НУ Я ПОДСКОЧИЛ И РЕЗКО ПЕРЕЕБАЛ ЕМУ В ЩЩИ С ВЕРТУШКИ И ПОЯСНИЛ ЕГО КРИКОМ "ЭТО ТЕБЕ ИНЪЕКЦИЯ СУКА", ПОТОМУ ЧТО Я УГОРЕЛ ПО ЧИСТЫМ API, ПАЦАНЫ ДУХ СТАРОЙ ШКОЛЫ ЖИВЁТ ТОЛЬКО В РУЧНОМ УПРАВЛЕНИИ КОНТЕКСТОМ, ГДЕ ЕБАШАТСЯ ПО ХАРДКОРУ, ГДЕ…

Вот так скажу вам. Ни разу, ни единого разика у меня не было бага, который бы не смогли решить ни gpt ни гемини, но осилил бы опус. Наоборот — сколько угодно.

Давайте, любители Антропиков, объясняйте, как так 😉

Ботик разбушевался и удаляет сообщения всех новорегов. Если вас тоже удаляет — потерпите, качу фикс :)