Попробовал новую локальную модель GLM-4-32B от китайцев

И если честно офигел, модель по уровню написания кода не хуже Sonnet 3.5 – в видео она с первого раза сделала мне змейку с автопилотом и лендинг по большому взрыву, с анимациями и приятным дизайном

Но это не все, я не знаю как китайцы это сделали, но модель очень аккуратно работает с памятью – потребляет ее меньше чем конкуренты. Еще в этой же серии моделей вышла «думающая» Z1-32B, но она почему-то кодит хуже обычной

В этой же серии моделей доступна 9B версия, но она ожидаемо хуже пишет код

Контекстное окно – 32k

GGUF файлы с фиксом брал тут (на той неделе с багом была конвертация)

HuggingFace со всеми моделям

Потестировать в вебе можно тут (без реги)

P.S. Если что, в последних версиях AI Asisstant JetBrains есть ollama и LM Studio, можно прям как основную для написания кода гонять, но я тестирвоал на llama.cpp потому что люблю хардкор

Подписывайтесь на Telegram-канал Denis Sexy IT 🤖.