Попробовал новую локальную модель GLM-4-32B от китайцев
И если честно офигел, модель по уровню написания кода не хуже Sonnet 3.5 – в видео она с первого раза сделала мне змейку с автопилотом и лендинг по большому взрыву, с анимациями и приятным дизайном
Но это не все, я не знаю как китайцы это сделали, но модель очень аккуратно работает с памятью – потребляет ее меньше чем конкуренты. Еще в этой же серии моделей вышла «думающая» Z1-32B, но она почему-то кодит хуже обычной
В этой же серии моделей доступна 9B версия, но она ожидаемо хуже пишет код
Контекстное окно – 32k
GGUF файлы с фиксом брал тут (на той неделе с багом была конвертация)
HuggingFace со всеми моделям
Потестировать в вебе можно тут (без реги)
P.S. Если что, в последних версиях AI Asisstant JetBrains есть ollama и LM Studio, можно прям как основную для написания кода гонять, но я тестирвоал на llama.cpp потому что люблю хардкор
Подписывайтесь на Telegram-канал Denis Sexy IT 🤖.