Бенчмарки GLM-5 от Zhipu AI: новые достижения в ИИ
Появились официальные бенчмарки (эвалы) новой GLM-5 от Zhipu AI. И если верить слайдам, китайские коллеги не просто догнали, а в чем-то и перегнали текущий SOTA. Что интересного на графиках:
- BrowseComp (Веб-серфинг): Тут просто разрыв. 75.9 баллов против ~65 у конкурентов (даже GPT-5.2 осталась позади)
- Humanity's Last Exam: В режиме с инструментами (w/ Tools) набирает 50.4, обгоняя Claude Opus 4.5 и Gemini 3 Pro. Это, на секунду, один из самых "хардовых" тестов на сложные рассуждения
- Кодинг (SWE-bench): 77.8. Крепкий уровень, дышит в спину Opus 4.5 (80.9)
Ну и на минуточку размер GLM-5 всего 40B (для сравнения, у прошлой версии было 32B).
Подписывайтесь на Telegram Силиконовый Мешок.
Начать дискуссию