Бенчмарки GLM-5 от Zhipu AI: новые достижения в ИИ

Появились официальные бенчмарки (эвалы) новой GLM-5 от Zhipu AI. И если верить слайдам, китайские коллеги не просто догнали, а в чем-то и перегнали текущий SOTA. Что интересного на графиках:

BrowseComp (Веб-серфинг): Тут просто разрыв. 75.9 баллов против ~65 у конкурентов (даже GPT-5.2 осталась позади)
Humanity's Last Exam: В режиме с инструментами (w/ Tools) набирает 50.4, обгоняя Claude Opus 4.5 и Gemini 3 Pro. Это, на секунду, один из самых "хардовых" тестов на сложные рассуждения
Кодинг (SWE-bench): 77.8. Крепкий уровень, дышит в спину Opus 4.5 (80.9)

Ну и на минуточку размер GLM-5 всего 40B (для сравнения, у прошлой версии было 32B).

Подписывайтесь на Telegram Силиконовый Мешок.