✔️ KIMI K2.6 за ночь обогнала LM Studio на маке! В блоге о запуске новой модели Kimi есть история, от которой отвисает челюсть.

Моделька сама, без человека, поставила себе на мак Qwen3.5-0.8B и решила, что дефолтный инференс её не устраивает. Дальше она села писать свой, причём не на привычном питоне или C++, а на Zig.

В итоге скорость генерации выросла примерно с 15 до 193 токенов в секунду. То есть больше чем в десять раз.

И это оказалось на 20 процентов быстрее, чем LM Studio, которой пользуются тысячи людей именно для локального запуска моделей.

Больше 4000 вызовов инструментов, 12 часов непрерывной работы и 14 итераций, пока всё не сошлось.

Метрики K2.6 выглядят пртилично: SOTA среди опенсорса на HLE с тулзами, сильные результаты на SWE-Bench Pro, BrowseComp и математических бенчах с питоном.

✔️ KIMI K2.6 за ночь обогнала LM Studio на маке! В блоге о запуске новой модели Kimi есть история, от которой отвисает челюсть.

Бенчмарки:

• HLE с инструментами: 54.0

• SWE-Bench Pro: 58.6

• SWE-bench Multilingual: 76.7

• BrowseComp: 83.2

• Toolathlon: 50.0

• Charxiv с Python: 86.7

• Math Vision с Python: 93.2

Но запоминается больше всего этот эпизод с Zig. Потому что одно дело проходить тесты, и совсем другое- взять незнакомый язык и переписать на нём чужой рантайм так, чтобы он обогнал популярный продукт.Релиз Kimi K2.6.

🔗 API: https://platform.moonshot.ai

🔗 Tech blog: https://kimi.com/blog/kimi-k2-6

🔗 Weights & code: https://huggingface.co/moonshotai/Kimi-K2.6

Пишу экспертно про технологии, ИИ и науку у себя в телеге, без нейрослопа, подписывайтесь, будет полезно! Мах, если не грузит.