Kimi выкатила открытую модель, которая обходит Opus
Сегодня китайская Moonshot AI выложила Kimi K2.7 Code — открытую модель на триллион параметров, заточенную под программирование. На ключевом бенчмарке по работе с инструментами она обошла Claude Opus 4.8, доступ к которому стоит подписки. Ещё один кирпич в стену: китайские лаборатории догоняют — и раздают бесплатно то, за что на Западе берут деньги.
Что выложили
Kimi K2.7 Code — это модель на 1 трлн параметров архитектуры MoE, открытая под лицензией Modified MIT. Веса можно скачать и развернуть у себя; работа идёт через Kimi Code CLI и API, совместимый с интерфейсами OpenAI и Anthropic. В отличие от предшественницы, новая версия сфокусирована именно на коде и агентных сценариях: генерация, отладка, работа с инструментами, многошаговые задачи. Никакой подписки, чтобы просто попробовать, — забрал веса и поднял локально.
Цифры, которые щёлкнули
Заголовок релиза — работа с инструментами. На бенчмарке MCPMark Verified K2.7 набрала 81,1% против 76,4% у Claude Opus 4.8. То есть открытая модель аккуратнее вызывает инструменты через MCP, чем закрытый флагман, который стоит около $5 за миллион входных и $25 за миллион выходных токенов. Прирост над прошлой версией K2.6 заметный: +21,8% на собственном Kimi Code Bench v2 (с 50,9 до 62,0) и на 30% меньше «лишних» рассуждений — модель меньше переусложняет. Разрыв до GPT-5.5 на том же тесте сжался с 18 пунктов до семи.
Где всё ещё отстаёт
На MLS Bench Lite — тесте на изобретение новых методов машинного обучения — Opus 4.8 выдаёт 81,3%, а K2.7 лишь 35,1%. На переднем крае, где нужно не решить известную задачу, а придумать новый подход, закрытые модели пока уверенно впереди. Открытые догоняют в инженерии, но не в изобретении. Честная картина выглядит так: на массовых рабочих задачах по коду разрыв уже косметический, а вот на исследовательской кромке он всё ещё в пользу дорогих лабораторий.
Почему это геополитика, а не просто релиз
Kimi встаёт в один ряд с DeepSeek, Qwen, GLM и MiniMax — потоком китайских открытых релизов. Стратегия видна невооружённым глазом: подорвать подписочную ренту западных лабораторий, раздавая веса даром. Это продавец лопат, который вместе с лопатой выкладывает чертежи — и тем обнуляет премию за «секретный рецепт».
Есть и второй, неочевидный плюс открытости. Модель, которую ты скачал и держишь у себя, нельзя втихую подкрутить из облака — никто не «деградирует» твой ответ незаметно и не сменит правила задним числом. После историй со скрытыми ограничениями в закрытых моделях это уже не мелочь, а аргумент.
Если интересно — встретимся у меня в Telegram-канале @wbindexes