Kimi выкатила открытую модель, которая обходит Opus

Сегодня китайская Moonshot AI выложила Kimi K2.7 Code — открытую модель на триллион параметров, заточенную под программирование. На ключевом бенчмарке по работе с инструментами она обошла Claude Opus 4.8, доступ к которому стоит подписки. Ещё один кирпич в стену: китайские лаборатории догоняют — и раздают бесплатно то, за что на Западе берут деньги.

Kimi выкатила открытую модель, которая обходит Opus

Что выложили

Kimi K2.7 Code — это модель на 1 трлн параметров архитектуры MoE, открытая под лицензией Modified MIT. Веса можно скачать и развернуть у себя; работа идёт через Kimi Code CLI и API, совместимый с интерфейсами OpenAI и Anthropic. В отличие от предшественницы, новая версия сфокусирована именно на коде и агентных сценариях: генерация, отладка, работа с инструментами, многошаговые задачи. Никакой подписки, чтобы просто попробовать, — забрал веса и поднял локально.

Цифры, которые щёлкнули

Заголовок релиза — работа с инструментами. На бенчмарке MCPMark Verified K2.7 набрала 81,1% против 76,4% у Claude Opus 4.8. То есть открытая модель аккуратнее вызывает инструменты через MCP, чем закрытый флагман, который стоит около $5 за миллион входных и $25 за миллион выходных токенов. Прирост над прошлой версией K2.6 заметный: +21,8% на собственном Kimi Code Bench v2 (с 50,9 до 62,0) и на 30% меньше «лишних» рассуждений — модель меньше переусложняет. Разрыв до GPT-5.5 на том же тесте сжался с 18 пунктов до семи.

Где всё ещё отстаёт

На MLS Bench Lite — тесте на изобретение новых методов машинного обучения — Opus 4.8 выдаёт 81,3%, а K2.7 лишь 35,1%. На переднем крае, где нужно не решить известную задачу, а придумать новый подход, закрытые модели пока уверенно впереди. Открытые догоняют в инженерии, но не в изобретении. Честная картина выглядит так: на массовых рабочих задачах по коду разрыв уже косметический, а вот на исследовательской кромке он всё ещё в пользу дорогих лабораторий.

Почему это геополитика, а не просто релиз

Kimi встаёт в один ряд с DeepSeek, Qwen, GLM и MiniMax — потоком китайских открытых релизов. Стратегия видна невооружённым глазом: подорвать подписочную ренту западных лабораторий, раздавая веса даром. Это продавец лопат, который вместе с лопатой выкладывает чертежи — и тем обнуляет премию за «секретный рецепт».

Есть и второй, неочевидный плюс открытости. Модель, которую ты скачал и держишь у себя, нельзя втихую подкрутить из облака — никто не «деградирует» твой ответ незаметно и не сменит правила задним числом. После историй со скрытыми ограничениями в закрытых моделях это уже не мелочь, а аргумент.

Если интересно — встретимся у меня в Telegram-канале @wbindexes

2
2 комментария