Kimi-K2: китайская LLM бросает вызов GPT-4 и Claude

Китайская Moonshot AI представила открытую языковую модель Kimi-K2, построенную по архитектуре Mixture-of-Experts, что позволяет масштабировать модель без резкого увеличения вычислительных затрат. По заявлению компании, модель доступна в двух вариантах: Kimi-K2-Base для дообучения и Kimi-K2-Instruct — для готового использования в задачах общения и автономных агентов.

Kimi-K2 разработана не как чат-бот, а как «агент» — система, способная автономно выполнять сложные задачи: вызывать внешние инструменты, писать и отлаживать код, анализировать данные, управлять веб-приложениями и выполнять последовательности действий без участия человека.

По результатам тестов, опубликованных разработчиками, Kimi-K2-Instruct показывает высокие результаты: 53,7% на LiveCodeBench (GPT-4.1 — 44,7%), 97,4% на MATH-500 (у GPT-4.1 — 92,4%) и 71,6% на SWE-bench Verified (Claude Sonnet 4 — ~72,7%, GPT-4.1 — 54,6%).

Модель обучалась с использованием оптимизатора MuonClip, который, как утверждает Moonshot AI, обеспечил стабильную тренировку без сбоев — редкость для моделей такого масштаба. По оценке компании, этот подход снижает затраты на обучение и делает масштабирование более доступным.

Kimi-K2 распространяется по открытой лицензии MIT с дополнительным условием: при использовании модели в продуктах с аудиторией более 100 млн активных пользователей в месяц или выручкой свыше 20 млн долл. в месяц необходимо явно указывать название Kimi K2 в интерфейсе. Доступна через API и для локального запуска, модель стоит 0,60 долл. за миллион токенов ввода и 2,50 долл. за вывод — по данным компании, это в 5 раз дешевле, чем у аналогов вроде Claude 4 и Gemini 2.5.