Китай выпустил нового монстра - Kimi K2.5
Kimi K2.5 это мультимодальная модель, которая с нуля обучалась на vision+text датасете примерно в 15 трлн токенов. Она умеет понимать текст, изображения и видео, работать с кодом и сразу спроектирована под агентные сценарии, а не как «чатик плюс костыли инструментов».
Ключевые упоры:
- Мультимодальность «из коробки»: текст, картинки, видео в одном проходе.
- MoE‑архитектура семейства K2, заточенная под сложные рассуждения и долгие пайплайны.
- Агентность как базовая фича: управление пачкой sub‑агентов, планирование, tool calls.
В бенчмарках по программированию K2.5 уже обходит Gemini 3 Pro и GPT‑5.x на SWE‑bench и мультиязычных задачах, а в видео‑бенчмарках типа VideoMMMU догоняет и местами обгоняет крупных закрытых конкурентов вроде Claude Opus 4.5. На практике это означает: лучше понимание кода, более стабильное поведение на длинных задачах и меньше «сломанных» ответов, когда модель теряется на середине рассуждения.
Agent Swarm - рой агентов вместо одного ИИ
Самая заметная фича K2.5 режим Agent Swarm. Вместо одного агента, который последовательно жует пайплайн, модель сама порождает рой из десятков саб‑агентов.
Что внутри:
- До 100 суб‑агентов параллельно.
- До 1500 tool calls в одном сценарии.
- Ускорение сложных задач до 4.5× за счёт параллельного выполнения, а не тупого линейного прогресса.
Это прям логичное продолжение тренда от одиночных ассистентов к полноценным agent‑оркестрациям. Cursor 2.0 только недавно подвёз до 8 параллельных агентов, а Kimi уже накидывает два нуля сверху и делает это на уровне самой модели.
Coding + vision - визуальный IDE‑ассистент
Отдельный упор K2.5 - кодинг в связке с визуалом. Это не просто «модель, которая пишет функции по ТЗ», а инструмент, который:
- Собирает интерфейсы и анимации по тексту, скриншотам и даже видео.
- Делает визуальный дебаг: «что-то тут вёрстка развалилась» - модель смотрит на скрин и чинит код.
- Может воспроизвести UI по образцу из видео или mockup’а, а не только по текстовому описанию.
Под это всё выпустили отдельный инструмент Kimi Code - CLI и ассистент под VS Code, Cursor, Zed и другие IDE. По сути, прямой конкурент Claude Code и Gemini‑CLI. Можно запускать генерацию и рефакторинг кода, завязывать всё на терминал, проверять тесты, прогонять пайплайны через агента.
Если хочется не просто читать про цифры, а потрогать руками, опций несколько
- Веб‑интерфейс Kimi - базовый вход, где можно погонять модель в чат‑формате и протестировать визуальные сценарии и агентов.
- Документация по K2.5 и Agent Swarm - технические детали по архитектуре, лимитам и кейсам использования.
- API и цены на платформе Moonshot - для тех, кто хочет прикрутить модель к своим пайплайнам или собрать поверх неё собственный агентный сервис.
- Репозиторий на HuggingFace - вариант для тех, кто готов запускать модель локально или в своём облаке.
Ссылки:
- Попробовать Kimi K2.5: https://www.kimi.com
- Подробнее про модель: https://www.kimi.com/blog/kimi-k2-5.html
- API и цены: https://platform.moonshot.ai
- HuggingFace: https://huggingface.co/moonshotai/Kimi-K2.5/tree/main
Не отставайте от технологий! Подписывайтесь на Telegram-канал, чтобы быть в курсе последних трендов и лайфхаков.