Китай выпустил нового монстра - Kimi K2.5

Kimi K2.5 это мультимодальная модель, которая с нуля обучалась на vision+text датасете примерно в 15 трлн токенов. Она умеет понимать текст, изображения и видео, работать с кодом и сразу спроектирована под агентные сценарии, а не как «чатик плюс костыли инструментов».

Ключевые упоры:

  • Мультимодальность «из коробки»: текст, картинки, видео в одном проходе.
  • MoE‑архитектура семейства K2, заточенная под сложные рассуждения и долгие пайплайны.
  • Агентность как базовая фича: управление пачкой sub‑агентов, планирование, tool calls.

В бенчмарках по программированию K2.5 уже обходит Gemini 3 Pro и GPT‑5.x на SWE‑bench и мультиязычных задачах, а в видео‑бенчмарках типа VideoMMMU догоняет и местами обгоняет крупных закрытых конкурентов вроде Claude Opus 4.5. На практике это означает: лучше понимание кода, более стабильное поведение на длинных задачах и меньше «сломанных» ответов, когда модель теряется на середине рассуждения.

Китай выпустил нового монстра - Kimi K2.5

Agent Swarm - рой агентов вместо одного ИИ

Самая заметная фича K2.5 режим Agent Swarm. Вместо одного агента, который последовательно жует пайплайн, модель сама порождает рой из десятков саб‑агентов.

Что внутри:

  • До 100 суб‑агентов параллельно.
  • До 1500 tool calls в одном сценарии.
  • Ускорение сложных задач до 4.5× за счёт параллельного выполнения, а не тупого линейного прогресса.

Это прям логичное продолжение тренда от одиночных ассистентов к полноценным agent‑оркестрациям. Cursor 2.0 только недавно подвёз до 8 параллельных агентов, а Kimi уже накидывает два нуля сверху и делает это на уровне самой модели.

Coding + vision - визуальный IDE‑ассистент

Отдельный упор K2.5 - кодинг в связке с визуалом. Это не просто «модель, которая пишет функции по ТЗ», а инструмент, который:

  • Собирает интерфейсы и анимации по тексту, скриншотам и даже видео.
  • Делает визуальный дебаг: «что-то тут вёрстка развалилась» - модель смотрит на скрин и чинит код.
  • Может воспроизвести UI по образцу из видео или mockup’а, а не только по текстовому описанию.

Под это всё выпустили отдельный инструмент Kimi Code - CLI и ассистент под VS Code, Cursor, Zed и другие IDE. По сути, прямой конкурент Claude Code и Gemini‑CLI. Можно запускать генерацию и рефакторинг кода, завязывать всё на терминал, проверять тесты, прогонять пайплайны через агента.

Если хочется не просто читать про цифры, а потрогать руками, опций несколько

  • Веб‑интерфейс Kimi - базовый вход, где можно погонять модель в чат‑формате и протестировать визуальные сценарии и агентов.
  • Документация по K2.5 и Agent Swarm - технические детали по архитектуре, лимитам и кейсам использования.
  • API и цены на платформе Moonshot - для тех, кто хочет прикрутить модель к своим пайплайнам или собрать поверх неё собственный агентный сервис.
  • Репозиторий на HuggingFace - вариант для тех, кто готов запускать модель локально или в своём облаке.

Ссылки:

Не отставайте от технологий! Подписывайтесь на Telegram-канал, чтобы быть в курсе последних трендов и лайфхаков.

6
8 комментариев