Вышла Kimi K2.5 — Denis Shiryaev на vc.ru

Главная новая фича — рои агентов, модель натренировали делегировать подзадачи другим инстансам самой себя. Она может использовать одновременно до сотни субагентов, но, к сожалению (или к счастью), субагенты вроде не могут спавнить других субагентов. Мне кажется это скоро поправят и мы увидим сложнейшие оргчарты для выполнения простейших задач. Кроме более высокого качества выполнения задач, Agent Swarm выполняет задачи вплоть до 4.5 раз быстрее.

Кроме этого модель теперь понимает изображения, что особенно прокачало её в задачах разработки фронтенда. Ну и бенчмарки тоже выросли, примерно до уровня текущих SOTA моделей, но тестить как всегда нужно самим.

Как и K2 Thinking, веса модели распространяется в int4, что делает инференс триллиона параметров чуть менее болезненным, особенно на фоне заоблачных цен на оперативку.

Вместе с релизом модели, Kimi опенсорснули свой vendor verifier — тест для замера качества инференса модели у разных провайдеров. Такие тесты качества инференса критически важны как для дебаггинга, так и для выявления нечистых на руку провайдеров.

Модель доступна в чате, API и также в собственном CLI кодинг агента, с немудрённым названием Kimi Code. Он доступен как и по подписке (от $20 в месяц), так и с прямой оплатой API.

Блогпост

Веса

@ai_newz

Подписывайтесь на Telegram Denis Sexy IT 🤖.