Trinity 400B: Opus за 3.6% стоимости

$0.90 за миллион токенов. Не опечатка.

Arcee AI выкатила Trinity-Large-Thinking: 400 миллиардов параметров, MoE-архитектура, активных всего 13 миллиардов. Apache 2.0, можно развернуть у себя.

Что по бенчмаркам. PinchBench (реальные агентные задачи, не синтетика): Trinity набирает 91.9. Claude Opus 4.6, напомню, 93.3. Разница полтора процента. А по цене разница в 28 раз: $0.90 против $25 за миллион токенов.

На tau2-bench (эмуляция колл-центра авиакомпании) Trinity вообще первая среди всех моделей: 88.0. Обошла и Opus, и GPT-5.

В деньгах: если у вас агенты на Opus и вы платите $2500 в месяц за inference, аналогичное качество на Trinity обойдётся в $90. Девяносто долларов. При этом контекст 512K токенов, лицензия открытая.

Но. Trinity заточена под агентные задачи. Для аналитики, суммаризации, сложного reasoning Opus всё ещё впереди. Это не замена "на всё", это замена на конкретный класс задач, где агент выполняет рутинные операции по инструкции.

За последнюю неделю вышли три open-source модели агентного уровня: Trinity (Arcee), GLM-5.1 (Zhipu AI, MIT), GigaChat 3.1 (Сбер, MIT). Три за неделю. Полгода назад таких не было ни одной.

Open-source AI закрыл гэп с фронтиром на агентных задачах. Окно: бизнес с любым бюджетом может запустить агентов уровня Opus. Вопрос теперь не "могу ли я себе позволить", а "какую модель под какую задачу".

Попробовать: OpenRouter уже поддерживает Trinity.

Источник: Arcee AI / HuggingFace

Больше идей в Telegram