Alibaba выпустила модель Qwen3 Next, «рассуждающая» версия которой «превосходит» Gemini 2.5 в тестах компании

Её добавили в бесплатный чат-бот Qwen.

В тестах компании на написание кода, решение математических задач и общие знания её «рассуждающая» версия «превзошла» Gemini 2.5 Flash Thinking от Google.
Qwen3 Next — модель на 80 млрд параметров, но она может использовать только 3 млрд для обработки одного ответа. Это позволяет увеличить скорость и «снизить стоимость» для разработчиков. Она оптимизирована для понимания «сверхдлинного» контекста — более 32 тысяч токенов. Общая длина контекста — 256 тысяч токенов.
Работа с «рассуждающей» Qwen3-Next-80B-A3B-Thinking через API стоит $0,5 за 1 млн входных токенов и $6 за 1 млн выходных (42 рубля и 506 рублей по курсу ЦБ на 12 сентября 2025 года). С базовой Qwen3-Next-80B-A3B-Instruct — $0,5 и $2 за 1 млн токенов соответственно (42 рубля и 168 рублей). Веса модели выложили на HuggingFace.