Alibaba бросает вызов OpenAI и Google: Qwen3 — новичок с амбициями
Китайская технокомпания Alibaba решила не отставать от больших ИИ-игроков и выкатить свою новинку — семейство языковых моделей Qwen3, которые, по словам разработчиков, запросто могут тягаться с лучшими творениями от Google и OpenAI или даже их обогнать.
Большинство моделей либо уже доступны, либо вот-вот появятся в открытом доступе на Hugging Face и GitHub. Размеры на любой вкус: от «мини» на 0,6 миллиарда параметров до «монстра» на 235 миллиардов.
Китай наступает, а США нервничают
Появление Qwen3 добавило жара в котёл мировой гонки ИИ. Китайские модели активно догоняют — и местами обгоняют — американских гигантов, что вынуждает OpenAI крутиться быстрее. Тем временем политики в Штатах под шумок продолжают ограничивать доступ Китая к чипам, потому что кто ж хочет делиться оружием для следующей цифровой битвы?
Что умеет Qwen3?
Если верить анонсу от самой Alibaba и словам инсайдеров, в новой линейке восемь моделей — две с архитектурой MoE (внутренний «коллектив экспертов») и шесть классических плотных (dense layers). Флагман — Qwen3-235B-A22B — уже блеснул на бенчмарках по программированию, математике и прочей интеллектуальной тяжёлой артиллерии.
«Мы сшили вместе режимы “думаю” и “не думаю”, чтобы каждый пользователь мог сам управлять “бюджетом на размышления”», — сообщает команда Qwen в своём блоге.
Логично: хочешь быстро — получи ответ сразу, хочешь поумнее — подожди чуть дольше, но с рассуждением.
Умные «эксперты» и миллиардные токены
Некоторые модели внутри Qwen3 используют ту самую смесь экспертов (MoE) — архитектуру, которая разбивает задачу на части и кидает их не в одну кучу, а специализированным подмоделям. Это и быстро, и экономно.
Под капотом — 119 языков и датасет на 36 триллионов токенов. Миллион токенов эквивалентен 750 000 слов — при том, что стандартный объем обычной книги составляет около 50 000 слов. Звучит, мягко говоря, внушительно.
Кто круче: Qwen или OpenAI?
На платформе Codeforces Qwen-3-235B-A22B немного, но всё же обгоняет o3-mini от OpenAI и Gemini 2.5 Pro от Google. А в сложных тестах вроде AIME (олимпиадная математика) и BFCL (проверка ИИ на рассудительность) Qwen тоже показывает, кто тут умнее.
Правда, есть один нюанс — самый мощный зверь из линейки пока не доступен простым смертным. Зато модель Qwen3-32B уже в открытом доступе и бодро конкурирует с другими крупными моделями — например, R1 от DeepSeek и OpenAI o1. На тестах вроде LiveCodeBench она их даже обходит.
ИИ с инструментами, стилем и облачным будущим
Alibaba также уверяет, что Qwen3 отлично справляется с вызовом инструментов, понимает инструкции и может аккуратно копировать формат данных (что редкость среди ИИ, не любящих таблички и шаблоны). Модели доступны не только для скачивания, но и через облачные платформы — Fireworks AI и Hyperbolic.
Тухин Шривастава, CEO облачного хоста Baseten, подметил: тренд очевиден — открытые модели догоняют закрытые. И хотя США ужесточают экспорт чипов в Китай, такие модели, как Qwen3, уже начали жить собственной жизнью.
«Бизнес сегодня и сам пишет инструменты, и не брезгует закупкой у закрытых ребят вроде OpenAI», — говорит он.
Иначе говоря, если раньше мир ИИ был поделен между парой американских гигантов, то теперь у китайского Qwen есть шанс пошуметь. Да ещё и с открытым кодом.