Обновили Qwen3

И Alibaba явно собирается серьезно конкурировать с остальными моделями в номинации самый чудесный нейминг.

Обновили Qwen3

Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.

Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.

Модель стала быстрее, проводили тесты на RTX4090. В бенчах опережает Claude 4 и DeepSeek V3. В некоторых тестах дышит в спину Gemini 2.5 Pro. Также увеличили окно контекста, что позволяет грузить больше файлов.

Пу сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно.

А, ну и еще вышел Qwen3-Coder.

Отдельная версия для кодеров. Архитектура 480B суммарно, 35B активных. Контекст 256 000 токенов, можно растянуть до 1M. По задачам для разработки держится на уровне Claude Sonnet и GPT-4.1, а DeepSeek V3 остается позади.

#LLM@TochkiNadAI

Подписывайтесь на Telegram Точки над ИИ.

1
1 комментарий