Обновили Qwen3
И Alibaba явно собирается серьезно конкурировать с остальными моделями в номинации самый чудесный нейминг.
Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.
Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
Модель стала быстрее, проводили тесты на RTX4090. В бенчах опережает Claude 4 и DeepSeek V3. В некоторых тестах дышит в спину Gemini 2.5 Pro. Также увеличили окно контекста, что позволяет грузить больше файлов.
Пу сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно.
А, ну и еще вышел Qwen3-Coder.
Отдельная версия для кодеров. Архитектура 480B суммарно, 35B активных. Контекст 256 000 токенов, можно растянуть до 1M. По задачам для разработки держится на уровне Claude Sonnet и GPT-4.1, а DeepSeek V3 остается позади.
#LLM@TochkiNadAI
Подписывайтесь на Telegram Точки над ИИ.