Alibaba выпустила рассуждающую модель QwQ-Max в превью-версии

В тесте на программирование LiveCodeBench на GitHub она обошла DeepSeek-R1-Preview.

  • Китайская компания добавила модель в чат-бот Qwen Chat. Для работы с ней нужно нажать кнопку Think и выбрать модель Qwen 2.5-Max, на базе которой создана QwQ-Max-Preview.
Кнопка Think в чат-боте. Источник: Qwen
Кнопка Think в чат-боте. Источник: Qwen
  • По заявлениям Alibaba, рассуждающая модель справляется с математическими задачами и написанием кода лучше Qwen 2.5-Max, а также подходит для создания ИИ-агентов с «высокой производительностью».
Модель QwQ-Max-Preview написала скрипт для p5.js для сферы с 100 прыгающими шариками внутри. Источник: Qwen
  • В тесте LiveCodeBench, который помогает оценить навыки языковых моделей в написании кода, QwQ-Max-Preview обошла DeepSeek-R1 в версии Preview и o1 от OpenAI в версии Medium.
Результаты языковых моделей в тесте на программирование из 279 задач. Источник: LiveCodeBench
Результаты языковых моделей в тесте на программирование из 279 задач. Источник: LiveCodeBench
  • В «ближайшее время» компания планирует выпустить полную версию QwQ-Max и выложить её исходный код. Также запустят приложение чат-бота Qwen для Android и iOS.
  • 24 февраля 2025 года Alibaba заявила, что инвестирует более $52 млрд в создание облачных платформ и ИИ-инфраструктуры.
66
22
11
22 комментария

Чатботы в 2025 году:

4

и каждый из них самый умный

4

Когда будут осуждающие модели?

3

Для этого есть люди.

Видимо пик нейросеток пройден, обучать более не чем. Осталось только собрать в одну кучу все видеокарты на планете и посмотреть что они выплюнут.

1

Ну, ещё нужно научить их не врать при отсутствии знаний)

2
Раскрывать всегда