Ася Карпова

Alibaba выпустила рассуждающую модель QwQ-Max в превью-версии

В тесте на программирование LiveCodeBench на GitHub она обошла DeepSeek-R1-Preview.

Китайская компания добавила модель в чат-бот Qwen Chat. Для работы с ней нужно нажать кнопку Think и выбрать модель Qwen 2.5-Max, на базе которой создана QwQ-Max-Preview.

Кнопка Think в чат-боте. Источник: Qwen

По заявлениям Alibaba, рассуждающая модель справляется с математическими задачами и написанием кода лучше Qwen 2.5-Max, а также подходит для создания ИИ-агентов с «высокой производительностью».

Модель QwQ-Max-Preview написала скрипт для p5.js для сферы с 100 прыгающими шариками внутри. Источник: Qwen

В тесте LiveCodeBench, который помогает оценить навыки языковых моделей в написании кода, QwQ-Max-Preview обошла DeepSeek-R1 в версии Preview и o1 от OpenAI в версии Medium.

Результаты языковых моделей в тесте на программирование из 279 задач. Источник: LiveCodeBench

В «ближайшее время» компания планирует выпустить полную версию QwQ-Max и выложить её исходный код. Также запустят приложение чат-бота Qwen для Android и iOS.
24 февраля 2025 года Alibaba заявила, что инвестирует более $52 млрд в создание облачных платформ и ИИ-инфраструктуры.

Ася Карпова

Новая Qwen 2.5-Max от Alibaba и модели DeepSeek — чем отличаются продукты китайских разработчиков

Последняя модель Qwen, по заявлениям компании, превосходит DeepSeek V3.

Qwen 2.5-Max написала код для игры «Змейка»

#новости #alibaba

66

22

11

99

22 комментария

Суцкевер Семен - Fond&Flow

Чатботы в 2025 году:

4

Ответить

и каждый из них самый умный

4

Ответить

Когда будут осуждающие модели?

3

Ответить

Серафима Зоряева

Для этого есть люди.

Ответить

Видимо пик нейросеток пройден, обучать более не чем. Осталось только собрать в одну кучу все видеокарты на планете и посмотреть что они выплюнут.

1

Ответить

Митряев Денис

Ну, ещё нужно научить их не врать при отсутствии знаний)

2

Ответить

Андрей Шевчук

Ответить

Раскрывать всегда