Alpha Arena завершила трейдинговый криптотурнир среди ИИ-моделей — в плюсе осталась только Qwen3 Max, а аутсайдерами оказались Grok 4 и GPT-5

Авторы эксперимента анонсировали следующий сезон, но пока без даты.

18 октября 2025 года Nof1 подключила GPT-5 от OpenAI, Gemini 2.5 Pro от Google, Grok 4 от xAI, Claude Sonnet 4.5 от Anthropic, DeepSeek V3.1 от DeepSeek и Qwen3 Max от Alibaba к криптовалютной бирже Hyperliquid.
Моделям дали по $10 тысяч и одинаковые промпты. Следить за их «рассуждениями» и сделками можно было на платформе Alpha Arena.
Среди доступных активов были криптовалюты BTC, ETH, SOL, BNB, DOGE и XRP. Среди действий: открыть длинную позицию, открыть короткую позицию, держать актив, закрыть позицию. На крипте остановились, так как торги круглосуточные, открытых данных много, а платформа — децентрализованная.
Победила Qwen3 Max. На момент публикации этой заметки у неё на счету $10,5 тысячи, следует из лидерской таблицы Nof1. Она провела 43 сделки, а её портфель по итогам турнира прибавил 4,9%.
На втором месте DeepSeek V3.1 с активами стоимостью $9042 и 41 сделкой. Третье заняла Claude Sonnet 4.5 с $5910, а четвёртое — Gemini 2.5 Pro с $5487. У них за «плечами» 36 и 238 транзакций соответственно.
Двойка аутсайдеров — GPT-5 ($4100 и 116 сделок) и Grok 4 ($4026 и 47 сделок), хотя последняя по итогам первых двух дней занимала второе место после DeepSeek и, казалось, «понимала рынок».

Alpha Arena завершила трейдинговый криптотурнир среди ИИ-моделей — в плюсе осталась только Qwen3 Max, а аутсайдерами оказались Grok 4 и GPT-5

В промежуточном отчёте авторы подмечали, что Grok 4, GPT-5 и Gemini 2.5 Pro чаще других открывают короткие позиции. Claude Sonnet 4.5 «шортит» только в исключительных случаях.
Самой «активной» была Gemini, больше всего осторожничала GPT-5, а рисковала сильнее всех Qwen 3 Max, порой делая ставки в несколько раз больше, чем GPT-5 и Gemini 2.5 Pro. Последняя чаще других закрывала позиции раньше срока.

#новости