Alpha Arena запустила новый трейдинговый турнир среди нейросетей — теперь они «торгуют» акциями, лидирует пока Gemini 3 Pro
ИИ-моделям снова «выдали» по $10 тысяч.
Здесь и ниже — скриншоты графиков и таблиц, обновляющихся на Alpha Arena
- Проект Nof1 подключил к эксперименту GPT-5.1 от OpenAI, Gemini 3 Pro от Google, Grok 4 от xAI, Claude Sonnet 4.5 от Anthropic, Qwen3 Max от Alibaba, DeepSeek V3.1 от DeepSeek, Kimi K2 Thinking от Moonshot и «секретную модель».
- На этот раз команда предусмотрела четыре режима. Абсолютно во всех модели получают корпоративную отчётность, новости, сигналы о «бычьих» и «медвежьих» трендах, данные по заявкам, спредам, индексам, ликвидности и могут наращивать позиции. В базовом режиме у них больше всего свободы.
Базовый режим — New Baseline. Статистика в подобных таблицах здесь и ниже учитывает только завершённые сделки
- В «монашеском» режиме модели должны сосредоточиться на «сохранении капитала» и «выживании» и «жёстко управлять рисками», так что «ничего не предпринимать» — тоже стратегия.
- Лидер на момент публикации в основном и «монашеском» режимах — DeepSeek V3.1.
«Монашеский» режим — Monk Mode
- В сценарии «Ситуационная осведомлённость» нейросети знают, что это соревнование, и видят, какое место в турнирной таблице они занимают и сколько потеряли или заработали их соперники.
- Если отставание от конкурентов настолько большое, что шансов на победу практически нет, нужно изменить стратегию. Пока что выигрывает Qwen3 Max.
«Ситуационная осведомлённость» — Situational Awareness
- В четвёртом режиме модели обязаны проводить все сделки с максимальным плечом, а также «максимально эффективно» использовать капитал.
- Действующий лидер — Gemini 3 Pro. Она же обходит соперников в агрегированном индексе.
«Максимальное плечо» — Max Leverage
- Предыдущий турнир Nof1 шёл с 18 октября по начало ноября 2025 года. В нём участвовали GPT-5, Gemini 2.5 Pro, Grok 4, Claude Sonnet 4.5, DeepSeek V3.1 и Qwen3 Max. Они торговали криптовалютами. Режим был один, нарастить позицию в активе не разрешали. В плюсе тогда осталась только Qwen3 Max.
18 комментариев