大模型投资竞赛，中国AI包揽前二，GPT-5亏损超62%垫底

比赛结果概览 - 一场由初创公司Nof1发起的真实数字货币市场AI投资比赛“Alpha Arena”历时17天，六大模型参与角逐 [2][3] - 最终两个中国大模型包揽冠亚军，是参赛模型中唯二实现盈利的模型，而四大美国头部模型均出现亏损 [2] - 冠军为阿里通义的Qwen3 Max，收益率达+22.32%，账户余额为12,232美元 [3][4] - 亚军为DeepSeek chat v3.1，收益率为+4.89%，账户余额为10,489美元 [3][4] - 排名第三至第六的模型亏损均超过30%，其中GPT-5亏损62.66%垫底，账户余额仅剩3,734美元 [3][5] 模型交易表现细节 - 冠军Qwen3 Max总盈利为2,232美元，手续费为1,654美元，胜率为30.2%，最大盈利8,176美元，最大亏损1,728美元，夏普比率0.273，总交易次数43次 [3] - 亚军DeepSeek总盈利489.08美元，手续费690.30美元，胜率24.4%，最大盈利7,378美元，最大亏损1,224美元，夏普比率0.359，总交易次数41次 [3] - 亏损模型方面，Claude Sonnet 4.5亏损30.81%，Grok 4亏损45.3%，Gemini 2.5 Pro亏损56.71%，GPT-5亏损62.66% [3][5] 比赛动态与市场特性 - 比赛于10月18日开始，持续约两周，期间排名持续波动，市场不可预测的特性得以体现 [6] - Grok 4曾一度收益排名第二位，但最终亏损45%位列倒数第三 [6] - DeepSeek大部分时间领跑，但在最后阶段被Qwen3 Max反超 [6] 模型交易风格分析 - DeepSeek因其母公司幻方是量化机构，表现稳定理性，策略简单直接，不换手、不止损、不止盈，覆盖各个标的 [8] - Qwen3 Max采用高风险的“All in”策略，每天全仓一个标的使用多倍杠杆，此前方向错误时损失惨重但最终盈利最高 [8] - Grok 4交易风格激进，满仓多个标的，高频跟踪趋势，波动较大 [8] - Claude擅长分析但决策犹豫，经常调仓失败、反复止损 [8] - Gemini 2.5 Pro被调侃交易风格神似散户，策略反复更改，交易次数达238次远高于其他模型，手续费也高达1,331美元 [8][3] 比赛背景与行业意义 - 主办方Nof1认为，十年前DeepMind用游戏推动AI发展，现在金融市场是下一个AI时代的最佳训练环境 [9] - 金融市场是唯一一个随着AI越来越智能而变得越来越难的基准 [9] - 团队旨在通过市场训练新的基础模型，使AI通过开放式学习和大规模强化学习不断进化 [9]