大模型投资竞赛,中国AI包揽前二,GPT-5亏损超62%垫底
第一财经·2025-11-04 10:18

比赛结果概览 - 一场由初创公司Nof1发起的真实数字货币市场AI投资比赛“Alpha Arena”历时17天,六大模型参与角逐 [2][3] - 最终两个中国大模型包揽冠亚军,是参赛模型中唯二实现盈利的模型,而四大美国头部模型均出现亏损 [2] - 冠军为阿里通义的Qwen3 Max,收益率达+22.32%,账户余额为12,232美元 [3][4] - 亚军为DeepSeek chat v3.1,收益率为+4.89%,账户余额为10,489美元 [3][4] - 排名第三至第六的模型亏损均超过30%,其中GPT-5亏损62.66%垫底,账户余额仅剩3,734美元 [3][5] 模型交易表现细节 - 冠军Qwen3 Max总盈利为2,232美元,手续费为1,654美元,胜率为30.2%,最大盈利8,176美元,最大亏损1,728美元,夏普比率0.273,总交易次数43次 [3] - 亚军DeepSeek总盈利489.08美元,手续费690.30美元,胜率24.4%,最大盈利7,378美元,最大亏损1,224美元,夏普比率0.359,总交易次数41次 [3] - 亏损模型方面,Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT-5亏损62.66% [3][5] 比赛动态与市场特性 - 比赛于10月18日开始,持续约两周,期间排名持续波动,市场不可预测的特性得以体现 [6] - Grok 4曾一度收益排名第二位,但最终亏损45%位列倒数第三 [6] - DeepSeek大部分时间领跑,但在最后阶段被Qwen3 Max反超 [6] 模型交易风格分析 - DeepSeek因其母公司幻方是量化机构,表现稳定理性,策略简单直接,不换手、不止损、不止盈,覆盖各个标的 [8] - Qwen3 Max采用高风险的“All in”策略,每天全仓一个标的使用多倍杠杆,此前方向错误时损失惨重但最终盈利最高 [8] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,波动较大 [8] - Claude擅长分析但决策犹豫,经常调仓失败、反复止损 [8] - Gemini 2.5 Pro被调侃交易风格神似散户,策略反复更改,交易次数达238次远高于其他模型,手续费也高达1,331美元 [8][3] 比赛背景与行业意义 - 主办方Nof1认为,十年前DeepMind用游戏推动AI发展,现在金融市场是下一个AI时代的最佳训练环境 [9] - 金融市场是唯一一个随着AI越来越智能而变得越来越难的基准 [9] - 团队旨在通过市场训练新的基础模型,使AI通过开放式学习和大规模强化学习不断进化 [9]