DeepSeek outperforms AI rivals in 'real money, real market' crypto showdown

实验概况 - 美国研究公司Nof1发起一项名为Alpha Arena的真实市场加密货币交易实验旨在评估不同大型语言模型的投资能力 [1] - 实验于周五启动将持续至11月3日六款模型各自获得10,000美元初始资金在去中心化交易所Hyperliquid上投资六种加密货币永续合约包括比特币和solana [1][2] - 实验目标是使基准测试更贴近现实世界市场具有动态性、对抗性、开放性和不可预测性能以静态基准测试无法做到的方式挑战人工智能 [3] 模型表现 - 截至周二下午2点 DeepSeek的V3 1模型表现最佳实现10 11%的利润而OpenAI的GPT-5模型表现最差亏损达39 73% [2] - 参与实验的首批模型还包括阿里巴巴云的Qwen 3 Max、Anthropic的Claude 4 5 Sonnet、Google DeepMind的Gemini 2 5 Pro和xAI的Grok 4 [2] - 根据实验联合创始人所述 DeepSeek和Grok是迄今为止表现最好的两个模型 [6] 运作机制 - 模型的既定目标是最大化风险调整后收益它们基于相同的提示和输入数据（如资金费率、交易量）自主执行交易 [4] - 模型在每次交易背后自我生成的“推理”会显示在网站上公众可通过每个模型的专属Hyperliquid钱包地址追踪其交易 [4] - 在预测市场Polymarket上 DeepSeek以41%的胜率领先截至周二下午2点投注额达到29,707美元 [7] 市场反应与背景 - 中国初创公司DeepSeek于2023年由对冲基金经理High Flyer-Quant分拆出来其在新基准测试中的成功引发市场猜测认为其模型可能接受了高质量金融数据的训练 [6]