Workflow
拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此
量子位·2025-09-06 04:21

模型规模与性能提升 - 总参数量达到1万亿,是阿里迄今为止最大的模型,相比前代Qwen3(235B)参数规模扩大四倍[1][2] - 新版本在中英文理解、复杂指令遵循、工具调用等维度实现显著增强,并大幅减少知识幻觉[2] - 模型在官方测评中超越前代最强模型Qwen3(235B)及包括Claude Opus 4在内的国内外竞争对手[4] 技术特性与功能 - 支持多模态输入,可直接上传图片进行交互[12] - 仅支持非思考模式,不再使用混合思维模式[10] - 原生支持上下文长度262,144 token,最大输入258,048 token,最大输出32,768 token[28] - 代码生成速度达到每秒107个token,可生成4,467个token[23] 实际应用测试 - 成功解答AIME数学竞赛题,答案与标准答案"204"一致[11][13] - 快速生成p5js可交互动画代码并成功运行[15][16] - 一次性成功生成扫雷游戏代码,无需反复调试[18][19] - 能够生成介绍自身的可交互网站,支持文件保存和实时预览功能[20][21] 商业化进展 - 模型已全面上线,可通过通义APP、Qwen Chat网页和阿里云API体验[3] - API采取阶梯计费:0-32K token输入每百万$1.2,32K-128K token输入每百万$2.4[27][28] - 开源负责人透露正式版即将发布,且对继续扩展模型规模充满信心[30][32] - 按照以往节奏,预计推理版本可能在几天后发布(参考Qwen3-235B推理版仅隔4天)[34] 市场反响 - 国内外反响热烈,用户对模型规模扩张表示期待[6] - 开发者评价"再次令人惊叹",认可模型性能提升[7] - 开源阵营对后续版本保持高度期待[28]