云栖大会上阿里发布Qwen3-Max,跻身全球前三
产品发布与性能表现 - 阿里通义旗舰模型Qwen3-Max于2025云栖大会亮相 性能跻身全球前三 包含指令和推理两大版本 [1] - 模型预训练数据量达36T tokens 总参数超过万亿 拥有极强编程能力和工具调用能力 [1] - Instruct版本在SWE-Bench Verified测试中获得69.6分 位列全球第一梯队 [1] - 在Tau2-Bench工具调用测试中获得74.8分 超过Claude Opus4和DeepSeek-V3.1 [1] 技术突破与创新 - 推理增强版本Qwen3-Max-Thinking-Heavy结合工具调用和并行推理技术 在数学推理测试AIME25和HMMT中均获满分100分 为国内首次突破 [3] - 模型通过写代码解题及增加计算资源实现性能提升 展现卓越推理能力 [3] - 通过持续增长数据和参数规模验证Scaling Law有效性 性能突破显示规模化路径仍具潜力 [5] 产品体系与商业化 - 通义千问系列实现从0.5B到超万亿参数的全尺寸覆盖 包含三百多个大模型 满足不同场景需求 [5] - 用户可通过通义千问QwenChat免费体验Qwen3-Max 或通过阿里云百炼平台调用API服务 [5]