Workflow
AI产业跟踪:通义Qwen3-Max正式发布,引领“参数革命”,持续关注大模型商业化进展
长江证券·2025-09-29 10:56

行业投资评级 - 看好 维持[8] 核心观点 - 通义千问Qwen3-Max正式发布 总参数超万亿 较上一代提升300% 综合性能宣布超过GPT-5和Claude Opus 4 跻身全球大模型前三阵营[2][5][11] - 模型主推Coding能力和Agent工具调用能力 HumanEval测评通过率89.7% Agent工具调用响应速度提升至0.8秒 超越GPT5的1.2秒基准线[11] - 长上下文训练支持1M长度 为金融、法律等垂直场景提供直接支撑 加速行业适配深化[11] - 验证Scaling Law仍然成立 国内模型厂商训练范式不断成熟 掌握规模化训练工程体系的核心know-how[11] - 标志国产大模型从跟跑到并跑、局部领跑的拐点 有望成功切入海外打开增长空间[11] - 持续关注国内AI Infra厂商业务进展与投入 看好Agent商业化元年及其投资机遇[2][11] 模型技术突破 - 数据与参数突破:36T tokens预训练数据量 万亿级参数规模较上一代提升300%[11] - Coding能力增强:SWE-Bench Verified测试得分69.6分 位列全球第一梯队[11] - Agent能力提升:Tau2-Bench测试得分74.8分 超过Claude Opus4和DeepSeek-V3.1[11] - 数学推理突破:Thinking版本通过集成代码解释器 AIME 25和HMMT均取得满分[11] - 训练稳定性提升:使用global-batchload实现预训练过程无loss尖刺和balancing loss[11] - 训练效率显著提升:Base版本MFU相比Qwen2.5-Max-Base提升30% 硬件故障时间损失下降为上一代的五分之一[11] 商业化应用前景 - 长序列训练采用ChunkFlow策略 获得相比序列并行方案提升3倍的吞吐收益[11] - 阿里强调AI、云基础设施、Agent平台、模型应用与算力支撑的协同路线 Qwen3-Max是重要底座角色[11] - 开源战略下行业生态整合有望加速 AI Agent落地进一步推进[11] 投资关注方向 - AI Infra龙头有望核心受益[11] - AI Agent相关厂商[11] - 中国推理算力产业链[11] - CSP厂商推理需求推动[11] - 与头部大厂合作的IDC[11]