通义千问QwenChat

搜索文档
阿里发布Qwen3-Max,宣布性能超GPT5,跻身全球前三
新浪科技· 2025-09-24 05:27
产品发布 - 阿里发布通义旗舰模型Qwen3-Max 性能超过GPT5和Claude Opus 4 跻身全球前三[1] - 模型包括指令版本和推理版本 预览版在Chatbot Arena排行榜位列第三[1] - 正式版性能有望再度实现突破[1] 技术规格 - Qwen3-Max为通义千问家族中最大最强的基础模型 预训练数据量达36T tokens 总参数超过万亿[1] - 拥有极强编程能力和Agent工具调用能力[1] - 在SWE-Bench Verified测试中Instruct版本获得69.6分 位列全球第一梯队[1] - 在Tau2-Bench测试中取得74.8分 超过Claude Opus4和DeepSeek-V3.1[1] - 推理增强版本Qwen3-Max-Thinking-Heavy在AIME 25和HMMT测试中均获满分100分[1] 产品体系 - 通义千问系列模型实现从0.5B到超万亿参数的全尺寸覆盖[2] - 包含三百多个大模型 可满足不同场景需求[2] 服务接入 - 用户可在通义千问QwenChat上免费体验Qwen3-Max[2] - 可通过阿里云百炼平台调用API服务[2]