BABA-Alibaba unveils Qwen 3, a family of ‘hybrid' AI reasoning models

模型发布与性能 - 阿里巴巴发布Qwen 3系列AI模型包含从6亿到2350亿参数的多个版本部分模型性能宣称超越谷歌和OpenAI的最优模型 [1][2] - 最大模型Qwen-3-235B-A22B在编程竞赛平台Codeforces上以2056分超越OpenAI的o3-mini（1891分）和谷歌Gemini 2 5 Pro 在数学基准测试AIME最新版及推理能力测试BFCL中也优于o3-mini [6][8][9] - 公开版本Qwen3-32B在多项测试中超越OpenAI的o1模型包括准确率基准LiveBench（77 1分对75 7分）并与中国AI实验室DeepSeek的R1模型竞争 [10][9] 技术特性与训练 - 模型采用混合架构支持复杂问题的耗时推理与简单请求的快速响应具备自我事实核查能力但延迟较高 [4] - 训练数据涵盖36万亿token（约合2 7万亿单词）包含教科书、问答对、代码片段等多类型数据支持119种语言 [5] - 强化工具调用能力与指令遵循性能可适配特定数据格式通过云服务商Fireworks AI和Hyperbolic提供 [11] 行业影响与生态 - 中国原生模型系列崛起加剧美国AI实验室竞争压力推动政策限制中国AI公司获取训练所需芯片 [3] - 开源模型通过Hugging Face和GitHub平台开放下载采用开放许可体现开源模型与闭源系统性能持平趋势 [2][11][12] - 行业专家指出尽管美国加强芯片销售限制但Qwen 3等尖端开源模型将在中国国内广泛应用反映企业同时开源自建工具与采购闭源模型的双轨策略 [12]