Workflow
Alibaba unveils Qwen 3, a family of ‘hybrid' AI reasoning models
TechCrunch·2025-04-28 21:37

模型发布与性能 - 阿里巴巴发布Qwen 3系列AI模型 包含从6亿到2350亿参数的多个版本 部分模型性能宣称超越谷歌和OpenAI的最优模型 [1][2] - 最大模型Qwen-3-235B-A22B在编程竞赛平台Codeforces上以2056分超越OpenAI的o3-mini(1891分)和谷歌Gemini 2 5 Pro 在数学基准测试AIME最新版及推理能力测试BFCL中也优于o3-mini [6][8][9] - 公开版本Qwen3-32B在多项测试中超越OpenAI的o1模型 包括准确率基准LiveBench(77 1分对75 7分) 并与中国AI实验室DeepSeek的R1模型竞争 [10][9] 技术特性与训练 - 模型采用混合架构 支持复杂问题的耗时推理与简单请求的快速响应 具备自我事实核查能力 但延迟较高 [4] - 训练数据涵盖36万亿token(约合2 7万亿单词) 包含教科书、问答对、代码片段等多类型数据 支持119种语言 [5] - 强化工具调用能力与指令遵循性能 可适配特定数据格式 通过云服务商Fireworks AI和Hyperbolic提供 [11] 行业影响与生态 - 中国原生模型系列崛起加剧美国AI实验室竞争压力 推动政策限制中国AI公司获取训练所需芯片 [3] - 开源模型通过Hugging Face和GitHub平台开放下载 采用开放许可 体现开源模型与闭源系统性能持平趋势 [2][11][12] - 行业专家指出 尽管美国加强芯片销售限制 但Qwen 3等尖端开源模型将在中国国内广泛应用 反映企业同时开源自建工具与采购闭源模型的双轨策略 [12]