Workflow
开放权重AI推理模型
icon
搜索文档
六年来首次!OpenAI发布两款开放权重AI推理模型!奥尔特曼称其为“全球最佳开放模型”
每日经济新闻· 2025-08-05 22:57
OpenAI开源模型发布 - OpenAI宣布推出两款开放权重AI推理模型GPT-OSS-120b(1170亿参数)和GPT-OSS-20b(210亿参数)[1][3] - 大模型GPT-OSS-120b可由单个英伟达专业数据中心GPU驱动 小模型GPT-OSS-20b能在16GB内存消费级笔记本运行[3] - 模型采用Apache 2.0许可证 企业商用无需付费或获得许可[5] - 这是OpenAI六年来首次推出开放权重模型 标志战略转向重要节点[6] 模型技术细节 - 采用专家混合(MoE)架构Transformer 减少活跃参数数量[6] - GPT-OSS-120b每个token激活5.1亿参数 GPT-OSS-20b激活3.6亿参数[6] - 支持高达128k上下文长度 使用交替密集和局部带状稀疏注意力模式[6] - 大模型需要至少60GB显存 小模型需要16GB显存 适配高端消费GPU和苹果芯片Mac[7] 模型性能表现 - GPT-OSS-120b在核心推理基准测试接近OpenAI o4-mini表现[7] - 在Codeforces、MMLU、HLE、TauBench等测试优于o3-mini 匹敌甚至超越o4-mini[7] - 在HealthBench和AIME竞赛数学表现超过o4-mini[7] - GPT-OSS-20b在同类评估中匹敌甚至超越o3-mini[7] - 两款模型在PersonQA基准测试中幻觉率分别为49%和53% 高于o4-mini的36%[11] 行业合作与竞争 - 亚马逊将在Bedrock和SageMaker平台提供OpenAI开放模型 系首次合作[6] - OpenAI与英伟达、AMD、Cerebras和Groq等芯片商合作确保跨芯片兼容性[12] - 谷歌DeepMind同期推出第三代世界模型Genie 3 可生成720p实时交互环境[13] - Genie 3与通用智能体SIMA结合测试 为具身智能体提供训练场[14] 战略背景 - 公司承认此前在开源技术方面"站在历史错误一边" 此次发布受市场竞争压力驱动[5][12] - 模型经过广泛安全测试 过滤CBRN有害数据 恶意微调无法达到高能力阈值[12] - 公司预告本周将有"重大更新" 市场预期可能是GPT-5发布[12]