开源模型发布 - OpenAI推出两款开源模型GPT-oss-120b和GPT-oss-20b,这是自2020年发布GPT-2以来首次推出开源语言模型 [2] - 两款模型采用专家混合(MoE)架构的Transformer,以减少活跃参数数量 [3] - GPT-oss-120b每个token激活5.1亿参数,总参数量为1170亿;GPT-oss-20b激活3.6亿参数,总参数量为210亿 [3] - 模型支持高达128k的上下文长度,GPT-oss-20b需要至少16GB显存,GPT-oss-120b需要至少60GB显存 [3] 性能表现 - GPT-oss-120b在核心推理基准测试中表现接近OpenAI o4-mini,在竞赛编码、通用问题求解等方面超越o3-mini [4] - GPT-oss-120b在健康相关查询和竞赛数学表现上优于o4-mini [4] - GPT-oss-20b在相同评估中达到或超过o3-mini性能,尤其在竞赛数学和健康领域表现突出 [4] 战略转变与竞争 - OpenAI此次开源模型发布是对市场趋势的回应,旨在重新融入开源生态 [5] - 谷歌DeepMind于8月4日宣布推出第三代通用世界模型Genie 3,加剧市场竞争 [5] - OpenAI与英伟达、AMD等芯片制造商合作,确保模型在各种芯片上良好运行 [5] 模型安全性与市场预期 - 两款开放模型相比o3和o4-mini更容易出现"幻觉"现象,GPT-oss-120b和GPT-oss-20b分别对49%和53%的问题产生幻觉 [6] - OpenAI在预训练期间过滤了与化学、生物、放射性等相关的有害数据 [6] - 市场普遍预期OpenAI的下一个重大更新将是推出GPT-5 [6] GPT-5预期 - GPT-5将整合GPT系列基础模型、o系列推理模型以及GPT-4o全模态模型的三方能力 [7] - GPT-5单次推理的算力消耗不会大幅增加,API价格或较GPT-4o仅小幅增长甚至维持不变 [7] - GPT-5推理性价比有望提升一倍以上,将显著改善AI应用的盈利能力 [7]
OpenAI 推出两款开源模型,GPT-5蓄势待发!
经济观察报·2025-08-06 06:36