生成对抗网络(GANs)

搜索文档
OpenAI的“新突破”:通用验证器
虎嗅· 2025-08-05 07:04
在下一代大模型GPT-5备受期待之际,一项名为"通用验证器"的新技术正浮出水面,揭示了OpenAI可能 用于拉开竞争差距的"秘密武器"。 OpenAI的"通用验证器"或将直接影响GPT-5模型的市场竞争力,8月4日据科技媒体The Information援引 知情人士消息报道,这项技术已被应用于GPT-5的开发过程中。 该技术的核心机制,被比作一场"证明者-验证者游戏"。简而言之,它让一个AI模型扮演"验证者"的角 色,去检查和评判另一个"证明者"模型生成的答案。通过这种内部对抗和反馈,系统性地提升模型的输 出质量。这一自动化流程旨在解决强化学习(RL)在创意写作等主观领域或数学证明等复杂领域难以 验证的瓶颈。 OpenAI内部研究人员已在社交平台X上间接证实了相关方法的有效性。研究员Noam Brown表示,这些 技术是"通用的",能让大模型"在难以验证的任务上表现得更好"。这也标志着OpenAI正试图攻克AI商 业化应用中的核心痛点——可信度。 "证明者-验证者"的对抗游戏 "通用验证器"的技术细节,最早在OpenAI于2024年7月发表的一篇题为《证明者-验证者游戏提升大语言 模型可读性》的论文中被阐述 ...
大模型下一个飞跃?OpenAI的“新突破”:通用验证器
华尔街见闻· 2025-08-05 06:07
下一代大模型GPT-5与通用验证器技术 - OpenAI正在开发名为"通用验证器"的新技术 该技术被视为提升GPT-5市场竞争力的关键武器 已应用于GPT-5开发过程 [1] - 通用验证器采用"证明者-验证者游戏"机制 通过内部对抗训练系统性提升模型输出质量 解决强化学习在主观和复杂领域的验证瓶颈 [1] - 该技术被证实具有通用性 能让大模型在难以验证的任务上表现更好 有助于攻克AI商业化应用中的可信度痛点 [1] 证明者-验证者游戏技术细节 - 技术细节发表于2024年7月OpenAI论文《证明者-验证者游戏提升大语言模型可读性》 构建了内部对抗训练框架 [2] - 框架包含"证明者"和"验证者"两种角色 验证者学习区分正误方案 证明者根据反馈优化生成能力 验证器规模适合大规模部署 [2] - 机制类似生成对抗网络(GANs) 通过"判别器"倒逼"生成器"进步 包含"靠谱证明者"和"狡猾证明者"两种模式 [2][3] 超级对齐团队的技术遗产 - 通用验证器技术源自OpenAI已解散的"超级对齐团队" 该团队由联合创始人Ilya Sutskever主导成立 [6] - 论文六位作者中仅两人仍留任 但技术成果已被整合进核心产品研发 用于解决模型对齐和可靠性问题 [6] GPT-5的市场预期与竞争格局 - GPT-5整合了曾在GPT-4试点的模型自我批判系统 市场期望达到新高 [7][8] - OpenAI CEO Sam Altman称GPT-5"在几乎所有方面都比我们更聪明" 加剧市场期待 [8] - 竞争对手xAI和谷歌也在强化学习领域加倍投入 通用验证器被视为OpenAI保持领先优势的核心资产 [8] 技术突破与现存挑战 - 通用验证器在软件编程和创意写作等主客观领域均展现改进 使AI能力向主观领域渗透 [9] - 该技术帮助OpenAI模型在国际数学奥林匹克竞赛取得突破 可验证更主观类别的答案质量 [9] - GPT-5研发面临高质量训练数据稀缺 大规模预训练收益下降 以及部署后性能衰减等挑战 [9]