产品发布与核心能力 - OpenAI发布了迄今为止最先进的智能体编码模型GPT-5.2-Codex,专为复杂的实际软件工程而设计 [1] - 新模型是GPT-5.2的升级版本,提高了指令遵循能力和对长远语境的理解能力,并针对智能体编码进行了进一步优化 [3] - 该模型在重构和迁移等大型代码变更中表现更佳,在Windows环境下性能更优,同时网络安全能力显著增强 [3] - 与GPT-5.2相比,GPT-5.2-Codex在编码任务的词元效率方面有显著提升,尤其是在中等和高推理水平下 [3] - 新模型融合了GPT-5.2在专业知识处理方面的优势以及GPT-5.1-Codex-Max在智能体编码和终端使用方面的前沿能力 [7] - 在长上下文理解、可靠的工具调用、事实准确性和原生压缩方面表现更佳,使其成为长时间编码任务更可靠的伙伴 [7] 性能表现与基准测试 - GPT-5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0基准测试中取得了最先进的性能(SOTA)[8] - SWE-Bench Pro要求AI生成补丁来解决实际的软件工程任务 [10] - Terminal-Bench 2.0用于在真实终端环境中测试AI智能体,任务包括编译代码、训练模型和搭建服务器 [10] - 模型能够更高效地处理大型代码库,即使在长时间会话中也能保持完整的上下文信息 [8] - 能够更可靠地完成复杂的任务,例如大型重构、代码迁移和功能构建,即使计划有变或尝试失败,也能持续迭代而不丢失进度 [8] - 更强大的视觉性能使其能够更准确地解释编码过程中共享的屏幕截图、技术图表、图表和UI界面 [11] - 可以快速将设计稿转化为功能原型,开发者可以配合使用这些原型进行生产 [12] 网络安全能力与应用案例 - GPT-5.2-Codex的网络安全能力比OpenAI迄今为止发布的任何模型都更强大 [6] - 从GPT-5-Codex开始,能力出现显著提升;GPT-5.1-Codex-Max实现大幅提升;而GPT-5.2-Codex则带来了第三次飞跃 [17] - OpenAI正在按照每个新模型都能达到“高”网络安全能力水平的标准进行规划和评估 [18] - 一位安全研究人员使用GPT-5.1-Codex-Max和Codex CLI发现并负责任地披露了React中存在一个可能导致源代码泄露的漏洞 [6] - 在尝试重现另一个React漏洞(React2Shell)时,Codex发现了一些意料之外的行为,并在短短一周内发现了之前未知的漏洞 [22] - 这表明先进的人工智能系统能够显著加快实际软件的防御安全工作 [25] 市场定位与开发者反馈 - 新模型已迅速成为Codex团队成员的日常主力工具 [3] - 在开发者社区,人们认为Codex/GPT5.x在仔细、系统地查找“问题”(无论是代码问题还是数学问题)方面是无可匹敌的 [3] - 已经有很多人开始认同使用Claude Code写代码,同时用Codex来做代码审查,让后者分析流程和发现细微bug的工作方式 [6] - 有开发者表示Codex能帮助克服拖延症,面对艰巨任务时,它几乎总能提供一个不错的起点,让开发者快速迭代改进 [6] - 新模型终于具备了推动优秀设计的空间推理能力 [4] 产品部署与访问计划 - GPT-5.2-Codex已面向付费ChatGPT用户在所有Codex平台上开放 [7] - OpenAI计划在未来几周内向API用户开放GPT-5.2-Codex的访问权限 [7] - 公司正在试点仅限受邀用户访问即将推出的功能 [7] - 为经过审核的专业人士和专注于防御性网络安全工作的组织提供更宽松的访问权限模式 [7]
OpenAI最强代码模型GPT-5.2-Codex上线
机器之心·2025-12-19 00:21