人工智能编程助手

搜索文档
刚刚,OpenAI发布GPT-5-Codex:可独立工作超7小时,还能审查、重构大型项目
机器之心· 2025-09-16 00:22
产品发布与核心能力 - OpenAI发布GPT-5-Codex,专为智能体编程任务优化,训练重点为真实软件工程任务,具备快速响应和独立处理冗长任务的能力 [1] - 模型在SWE-bench Verified和Code refactoring tasks基准测试中准确度优于GPT-5 (high),且首次使用全部500个任务(此前仅用477个) [8][10] - 可根据任务复杂度动态调整思考时间,交互式会话响应快,复杂任务可持续运行超7小时 [11][12] - 在用户请求token最少10%的场景下,token消耗比GPT-5少93.7%;在token最多10%的场景下会投入更多时间深入推理 [12] 功能特性与性能表现 - 具备代码审查能力,可主动发现关键漏洞,通过遍历代码库、分析依赖和运行测试验证正确性,审查意见错误率更低且更聚焦关键问题 [1][14] - 支持前端任务(生成桌面应用、优化移动网站)和云端任务(读取图片截图并返回结果),深度优化Codex CLI、IDE插件及GitHub集成 [16] - 结合交互式会话与持久自主执行能力,支持完整项目构建、功能开发、测试编写、调试和大规模重构 [8] 产品集成与用户体验 - 已在Codex所有使用场景上线(包括CLI、IDE扩展、网页端、移动设备及GitHub代码审查),并为云端任务和代码审查的默认模型 [3] - 发布2.5小时后流量占Codex总流量40%,预计当日成为流量主体 [3] - 用户可通过Codex CLI或IDE插件在本地任务中选择使用,且与ChatGPT账号打通实现无缝切换环境 [3][4] 开发工具升级 - Codex CLI开源并重新设计,支持直接添加图片(如截图、线框图)建立共享上下文,集成待办清单跟踪进度,支持web搜索和MCP工具连接 [19] - CLI提供三种批准模式:只读(需明确批准)、自动(工作区内自动执行)、完全访问(可读任意文件并运行命令) [22] - IDE插件支持VS Code及其分支,支持无缝预览本地改动并直接修改代码,终端界面工具调用和代码差异显示格式更清晰 [20][21] 云端与GitHub集成 - 云端Codex支持图片上传(如UI设计规范或bug截图),并在浏览器中自检效果后附截图至任务或PR [23] - 通过缓存容器使新任务和跟进任务完成时间缩短90%,自动执行环境配置脚本及依赖安装命令 [25] - GitHub集成支持自动代码审查(PR从草稿变为可审查状态时自动分析),用户可通过"@codex review"指令手动请求审查或指定审查类型 [34] 安全与权限管理 - 默认在沙箱环境中运行且关闭网络访问,避免有害操作和提示词注入风险 [34] - 执行危险操作前会请求许可,并经过训练以命令验证输出;支持可配置安全设置(如限制网络域名、批准命令执行) [34] - 在生物与化学领域任务中归类为High能力,并采取相应安全措施减少潜在风险 [30] 商业化与可用性 - 包含在ChatGPT Plus、Pro、Business、Edu和Enterprise订阅中 [3][32] - Plus/Edu/Business用户支持每周数次集中编程会话,Pro用户支持整周多项目完整工作量 [35] - Business计划可额外购买积分突破上限,Enterprise计划提供共享积分池并按实际使用付费 [36] - 暂未开放API Key访问,但即将通过API开放GPT-5-Codex [36]