Workflow
GPT-5编程专用版发布,独立连续编程7小时,简单任务提速10倍,VS Code就能用
36氪·2025-09-16 02:01

模型性能提升 - 推出GPT-5-Codex特化版模型,支持独立连续编程7小时,并集成IDE插件版至VS Code和Cursor等开发环境[1] - 新模型具备"真·动态思考"能力,可在执行任务过程中实时调整算力分配,例如处理问题时可能动态追加1小时计算资源[2] - 在SWE-bench Verified测试中表现略优于原版GPT-5,代码重构任务成功率提升近20%[5] - 简单任务输出token数比GPT-5减少93.7%,响应速度提升10倍;复杂任务输出token量增加102.2%,推理时间延长至两倍[8] 代码审查能力 - 经过专门代码审查训练,对开源项目PR的错误评论率从13.7%降至4.4%,高影响力评论比例从39.4%提升至52.4%[11] - 具备理解PR意图、遍历代码库及依赖关系、运行测试验证的完整能力[11] - 在OpenAI内部已审查绝大多数PR,每日发现数百个问题[13] 生态系统升级 - 重构整个Codex产品体系,CLI支持图像输入功能,可处理截图、线框图和设计稿[14] - 集成待办事项列表、网络搜索和MCP工具,终端界面优化工具调用与diff展示[14] - 审批模式简化为三级权限:只读模式需明确批准、自动模式工作区内全权限、完全访问模式可执行带网络访问命令[14] - IDE扩展支持云端与本地无缝切换,可在IDE创建云任务并保持全上下文信息[14] 基础设施优化 - 通过容器缓存技术使新任务和后续任务的中位完成时间缩短90%[15] - 自动扫描并执行设置脚本,运行时通过pip install等命令获取依赖[15] - 前端任务中可自主启动浏览器查看构建结果,迭代改进并附加截图至任务和GitHub PR[15] 市场竞争态势 - 升级时机恰逢Claude Code因模型质量下降出现用户退订潮,公司趁机抢占AI编程市场份额[16] - 市场存在对微软Copilot升级的期待,此前.NET Runtime项目曾受限于AI能力不足[18]