Workflow
OpenAI发布新模型硬刚Anthropic,Claude Code刚火,就被GPT-5-Codex拍在沙滩上?
36氪·2025-09-16 10:09

产品发布与核心功能 - OpenAI于9月15日正式推出专为AI辅助编程工具设计的微调模型GPT-5-Codex [1] - 新模型具备动态"思考"时间特性 处理编码任务耗时范围从几秒到七小时不等 在代理编码基准测试中表现优于前代模型 [1][14] - 增强代码审查功能 通过匹配PR声明意图与实际差异、推理完整代码库及依赖项、执行代码测试验证行为 在产品发布前发现潜在关键错误 [3] 技术能力与性能表现 - 在SWE-bench Verified基准测试中表现优于GPT-5 该测试涵盖500个代码重构任务(从477个扩充而来) [8] - 对低负载任务(后10%用户轮次) token使用量比GPT-5减少93.7% 对高复杂度任务(前10%用户轮次) 推理编辑测试迭代时间为GPT-5两倍 [10] - 支持连续独立工作超过7小时 完成大型重构并迭代修复测试错误 兼具交互式配对开发与长期独立执行能力 [6][14] 产品集成与用户体验 - 已成为Codex云任务和代码审查默认设置 支持通过CLI和IDE扩展应用于本地开发环境 [4] - 整合为基于ChatGPT账号的统一产品体验 支持本地环境与云端任务无缝迁移并保持完整上下文衔接 [6] - 运行平台覆盖终端、IDE、网页、GitHub及ChatGPT iOS应用 并纳入ChatGPT Plus/Pro/Business/Edu/Enterprise套餐 [7] 市场反馈与行业影响 - 用户实测显示可自主运行长达35分钟 能一次性解决此前无法处理的Electron渲染和JSON生成问题 [15][18] - 被部分开发者认为将改写行业规则 预计可使AI生成代码比例达75% 显著降低企业成本(服务费20-200美元/月 vs 初级开发人员成本5000-10000美元/月) [18] - 推动编程重心向架构设计转移 传统初级工程师雇佣模式逐渐失去意义 [19] 行业竞争与资本动态 - AI编码工具市场持续拥挤 主要竞品包括Claude Code、Anysphere的Cursor及微软GitHub Copilot [20] - Anysphere于6月完成9亿美元融资(估值99亿美元) 年化收入约每两月翻倍 当前ARR超5亿美元(较4月中旬3亿美元增长60%) [21] - Anthropic完成130亿美元融资 估值达1830亿美元 经常性收入在1-8月间增长五倍 [21] - Replit完成2.5亿美元融资(估值30亿美元) 年化收入从280万美元增长至1.5亿美元(增幅超50倍) 用户社区超4000万 [22]