百度文心智能体平台 - 财报，业绩电话会，研报，新闻

百度文心智能体平台

搜索文档

OpenAI发布GPT-5-Codex：独立编码7小时，能动态调整资源，token消耗更少

Founder Park· 2025-09-16 03:24

产品发布与定位 - OpenAI发布专用于编程任务的新模型GPT-5-Codex，属于GPT-5的特殊版本，专为智能体编程重新设计 [3][4] - 该模型具备双模特长，不仅响应速度快且可靠性高，小任务几乎即时响应，大任务可持续执行数小时 [5][6] - 内部测试显示可连续7小时完成大规模重构任务 [7] 性能表现与效率提升 - 在SWE-bench验证和代码重构任务上，GPT-5-Codex准确率达51.3%，显著超过GPT-5-high的33.9% [9][10] - 后10%用户请求中token消耗量比GPT-5减少93.7%，前10%高复杂度请求中思考耗时达到两倍 [12][13] - 代码审查能力增强，不正确评论从13.7%降至4.4%，高影响力评论从39.4%提升至52.4%，平均每个PR评论数从1.32降至0.93 [16][18] 技术架构与设计理念 - 模型采用动态调整资源机制，根据不同任务复杂度自适应分配计算资源 [9][12] - 提出"Harness"概念，强调模型与外部环境（工具、IDE、终端等）的集成框架重要性，确保模型可执行实际任务 [23][28][34] - 延迟控制低于1.5秒，支持多模式交互包括终端、IDE编辑、GitHub及Cursor集成 [30][32] 内部工具与生态建设 - 内部孵化工具包括10x（终端异步执行工具）、Agents.md（项目环境说明文件）和Code Review Agent（PR审查工具） [36][37][39][40] - Code Review Agent在内部试点中实现数十个PR审查且几乎零bug发布 [41][42] - 编程智能体市场竞品包括Cursor、Claude Code CLI、Gemini CLI及国内腾讯CodeBuddy、阿里Qwen3-Coder、字节TRAE等 [50][51][52] 行业趋势与战略方向 - 编程领域正向"AI写大部分代码+人类监督架构"模式演进，开发者角色转向战略设计与创意指挥 [43][44] - 2025年被视为智能体之年，编程智能体成为行业竞争焦点，国内外厂商均加速布局同类产品 [49][53] - OpenAI通过GPT-5-Codex正式加入编程智能体市场竞争，但面临Cursor、Claude Code等已建立认知的产品挑战 [45][54]

编程智能体

AI编程

Artificial Intelligence

Artificial Intelligence

GPT-5-Codex

GPT-5

GPT-5-high

收手吧GPT-5-Codex，外面全是AI编程智能体

36氪· 2025-09-16 02:47

产品发布 - OpenAI推出GPT-5-Codex 专为智能体编程设计提升代码重构审查和缺陷发现表现[1] - 新模型具备双模特长支持即时协作和独立执行小任务几乎即时大任务可持续执行数小时内部测试可连续7小时完成大规模重构[3] - 交互响应更灵敏代码补全延迟必须低于1.5秒支持多模式交互包括终端 IDE GitHub和Cursor集成[19][20] 性能表现 - 在SWE-bench验证和代码重构任务上超过目前最先进的GPT-5-high[4] - 动态调整资源机制使低负载请求token消耗量比GPT-5减少93.7% 高复杂度请求思考时间达到两倍[6] - 代码审查能力显著提升不正确评论从13.7%降至4.4% 高影响力评论从39.4%提升到52.4% 平均每个PR提出的评论数从1.32降至0.93[8][9] 技术背景 - 使用Codex品牌名称作为新模型后缀延续2021年Codex与GitHub合作打造Copilot的技术路线[1][13] - 提出"Harness"概念强调模型与外部环境连接的重要性决定模型是否真正可用[15][17][18] - 编程一直是OpenAI特别关注领域专门使用代码数据和指标优化模型表现[14] 行业竞争 - 2025年编程智能体大战全面升温国内外巨头竞争白热化[1][24] - 国外主流产品包括Cursor Claude Code CLI Gemini CLI和GitHub Copilot[24][26] - 国内代表性产品有腾讯CodeBuddy 通义千问Qwen3-Coder 字节TRAE 百度和DeepSeek V3.1系列[24][26] 内部实践 - OpenAI孵化10x内部原型支持异步长时间执行带来十倍生产力提升但尚未对外发布[22] - 开发Agents.md说明文件压缩上下文减少模型探索代码负担存放团队开发偏好[22] - Code Review Agent能理解PR意图检查依赖关系发现人类审查遗漏的bug 内部团队依赖它审查数十个PR并几乎零bug发布[22] 未来展望 - 2030年软件开发将不再是人写代码加工具辅助而是AI写大部分代码加人类监督和设计架构[22] - 开发者将成为团队指挥官专注于战略性问题和创意设计繁琐重复危险工作由AI智能体承担[23] - OpenAI重新定义自动补全为agent-complete 升级智能体编程能力[1]

编程智能体

Artificial Intelligence

Artificial Intelligence

百度文心智能体平台与小米应用商店达成深度合作，联合打造AI智能体专区

快讯· 2025-07-03 05:19

行业合作 - 百度文心智能体平台与小米应用商店达成深度合作共创行业首个智能体与应用市场跨端分发模式 [1] - 合作内容包括上线「AI智能体专区」实现智能体与应用市场首次打通 [1] 产品与功能 - 小米应用商店将陆续向用户开放AI智能体分发功能 [1] - 小米应用商店首页增设AI智能体专区 [1]

AI智能体

Software and Internet

Software and Internet

百度文心智能体平台

小米应用商店

AI智能体专区