Coding Agent
搜索文档
Codex负责人打脸Cursor CEO“规范驱动开发论”,18天造Sora爆款,靠智能体24小时不停跑,曝OpenAI狂飙内幕
36氪· 2025-12-17 02:45
自 8 月 GPT-5 发布以来,Codex展现出惊人的爆发力,用户增长 20 倍,每周处理数万亿 tokens,成为 了 Open AI 最受欢迎的编程智能体。 "Codex 能快速实现 20倍的增长,不只是因为模型变强了,还因为我们理解了,真正的智能体不是一个 模型,而是模型、API 和框架共同努力的结果。"在最新播客中,OpenAI 的编程智能体 Codex 产品负 责人 Alexander Embiricos 揭露背后的秘密。 比如,Codex 在长时任务能力上的突破。为了让它能够连续工作十几个小时甚至数天,团队设计了名 为"压缩"的机制——模型负责提炼关键信息,API 承接任务链路,框架负责稳定运行。三层像齿轮般咬 合,使 Codex 能够完成传统大模型难以支撑的长时编程任务。 正是这样的底层逻辑,让 Codex 在业务实战中有惊人表现。 Andrej Karpathy 曾公开分享,他被一个 bug 困住数小时,最终交给 Codex 处理,一小时内就完成了修 复。 Sora 团队更是依靠 Codex,在短短 28 天时间,从 0 到 1 完成 Android 应用的上线,直接冲到 App Store ...
智能体崛起,AI+软件研发到新拐点了?
AI前线· 2025-11-18 05:34
LLM原生开发时代的现状评估 - 行业对大模型在软件开发中的作用存在分歧,部分观点认为其仅是高级自动补全而非范式变革[5] - 大模型在实际开发中呈现"一半是火焰,一半是海水"的两面性:在独立、结构清晰的小任务或0到1创新场景表现突出,但在复杂庞大的现实任务中挑战巨大[5] - 对非研发群体而言已实现范式变革,使其从"不会"到"能"完成软件开发;对专业程序员群体则处于变革拐点阶段,尚未完全实现范式变革[5][6] - 越来越多公司开始披露AI生成代码比例,该比例正在快速上升,部分团队甚至超过50%[6] AI在具体开发环节的应用成效 - 在UI设计稿转代码方面,通过多模态模型结合设计稿解析,代码生成可用度达到80%至90%[13][14] - 在多端代码转换任务中,AI生成代码质量可达70%以上,整体提效约达原来的1.5倍[14] - 在代码审查环节,通过AI结合规范进行自动检测,测试阶段bug数量下降幅度达30%-40%[15] - 在测试用例生成方面,平安集团内部用例数据生成覆盖率已达60%左右,脚本生成时间从数小时缩短至几分钟[18][19] - AI特别擅长替代重复性、机械性任务,如中英文前端代码互转等传统自动化难以覆盖的场景[15] 智能体与AI助手的能力演进 - Coding Agent代表通用智能体的发展路径,能独立完成软件研发任务,潜力远超特定工具层面的自动化[3][31] - 智能体与助手的核心区别在于闭环能力:助手是单点辅助,而智能体可串联完整开发-测试-审查流程[28] - 智能体具备"动脑、动手、动嘴"的自主执行能力,能在DevOps平台上自动执行代码生成、测试、验证、提交PR等任务[31] - 实现从开发意图输入到代码生成与自测的完整AI流程闭环,预计至少还需要一年以上时间[30] AI落地研发面临的主要挑战 - 当前最大问题在于AI效果缺乏稳定性,收益不足以抵消改变工作习惯的成本时落地困难[20] - 算力问题影响使用体验,响应速度从2分钟降至10秒可显著提高用户容错意愿[22] - 用户提示词能力差异导致使用效果悬殊,有的用户AI参与率能达到50%,有的不足10%[22] - 在大型存量代码库中,AI难以处理庞大上下文,常出现不符合逻辑的修改[20] AI时代对人员能力模型的新要求 - 提示词工程成为关键能力,需要让模型进行"角色扮演",通过严谨结构和细颗粒度输入确保理解准确[23] - 知识工程能力日益重要,需要将团队流程规范、协作规范等整理成明确文档供模型学习引用[24] - 未来工程师价值将体现在架构视角和整体技术思维,AI加速了各角色从"执行者"向"评估者"或"决策者"的转变[37][38] - 全栈工程师价值可能更高,AI使精通多种语言成为可能,能显著提升个人能力边界[39] 行业发展趋势与生态建设 - 更倾向于发展轻量化、插件化生态而非统一大平台,先观察AI在各环节改进效果再谈平台化整合[32] - DevOps层面可能出现更高抽象层次的AI工作台,整合数据检索、任务调度、执行分析等能力[32] - 目前几乎没有公司把"AI生成代码比例"写入绩效考核体系,更倾向于通过文化与引导而非考核推动普及[33][34][35] - AI带来的不是岗位消亡而是岗位价值重塑,开发和测试岗位将转向更具策略性和创造性的工作[35]
智能体崛起,AI+软件研发到新拐点了?
36氪· 2025-11-13 04:51
LLM原生开发时代的现状与挑战 - 行业认为AI编程正处于范式变革的临界点前夕,尚未完全达到真正的范式变革 [2] - AI在相对独立、结构清晰的小任务或0到1的创新场景中表现突出,但在复杂庞大的现实任务中挑战巨大 [2] - 越来越多公司披露其代码中AI生成比例快速上升,部分团队已超过50%,AI已深度介入代码生产 [3] - 从整体影响力和效率提升角度看,AI编程还未达到真正的范式变革,目前只是走在半坡上 [3][7] AI已实现自动化的开发环节 - 在Design to Code方向,通过图像理解与设计稿解析结合,代码生成可用度达到80%至90% [9][10] - 多端代码转换任务中,AI生成质量可达70%以上,整体提效约达原来的1.5倍 [11] - 代码审查方面,结合规范进行自动检测,测试阶段bug数量下降幅度达30%-40% [11] - 在测试用例生成方面,平安集团内部用例数据生成覆盖率已达60%左右,复杂接口测试脚本生成时间从数小时缩短至几分钟 [14][15] - AI擅长替代重复性、机械性任务,如中英文版本代码互转,让程序员将时间投入到更复杂工作中 [12] AI落地研发面临的主要障碍 - 最大问题在于AI效果缺乏稳定性,收益不足以抵消改变工作习惯的成本时落地困难 [16] - 在大型存量代码库中,AI难以处理庞大上下文,常出现不符合逻辑的修改 [16] - 信任建立是关键挑战,初期使用中AI回答不准确会降低用户信任度 [17] - 算力问题影响使用体验,响应速度直接影响用户容忍错误的意愿 [18] - 提示词质量差异导致使用效果差距巨大,低效使用者因输入模糊导致模型误解意图 [18][19] 从AI助手到智能体协作的演进 - 智能体与助手的核心区别在于闭环能力,智能体可以串联完整的开发-测试-审查流程 [25] - Coding Agent代表通用智能体的发展路径,能独立完成软件研发任务,潜力远超特定工具层面的自动化 [5][27] - 行业更倾向于发展轻量化、插件化生态,而非大一统平台,当AI能稳定接管50%以上流程后再谈平台整合 [28] - 要实现人类仅输入开发意图,后续由AI完成代码生成与自测的流程,预计至少还需要一年以上时间 [26] AI时代的人才价值重塑 - 未来工程师价值体现在全局视角和系统架构理解能力,而非单一技能 [33][34] - 架构师价值被放大,因为AI在小任务上出色但系统层面设计仍需人类把控 [35] - 协作能力成为关键差异,清晰与AI沟通任务的能力可带来五到十倍的效率提升 [35] - 全栈工程师价值更高,AI帮助突破语言壁垒,使个人能力边界得到显著扩展 [36] - 产品经理需要既懂技术又懂业务与测试,具备全面理解能力的人才更具不可替代性 [34]
从模型为王到应用为王:AI 中间件的基建之战 | 直播预告
AI前线· 2025-09-20 05:33
行业核心趋势 - 行业竞争焦点正从模型本身转向AI应用的落地效率 [2][6] - 一场围绕AI中间件的基建之战正在开启 [2][6] - 行业处于从模型为王向应用为王过渡的关键阶段 [2] 技术发展挑战 - 当前AI领域面临模型触手可得但实际落地举步维艰的困境 [2][6] - 企业级AI中间件需要解决落地成本和管控难题 [3] - 技术发展需要从云原生平滑过渡到智能原生架构 [3] 应用落地重点 - RAG框架需要从简单搭建升级到真正可用的工程化实践 [7] - Agent应用工程化落地需要建立明确的架构范式 [7] - Coding Agent在研发全流程具有显著的应用和提效潜力 [7] 人才发展机遇 - 开发者面临成为智能时代核心人才的红利机遇 [3][6] - Agentic AI应用前沿技术是当前重点发展方向 [7]
LangChain 推出开源异步编码智能体 Open SWE
AI前线· 2025-08-23 05:32
产品定位与架构 - 推出完全开源的异步编码智能体Open SWE 专为云端运行和复杂软件开发任务设计 代表从实时副驾驶助手向自主长期运行智能体的转变 [2] - 采用多智能体架构(Manager Planner Programmer Reviewer)生成高质量代码 Reviewer在创建拉取请求前检查错误以减少构建失败和重复审查周期 [3] - 基于LangGraph构建并通过LangGraph平台部署 该平台针对长期运行智能体优化 提供持久性 扩展性和部署灵活性 支持自托管企业部署 [5] 功能特性 - 直接连接GitHub仓库 通过GitHub Issues或专用UI分配任务 可研究代码库 生成计划 编写测试代码 审查并打开拉取请求 [2] - 在安全隔离的Daytona沙箱中运行 允许自由执行shell命令而不危及宿主环境 完全云端运行 并行处理多任务不消耗本地资源 [2] - 支持人在回路控制 开发人员可中断任务 请求更改或提供新指令无需重启 计划阶段可接受编辑或拒绝建议策略 支持双重文本功能 [3] 生态与市场反馈 - 在GitHub提供完整文档 支持开发人员扩展 自定义提示或集成到内部系统 定位为生产就绪助手和社区创新基础 [7] - 早期反应褒贬不一 Hacker News用户质疑LangChain生态系统能力 认为其智能体构建存在危险信号 [6]
巨头博弈下,Agent 的机会和价值究竟在哪里?
海外独角兽· 2025-06-14 11:42
核心观点 - 2025年是Agent技术加速发展的关键年份,但真正实现用户价值闭环的产品仍稀缺 [6] - Agent的真正门槛在于基础设施而非模型能力,包括记忆系统、上下文感知、工具调用和可控环境等模块 [6] - Coding被视为衡量AGI最关键的先验指标,可能占据大模型产业阶段性90%的价值 [6][45] - AI Native产品需要构建同时服务于AI和人类的双向机制 [34] - Agent商业模式正从按token/调用次数计费向按结果/工作流计费演进,未来可能出现直接雇佣Agent的模式 [6][39] 01 通用Agent是大模型公司主战场 - 通用Agent领域表现最佳的是"模型即Agent"(Model as Agent)模式,如OpenAI的Deep Research和o3模型 [12] - 通用Agent市场已成为大模型公司的主战场,创业公司难以仅靠通用需求做大 [13] - 垂直领域Agent分为前台(与人交互)和后台(重复性工作)两类,典型案例包括HappyRobot(物流沟通)和AI for Science创业公司 [14][15] 02 Cursor是从Copilot发展到Agent - Cursor通过三个阶段完成从Copilot到Agent的转型:自动补全→代码重构→后台异步执行 [22][23] - 关键策略是先从Copilot切入收集用户数据,逐步过渡到Agent形态,而非一开始就追求完全自动化 [18] - 产品设计注重用户交互心智,通过同步交互收集反馈数据,为后续Agent能力奠定基础 [23] 03 Coding是衡量AGI最关键的先验指标 - Coding数据具有干净、可验证、易闭环的特性,最可能率先实现数据飞轮 [24] - 数字世界是实现AGI的第一环境,Coding能力提升将带动指令遵循等核心能力 [25] - 若AI无法规模化完成端到端应用开发,在其他领域进展会更缓慢 [25] 04 做一个好的Agent需要什么条件 - 需要构建可验证的反馈机制和数据飞轮环境,如代码和数学领域 [26] - 产品需同时考虑人和Agent的需求,实现AI Native设计 [28] - 评估标准包括任务完成率(行业及格线约50%)、成本效率(计算/时间成本)和用户指标(留存/付费率) [30][32][33] 05 Agent定价会从基于成本转向基于价值 - 商业模式演进路径:按成本→按动作→按工作流→按结果→按Agent本身 [39] - 典型案例Hippocratic AI的AI护士成本仅为人类护士的1/4 [39] - 未来可能出现智能合约模式,通过Crypto技术实现Agent经济价值分配 [40] 06 人与Agent该如何交互协作 - 交互模式分为Human in the loop(持续参与)和Human on the loop(关键节点介入) [41] - 未来高重复性任务将实现高度自动化,人类仅需复核摘要 [42] - 新的异步协同方式将出现,需要探索Agent与Agent之间的交互机制 [43] 07 Agent爆发离不开Infra - 环境(虚拟机/浏览器)是Agent开发早期80%问题的根源 [55] - 关键基础设施包括上下文管理(记忆/检索)、工具发现平台和安全机制 [57][58] - 未来机器搜索需求可能达万亿次/天,远超人类搜索规模(200亿次/天) [59] - 大厂分化明显:Anthropic专注Coding,OpenAI布局多方向,Google具备端到端能力 [52][53]
拾象李广密:Coding Agent是观测Agent趋势的关键点
快讯· 2025-05-25 09:02
AI行业趋势 - 年内将出现两个确定的AI趋势:长窗口和Agent,特别是Coding Agent的规模化应用 [1] - Coding Agent将端到端地完成有经济价值的软件应用开发 [1] - Coding Agent是观测通用Agent发展的关键,因其逻辑性、可验证性和闭环性 [1] - 若Coding Agent未能大规模替代初级程序员或完成经济任务,其他通用Agent的发展可能更慢 [1] Coding Agent的重要性 - Coding Agent被视为最简单且可验证的通用Agent类型 [1] - 其发展进度可能直接影响其他通用Agent的推进速度 [1] - 规模化应用将聚焦于替代初级程序员和创造经济价值 [1]