Amp
搜索文档
看完才发现,AI 早已悄悄改变顶尖程序员的工作方式!Flask 之父:传统代码协作工具已经 Out 了
程序员的那些事· 2026-01-02 06:00
文章核心观点 - 资深开发者通过一整年深度使用AI编程工具,工作模式发生根本性转变,从亲自编码转变为管理和指导“虚拟程序员实习生”[6] - 2025年被视作“智能体元年”,以Claude Code为代表的工具结合了大型语言模型与工具执行功能,改变了编程范式[9][10] - 开发者与AI协作的关系引发复杂思考,包括无意识的拟人化倾向以及工具命名的伦理争议[12][13] - 现有的软件开发工具(如版本控制系统、代码审核平台)已无法适应AI生成代码的新工作流程,亟需创新[22][24] - AI编程的普及带来了新的行业挑战,如代码质量审核、开源项目贡献规范以及对外包与自研趋势的潜在影响[18][26][27] 不一样的2025年:工作模式的根本转变 - 开发者彻底改变了编程方式,从主要使用Cursor转变为几乎完全依赖Claude Code,无需亲手敲键盘[6] - 工作角色从编码者转变为工程负责人,管理一个“虚拟程序员实习生”[6] - 因深入探索AI领域,年度博客文章产出大幅增加,全年发布36篇文章,约占其自2007年开通博客以来总内容的18%[7] 智能体元年:工具生态与范式确立 - 核心工具体验:Amp被类比为高端精致的苹果或保时捷,Claude Code是经济实惠的大众,Pi则是黑客的开源首选[14] - Claude Code开创的模式被视为当前最顶尖的,其结合大型语言模型与工具执行的能力令人惊叹[9][10] - 文本用户界面强势回归,开发者常用的Amp、Claude Code和Pi均为命令行操作工具[9] - 大型语言模型的功能从年初的代码生成扩展到日常琐事处理和生活规划,预计2026年将涌现大量消费级AI产品[10] 我与机器:协作关系的困惑与思考 - 开发者容易对常用工具产生“拟社会关系”,这种感觉既奇怪又令人不安[12] - 尽管努力将模型视为字符处理工具,但发现此简化观点已站不住脚,系统已具备某些人的特质,但将其等同于人类是错误的[12] - 反对使用“智能体”一词,因为能动性和责任应属于人类,但缺乏更贴切的术语来描述这些机器[12] - 与坚决抵制AI系统的人共事时,会感到尴尬,行业普遍反对给机器赋予人格[13] 众说纷纭:主观感受与行业共识的动摇 - 关于AI工具的讨论,焦点常集中在使用“感觉”而非纯粹技术上,这挑战了半个世纪以来的软件工程经验[16] - 许多行业共识经不起推敲,但难以证伪,例如开发者认为MCP用起来不顺手,却只能以“对我不适用”作为理由[16] - 模型选择具有高度主观性,例如有人从Claude转向Codex并认为好用,而本文开发者则偏爱Claude,只因“感觉对了”[16] - 需注意网络观点的利益倾向,许多言论来自相关产品的投资者或收费推广博主,可能影响其客观性[16] 外包还是自研:AI对开发模式的影响 - 当前趋势是核心服务外包给专业公司,如使用Stainless、Fern、Mintlify、Clerk等现成服务,提高了用户体验门槛[18] - AI编程工具提供了自研能力,例如开发者让Claude制作了支持Python和TypeScript的SDK生成器,过程并不困难[18] - AI可能鼓励减少对第三方工具的依赖,转向自己动手开发,这与当前普遍的外包趋势形成对比,未来方向尚不确定[18] 心得体会与未来期许:亟待创新的领域 - **新型版本控制系统**:传统工具如Git和GitHub的PR模式无法满足需求,需要能记录每次修改对应提示词及失败尝试的系统,失败经验对机器至关重要[22][23] - **新型代码审核模式**:现有工具(如GitHub)的严格角色权限与AI工作模式不兼容,审核功能应成为版本控制系统的一部分,且需解决本地审核导致的团队协作不透明问题[24] - **新型可观测性方案**:大型语言模型降低了eBPF程序开发和复杂SQL查询的门槛,使得过去因操作复杂而未能落地的可观测性想法有望重生,该领域预计将迎来大量创新[25] - **应对冗余与混乱**:AI生成代码导致开源项目中未经充分审核的贡献增多,对传统开发者构成冒犯,需要行业建立新规范来界定智能体代码库中的合规行为,而非仅靠贡献指南[27][28]
深度|AI编码黑马Sourcegraph华裔联创:我们的理念不是以模型为核心,而是以Agent为核心
Z Potentials· 2025-12-15 02:08
公司发展历程与产品演进 - 公司最初定位为解决大型组织内部编程效率问题,核心是帮助工程师理解代码,因为理解代码占用了80%到99%的时间,而写代码只是最后一步 [6] - 公司早期产品是全球首个可用于生产环境的代码搜索引擎,并成功推广至相当数量的《财富》500强企业 [5] - 随着大语言模型成熟,公司利用其增强搜索引擎的排序信号,并在ChatGPT等应用爆发后,结合自身能力推出了名为Amp的编程智能体产品 [8] - Amp产品于今年二三月启动,历时约七八个月,是从第一性原理出发从零构建的智能体,旨在重新定义所需工具,在大型代码库和业余编程中均表现出色 [10] 产品定位与商业模式 - Amp提供两种顶层智能体:按用量计费的Smart Agent(保持最前沿智能水准)和广告支持、可免费使用的Fast Agent [25] - 商业模式转向广告驱动的实验性决定,源于发现小规模、快速模型的推理成本极低,适合业余项目用户,此模式推出后成长速度非常迅猛 [14] - 产品策略是提供最强大的智能,用户仅为推理成本买单,但随着功能扩展,发现在智能与延迟的权衡曲线上存在多个有价值的平衡点 [13] - 并非最强大的模型一定带来最佳体验,更聪明的模型往往更慢,因此有机会打造更快的顶级智能体来处理针对性的编辑任务 [14] 智能体(Agent)的核心理念与架构 - 真正的“原子级可组合单元”不是模型,而是智能体本身,即用户输入文本、系统输出一系列行为的契约 [7][19] - 公司的理念是智能体中心化而非模型中心化,模型只是实现细节,智能体的行为由系统提示词、工具集、运行环境、反馈机制等多因素共同塑造 [18] - 在智能体架构下,软件开发流程可被拆分为上下文获取、调试等专门任务,为每个任务配置专属智能体,并为其选择参数尽可能小且符合质量标准的模型 [32] - 智能体就像函数在AI语境下的升级版本,虽然每次执行路径可能略有差异,但设计得当的智能体对于完成具体任务已足够可靠 [20][21] 模型选择与开源生态 - 公司同时大量使用开源和闭源模型,并且开源模型正变得越来越关键 [27] - 开源或开放权重模型的核心优势在于可以进行后训练,对于领域专用任务(如上下文检索),可以围绕目标进行优化,且价格优势显著 [7][27] - 在智能体工作负载上表现最出色的模型几乎全部源自中国,美国公司在工具使用的稳健性上尚未到位 [41] - 公司不会从零开始预训练模型,认为那样不经济,普遍做法是在后台使用多模型路由,根据任务切换到更小的专用模型 [31][32] - 驱动顶层智能体仍需数百亿乃至数千亿参数的模型,但用于编辑建议等场景的模型仅需“个位数十亿参数”即可 [30] 行业评估与未来展望 - 评估集作为单元测试或冒烟测试工具非常有效,但问题在于将其作为优化目标,因为评估集必然滞后于技术前沿,将优质产品体验提炼成评估集需要时间 [7][22][23] - 未来十年的开发环境既不会像现有IDE,也不会像今天的终端,核心界面将是能让人类编排多位智能体协作并理解其输出要点的面板 [35] - 目前超过90%的代码行数借助Amp生成,且比例仍在上升,开发者角色正转变为协调者和代码评审者,约90%的时间在做代码评审 [35][37] - 软件工程始终是创造性工作,人类仍是瓶颈,但让编程重新变得“好玩”是待解决的关键痛点之一 [36][38] 地缘格局与监管影响 - 全球开发者若大量依赖中国开源模型进行微调和部署,对美国及整体生态是潜在风险,美国需要确保其AI生态保持活力与竞争力 [40][49] - 当前美国监管格局趋向各州各管一套的“拼布式”法规,增加了复杂度和合规风险,不利于行业发展,反而巩固了原有巨头的地位 [47][49] - 政策建议是制定一套全国统一、清晰且完善的监管标准,聚焦具体应用场景而非模型层面的“生存风险”,同时确保模型层面的充分竞争,防止垄断 [7][49] - 围绕AGI的“终结者”式叙事影响了美国政策制定,降低了对风险的容忍度、生态创新的开放度以及对模型权重开源的接受度 [45]