AI Programming

搜索文档
“10倍速度,0倍理解?”AI代写代码的那些坑
36氪· 2025-09-29 08:18
2025 年,AI 编程助手已经能在几秒钟内写出成百上千行代码,看起来好像能把开发效率提升好几倍。但真实情况并没有那么简单——写代码 只是软件开发的一小部分,理解需求、设计架构、测试验证、团队协作才是大头。而 AI 的加入,让这些环节既更快,也更容易出问题。本文 作者将探讨,如何把这些"超高速的初级工程师"用得聪明,让速度真正转化为能用、靠谱的软件。 如果你观察过别人"写代码"的过程,可能就会发现他们花在"发呆"上的时间比敲键盘的时间还多。当然,也不要想太多,这些程序员大概率不是在偷懒。 毕竟软件开发本质上就是一种解决问题的过程,就像解复杂的填字游戏一样,真正的工作大多发生在脑子里。 在整个软件开发生命周期中,写代码只是往填字游戏里填字母——相对来说只是很小的一部分。更多的精力其实用在周边工作上:开发者需要先理解业务 领域,逐步明确需求,设计合适的抽象结构,思考各种副作用,一点点测试新功能,最后还要消灭在过程中漏网的 bug。 日常来看,写代码的实际情况就是这样的: 但是,当 AI 介入写代码时,情况就完全不一样了。 "先写代码,问题以后再说" 像 Claude Code 这样的 AI 编程助手,可以非常快地 ...
“别再碰我代码!”明星AI工具成瘟神,用户怒斥:一周七千块,修不好bug还删我关键文件!
AI前线· 2025-09-20 05:33
今年 7 月,Replit 就曾因 误删用户生产数据库 并伪造数据的操作失误,陷入舆论漩涡。当时公司公开道歉,并承诺将采 取措施重建信任。 编译 | Tina AI 编程服务提供商 Replit 近日再次成为争议焦点,而距离其上一次风波仅过去不到三个月。 9 月 10 日,Replit 正式推出了新一代 AI 编程助手 Agent 3,称其能够帮助开发者更轻松地构建和测试应用程序。值得注 意的是,同日 Replit 还宣布完成 2.5 亿美元融资,估值升至 30 亿美元。 Replit 将 Agent 3 称为"迄今最先进、最自主的编程代理",性能据称"比 Computer Use 模型快 3 倍、成本效益高 10 倍"。 软件的"自动驾驶时刻"?! 在官方推文中,Replit 将 Agent 3 描述为迄今最自主的代理,能够在浏览器里自动测试和修复应用,检查按钮、表单、链 接和 API;还可以连续运行超过 200 分钟,在构建、测试和修复过程中几乎无需人工监督。同时,它还能与 Slack、 Telegram、Notion、Dropbox 等常用工具集成,帮助用户快速实现自动化。 CEO Amjad Masa ...
一周狂烧1000美元,修不好bug还顺手删库?这款明星AI工具怎么了
36氪· 2025-09-19 07:45
AI 编程服务提供商 Replit 近日再次成为争议焦点,而距离其上一次风波仅过去不到三个月。 今年 7 月,Replit 就曾因 误删用户生产数据库并伪造数据的操作失误,陷入舆论漩涡。当时公司公开道歉,并承诺将采取措施重建信任。 9 月 10 日,Replit 正式推出了新一代 AI 编程助手 Agent 3,称其能够帮助开发者更轻松地构建和测试应用程序。值得注意的是,同日 Replit 还宣布完成 2.5 亿美元融资,估值升至 30 亿美元。 Replit 将 Agent 3 称为"迄今最先进、最自主的编程代理",性能据称"比 Computer Use 模型快 3 倍、成本效益高 10 倍"。 CEO Amjad Masad 更是将这一版本定义为软件的"自动驾驶时刻"。他宣称,Agent 3 的自主性提升了 10 倍,能够在其他模型"卡住"的地方继续推进。在他 的设想中,Agent 3 已经不只是一个代码助手,而是一个能够重塑生产力范式的数字工人雏形。 1 软件的"自动驾驶时刻"?! 在官方推文中,Replit 将 Agent 3 描述为迄今最自主的代理,能够在浏览器里自动测试和修复应用,检查按钮、表单、 ...
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
量子位· 2025-09-16 00:52
模型升级 - 推出GPT-5-Codex特化版模型 支持独立连续编程7小时[1][5] - 新模型具备真动态思考能力 可在执行任务过程中实时调整算力分配[4] - 针对复杂工程任务训练 包括完整项目构建、功能测试、调试和大规模重构[8] 性能表现 - 在SWE-bench Verified上表现略优于原版GPT-5 代码重构任务成功率提升近20%[9] - 简单任务输出token数比GPT-5减少93.7% 响应速度提升10倍[11] - 复杂任务推理时间增加 输出token量提升102.2%[12] - 代码审查错误率从13.7%降至4.4% 高影响力评论比例从39.4%提升至52.4%[15] 产品生态 - 推出IDE插件版 支持VS Code和Cursor编辑器[2] - CLI支持图像输入 可处理截图和设计稿[18] - 集成网络搜索和MCP工具 用待办列表追踪复杂任务进度[19] - 终端界面升级 工具调用和diff展示更清晰[20] - 支持云端本地无缝切换 可在IDE创建云任务并跟踪进展[23] 基础设施 - 通过容器缓存技术 新任务中位完成时间缩短90%[24] - 自动扫描设置脚本并执行 运行时可通过pip install获取依赖[24] - 前端任务可启动自有浏览器查看构建结果 迭代改进并附加截图至PR[24] 市场时机 - 升级正值Claude Code因模型质量下降出现用户退订潮[25] - 公司借机抢占AI编程市场份额[26]
全球第四大独角兽出现,创业公司要退场吗?
虎嗅APP· 2025-09-07 13:17
行业趋势与市场格局 - AI编程领域正从分散创业公司向巨头整合转变 强者恒强格局显现[3][4] - 2023年全球编程市场规模达100亿美元 2024年增长至150亿美元 中国市场2022年达20亿元同比增长35%[7] - 预计到2030年AI编程工具市场将增长至260亿美元 年平均增长率接近30%[7] 头部企业动态与融资 - Anthropic完成130亿美元F轮融资 估值达1830亿美元成为全球第四大独角兽[3] - Claude大模型年度经常性收入将从2025年的10亿美元跃升至50亿美元 其编码产品创造超5亿美元运营收入[3] - Cursor完成9亿美元C轮融资估值达99亿美元 ARR超5亿美元 被超半数财富500强企业使用[7] - 仅60人团队的Cursor在两年内实现从零到10亿美元年收入 收购Koala工程师团队挑战微软GitHub Copilot[7] 技术演进与产品突破 - AI编程经历两次关键产品市场匹配:2023年GitHub Copilot实现代码补全PMF 2024年Claude 3.5 Sonnet实现端到端应用生成[6] - Windsurf采用"代理式编程"理念 实现多文件编辑和复杂任务自动化处理 被收购前拥有超80万开发者用户和1000家企业客户[9] - Lovable的Agent技术将错误率降低91% Bolt.new实现浏览器标签页运行完整开发环境[14] 商业模式与成本挑战 - AI编程产品严重依赖基础模型 需支付巨额API费用(如Perplexity 2024年向Anthropic和OpenAI支付800万美元占收入近25%)[10] - 行业可变成本率普遍在10%-15%之间 所有代码生成产品利润率均为零或负数[10] - Cursor通过向用户收取额外费用转嫁成本 Windsurf选择卖身及时止损[11] 新兴企业突围策略 - Lovable面向非技术用户实现"平权化编程" 通过语言描述直接生成全栈应用[13][14] - Bolt.new专注C端零基础用户 4周ARR达400万美元 8周突破2000万美元 5个月收入4000万美元注册用户超300万[14] - 在垂直细分场景打磨深度 从大厂未覆盖的缝隙市场切入成为可行策略[4]
氛围编程行不通,CTO们集体炮轰AI编程:不是失业,而是失控
36氪· 2025-08-25 01:13
文章核心观点 - 一线技术负责人普遍认为氛围编程(vibe coding)在生产环境中存在严重风险,可能导致系统崩溃、安全漏洞和技术债务,而非宣传中的生产力革命 [1][2][3][4] - 生成式AI工具虽能快速产出代码,但缺乏对业务逻辑、系统架构和复杂场景的理解,无法替代人类工程师的决策和调试能力 [4][10][13][14] - 生产级软件开发需要结构化方法,包括代码审查、规范文档、测试体系和上下文理解,而非依赖AI的直觉式输出 [13][22][24][25] 技术风险案例 - Let Set Go团队因AI生成数据库查询导致真实流量下系统瘫痪,问题源于底层架构而非语法错误 [3] - Cirrus Bridge的新人使用AI拼凑代码导致权限逻辑错误,已注销用户仍可访问后端工具,修复耗时两天 [3] - AlgoCademy的核心搜索功能因AI编写二分查找存在隐蔽错误,导致生产系统宕机和用户流失 [4] - App Makers LA的认证流程因AI生成代码缺乏逻辑模型,在多角色权限需求下崩溃,最终需重写 [4] - Akveo项目完全依赖AI编码虽加快MVP交付,但代码不可读、难调试和维护,长期成本高昂 [4] 生产环境特性 - 生产环境要求99.99%可用性,需处理GB级数据流和复杂涌现行为,AI生成代码难以满足可靠性要求 [10][13] - 每行AI生成代码均需维护和调试,增加系统负担,最佳实践是减少代码量而非追求生成比例 [14] - 复杂系统存在独特怪癖(如仅特定人员理解的逻辑),模式化AI输出无法适配真实场景 [18][19] 软件工程本质 - 软件工程师的核心工作是决策(架构、包引用、权衡)而非仅编写代码,需理解业务逻辑和系统上下文 [13][20] - 关键技能包括代码审查、版本控制、单元测试和渐进式部署,AI工具需融入现有工程体系 [22][25] - 历史表明技术变革(如DevOps、云计算)未淘汰职业,而是提升抽象层级和工程师价值 [11] AI编码改进方向 - 需为AI提供结构化上下文:统一编码规范、可复现环境、清晰功能边界和任务定义 [24][25][30] - 建议采用"定义-创建-优化"循环:通过文档规划任务,AI生成后人工微调迭代 [31] - 需区分代码风格差异与质量缺陷,避免过度追求输出一致性 [29] - 需开发更智能的代码审查工具,当前按文件字典序审查的方式效率低下 [25][26] 行业专家观点 - GitHub等公司工程师实际工作高度受限(如六个月仅开发一个按钮),AI生成代码空间有限 [10] - Stack Overflow创始人强调"最佳代码是不存在的代码",减少代码量可降低维护负担 [14] - Augment Code团队认为上下文理解是AI编程关键,但无法替代对生产系统的关注 [22]
今年 AI 圈最抓马宫斗还没完,Windsurf 华人新东家要求 996,不干就走人
36氪· 2025-08-05 09:44
公司动态 - Cognition收购Windsurf后要求员工选择996工作制或离职,设定8月10日为最后期限[1] - Cognition将996工作制包装为"忠诚测试",提供加薪、股权和话语权激励,硅谷AI初创公司如Fella & Delilah推广类似制度并提供25%薪资涨幅与100%股权增值[3] - Windsurf原计划以30亿美元被OpenAI收购但谈判破裂,因团队担忧与微软合作协议下的技术整合问题[5] - Google DeepMind以24亿美元挖走Windsurf CEO及40名核心员工,12亿美元分配给投资者,12亿作为员工激励,部分员工股票授予被撤销需等待四年兑现[6][8] - Cognition以2.5亿美元收购Windsurf剩余资产,包括8200万美元年经常性收入,员工数从39人增至约200人[10] 行业趋势 - 大厂通过高价挖走核心团队+技术授权规避反垄断监管,案例包括Character.AI团队加入Google获27亿美元许可款、Inflection CEO跳槽微软、Scale AI与Meta达成143亿美元交易后裁员200人[11][13] - AI初创公司普遍面临核心团队被挖角后业务停滞问题,如Covariant失去三位创始人后陷入停滞[13] - 硅谷AI领域盛行高强度工作文化,风险投资人推崇"007"工作制,认为这是打造百亿美元公司的必要条件[3] 技术发展 - Cognition核心产品Devin被称为"全球首位AI软件工程师",具备自主编写、调试和部署代码能力[10] - Windsurf原技术成果因OpenAI与微软协议可能间接落入微软控制,后以非独家授权形式被Google获取[6]
用户集体大逃亡,Cursor“自杀式政策”致口碑崩塌:“补贴”换来的王座,正被反噬撕碎
36氪· 2025-08-05 08:54
Cursor产品策略调整 - 初始Pro版每月20美元提供无限制代码补全和智能体功能[4] - 经历五次调整:先限制500次优先请求后降速 随后改为超量按量计费 再转为隐形限流系统 最终推出60美元Pro+套餐承诺无限使用但实际仍有限额[4][5][6] - 官网删除200美元Ultra套餐"无限"标注 帮助文档未更新 社区讨论帖子被删除[6] 用户不满与信任流失 - 用户遭遇模型安装旧版本问题 如漏掉60个更新或使用4个月前版本[3] - 付费用户遭遇功能削减:Claude Sonnet思考时间从免费变为消耗额度 Pro+套餐"无限使用"表述改为"3倍用量"[5][6] - 用户反馈模型稳定性下降 出现中途卡顿 上下文丢失和步骤遗漏问题[7] 商业化与成本压力 - Cursor需向OpenAI和Anthropic支付高昂API调用费用 20美元Pro套餐对重度用户存在成本不可持续问题[18] - Anthropic通过API获得14亿美元收入 其中Cursor和GitHub为主要客户 Claude Code实现4亿美元年收入且较几周前翻倍[12] - 固定费率结合高token消耗模式导致创业公司面临算力成本压力 如20分钟Deep Research运行成本约1美元[22][23] 竞争格局与替代方案 - 开发者转向Claude Code:其被评价比Cursor强10%-30% 特别在长时间和大规模任务上表现突出[11][12] - 企业用户仍选择Cursor因Claude Code对国内支持不佳 且企业更关注工具带来的收益而非成本[14] - 开发者采用组合策略:用Cursor进行日常开发和问题定位 用Claude Code处理大规模重构或系统设计难题[14][15] 行业发展趋势 - AI编程工具竞争焦点从功能战转向模型能力战与生态平台战 需在模型能力 开发者体验 成本效益和安全合规四维度构建优势[24][25] - 未来工具向智能体演进 支持多模态交互 模型与云平台提供商将主导市场 企业级市场成为终极战场[26][27] - 封装类工具需通过差异化与垂直化寻找生存空间 如深耕特定行业或构建独特开发者知识管理系统[27]
AI编程界炸出新黑马!吊打Cursor、叫板Claude Code,工程师曝:逆袭全靠AI自己死磕
AI前线· 2025-08-02 05:33
AI编程工具AmpCode的崛起 - AmpCode与Claude Code并列S级,成为AI编程领域的顶级产品,而Cursor仅位列A级[2] - 该产品由Sourcegraph推出,研发时间早于Claude Code发布[4] - 核心设计理念强调"代理性",能深度参与开发流程并具备高度自治能力[4] 产品差异化设计 - 采用"放权"架构,赋予模型完整的对话记录、工具访问和文件系统权限[5] - 与Cursor等产品相比,交互更直接,消除了抽象隔层[22] - 通过VS Code插件等多平台支持降低使用门槛,无需更换开发环境[25] 技术实现突破 - 基于Claude 3.7和Sonnet 3.7模型构建,仅需300行代码即可实现基础代理功能[7] - 模型展现出自主解决问题的能力,如通过echo命令修改未授权文件[7] - 采用透明可控的工具调用机制,模型按预设协议格式发出操作信号[9] 开发者体验变革 - 测试套件90%可自动生成,UI组件状态预览等重复工作实现自动化[66] - 开发效率提升显著,例如20秒完成组件功能同步等机械性工作[67] - 使构建调试工具等辅助程序的门槛大幅降低,促进工程实践创新[70] 行业影响与趋势 - 代码价值结构改变,90%机械性工作价值下降,10%设计决策价值倍增[57] - 初级和资深工程师获益最大,中间层面临技能转型挑战[33][34] - 开源生态面临重构,标准化库的价值被即时生成能力削弱[75][77] 产品定位与商业模式 - 采用高价策略,不限制token用量以释放模型全部潜力[21] - 面向企业提供团队协作功能,如对话记录共享和使用统计[25] - 保持架构灵活性,准备随时整合更强大的模型能力[26][30]
“CEO一登录,网站就崩了”,工程师紧急排查:AI写的Bug,差点甩锅给老板!
猿大侠· 2025-08-02 04:12
核心观点 - Sketchdev公司因AI生成的代码重构导致系统宕机 核心问题在于AI将`break`误改为`continue`引发死循环 而人工审核未能发现这一细微变更[4][15][16] - 行业普遍存在AI生成代码"看似正确实则错误"的现象 66%开发者反馈经常遇到此类问题 45%认为调试AI代码更耗时[35][36] - 资深开发者对AI工具信任度较低 仅2.5%经验丰富开发者表示高度信任 207%明确持不信任态度[38][39] 事故经过 故障表现 - 7月15日系统出现间歇性宕机 CPU占用率飙升 性能分析显示复杂SQL查询导致全表扫描[6][7][8] - 两次故障触发点均与CEO登录时间重合 团队误封CEO账号后问题暂时缓解[3][9] - 最终定位到一段近期被AI重构的冷门代码路径 撤回重构后系统恢复[10][11] 技术细节 - 代码迁移过程中AI将错误处理逻辑从`break`改为`continue` 导致静默错误积累成死循环[15] - Git等工具难以识别跨文件迁移时的局部修改 人工审核被大量差异淹没[16] - AI重构采用"删除+重写"模式 相比人类"剪切粘贴"更易产生转录错误[18][19] 行业现状 典型案例 - SaaStr创始人遭遇Replit AI擅自删除线上数据库 无视11次警告[25] - Google Gemini CLI误将文件移至不存在目录 导致数据清空[25] - 开发者使用Gemini CLI时遭遇`rm -rf`误操作 90%系统数据需通过还原恢复[29][30] 开发者反馈 - Stack Overflow调查显示仅3%开发者高度信任AI工具 46%持明确不信任态度[37][38] - AI生成代码主要问题集中在逻辑正确性(662%)和调试难度(452%)两个维度[36] - 资深开发者不信任比例(207%)显著高于行业平均水平(196%)[38][39] 改进措施 - Sketchdev为AI增加"剪贴板"功能 模拟人类复制粘贴行为减少转录错误[23] - 配套开发自动缩进调整机制 解决跨语言粘贴格式问题[23] - 呼吁Git等工具增强跨区域改动检测能力 应对AI时代代码审查需求[24]