Vibe Coding

搜索文档
Figma MCP + GPT-Codex:新的 Vibe Coding 之王
歸藏的AI工具箱· 2025-09-25 10:25
昨天刷到了新的 Figma 远程 MCP 服务,进行了一大堆升级,然后又看到 GPT-5 Codex 有 API 了。 GPT-5 Codex 的话因为有了 API 所以常见的 AI IDE 比如 Cursor 等都加上了,选择后直接用就 行。 Figam MCP 这次升级最大的一个更新就是不再需要原来复杂的添加流程和本地 Figma 客户端了。 你不需要管之前咋装,我们直接看现在就行,这里我先按 Cursor 的操作路径介绍一下。 首先我们需要找到 Cursor 的设置,在设置里面找到 MCP 这个 TAB,然后点击"New MCP Serve r"将下面的 Json 代码复制进去保存就行不需要做任何改动。 { "mcpServers": { "figmaRemoteMcp": { "url": "https://mcp.figma.com/mcp" } } } 然后回到设置页面你就会看到多了一个 Figam 的 MCP,右边还有个"Connect"按钮,我们点击, 系统会询问是不是要打开外部网站,你选择打开就行。 于是就都研究了一下,没想到这么顶啊,这个美学表现直接拉满了,下面这是直接给 GPT-5 Co ...
Vibranium Labs Raises $4.6M To Fix Vibe Coding Failures With AI Agents After Engineers Admit These Apps 'Are Definitely Going To Break'
Yahoo Finance· 2025-09-23 16:01
A 2 a.m. phone alert disrupting an engineer's sleep has become a symbol of outdated IT incident response, Vibranium Labs co-founder and CEO Sang Lee said. The startup last Thursday announced $4.6 million in seed funding to scale Vibe AI, a 24/7 incident response platform built to handle those emergencies before humans log in. Vibranium Labs was founded by Lee, Tim Hwang, Charles Kim, and Tanny Kang, who all have backgrounds spanning Google, Amazon Web Services, Workday, Arnold & Porter, and FiscalNote (NY ...
对话吴穹:软件开发的终局,是我们将迎来自己的“黑灯工厂”
AI科技大本营· 2025-09-15 00:50
软件工程方法论本土化 - 西方敏捷方法论在中国出现水土不服 因国内企业文化偏管控型 强调令行禁止的确定性 而西方崇尚试错和自组织[6][12] - 需将敏捷核心思想与本土实践结合 基于第一性原理重新设计适合中国土壤的农具 而非照搬最佳实践[7][14][15] - 华为在落地IPD时做了管理变革和创新 体现本土化必要性[13] - 推出Adapt方法论框架和《敏稳兼顾:数字化研发管理实战》著作 总结规模化敏捷本土落地经验[15] AI对软件工程的冲击 - AI工具存在悖论:对员工是摸魚神器 对老板却是提效神器 两者本质矛盾[9][35] - 生产力变革触及生产关系根基 需解决员工为何使用AI为公司创造价值而非提前下班的管理问题[9][35] - 私域知识质量差是AI应用短板 大多数软件开发项目有独特金融软件或电商系统实现方式等私域知识[18] - 上下文缺失是AI发挥作用的重要阻碍 老系统缺乏历史信息或历史上下文[18][20] - AI在代码补全场景高效 因已有明确修改点和意图上下文 但让AI纯粹处理任务则需大量上下文[19][20] - 短期困难包括AI幻觉和上下文不足 导致团队效率提升数据在10%-20%体感误差范围内[20] Agent专业化趋势 - 不会有通用Agent 最终会分化成专用Agent 如金融Agent 测试Agent 重构Agent[24] - 工程生产线需差异化 如特斯拉造车产线不会用于生产飞机 否则不经济[24] - 开发语言进一步专业化 自然语言编程提升抽象层次 但最终会出现领域特定语言(DSL)[25][26] - 描述和Agent都会分化 形成更专业化生产线[27] 组织管理变革 - 未来组织是1+N模式 即1位人类小队长带领N个AI特工协同工作[35][38] - 需把Agent当成员工管理 建立注册 KPI考核 任务冲突调解等管理机制[24][35] - 考核体系变化 人的效能不再是个人产出 而是带领多少Agent产出多少[38][42] - 兵种主建 战区主战 类似国家军事改革 在职能线上叠加交付型组织[30] - 科技团队不能孤立谈管理 需与PMO 财务等职能部门深度卷入 为整个公司治理服务[47] 技术债与质量管控 - AI可能加速技术债累积 如果过分强调效率或代码行数等指标 会导致低质代码更快产出[53] - 使用得当AI反而减少技术债 如AI生成单元测试能力非常强 形成自闭环[54] - 布设单元测试像铃铛 代码被不该改的地方触碰就会报警[54] - 需传统度量体系感知质量 如交付效率 缺陷修复时间 代码重复度等[53] 工具与平台演进 - 知微工具平台将Adapt方法论理念变为数字化工具 如分层需求体系 多维组织架构[49] - 知微是可配置零代码平台 像高级定制西装 根据客户情况量体裁衣 而非定制开发或盒装软件[52] - 知微会逐渐中台化 大模型也是其用户 通过API调用 成为组织流程资产中心[60] - 未来IDE和CLI是主入口 界面越来越少 因AI改善工具使用 根据工作上下文自动操作[60] 程序员能力重塑 - 未来重要能力是对AI的了解和沟通协同能力 需学会与AI有效沟通[66] - 程序员需放下对AI戒备和抵制 进行心理角色转换 从种地变为地主[77] - 与人沟通和团队协作能力变得非常重要 需补强[78] - 对业务理解至关重要 程序员现在创业更容易[78] - 有技术底色的程序员更具优势 因懂技术细节可不关心 但产品经理压根不懂则难做精准判断[74] - 马斯克 扎克伯格 比尔·盖茨等有编程能力者最终成为顶尖产品缔造者[75] 行业长远展望 - 软件工程终极图景是黑灯软件工厂 AI自主编码 人类负责指挥和规划[9][81] - 软件不会用后即弃 因承担产生数据使命 有长生命周期 形成领域知识[80][83] - 软件行业类比制造业 产能飞跃后可能解决更高阶问题 产生新需求 如星际旅行 可控核聚变 智能医药[82][83] - AI颠覆原有冯·诺依曼架构 LLM是全新概率引擎 从确定性输出变为合理可能结果 拓展软件能力边界[61][62] - 软件边界和形态发生变化 从服务顾问变为直接服务用户 从确定性软件变为能给出不确定结果的软件[63] - 测试和质量过程都需改变 因软件给出不确定结果[64]
Replit hits $3B valuation on $150M annualized revenue
Yahoo Finance· 2025-09-10 16:54
Replit has raised a $250 million round, valuing the company at $3 billion. Unlike other fast-growing vibe coders, Replit has not been running to VCs every few months, though we’ll see if that changes. Its last raise was in 2023 when it raised about $100 million that valued the company at $1.16 billion post-money. Replit has now raised a total of about $478 million, PitchBook estimates. The company, founded in 2016 by programmers Amjad Masad (pictured), Faris Masad, and designer Haya Odeh, says it’s been ...
AI 研发提效进行到哪儿,谁来守住质量底线?
36氪· 2025-09-01 02:35
AI在研发中的角色演变 - AI应用经历了三个阶段演变:从辅助编程的IDE插件工具到引入Agent的"氛围编程1.0时代",再到CLI模式的"氛围编程2.0时代"[2] - 2022年底ChatGPT推出被视为AI的"iPhone时刻",此后AI迅速介入更多研发环节并影响架构设计与组织协作[1] - 当前AI已深度融入需求调研、PRD评审、技术设计、测试及CI/CD等全交付生命周期环节[4] 研发效率提升数据 - 开发岗位效率提升约30%,主要集中在代码编写和评审环节[13] - 测试岗位提效约25%,涵盖用例编写和自动化测试[13] - 运维岗位提升约25%,尤其在DevOps场景和复杂问题排查方面[13] - 头条和抖音前端团队通过AI工具将设计稿转代码时间从1-2天缩短至几分钟[5] 代码质量与规范 - AI生成代码往往比人工编写更规范,附带详细注释且接口函数遵循统一标准[9] - 超过80%的场景能通过AI自动提升单元测试覆盖率[9] - AI可辅助代码评审,进行变量命名检查、格式规范验证及生成PR总结解释[10] - 采用TDD(测试驱动开发)模式可增强AI生成代码的可控性[10] 企业级应用挑战 - AI生成代码难以直接入库生产系统,需经过严格扫描校验流程[3][6] - 算力和token消耗导致高成本,限制大规模应用落地[20] - 管理层认知偏差可能削弱企业竞争力,需科学量化提效效果[21] - 复杂业务场景中AI难以理解全局业务逻辑,需依赖领域知识库支持[16] 人机协作模式 - AI要求开发者具备更强理解把控能力,最终责任仍在工程师本人[4] - Cursor等工具通过设置checkpoint确保开发者对结果保持掌控[5] - 开发者仅30%时间用于编码,其余用于沟通协作,AI在需求设计等环节作用显著[6] - 辅助模式可带来20%-30%效率提升,优于准确率不足的Agent模式[19] 架构与组织变革 - 出现AOA(AI Oriented Architecture)新架构范式,研发组织向AI中心化转变[24] - 岗位左移(测试向开发靠拢,开发向产品靠拢)和职级上移成为趋势[22] - 前端交互向LUI(Language User Interface)转变,可能推动"无边界体验"发展[23] - 未来Web应用可能消亡,交互方式转向自然语言,企业重点提供后端服务能力[25] 未来发展方向 - AI需从"高级工程师"向"架构师"演进,具备系统理解能力和自我进化能力[26] - 需解决大模型对具体项目业务理解不足的问题,降低知识库构建成本[26] - 可穿戴设备发展可能解决AI缺乏真实世界感知能力的问题,实现研发闭环[27][28] - 全栈开发通过AI辅助变得更易实现,人机协同可快速补齐技术短板[31] 技术实现路径 - 领域知识库普遍采用向量数据库结合Embedding技术[32] - RAG、上下文增强和MCP是搭建开放生态的手段而非目的[18] - 企业需提供高质量内部语料库才能生成符合自有规范的UI代码[30] - Agentic RAG结合自我演进能力可实现更智能的检索召回[32]
硅谷 AI 大转弯与二级市场的牛市|42章经
42章经· 2025-08-31 12:35
AI行业发展趋势 - AI进入高速发展阶段 核心衡量指标从Scaling Law转变为Token消耗量 7月Token消耗量较6月增长20%以上[3] - 行业预期发生变化 从追求AGI转向优化现有智能的可用性和易用性[4] - AI已超越应用阶段 进入产业化和工业化新阶段[6] 模型发展特点 - GPT-5代表重要转折点 通过整合分散的模型能力和前端界面提升可用性而非追求更聪明[5] - 模型智能评估重要性降低 OpenAI和DeepMind模型已获得IMO金银牌[18] - 模型进入瓶颈期 智能提升主要来自各环节增量优化 仍有几十个百分点提升空间[22] 基础设施优化 - Infra优化分为四层:模型与GPU间优化 模型与应用间推理加速 Agentic Infra优化 context层Infra优化[25][26][27] - 推理加速技术壁垒不高 部分开源 毛利空间存在争议[25] - 英伟达需求来自训练和推理两部分 Token消耗增长推动推理需求持续上升[29] 公司战略演变 - 模型 应用和Infra公司边界变得模糊 出现端到端打通全链条的趋势[13][14] - OpenAI招募创业公司创始人 Google加快应用端发力 Manus开展技术工作 Cursor开始训练自有模型[13] - 公司分工新共识:模型公司提升Token价值 Infra公司优化使用效率 应用公司换取数据反馈[11] 投资市场表现 - 英伟达股价上涨核心驱动是Token消耗量持续增长[29] - ASIC厂商和AMD股价表现亮眼 反映市场对降低成本方案的追求[30][31] - 美国AI估值存在泡沫 但发展前景依然被看好[48] 应用场景发展 - RL范式推动Coding 数学等可验证效果场景发展[37] - 垂类公司找到PMF Harvey AI在法律领域实现高ARR 医疗金融保险领域出现成功团队[37] - 视频Token消耗增速远高于文字 但真正多模态原生应用尚未出现[88][89] 二级市场差异 - 美国市场受AI发展预期主导 AI对整体景气度影响占三分之二以上[45] - 中国市场受多重因素影响 包括居民存款 投资意愿 风险偏好和制造业周期[46] - 腾讯成为国内AI板块代表性标的 因AI努力程度和战略高度获得市场认可[56] 一级市场特点 - 美国模型公司估值达到上百亿美元 出现全明星团队加持现象[79] - 第一梯队与第二梯队公司估值差距创历史纪录[82] - 国内一级市场两极分化严重 头部公司可能获得十倍资金[84] 新兴公司关注 - Reddit因社区数据质量高被ChatGPT高频使用 类似美国版知乎+小红书+B站[76] - ServiceNow通过Workflow梳理和软件交付获得500强客户 增长速度加快[76] - Figma凭借协作场景优势和中生代公司地位 有望将AI融入协作场景[77]
AI 研发提效进行到哪儿,谁来守住质量底线?
AI前线· 2025-08-31 05:33
AI工具在研发流程中的应用现状 - AI工具已深度融入研发全流程 覆盖需求调研 PRD评审 技术设计 测试及CI/CD等环节 渗透率接近100% [9] - 代码生成效率显著提升 如Figma设计稿还原代码从1-2天缩短至几分钟 [9] - 开发者30%时间用于编码 70%时间用于沟通与流程 AI在需求设计 任务拆解等环节作用突出 [11] AI提效的量化表现与质量影响 - 开发岗位效率提升约30% 测试岗位提效25% 运维岗位提升25% 主要体现在代码编写 评审和DevOps场景 [18] - AI生成代码规范性优于人工 附带详细注释 接口和函数层面遵循统一规范 [13] - 单测Agent使80%场景能覆盖传统自测环节 代码评审AI辅助可检查命名 格式规范并生成PR总结 [14] 技术演进与阶段划分 - AI应用经历三阶段:IDE插件辅助编程→Cursor为代表的氛围编程1.0→CLI模式氛围编程2.0 [5][6] - Vibe Coding概念推动CLI模式发展 门槛更高但用户群体更广 定制自由度提升 [6] - 研发范式遵循EPCC流程:探索 计划 编码 提交 需分环节让AI协助 [7] 落地挑战与成本问题 - 算力和token消耗导致高成本 如用户花200美元实际消耗上万美元算力 [24] - 效果难以量化 不同用户对Claude Code和Copilot等工具感受差异明显 [25] - 管理层认知存在两极分化:传统方式推动研发或过度乐观认为AI能取代研发人员 [25] 架构与协作模式变革 - 研发组织向AI中心化转变 MCP协议应用形成AOA(AI Oriented Architecture)新架构范式 [28] - 岗位左移(测试向开发靠拢 开发向产品靠拢)和职级上移(高级岗位比例提高) [27] - 交互方式从图形化UI转向LUI(Language User Interface) 未来可能发展为"无边界体验" [27] 人机协作与责任边界 - AI不会替代工具团队 研发流程未被打破 但加速各角色效率 人需承担更高层次决策 [10] - AI对人的要求更高 工程师需对AI生成代码负最终责任 要求更强理解和把控能力 [8][9] - 初级开发者可能无法完全理解AI生成代码 出现问题时依赖AI修复反而导致反噬 [19] 未来发展方向 - AI需从"高级工程师"向"架构师"演进 具备系统理解能力和自我进化能力 [31] - 可穿戴设备普及可能解决AI缺乏感知能力问题 实现研发流程真正闭环 [32] - 领域知识库建设需结合向量数据库和Agentic RAG技术 不同业务差异显著 [36] 业务场景实践 - 电商中台团队通过领域知识库接入AI大脑 在0~1场景和老项目迭代中表现超预期 [22] - 企业UI生成需提供高质量内部语料训练 否则结果只能停留在通用层面 [34] - 全栈开发在AI辅助下更易实现 程序员可通过解释模式和TODO项补齐能力短板 [35]
a16z 全球 AI 产品 Top100:DeepSeek 增长放缓,「中国开发,出海全球」成为新常态
Founder Park· 2025-08-28 11:13
生成式AI应用生态系统稳定性 - 生态系统趋于稳定 换血速度明显放缓 网页端新上榜应用11款 移动端新上榜应用14款 相比第四版榜单网页端17款新上榜的情况有所减少 [2] 中国AI应用全球表现 - 网页端中国应用包括Deepseek第3名 Quark第9名 豆包第12名 Kimi第17名 Qwen第20名 Lovable第23名 Manus第31名 可灵第33名 海螺第45名 Monica第49名 SeaArt第19名 Cutout Pro第34名 [4] - 移动端中国应用包括豆包第4名 百度第7名 Deepseek第8名 美图第9名 B612第12名 Facemoji第13名 Cici第14名 Hypic第16名 Wink第17名 BeautyPlus第32名 BeautyCam第34名 Gauth第40名 Quark第47名 Airbrush第49名 [4] - 中国开发出海全球成为新常态 网页端榜单大部分产品在中国开发后出海 绝大部分用户来自其他国家 移动端Top 50中22款应用在中国开发 主要用户遍布全球 [8][32] - Manus年化收入达9000万美元 流量来源多元化 巴西排名第一 美国其次 [32] - 美图公司5款应用上榜 字节跳动推出多款面向全球产品 [8][32] 主要厂商竞争格局 - Google旗下四款产品进入网页端榜单 Gemini网页端访问量达ChatGPT的12% 移动端月活接近ChatGPT的一半 近90%月活用户来自Android平台 [8][11] - Grok移动端月活超过2000万 7月新模型Grok4发布及AI伴侣头像功能上线后移动端用户量大幅增长近40% [8][18][19] - DeepSeek增长显著放缓 移动端月活从峰值下滑22% 网页端较2025年2月峰值下降超过40% [8][25] - Meta AI增长平缓 网页端排名第46 未进入移动端榜单 2025年5月下旬亮相后增长速度远慢于Grok [22] - Perplexity网页端和移动端保持强劲增长 Claude网页端持续增长 [25][26] 应用类别分布 - 三类应用主导市场:通用聊天助手 创意工具 AI陪伴类应用 [34] - 陪伴类产品三款新上榜:Juicy Chat Joi和Ourdream Characterai JanitorAI SpicyChat PolyAI CrushOnAI和CandyAI仍在榜 [34] - 创意类工具涵盖图像 视频到音频生成 包括Midjourney PhotoRoom Leonardo Cutout Pro Veed和ElevenLabs [34] Vibe Coding赛道发展 - Vibe coding类应用用户粘性极高 某顶级平台美国用户群在注册后几个月内保持超过100%收入留存率 [39] - 带动周边工具流量增长 如数据库提供商Supabase流量增长与核心vibe coding平台崛起同步 过去九个月显著加速 [41] - Lovable和Replit首次进入主榜单 Bolt进入Brink List潜力榜 [36] 常青树企业分析 - 14家公司五期榜单始终在榜 横跨通用助手 情感陪伴 图像生成 图像视频编辑 语音生成 生产力工具及模型托管领域 [44][47] - 仅5家拥有自研基础模型 7家依赖API或开源模型 2家为大模型聚合平台 [48] - 除Midjourney和Cutout Pro外均获得风险投资 来自美国 英国 澳大利亚 中国和法国 [50] - 如不包含第一次榜单 还有5家可入选All Stars:Claude DeepAI JanitorAI Pixelcut和Suno [53]
Karpathy氛围编程最新指南,三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro
36氪· 2025-08-26 01:31
AI编程工具分层结构 - 提出三层AI编程结构:第一层Cursor负责自动补全与小范围代码修改(75%使用频率)[3][9],第二层Claude/Codex用于较大功能块实现与快速原型开发[5][8],第三层GPT-5 Pro解决最棘手bug与复杂抽象问题[4][5] - 工具选择策略基于任务复杂度:简单局部任务用Cursor,中等功能用Claude/Codex,极端难题用GPT-5 Pro[4][13] - 结构源自实战经验,强调工具按频率和任务类型组织[4] 高带宽沟通与实施方法 - 通过代码片段或注释直接展示任务意图,实现高效信息传递[7] - 对具体代码高亮后请求修改,避免纯文字描述的低效性[7] - 在大型项目中需将相关内容塞入上下文,小型项目则直接包含所有文件[16] 工具优势与适用场景 - 在陌生领域(如Rust、SQL)不可或缺,能快速生成一次性可视化或调试代码[11] - 节省重复劳动,支持快速原型开发和跨领域代码尝试[5][11] - GPT-5 Pro能挖掘深奥文档论文,处理文献综述和抽象结构清理[13] 当前局限性及改进需求 - 模型易跑偏,需常按ESC终止,避免全面托管模式[12] - 代码质量存在问题:滥用try/catch、抽象过度复杂、代码膨胀(如嵌套if-else替代列表推导)、重复代码而非使用辅助函数[12] - 需手动清理编码风格问题,缺乏The Zen of Python美感[12] - 交互性局限:模型倾向于写代码而非解释原因[12] 开发者实践与社区反馈 - 网友验证分层有效性:小问题靠AI补全,大问题靠多模型尝试并人工监督[15] - 模型切换成为艺术,不同模型针对特定任务效果差异显著[17] - 确保代码一致性需提供详细需求说明、功能拆解及验收标准(含代码风格规范)[19] - 开发流程建议:求思路优缺点分析→写第一版代码→复查API文档→测试→提交→迭代循环[16] 行业影响与概念演进 - 提出"代码后稀缺时代"概念,代码可随意创造删除[12] - Vibe Coding指南从1.0持续迭代,避免沦为概念游戏[13] - 工具可能性拓展引发开发者焦虑,需通过社区交流推动集体进步[13][14]
Karpathy氛围编程最新指南!三层AI编程结构:顺境Cursor,逆境Claude,绝境GPT-5 Pro
量子位· 2025-08-25 15:47
AI编程三层结构框架 - Karpathy提出AI编程的三层递进结构 将编程任务按复杂度和工具特性分为三个层级进行分配[1][3] - 第一层使用Cursor处理约75%的常见情况 通过Tab键自动补全代码和小范围修改[9] - 第二层使用Claude Code/Codex实现较大功能块 特别适用于开发者不熟悉的领域如Rust和SQL语句[14][16] - 第三层使用GPT-5 Pro解决最棘手问题 如复杂bug修复和深度文档研究[4][20] 工具配置与使用策略 - Cursor支持配置多模型 包括claude-3.5-sonnet、gpt-40、gpt-5等主流AI编程模型[15] - 采用"顺境Cursor 逆境Claude/Codex 绝境GPT-5 Pro"的分层调用策略[6][7] - 通过代码片段或注释实现高带宽沟通 比文字描述更高效传递任务意图[11][12] 当前AI编程工具的局限性 - 模型容易跑偏 需要频繁终止任务 不适合全面托管模式(YOLO模式)[16] - 生成代码存在质量问题 包括滥用try/catch 代码膨胀 重复代码块等问题[17] - 缺乏解释性和交互性 工具更倾向于写代码而非解释代码逻辑[18][19] 开发者实践经验 - 网友使用统计显示约80%为自动补全 18-19%为功能添加 很少用于bug修复和重构[28] - 零样本新功能生成效果不稳定 通常需要大量清理工作[28] - 全自主模式表现最差 需要高度监督才能产出有用结果[28] 社区反馈与优化建议 - 开发者建议提供详细需求说明和功能拆解 附验收标准确保代码一致性[31] - 推荐采用增量式开发流程:需求分析-思路生成-代码实现-复查测试的循环[25] - 模型间切换已成为一门艺术 不同模型针对特定任务表现差异显著[29]