Software 2.0

搜索文档
深度|Andrej Karpathy:LLM 是一种新型的OS,Software 3.0 时代你的编程语言就是英语
Z Potentials· 2025-06-27 03:31
软件范式革命 - 软件正在经历70年未有的变革 从Software 1 0(人类编写的经典代码)到Software 2 0(神经网络权重) 再到Software 3 0(基于自然语言提示词的编程)[2][3] - Software 3 0的核心是英语作为编程语言 通过提示词直接操控大语言模型 实现更高效的开发[3] - 未来开发者需同时掌握三种范式 根据功能需求灵活选择编程方式[4] LLM操作系统生态 - 大语言模型(LLM)本质是新型操作系统(LLM OS) 其核心架构包含:LLM作为CPU 上下文窗口模拟内存 外部工具充当外设[5] - 当前LLM OS处于类似1960年代大型机的"分时共享"阶段 算力集中在云端 用户通过终端交互 个人化计算革命尚未到来[6] - 交互界面仍处于命令行终端阶段 尚未出现类似Windows的图形界面(GUI)[6] AI产品开发机遇 - 最大机会在于构建"部分自治"的AI产品 如钢铁侠战衣般增强人类能力 而非追求全自动智能体[10] - 成功案例(如Cursor Perplexity)已验证模式:自动管理上下文 智能调度多模型 通过定制GUI加速人类验证[10] - 需设计"自治滑块"机制 平衡AI生成内容复杂度与人类审查效率[10] 编程民主化与智能体兼容性 - Software 3 0极大降低编程门槛 "Vibe Coding"模式允许非专业人士通过自然语言实现开发[11] - 未来软件需新增第三类消费者(智能体) 现有GUI/API设计需适配智能体的理解与操作需求[11] - 需建立新标准:文档提供Markdown版本 网站支持命令行指令 提升智能体可读性[12]
AI大神的人生,和他YC的刷屏演讲一样精彩
虎嗅· 2025-06-24 23:56
行业趋势与技术创新 - 软件行业正在经历70年来的第三次根本性变革,进入"Software 3.0"时代,特点是可以用自然语言直接编程 [2] - 大模型不仅是新电力,更是新的操作系统,当前阶段相当于计算机发展的1960年代 [2] - "Vibe Coding"(氛围编程)概念成为AI时代编程方式的标准术语,与PC革命时的"所见即所得"概念具有同等历史地位 [3][51] - "Software 2.0"概念提出传统手写代码正在被神经网络逐步替代,程序员通过训练数据教会神经网络处理逻辑 [29][30] 公司发展与技术突破 - OpenAI早期团队专注于开发安全人工智能,奠定技术基础并专攻深度学习和计算机视觉方向 [23] - 特斯拉Autopilot采用神经网络替代传统C++代码,实现端到端学习并处理多摄像头时序信息融合 [28] - DeepSeek以500万美元低成本(2048块GPU训练2个月)实现接近GPT-4性能的开源大模型,打破行业认知 [47][48] - Eureka Labs致力于AI教育革命,推出"LLM101n"课程指导学生从零构建大语言模型 [43][44] 技术领袖影响力 - Andrej Karpathy提出的"Software 2.0"和"Vibe Coding"成为定义时代的技术概念 [3][29][52] - 其技术演讲和课程(如斯坦福CS231n)影响全球AI从业者,观看次数超百万 [18] - 通过推文改变行业对中国AI能力的认知,使DeepSeek获得国际关注 [46][48] - 强调人机协作重要性,提出"AI增强人类"而非取代人类的平衡观点 [54][55]
大摩TMT论坛-英伟达会议实录
2025-03-06 01:52
纪要涉及的公司 NVIDIA 公司 纪要提到的核心观点和论据 1. **需求方面** - **数据中心需求强劲**:Q4 数据中心环比增长 18%,大部分收入来自 Hopper,尽管 Blackwell 延迟且投资回报率更高,但 Hopper 仍在大量销售,因许多客户在完成数据中心构建或扩展现有集群,需要更多计算资源,且 Blackwell 供应需时间,客户使用 Hopper 过渡 [8][9][10][12][13] - **后训练和模型调优计算需求大**:后训练和模型调优所需计算量比前训练多几个数量级,预训练阶段需更多计算来改进模型和处理多模态内容,后期训练微调模型、提炼模型对推理至关重要,推理是额外计算的关键驱动因素,训练后增长和模型规模增加将提升计算需求 [16][17][18][19] - **推理模型带来积极影响**:推理是模型类型的重要新阶段,未来软件变革和自主软件解决方案需能决策和推理的模型,创建推理模型需特定类型数据和专家数据,公司推理平台性能过去两年提高超 200 倍,新推理模型前期生成令牌增加了令牌生成和整体收入机会 [20][22][23][25][28] 2. **产品方面** - **Blackwell 表现出色但有复杂性**:Q4 Blackwell 收入达 110 亿美元,超出预期,产品有不同版本和变体,带来前所未有的复杂性,GB200 取得进展,多个地方有普遍可用性,公司 Q1 继续努力实现云端可用性并交付给客户,不同配置重要,部分大型集群首次专门用于前端推理 [30][31][34][35] - **Blackwell Ultra 前景乐观**:Blackwell 架构转向数据中心规模基础设施,GB200 现有架构市场情况良好,Ultra 版本架构相同,只是组件类型不同,预计不会有真正挑战 [37][38] - **定制硅竞争影响有限**:定制硅受关注约七年,但构建计算困难,不仅涉及芯片设计,还需理解开发者社区、软件、系统及兼容性,很多定制硅设计未进入市场或半途而废,NVIDIA 性能最佳且总拥有成本最低,客户大多仍选择 NVIDIA [39][40][42][43][44][46] - **网络业务有增长机会**:InfiniBand 和以太网都有增长机会,InfiniBand 是重要端到端系统,顶级超级计算机使用,其部分最佳功能将转移到以太网,以太网用于人工智能,公司从 NVL8 或 NVLink 8 转向 NVL72,集群规模变大,网络业务 Q1 会增长,是完整系统性能重要部分 [52][53][54][56] 3. **出口管制方面** - **拜登 AI 扩散规则待审查**:拜登 1 月初宣布的 AI 扩散规则预计 5 月生效,目前处于审查中,公司与美国政府讨论,认为该规则对全球计算和自身计算无好处,希望政府合理化更好的扩散过程 [62][63][65][68] - **H20 产品受出口管制影响**:H20 产品专为中国市场打造,符合当前出口管制,性能比 Blackwell 低约 25 倍,中国市场竞争激烈,公司向中国出口量约为出口管制前一半,当前季度将保持该水平,只要需求存在且在出口管制范围内,H20 就会发货 [70][72][73][74] 4. **毛利率方面** - **短期毛利率有压力但有望回升**:4 月毛利率比预期稍差,回到中 70%水平可能需更长时间,公司为将产品尽快交付客户加速各项工作,下半年将专注增加材料供应商和微调成本结构,有信心回到中 70%水平 [75][77] - **Blackwell 异常情况已解决**:Blackwell 因大规模更改出现异常情况,现工作顺利,未来不会有此类情况,公司可保持 Q4 中 70%水平并继续提升 [80] 5. **运营支出方面** - **研发投入大且持续增长**:公司研发支出年化约 160 亿美元,有能力推进多种架构,研发团队创新工作多且吸引人才,虽难跟上收入增长,但会谨慎推进,预计今年增长约中 30%,略低于去年 [82][83][86] 6. **增长举措方面** - **软件和服务收入增长**:软件是公司整体展望重要部分,推动软件 2.0 发展,公司开发大量应用程序和库,帮助行业发展,重点关注企业客户,NVIDIA AI E 和 NIMs 重要,本季度软件和服务预订接近 20 亿美元年化收入,未来将显著增长 [88][90][91][93] - **长期项目有潜力**:物理人工智能和机器人技术领域,公司希望在计算、设计和软件平台方面成为合作伙伴,类似在汽车领域的工作模式,机器人技术发展可能比汽车行业快,公司通用架构可用于多领域,在行业特定方向有额外投资但非最大部分 [96][98][99][101][103] 其他重要但是可能被忽略的内容 - 2025 年 Q4 财报摘要:每股收益 0.89 美元,超出预期 0.04 美元;收入 393.3 亿美元,同比增长 77.94%,超出预期 11.9 亿美元 [1] - 会议提醒演示包含前瞻性陈述,建议投资者查阅向 SEC 提交的报告获取业务风险和不确定性信息 [6] - 摩根士丹利研究披露网站为 morganstanley.com/researchdisclosures,有问题可联系销售代表 [7]