Workflow
超级智能(ASI)
icon
搜索文档
微软CEO深度访谈:Azure利润很大程度来自配套服务,模型开发商会陷入"赢家诅咒"、平台价值不会消失
华尔街见闻· 2025-11-13 08:37
Azure/云策略 - Azure/AI工作负载不仅需要AI加速器,还需要大量配套支持,利润空间很大程度上来源于这些配套服务[4] - 将Azure打造成为长尾工作负载的终极平台,这是超大规模云业务的本质[4][8] - 必须在最基础的高端训练硬件层保持绝对竞争力,但不能挤占其他业务,因为微软并非仅与少数客户签订裸金属服务合同[8] - 超大规模云业务归根结底是为AI工作负载提供长尾服务,为此将保持领先的裸金属即服务能力[8][300] 自研芯片策略 - 微软将通过自有模型与定制芯片的闭环优化来降低总拥有成本(TCO),这种垂直整合策略旨在为大规模AI工作负载提供成本优势[4] - 任何新加速器的最大竞争对手甚至是英伟达的上一代产品,评估标准是集群整体的TCO[7][363] - 在自有MAI模型和自研芯片之间建立闭环,这被视为做自研芯片的“天赋人权”,能够根据具体任务设计微架构[7][367] - 微软拥有从计算到AI芯片的扩展成功先例,将管理包含自研芯片、英特尔、AMD等多供应商的平衡集群[365] 与OpenAI的合作关系 - 根据新协议,微软拥有OpenAI所有系统级创新(包括芯片和系统设计)的完整IP授权,除了消费级硬件[4] - 微软对OpenAI的项目拥有全部访问权限,直接获得所有知识产权,同时微软也向OpenAI提供了大量知识产权以帮助其起步[6][369][371] - 双方共同建造了所有超级计算机,微软可以从OpenAI和自家MAI+Maia团队两边汲取最好的技术,甚至直接使用OpenAI的设计[4][372] - OpenAI的无状态API业务(PaaS)是Azure独占的,而其SaaS业务(如ChatGPT)可在任何地方运行,但任何定制协议或涉及无状态API的合作伙伴集成都必须通过Azure[379][382] 模型商业化与行业利润 - 总会有一个相当强大的开源模型可供使用,前提是拥有配套的数据资源和基础设施支撑[4][12] - 模型开发商可能陷入“赢家的诅咒”,即完成艰巨创新后成果易被复制而商品化,而掌握数据根基、情境工程能力及数据流动性的企业可获取检查点进行再训练[4][12][119] - 公司的未来将是工具业务与为AI智能体提供计算资源的结合,微软现有的最终用户工具业务将演变为支持代理工作的基础设施业务[12][177] - 价值不会完全迁移到模型层,拥有数据和“脚手架”(应用层基础设施)的企业同样能获取价值,行业结构将迫使专业化,存在多个模型和赢家的空间[106][150][268] AI基础设施与数据中心 - 公司目标是每18至24个月将训练能力提升10倍,新一代Fairwater 2架构将使训练能力较GPT-5提升整整10倍[5][18] - Fairwater 2数据中心内的光器件数量几乎相当于两年前全球所有Azure数据中心的总和,拥有约500万个网络连接[13][18][19] - 设计支持跨站点聚合算力资源来执行大型训练任务,资源会依次用于训练、数据生成和推理,而非永久处理单一工作负载[13][21] - 基础设施需具备可替换性,避免被单一代际或模型架构锁定,以应对快速的技术迭代和不同的功率密度、冷却要求[34][35][289][294] AI代理(Agent)与GitHub战略 - 提出“Agent HQ”(智能体总部)概念,将其描述为AI代理的“有线电视”,可打包Codex、Claude、Cognition、Grok等任何人的智能体到一个订阅中[11][90][91] - 在GitHub上构建“Mission Control”(任务控制中心),允许用户启动、监控多个智能体,并在独立分支中工作,实现对代码库的控制和多个智能体输出的消化[11][90][92] - GitHub在代码库创建、拉取请求(PRs)等方面处于历史最高水平,每秒有一名开发者加入,其中80%会进入GitHub Copilot工作流程[87][89] - 即使AI编码代理市场竞争加剧,GitHub作为代码托管的平台地位将使其持续增长,无论哪个代理获胜[96][100] 商业模式转型与市场扩张 - AI的转型类似于从服务器到云的迁移,虽然初期可能担心利润率收缩,但实际会大规模扩展市场,例如云端使印度等地的IT购买能力按比例提升[63][64][71] - 商业模式将包括广告、交易、设备毛利润、订阅(消费者和企业)及消费量计费等多种计量方式,订阅本质是对封装消费权利的授权[50][52][54] - 以GitHub Copilot为例,AI编码代理市场从去年约5亿美元年度运营收入增长至当前50-60亿美元,呈现10倍扩张,表明市场在快速扩大[75][76][96] - 从客户端-服务器计算到超大规模计算的转型中,微软的份额可能降低,但所在市场的业务规模数量级更大,只要市场创造价值且有多个赢家,公司表现仍会不错[100][101] 资本支出与投资策略 - 业务正转变为既是资本密集型也是知识密集型,需用软件能力提高资本支出回报率(ROIC),通过优化实现每美元每瓦特token吞吐量的显著提升(季度或年度改善可达5倍、10倍甚至40倍)[384] - 资本支出决策需考虑工作负载多样性、客户多样性、地理分布和技术迭代节奏,避免过度建设单一代际产能而导致资产被困[276][284][294][342] - 将一部分资源分配给研究计算,视作研发投入,允许其在一定时期内(如两年或16个月)进行数量级扩展,其余部分由实际需求驱动[386] - 采用灵活的基础设施建设策略,包括租赁数据中心、购买托管容量、甚至采用GPU即服务,并欢迎其他“新兴云”成为Azure市场的一部分,以服务客户需求[282][283][352][356] 全球战略与主权AI - 美国科技行业和政府的优先事项是确保领先创新,并在全球建立对美国技术栈的信任,美国公司需将资本投向世界各地进行外国直接投资[393][399][400] - 在欧盟等地建设主权云和“Azure主权服务”,提供密钥管理、机密计算(包括GPU中)等服务,以满足当地数据驻留和法律要求,赋予其真正的自主权[402][403][404] - 相信各国会利用AI创造经济价值,开源和多个模型的存在将提供连续性并避免集中风险,这是一种制衡力量[410][411][412] - 超大规模投资需考虑全球布局,应对不同地区的监管需求、数据主权和电力成本等因素,而非仅集中在美国本土[340][341][350]
继OpenAI千亿豪赌后,阿里3800亿入局:全球算力之战,谁能给出终极答案?
锦秋集· 2025-09-24 10:17
全球算力投资格局 - 英伟达与OpenAI宣布千亿美元级别AI算力集群合作[1] - 阿里巴巴宣布投入3800亿人民币加强AI基础设施并持续追加投资[2] - OpenAI、谷歌、Meta、xAI及阿里巴巴等全球科技巨头均加入算力竞争[3][4] 算力竞争战略核心 - 算力基础设施成为AGI和ASI竞赛的战略基石[5] - 构建算力壁垒需具备未来预判、工程执行、系统架构颠覆和开发者生态构建能力[6][7] - 英伟达作为核心硬件供应商提供行业参考标准[8] 英伟达与英特尔合作 - 英伟达向英特尔投资50亿美元联合开发定制数据中心和PC产品[10] - 合作使英伟达投资增值30%获利10亿美元[10] - 双方合作开发chiplet封装PC产品显著提升笔记本电脑市场竞争力[10] 市场竞争影响 - 英伟达与英特尔合作对AMD构成重大威胁[11] - ARM架构因英伟达获得英特尔技术支持面临竞争压力[11] GPU市场动态 - GPU市场经历从产能紧缺到价格战再回归产能为王的周期变化[12] - 初创公司获取少量GPU容易但大规模部署困难[12] 云服务商战略 - 甲骨文凭借强大资产负债表为OpenAI等客户提供3000亿美元超长期计算订单[13] - 采用灵活硬件策略兼容英伟达Infiniband和Arista以太网技术[13] - 通过精密数据中心模型预测算力增长和收入[13] AWS复苏策略 - AWS通过为Anthropic等客户提供海量GPU和自研Trainium芯片推动收入增长超20%[14] - 升级传统数据中心成本相比GPU价格微不足道[14] - Trainium芯片在特定大规模场景下展现效率优势尽管通用性较差[15] Blackwell架构性能 - GB200部署成本为H100的1.6倍但性能提升高度依赖工作负载[17] - 预训练任务性能提升约2倍属边际提升[20] - 特定推理任务性能提升达6-7倍每美元性能提升3-4倍[20] 系统可靠性挑战 - GB200 NVL72将72个GPU互联形成单一故障域[18] - 故障爆炸半径问题导致单GPU故障可能使整个机柜下线[20] - 采用64+8工作负载管理策略应对可靠性挑战[20] 硬件架构演进 - AI推理分为预填充(计算密集型)和解码(内存带宽密集型)两个阶段[28] - 业界采用分离式部署策略优化不同任务[21] - 英伟达推出专用CPX芯片剥离HBM降低制造成本[21] 英伟达核心竞争力 - 创始人黄仁勋采用YOLO式大胆决策策略如提前投资Xbox芯片产能[23] - 通过锁定供应链产能策略主导市场[23] - 管理风格依赖商业直觉而非数据报表[24] 技术执行力 - 芯片设计实现一次成功能力避免多次修订延迟[26] - Volta芯片在最后时刻增加Tensor Cores奠定AI硬件霸主地位[26] - 强大执行文化确保产品准时交付[25] 未来资金部署 - 英伟达年产生数千亿美元自由现金流面临巨额资金部署挑战[27] - 反垄断监管限制大型并购选项[27] - 可能投资数据中心、能源基础设施或机器人和AI工厂[27]
AI若解决一切,我们为何而活?对话《未来之地》《超级智能》作者 Bostrom | AGI 技术 50 人
AI科技大本营· 2025-05-21 01:06
AGI技术发展现状 - 通用人工智能(AGI)正从科幻走向现实,DeepSeek等模型引发OpenAI、谷歌等顶级公司模型大战[1] - 2025年AI领域出现重大突破,如Manus通用Agent问世和Cursor编程工具流行[1] - 大语言模型如ChatGPT和DeepSeek虽普及,但距离真正AGI仍有差距[11] Nick Bostrom的学术贡献 - 2005年在牛津大学创办人类未来研究所,专注研究"存在性风险"[4] - 2014年出版《超级智能》,提出"智能爆炸"假说,成为AI风险研究里程碑[5] - 2024年出版《未来之地》,探讨技术成熟后的乌托邦社会[7][9] 人工智能发展路径 - AI发展既带来巨大风险也蕴含巨大机遇,需要平衡两方面考量[13] - "智能爆炸"可能导致AI能力在短期内呈指数级增长[59] - 当前AI系统表现出意外的人类化特征,为人机对齐提供新途径[56][57] 技术成熟社会构想 - "已解决的世界"指技术成熟状态,包含超级智能和纳米技术等先进科技[28] - 技术成熟将消除物质匮乏和疾病痛苦,但可能导致人类失去目标感[29] - "自我变革能力"使人类能直接修改自身精神状态,带来伦理挑战[32][35] 人机共存模式 - 理想状态是AI成为人类意志的延伸,类似父母关爱子女的关系[50] - 数字心智的道德地位将成为重要伦理议题,需扩展同理心概念[37][38] - 人类可能仅需宇宙资源的极小部分即可实现乌托邦[50] 未来社会形态 - 乌托邦居民可通过"人为目标"创造活动意义,如游戏设定规则[42][43] - 快乐、体验质感、理解和活动构成乌托邦生活基础要素[43] - 教育体系需从培养工人转向培养欣赏艺术和美的能力[53] 人工智能研究前沿 - AI对齐是关键技术挑战,需开发可扩展的监督方法[75] - 数字心智的福利研究是新兴领域,Anthropic已设立算法福利官[76] - 需考虑AI可能加入的"宇宙宿主"群体及其潜在规范[73][74] 现实与未来平衡 - 当前是充满目标的黄金时代,解决现实问题与规划未来同样重要[65] - 人类可能正处于文明转折点,当前决策影响深远[65][66] - 技术界忽视AI可能存在的宇宙级伦理关系研究[73]
扎克伯格最新专访:AI 会在知识工作和编程领域,引发一场巨大的革命
搜狐财经· 2025-04-30 10:02
文章核心观点 Meta首席执行官马克·扎克伯格在接受媒体采访时,谈到了Meta对AI发展格局的看法,回应外界质疑,介绍Llama 4模型进展,探讨AI应用场景、开源、商业化等问题,认为AI将带来多方面变革,未来充满机遇和挑战 [1] 分组1:AI发展格局与模型能力 - Meta认为尽管DeepSeek在特定领域有进展,但Llama 4模型能提供更高效率和更广泛功能 [1] - 预计未来12到18个月,Llama研发工作大部分代码将由AI编写,且会增加人类工作需求 [1] - Meta AI每月用户接近10亿,今年将构建个性化循环,是下一个发展方向 [2] 分组2:Llama 4模型进展 - 已发布Llama 4的Scout和Maverick模型,性价比高、原生支持多模态、可单台主机运行,未来几个月将推出类似Llama 3 8B参数的'Little Llama' [4] - 即将推出参数超2万亿的Behemoth前沿模型,需构建大量基础设施进行后期训练 [4] - Llama 4推理版本将在未来发布,低延迟和高性价比对消费级产品设计重要 [7] 分组3:模型评估与基准测试 - 开源模型领域发展良好,今年有许多优秀开源模型涌现,'开源模型将普遍超越闭源模型'的预测正成为现实 [5] - 外部基准测试有局限性,Meta将模型评估锚定在Meta AI产品的'北极星'用户场景和用户反馈上 [8] - 需谨慎看待一些基准测试结果,Meta主要参考内部指标 [9] 分组4:不同实验室优化方向 - 不同团队针对不同方面优化,Anthropic专注编码及智能代理,OpenAI侧重推理能力,Meta关注快速自然交互和多模态能力 [12] - 实现闭环的软件工程师(AI)是抢先达到超级人工智能的关键,Meta投入编码工作,开发编码和AI研究代理 [15] 分组5:AI应用场景与发展 - AI将在知识工作、编程、搜索技术、娱乐等多方面引发革命,未来媒体消费将更具互动性 [23][25] - 人们会利用AI处理社交任务,AI社交不会完全取代现实连接,未来AI具身性将增强 [27][28] - 增强现实领域设计应不干扰视线,促进人际互动,将数字内容无缝融入其中 [30][31] 分组6:模型比较与许可证 - 与DeepSeek相比,Llama 4模型尺寸更小、效率更高,在多模态能力上领先 [35] - Meta认为Llama许可证合理,目的是与大型云服务商沟通合作,目前未遇公司因许可证拒绝使用 [37][39] 分组7:开源与模型选择 - Meta构建自己的大模型以满足特定需求,但不排斥在特定场景使用其他模型 [40][41] - Meta需警惕跟进者的开源行为,要保持推动行业开源的战略方向 [42][43] 分组8:模型价值观与提炼 - 模型内含价值观和世界观,不同模型存在根本性偏见,推理和编码领域需关注安全问题 [46][48][49] - 模型提炼是开源有趣的事,可结合不同模型优点,但要解决安全问题 [49][50][51] 分组9:AI商业化模式 - AI不同应用适合不同商业模式,广告模式对免费服务有效,也会有付费的高级服务 [52][53] 分组10:CEO角色与决策 - 马克·扎克伯格通过招募人才、跨团队协调、推动基础设施建设、把控产品质量等方式监督项目 [54][56] 分组11:其他问题回应 - 作为美国公司,Meta默认与任政府建立富有成效关系,在人工智能治理上要为决定承担责任 [60] - 难以预测关税对建设数据中心的影响,每周效率最高的事不固定 [64][65] 分组12:未来趋势与展望 - 技术发展将释放巨大创造力,未来人们会更多参与线上互动,技术或增加社会对劳动力的需求 [66][67][69]
李录最新交流剖析新秩序:通过“四两拨千斤”,中国还可以释放很多改革红利……
聪明投资者· 2025-04-26 01:08
中国经济转型与改革红利 - 中国经济需疏通两大关键堵点:保障体系低效依赖家庭储蓄方式,以及资本市场未能有效连接消费与财富循环[11][18] - 商业保险机制可大幅提升保障效率(如100万大病治疗费通过年缴1万保费实现),释放约50%的高储蓄率进入消费[13][16] - 消费占GDP比例从48%-49%降至40%,远低于发达国家70%-80%水平,需通过制度变革激活香港资本市场连接内地储蓄(港股通现存IPO投资限制等)[21][23] 全球贸易秩序重塑 - 美国单边关税动摇WTO规则执行力,全球贸易体系进入重构期,中国可借机推动"东盟+中日韩"区域自贸体[33][43] - 中国内需驱动转型加速,生产外销占比50%不可持续,需通过改革释放增量(如2023年储蓄率逼近50%)[31][36] - 美元资产锚定地位受挑战(美国联邦债务超GDP100%,年增2万亿短债),为新秩序创造窗口[35] 科技与创新周期 - 经济体持续高增长后易现创新井喷(如英国1820-1860、美国1940-1960),中国20-40岁群体进入密集创新阶段[57][61] - AI发展受三重动力驱动:市场竞争、地缘压力、人类好奇心,技术演进已形成不可逆惯性[63][64] - 当AI接近AGI临界点时,中美合作将从战略选择变为生存必需[65][67] 国际关系新范式 - 修昔底德陷阱存在双重漏洞:未考虑中国"防御-贸易-文化融合"传统思维,以及现代经济累进增长弱化零和博弈[50][55] - 核威慑使中美共存成为生存状态,台湾问题可通过非军事手段解决[48][53] - 区域经济联盟可基于文化纽带(如东亚儒家圈)替代意识形态划分,形成新多极秩序[45][46]