Workflow
A100
icon
搜索文档
OpenAI和英伟达,正在把GPU玩成“金融产品”
36氪· 2025-09-30 03:25
9 月 23 日,一则消息搅动全球科技圈:英伟达可能向 OpenAI 投入高达 1000 亿美元,共同建设规模达 10 吉瓦(GW) 的 AI 数据中 心。虽然这一消息尚未得到权威确认,但无论真假,它都折射出一个更重要的事实——算力正在被金融化。 为什么说这不是空穴来风? 回顾过去一年,全球 AI 产业的资金流向已发生显著变化。 根据PitchBook 数据,2 024年全球生成式AI融资560亿美元,占到 A I 产业总 融资额的一半以上。微软、谷歌、Meta 的资本开支也刷新纪录,仅微软在 2024 年的资本开支就达到 550 亿美元,其中大部分用于建设 GPU 数据中心。 如果说 ChatGPT 的发布改变了人机交互方式,那么 GPU 金融化可能会改变整个 AI 产业的资本运行逻辑。这不是一家公司、一桩投资 的孤立新闻,而是正在发生的趋势。 GPU的"金融化时刻" 单笔投入过大:要支撑万亿级参数模型的训练,单次算力采购成本可能超过 50 亿美元。哪怕是微软、谷歌这样的巨头,也难以长期维 持"买断模式"。 硬件价值迅速缩水:当新架构 GPU 上市时,旧卡的价值立刻跳水。A100 在二级市场的价格一年内下跌 ...
特朗普没想到,中方突然下“封杀令”?美方当面表态:希望能共存
搜狐财经· 2025-09-20 05:26
中国对英伟达芯片采购禁令 - 中国互联网监管机构要求国内头部科技公司全面停止采购英伟达所有人工智能芯片并终止已下单订单 [1] - 中国国家市场监管总局对英伟达启动反垄断调查作为组合拳的一部分 [1] - 禁令比美方预期更早且更果断被视为对美方的提前反击 [1] 英伟达在华业务困境 - 英伟达陷入两难:配合美国政府政策停止对华供应A100、H100等高端芯片同时通过特供版芯片如H20维持中国市场 [3] - 特供芯片性能大幅缩水但价格居高不下且交付存在问题许多中国企业下单后迟迟拿不到货 [3] - 英伟达公开声称其芯片不存在后门但未提供令人信服的技术证据引发安全隐忧 [3] 中美科技竞争与政策博弈 - 特朗普政府试图通过技术封锁遏制中国AI发展维持美国科技领域绝对优势但中国反应表明市场换不来技术尊严 [6] - 美国财政部长抱怨中方对英伟达调查时机糟糕却未提美国将中国企业列入实体清单的双标态度 [8] - 美国对华政策调整是华盛顿领导层共识而非特朗普个人决策即便政府更迭方向也不会轻易改变 [10] 中国国产芯片替代进展 - 华为昇腾、寒武纪、海光等国内芯片企业在特定场景实现突破虽整体性能与英伟达仍有差距但政策与市场需求正缩短差距 [6] - 国产芯片在政务、电力等关键行业渗透率明显提升英伟达面临逐渐深化的国产化替代浪潮 [8] - 中国通过政策扶持、产业投资和技术攻关突破封锁将核心技术掌握在自己手中以摆脱卡脖子风险 [12] 企业战略与市场影响 - 英伟达在中国服务30年中国市场占其全球销售额20%以上是最大应用场景之一但美国政治压力迫使选边站队 [6] - 英伟达CEO黄仁勋对中方决定感到失望且无法接受但仍承诺耐心应对并支持美国政府解决地缘政治问题 [6] - 美国技术封锁可能加速中国自主创新而放松限制则意味着看着中国技术快速追赶陷入两难处境 [12]
Huang Breaks Silence On Beijing Move Targeting Nvidia AI Chips
Yahoo Finance· 2025-09-19 03:30
中国业务挑战 - 中国互联网监管机构据报禁止采购英伟达为中国市场定制的RTX Pro 6000D人工智能芯片 涉及企业包括字节跳动和阿里巴巴[1][3] - 公司首席执行官黄仁勋对禁令表示失望 强调公司长期对中国科技行业贡献显著[2] - 中国业务已多次受干扰 美国政府对包括H100、A100及降级版H20在内的高端AI芯片实施出口限制[3] 财务与交易影响 - 公司约20-25%收入来自中国市场 但指导分析师在财务预测中排除中国业务[5][4] - 中国市场监管总局对英伟达69亿美元收购以色列数据中心网络公司Mellanox展开反垄断调查 该交易于2020年完成[5] - 8月公司与美国政府达成协议 允许获得出口许可 条件是将中国区H20芯片销售额的15%交付美国政府[4] 战略投资动向 - 公司宣布投资110亿英镑(150亿美元)于英国人工智能基础设施 投资在美国总统国事访问期间与超大规模企业共同推进[6] - 人工智能热潮持续支撑公司股价 周三收复前日因中国芯片禁令报道导致的跌幅[1][6]
英伟达斥资超 9 亿美元挖走 Enfabrica CEO及核心团队
搜狐财经· 2025-09-18 23:32
IT之家 9 月 19 日消息,大家近期可能会经常听说 Meta、谷歌等公司常常通过高薪挖角、技术和人一起打包的方式吸纳顶尖 AI 人才,现在英伟达也已加入 到这一行列。 CNBC 今日报道称,英伟达以超过 9 亿美元(IT之家注:现汇率约合 63.9 亿元人民币)的现金与股票交易,将 AI 硬件初创公司 Enfabrica 的首席执行官 Rochan Sankar 及部分核心员工打包带走,并获得该公司的技术许可。据知情人士透露,这笔交易已于上周完成。 在此之前,业内已经多次出现类似挖角行为:今年 6 月,Meta 斥资 143 亿美元引入 Scale AI 创始人 Alexandr Wang 及其团队,并持有该公司 49% 股份;一 个月后,谷歌又以 24 亿美元的协议引入 Windsurf 的联合创始人兼 CEO Varun Mohan 及研发人员。此前,谷歌、微软和亚马逊也分别通过类似交易引进了 Character.AI、Inflection 和 Adept 的核心人才。 相较而言,英伟达在 AI 人才与技术领域的投资力度较大,但并不以大规模并购闻名。其唯一一次超过 10 亿美元的收购是在 2019 年 ...
Nvidia just spent over $900 million to hire Enfabrica CEO, license AI startup's technology
CNBC· 2025-09-18 22:23
Co-founder and chief executive officer of Nvidia Corp., Jensen Huang attends the 9th edition of the VivaTech trade show in Paris on June 11, 2025.Nvidia has just shelled out over $900 million to hire Enfabrica CEO Rochan Sankar and other employees at the artificial intelligence hardware startup, and to license the company's technology, CNBC has learned. In a deal reminiscent of recent AI talent acquisitions made by Meta and Google, Nvidia is paying cash and stock in the transaction, according to two people ...
我们还是低估了英伟达
美股研究社· 2025-09-18 11:33
文章核心观点 - 英伟达战略重心从自建云服务DGX Cloud转向平台化算力调度市场Lepton 以化解与云巨头的渠道冲突并掌控AI算力生态入口 [6][11][23] - 公司通过"卖芯片-投资客户-租回服务"模式构建自循环资金链 强化生态黏性并稳定市场价格预期 [13][17][18] - Lepton平台通过聚合跨云算力资源并统一软件栈 试图成为AI算力领域的"App Store" 掌握分配权与数据洞察能力 [21][26][27] 战略转型 - 2023年推出的DGX Cloud月租达36999美元 2024年底其所属的软件与服务收入达20亿美元年化规模 [6][8] - 2024年下半年云厂商大幅降价 AWS对H100和A100实例降价45% 导致DGX Cloud价格优势消失 [8] - 2025年公司不再将数十亿美元云支出承诺对齐DGX Cloud 其角色转为内部基础设施与研发用途 [6][11] - 2025年5月新上线Lepton平台 转型为算力调度市场 避免与AWS/Azure/GCP等云厂商直接竞争 [6][11][23] 生态构建模式 - 投资云服务商并优先供货:2023年向CoreWeave投资1亿美元并优先供应H100 GPU [13] - 租回算力协议:2025年9月与Lambda签订4年15亿美元租赁协议 租用1万台搭载自家GPU的服务器 [15] - 形成资金闭环:芯片销售即时确认收入 租赁支出分期摊销 最小化资产压力 [17] - 通过Nventures投资AI初创公司 绑定潜在算力需求客户 构建创业孵化器生态 [19] Lepton平台特性 - 不直接持有GPU库存 作为需求分发平台连接开发者与云服务商(包括AWS/Azure/CoreWeave等) [11][21] - 整合英伟达软件栈(NIM微服务/NeMo框架) 提供一致开发体验 [22] - 获得AWS和Azure等云巨头支持 通过平台接触额外算力需求 [23] - 实时观测算力任务类型、地域分布、GPU使用频率及价格弹性 辅助商业决策 [26] 市场影响 - 缓解渠道冲突:从直接竞争转为中立调度方 维持与云巨头的芯片销售合作关系 [11][23] - 锚定算力价格:英伟达回租行为变相为AI算力行情背书 稳定市场预期 [18] - 掌控价值链:无论客户选择哪家云服务商 最终依赖英伟达GPU和软件栈 [29] - 潜在挑战:中小云厂商担心客户关系与定价权被影响 推广仍需过程 [26]
我们还是低估了英伟达
投中网· 2025-09-18 06:33
文章核心观点 - 英伟达已从硬件供应商转型为算力平台和生态掌控者,通过Lepton平台实现AI算力市场的调度和分配,放弃与云巨头直接竞争转而构建中立入口,强化对AI产业链的控制[5][13][22][25] DGX Cloud退场原因 - 2023年推出时月租36999美元,主打高端算力租赁,2024年软件与服务收入达20亿美元年化水平[5][7] - 2024年下半年GPU供应缓解后,AWS等云厂商对H100/A100实例降价45%,价格优势消失[7] - 与亚马逊、微软、谷歌等核心芯片买家产生渠道冲突,可能推动后者加码自研芯片[9] - 客户将其作为临时方案,缺乏长期黏性,最终退回内部研发用途[9] Lepton平台战略定位 - 2025年5月上线,定位为GPU算力调度市场,不直接持有库存,连接需求方与云服务商[10][19] - 整合AWS、Azure及英伟达系云商(如CoreWeave),提供统一软件栈(NIM微服务/NeMo框架)[19][20] - 化解与云巨头竞争关系,转为中立平台,掌控算力需求入口[22][23] 英伟达生态构建策略 - 通过"卖芯片-投资-租回"循环:2023年投资CoreWeave 1亿美元,2025年与Lambda签订15亿美元四年租赁协议(含1万台GPU服务器)[15][16] - 财务操作优化:芯片销售即时确认收入,租金作为运营成本分期摊销,最小化资产压力[16] - 风险投资部门Nventures绑定AI初创公司,培育算力采购需求,构建生态闭环[17] 平台化野心与价值 - Lepton目标成为"AI算力App Store",通过调度权掌控合作伙伴生存空间[25] - 实时获取算力需求分布、GPU使用频率、价格弹性等数据,反哺商业决策[25] - 最终实现无需自建云设施,通过控制软件栈和入口层捕获全产业链价值[23][26]
How AMD, Nvidia, Broadcom Can Ride Oracle's $455B Cloud Surge
Forbes· 2025-09-12 09:35
公司业绩与财务表现 - 甲骨文云部门剩余履约义务同比激增359%至4550亿美元 上一季度仅为1380亿美元 [2] - 公司股价在周三交易中上涨近36% 创下多年来最大单日涨幅 [2] - 资本支出预测上调至350亿美元 较之前增长65% 凸显AI基础设施扩张紧迫性 [3] 基础设施扩张计划 - 公司需要电力、监管批准和高性能GPU来实现剩余履约义务向收入转化 [3] - 计划部署多达131072个AMD MI355X GPU 提供比前代产品两倍以上的性价比 [6] - 采用液冷数据中心设计 专注于能源效率和吞吐量优化 [4] 半导体供应商合作格局 - 英伟达提供大多数GPU 包括A10、A100、H100、H200及Blackwell旗舰芯片 [4] - AMD基于CDNA 4架构和台积电3nm工艺的MI355X GPU标志着AI加速器重大进步 [6] - 博通定制ASIC芯片在AI推理阶段可能获得显著份额 其股价周三大涨近10% [7] 技术战略与市场定位 - 提供"裸金属"实例 使客户直接独占高端物理芯片 消除虚拟化开销 [4] - 不同于谷歌、AWS或微软 公司未开发定制AI芯片 完全依赖外部GPU供应商 [3] - 推理工作负载预计将显著超过训练需求 形成类似公用事业的经常性需求流 [7] 合作伙伴关系发展 - 与英伟达保持紧密合作 其GPU一直是AI基础设施骨干 [4] - 通过引入AMD供应商实现硬件多元化 降低对单一供应商依赖 [6] - 多元化策略预计将增强与英伟达的GPU采购谈判能力 控制总体支出 [6]
黄仁勋的H20,也许真的要提前“退役”了
美股研究社· 2025-09-02 10:45
英伟达中国特供芯片H20的波折命运 - H20芯片可能提前退役 英伟达已指示关键零部件供应商暂停与H20芯片相关的生产[5][8] - H20基于Hooper架构 是英伟达在美国芯片禁令下针对中国市场推出的合规阉割版 牺牲训练通用算力 强化内存和IO优势[9] - H20曾经是英伟达在中国销售受阻情况下的主要希望 给中国收入贡献的比例达到80%[9] H20芯片2024年重要事件时间线 - 4月特朗普政府要求英伟达在未经许可的情况下禁止在中国销售H20芯片[10] - 7月15日英伟达宣布H20获得批准 在华恢复供应[11] - 7月31日国家互联网信息办公室要求英伟达就H20漏洞后门安全风险问题进行说明并提交相关证明材料[12] 美国芯片禁令对英伟达的影响 - 2022年10月美国商务部发布先进计算芯片出口控制规则 禁止出口先进节点芯片和高性能AI芯片到中国[18] - 禁令直接让英伟达当时的两代旗舰芯片A100和H100无法出口中国[18] - 英伟达迅速做出反应 在禁令颁布次月推出A100的中国替代版A800 2023年3月推出H800作为H100在中国市场的替代版本[19] - 2023年10月美国商务部更新规则 进一步收紧芯片禁令 将禁令扩展到性能略低的变体 新增对推理芯片限制 阈值调整为TPP≥1600[22] - 新规使得专门为中国市场推出的A800和H800也被涵盖 第一代中国特供退出舞台[23] 第二代特供芯片H20的技术规格 - H20对比原始H100峰值算力被限制到约296 TFLOPs 低于消费级RTX 4090显卡的661 TFLOPs 更远低于H100的1979 TFLOPs[23] - H20在缓存和内存带宽上做了优化 配备96GB的HBM3高带宽显存 显存带宽提升至4TB/s[23] - 二级缓存达到60MB 高于H100的50MB 完整保留了第四代NVLink高速互联接口 芯片间互联带宽高达900GB/s[23] 中国市场对英伟达的重要性变化 - 三年前ChatGPT发布前英伟达季度财报显示中国市场收入占比20%以上[25] - 2026财年第一财季英伟达季度总收入达到441亿美元 中国市场贡献55亿美元 占比降至13%[25] - 英伟达在中国的市场份额已从几年前的95%降至约50% 许多中国客户转向国产替代方案[25] 中国本土AI芯片的发展 - DeepSeek发布新模型V3 1 使用UE8M0 FP8 Scale参数精度 针对即将发布的下一代国产芯片设计[26] - 国内包括华为 寒武纪在内多家厂商的新一代AI芯片都可以支持FP8格式[26] - 国产芯片企业暴涨 寒武纪盘中大涨近14% 半导体ETF在半天的时间里大涨5 89%[26] 英伟达的未来计划 - 英伟达正在研发新的中国特供AI芯片 代号B30A 基于Blackwell架构 性能优于H20 但仍符合出口管制[29] - 新芯片最快可能在9月提供测试样片[29] - 黄仁勋透露英伟达正在就一款新的中国特供芯片和美国进行谈判[6][30] 特供芯片策略面临的挑战 - 今年4月的禁令特别针对H20 直接从技术规格限制转变为精准打击特定芯片[31] - 中国开始质疑英伟达中国特供芯片的安全性 英伟达需要同时应对中美两方的监管要求[32] - 英伟达中国特供芯片的不确定性从很高升级为了极高 影响中国客户信心及供应链企业的计划与产能分配[32]
BluSky AI Inc. and Lilac Sign Letter of Intent to Launch Strategic GPU Marketplace Partnership
Globenewswire· 2025-08-26 13:42
核心观点 - BluSky AI与Lilac签署意向书 建立战略合作 通过GPU资源共享提升AI生态计算资源利用效率并实现闲置容量货币化 [1][2][3] 合作内容 - BluSky AI将提供GPU云计算资源网络 包括未分配库存和客户选择加入的容量 通过Lilac平台出租 [2] - 合作涵盖工程集成 联合营销和客户获取框架 最终协议预计未来数月内达成 [3] - Lilac将转售BluSky AI及其客户网络的闲置GPU容量 为终端用户提供更高投资回报率和灵活租赁选项 [6] - BluSky AI将Lilac指定为"首选市场合作伙伴"并向其生态圈积极推广该平台 [6] - 双方将合作开展营销活动 包括联合新闻稿 社交媒体激活 白皮书 视频演示和活动合作 [6] - BluSky AI将提供季度GPU库存透明度报告 以指导市场策略和绩效跟踪 [6] 技术资源 - BluSky AI提供企业级高性能GPU型号 包括NVIDIA B200 H200 H100 A100 L40 RTX 5090和RTX 4090 [2] 公司背景 - BluSky AI总部位于犹他州盐湖城 是专为人工智能构建的Neocloud 通过快速部署的SkyMod数据中心提供可扩展的AI工厂 [1][4] - Lilac总部位于旧金山湾区 正在构建权威的GPU计算现货市场 通过动态价格驱动平台连接全球GPU供应与AI开发者 初创企业和企业 [5] 战略意义 - 合作旨在提高BluSky AI计算资产利用率 同时扩大Lilac的高性能GPU供应商基础 [2] - 通过整合闲置容量到Lilac平台 优化资源效率并使客户能够从未充分利用资产产生新收入流 [3] - 合作代表计算资源供应 货币化和扩展方式的重大进步 降低AI采用门槛并构建更高效公平的云经济 [3]