GB300
搜索文档
液冷的二阶段
国盛证券· 2025-12-21 08:53
行业投资评级与核心观点 - 报告继续看好算力板块,坚定推荐算力产业链相关企业 [6][14] - 报告建议关注算力、数据要素等多个细分领域及相应标的 [7][8][13] 液冷产业发展阶段转换 - 液冷产业正经历从“第一发展阶段”(预期阶段)向“第二发展阶段”(业绩兑现阶段)的关键转换 [1][19] - 第一发展阶段(2024年及2025年上半年)市场焦点集中于概念讨论、技术路线研究和远期市场空间测算 [2][20] - 第二发展阶段以订单确认、产能落地和业绩兑现为核心,随着AI集群规模化建设推进,液冷体系开始落地 [2][20] 第二发展阶段的核心驱动力 - **高功率需求成为常态**:100kW+高功率机柜成为新常态,GB200/GB300 NVL72均采用全液冷(DLC)架构 [2][20] - **关键产品量产时间表**:GB300系列AI服务器机柜自2025年底起量产,预计2026年下半年Vera Rubin平台落地,将进一步提升液冷价值量 [2][20] - **应用边界持续扩展**:液冷应用从GPU服务器向交换机、ASIC等设备侧延展,AWS、Meta自研ASIC将自2026年起逐步采取液冷方案,Google、Microsoft的自研ASIC AI服务器亦预计逐步由气冷转为水冷设计 [2][20] - **市场空间需系统性重估**:由于应用边界扩展,液冷市场空间应被系统性重估 [2][20][22] 产业竞争格局演变 - **竞争焦点上移**:从单一部件竞赛升级为涵盖服务器、机柜到机房设备的完整热管理系统竞争,价值体现在冷板、CDU、控制与运维协同的系统能力 [3][21] - **产业格局强者恒强**:行业长期确定性强,龙头企业在全链条布局、系统集成与交付、头部客户认证等领域优势凸显,客户对方案商依赖度提升 [3][5][21] - **龙头企业的核心能力**: - 拥有覆盖CDU、冷板、快接头、冷却液等的全链条解决方案能力 [5][23] - 具备全链条自研、系统协同以及大规模、稳定可靠的生产交付与运维能力 [5][23] - 已提前布局并有望切入国内外主流云服务商、服务器厂商或芯片原厂供应链 [5][23] 投资建议与关注标的 - **明确看好的液冷龙头**:最看好具备出海能力的龙头英维克,以及龙头上下游配套产业链如泵生产厂商飞龙股份 [6][22] - **算力产业链核心推荐**:坚定推荐光模块行业龙头中际旭创、新易盛等 [6][14][24] - **建议关注的光器件**:建议关注“一大五小”天孚通信、仕佳光子、太辰光、长芯博创、德科立、东田微 [6][14][24] - **广泛的算力板块关注列表**:报告列出了包括光通信、铜链接、算力设备、液冷、边缘算力、卫星通信、IDC、母线等多个细分领域的数十家建议关注公司 [7][13] - **数据要素领域关注**:建议关注运营商(中国电信、中国移动、中国联通)及数据可视化(浩瀚深度、恒为科技、中新赛克)相关公司 [8][13] - **重点标的财务数据**:报告给出了中际旭创、新易盛、天孚通信、英维克、沪电股份等五家公司的投资评级(均为“买入”)及2024-2027年的EPS与PE预测 [10] 行业行情回顾 - **整体表现**:本周(2025年12月15日-21日)通信板块下跌,表现弱于上证综指 [15] - **细分板块表现**:卫星通信导航指数上涨5.8%,表现相对最优;移动互联、区块链指数分别上涨1.9%、1.4%;光通信指数持平;物联网、通信设备、运营商、云计算、量子通信指数均有不同程度下跌 [16][18] - **个股涨跌**:中天服务本周上涨35.818%,领涨通信行业;理工光科、通鼎互联、亨通光电、亨通股份涨幅居前 [17] 其他行业要闻摘要 - **数据库技术演进**:openGauss Summit 2025峰会即将召开,openGauss 7.0.0创新版将深度集成向量数据库能力,并发布业界首个开源多写数据库oGRAC [25][26] - **开源AI发展**:“开源AI的应用与商业化”论坛成功举行,探讨模型可信性、异构硬件适配等关键议题 [27] - **AI行业动态**:马斯克称xAI有望最快在2026年实现通用人工智能(AGI)[28];谷歌发布Gemini 3 Flash模型,在MMMU-Pro测试中取得81.2%的成绩,高于GPT-5.2的79.5% [29][30] - **企业并购与整合**:高通提前完成对Alphawave Semi的收购,以完善其AI产品组合 [31][32] - **网络技术演进**:Turkcell联合华为发布AI WAN演进白皮书,已完成120KM长距下RDMA无损传输验证 [33][34] - **5G-A商用进展**:中东地区(尤其是GCC国家)5G-A商用部署已超过万站,科威特单国今年部署已超过2000站,运营商正通过体验经营重构产业价值 [35][36][37] - **设备回收实践**:法国Orange的宽带设备回收再利用计划行业领先,其在法国每年能够再利用约100万台设备,设备回收率超过90% [38][39]
谷歌本周审厂?液冷放量元年在即—2026年行业逻辑梳理及出海展望
傅里叶的猫· 2025-12-15 13:16
文章核心观点 - 2026年将是液冷行业需求爆发的元年,行业呈现高景气度,需求侧迅速扩大而供给侧跟进缓慢,先发企业将享受行业红利 [1][17] - 北美主要云服务提供商(CSP)的下一代AI算力平台将全面采用液冷方案,驱动千亿级市场规模 [2][6] - 中国大陆液冷厂商凭借供应链安全、成本和技术优势,存在明确的出海机遇,有望切入北美大厂供应链 [13][17] 需求侧驱动因素 - **高功耗驱动技术切换**:单AI算力卡及机柜功耗持续提升,当单柜功耗超过35-40KW时,风冷无法满足散热要求,必须采用液冷方案 [4] - **节能降耗需求迫切**:北美缺电严重,液冷方案能将数据中心PUE降至1.2以下,显著降低单位算力密度的总能耗,缓解因缺电导致的项目推迟 [4] - **环境友好性要求**:北美部分数据中心靠近经济中心或居民区,液冷方案相比风冷能显著降低机房噪音,加快项目落地进程,减少资金垫付成本 [6] - **头部厂商全面转向**:英伟达GB200及以上、谷歌TPU V7及以上、Meta MTIA V2及以上、亚马逊Trainium3及以上的高级机柜系列方案已全面采用液冷散热方案 [6] 主要客户需求与市场规模测算(2026年) - **英伟达**:预计2026年GB系列出货10万柜(以GB300为主),Rubin系列出货不到1万柜;GB系列液冷单柜价值量约9~10万美元,Rubin系列约11万美元;预计英伟达端液冷总价值量约100-110亿美元 [7] - **谷歌**:预计2026年TPU V7及以上芯片出货量约220-230万颗,按单柜64颗换算对应约3.5万柜需上液冷;单柜价值量约7-8万美元;预计谷歌端液冷总价值量约26亿美元 [9] - **Meta**:预计2026年MTIA V2出货量约100万颗,按单柜72颗换算对应约1.4万柜;假设单柜价值量与谷歌近似,预计Meta端液冷总价值量约10.5亿美元 [10] - **亚马逊**:预计2026年AWS Trainium3出货约120万颗(保守估计),单柜72颗对应约1.6万柜;假设单柜价值量与Meta近似,预计AWS端液冷总价值量约12.5亿美元 [10] - **其他厂商**:包括其他自研及国内厂商(如华为昇腾),预计液冷总价值量约5-8亿美元 [10] 液冷方案价值量拆解(以GB300为例) - **计算托盘**:每个冷板模块300美元,每个托盘6个,价值1800美元;冷却风扇每个25美元,每个托盘8个,价值200美元;NVQD每个20美元,每个托盘8个,价值160美元;浮动支架每个50美元,每个托盘2个,价值100美元;每个计算托盘热管理价值总计2260美元;每个机柜有18个计算托盘,计算托盘部分总价值约40,680美元 [8] - **交换托盘**:每个冷板模块200美元,每个托盘2个,价值400美元;冷却风扇每个25美元,每个托盘6个,价值150美元;NVQD每个20美元,每个托盘18个,价值360美元;浮动支架每个100美元,每个托盘2个,价值50美元;其他部件价值60美元;每个交换托盘热管理价值总计1020美元;每个机柜有9个交换托盘,交换托盘部分总价值约9,180美元 [8] - **机柜总计**:每个GB300机柜的热管理内容总价值约49,860美元 [8] 供给侧现状与壁垒 - **供应格局与产能**:北美液冷市场供应格局相对固化,主要供应商为美资及台资企业(如Vertiv、Cooler Master、奇宏、AVC等),中国大陆厂商目前几乎没有放量先例;通过北美CSP验证的可批量供应产能主要位于国外及中国台湾 [11] - **技术方案**:目前主要采用冷板式液冷方案,技术占比超98%,其余为浸没式及喷淋式方案 [11] - **应用范围**:目前液冷方案主要应用于计算模块及交换模块,未来存储、服务器电源/变压器件、高速率交换机模块等也将逐步采用 [11] - **验证壁垒**:液冷产品对数据中心服务器影响重大,需与芯片模组制造服务器厂进行深度磨合验证,验证周期短则半年,长则1-2年以上,渠道壁垒极高 [11] - **综合壁垒**:行业壁垒不仅在于技术,市场、渠道、产能、人脉资源等同样是重要壁垒,参考光模块市场龙头企业的竞争格局 [12] 大陆厂商出海机会与展望 - **出海驱动力**: - **供应链安全**:国外及中国台湾产能扩产周期长(9-12个月以上),在2026年需求爆发下可能无法满足需求,需要大陆产能保障供应稳定 [13] - **成本优势**:大陆厂商的液冷产品在成本上相对国外及台湾具备一定优势,可减少下游资本开支 [13] - **技术稳定性**:大陆部分龙头厂商在液冷产品技术上不输甚至领先于国外厂商,可提升客户数据中心效能 [13] - **出海现状**: - **送样情况**:冷板及其他细分领域向海外大厂送样的约有3-5家(含代工),提供综合解决方案多产品供应的约有2-3家 [14] - **批量供应预期**:到2026年,可能只有龙头厂商能够实现对海外大厂的批量供应 [14] - **出海盈利前景**:直供北美液冷产品的平均毛利率可能超过40%(参考光模块),在需求指数级爆发、供给短期无法满足的情况下,预计产品价格及盈利能力将在2-3年内维持高位,高需求态势可能持续3-5年 [16]
Super Micro Computer (NasdaqGS:SMCI) FY Conference Transcript
2025-12-11 18:52
公司概况 * 涉及的上市公司为超微电脑 (Super Micro Computer, NasdaqGS:SMCI) [1] 核心观点与论据 **财务表现与指引** * 公司对2026财年(6月结束)的营收指引从330亿美元上调至360亿美元 [8][15] * 公司在12月季度获得了价值130亿美元的GB300平台订单 [8][61] * 公司目标是实现两位数的毛利率,推动因素包括客户组合、产品组合和制造效率 [20] **市场需求与机会** * 行业终端市场充满活力,近期有同行表示将增加资本支出 [8] * 公司引用了市场谈论的1万亿美元(或3-4万亿美元)市场总规模,并认为自身目前约占10%的市场份额,对应1000亿美元的机会 [14][31] * 人工智能应用优化是核心,客户基础广泛,包括任何关心应用优化的客户 [34] **产品战略与差异化** * 公司致力于支持大规模人工智能应用,而竞争对手可能只为一个解决方案构建一种产品 [13] * 战略是成为人工智能和其他应用解决方案的全栈供应商,提供包括机架、液冷、电源等在内的全套组件,这改善了利润率 [13] * 正在发展数据中心构建块解决方案 (DCBBS),提供从电缆服务、电源、液冷到电池备份、电源架等数十种SKU,以支持独特的数据中心建设需求 [23][24][25] * 边缘人工智能解决方案被视为下游一个巨大的量级市场机会,目前仍在发展初期 [45] **客户与市场拓展** * 客户基础正在扩大,在2026财年,公司预计在已有的4个规模客户基础上,再增加2-4个规模客户 [16] * 在第一季度,公司增加了一个新的规模客户,并与一个现有大客户显著扩大了业务 [16] * 客户群包括超大规模云厂商、NeoCloud(新兴云)、企业和主权实体 [33][35] * 主权实体市场正在取得进展,公司在全球有许多概念验证和设备,预计2026年将看到更多部署迹象 [26][41] * 公司表示几乎所有大型客户都以某种方式与公司接触,探讨技术或产能方面的合作可能 [36] **产能规划** * 计划到2026财年末实现总计6000个机架的总产能,其中3000个为液冷机架 [28] * 液冷机架的ASP(平均售价)约为每机架300万美元,带来了巨大的营收机会 [28] * 产能地点包括硅谷、台湾、马来西亚和荷兰,并正在美洲寻找更多地点 [28] **竞争格局** * 行业复杂性增加,这有利于公司,因为公司全力投入应对复杂性 [55] * 公司通过专注于客户满意、技术创新(如降低功耗、改进冷却)、系统可靠性和质量来建立竞争优势 [52][55][56] * 公司认为随着复杂性增加,自己有望成为2027年人工智能优化应用领域的主导供应商,并且过去几年相对于一些知名品牌的市场份额有所增加 [56] **毛利率与运营效率** * 近期毛利率受到客户组合(部分大规模运营商拥有较强购买力)、产品组合和制造效率的影响 [16] * 12月季度由于大规模生产全新产品(GB300),产生了较高的成本 [17] * 随着客户基础扩大、产品组合优化、客户购买力相对减弱以及制造效率提升,毛利率有望改善 [17] * 公司运营结构相当精简,致力于在扩大规模的同时控制研发和运营支出 [18][60] **技术合作伙伴与多元化** * 支持多元化的技术栈,包括NVIDIA、AMD以及定制ASIC(来自英特尔、ARM等多方) [12] * 已与AMD在一些大型客户处进行了规模部署,这些客户同时也是NVIDIA客户 [46] * 工程团队是核心优势,公司近一半员工是工程师,以支持不同平台和用例 [48][49] **客户粘性** * 公司通过技术、可靠性、服务支持和工程支持来保持客户满意度,从而实现高客户保留率 [64] * 公司从主板业务起步,随着技术发展不断扩展,与客户共同成长,这种合作关系有助于保持客户粘性 [52][64]
2026年,AI服务器贵贵贵
36氪· 2025-12-11 11:51
AI服务器硬件正经历由GPU和ASIC驱动的重大设计升级 - 摩根士丹利研报指出,AI服务器硬件正在经历一场由GPU和ASIC驱动的重大设计升级,2026年英伟达的GB300、Vera Rubin平台和Kyber架构,以及AMD的Helios服务器机架项目将带来更高的计算能力和机柜密度 [1] - 系统级升级将匹配更有效的电源解决方案、标配的液冷散热方案以及更高要求的PCB和高速互联,预计2026年的AI服务器将变得“不可估量的贵” [1] AI服务器需求持续爆发式增长 - 摩根士丹利预测,仅英伟达平台的AI服务器机柜需求将从2025年的约2.8万台跃升至2026年的至少6万台,实现超过一倍的增长 [2] - AMD的Helios服务器机架项目(基于MI400系列)也获得良好进展,进一步加剧了市场对先进AI硬件的需求 [2] 英伟达AI服务器路线图显示芯片功耗与散热方案持续升级 - 英伟达GPU最大散热设计功耗从H100的700W,提升至B200的1000W、GB200的1200W,预计2026年下半年登场的Vera Rubin(VR200)平台GPU最大TDP将飙升至2300W,2026年末的VR200 NVL44 CPX更将高达3700W [3][4] - 随着GPU功耗逼近4kW,传统风冷方案失效,液冷成为唯一可行路径,英伟达已在GB200平台中将液冷作为标准配置 [4] - 供电系统正从12V VRM向48V直流母线迁移,以减少转换损耗并提升电源响应速度 [4] 主要ODM厂商产能全开,出货量及营收大幅增长 - 鸿海、广达、纬创、纬颖四家具备NVIDIA认证资质的ODM厂商构成当前GB200/GB300整机柜的主要供应方,其中鸿海为首批完成GB200及GB300整机柜量产交付的厂商 [10] - 鸿海第三季度AI服务器机柜出货季增幅度高达300%,预计2025年AI服务器收入将超过1万亿新台币,占据40%的市场份额 [10] - 广达、纬创及纬颖11月营收齐创单月历史新高,纬创11月合并营收冲上2806.24亿元新台币,环比增51.6%,同比增幅高达194.6% [12] - 摩根士丹利预计,11月单月GB200出货量为5500柜,较10月成长29%,其中广达出货1000-1100柜、纬创1200-1300柜、鸿海约2600柜 [12] - 从2025年度GB200、GB300机架服务器各ODM厂出货的市场占比来看,鸿海占52%,纬创约占21%,广达占约19% [12] 电源架构战略地位提升,Kyber平台将大幅提升单机柜价值 - 英伟达的AI服务器电源战略“Kyber”正双线推进,量产目标设定在2026年底前,其参考设计范畴已扩展至将整个数据中心的供电与基础设施纳入规划 [16] - 自Kyber世代起,电源架构的重要性在英伟达内部已提升至与半导体同等的战略地位 [16] - 摩根士丹利预测,到2027年,为Rubin Ultra机柜设计的电源解决方案,其单机柜价值将是当前GB200服务器机柜的10倍以上,同时每瓦功耗对应的电源方案价值也将比现阶段翻倍 [16] 液冷散热方案价值量显著提升 - 英伟达GB300 NVL72机架级AI系统的液冷散热组件价值高达49860美元(约合人民币近36万元),比GB200 NVL72系统高了大约20% [22] - 预计下一代Vera Rubin NVL144平台每个机柜的冷却组件总价值将增长17%,达到约55710美元(约合人民币近40万元),其中为交换机托架设计的冷却模块价值预计将显著增长67% [22] 高端PCB需求激增,层数与价格同步跃升 - AI服务器硬件升级推动高端PCB需求激增,PCB层数正向更高端发展,目前普遍已经达到44至46层 [23] - 2025年第一季度全球PCB市场规模同比增长6.8%,其中高端HDI板和18层以上高多层板需求增速分别达14.2%和18.5% [23] - PCB产品迭代带来价格的翻倍式增长,例如从400G升级到800G或1.6T,PCB价格成倍增长 [23] - AI服务器PCB从以往的14~24层提升至20~30层,交换机提升至38~46层,部分产品还会引入HDI工艺,行业附加值有望增长 [24] 云服务提供商资本支出持续扩大,为AI服务器需求提供坚实支撑 - TrendForce集邦咨询将2025年全球八大主要CSPs资本支出总额年增率从原本的61%上修至65%,预期2026年合计资本支出将进一步推升至6000亿美元以上,年增达40% [26] - 谷歌把2025年的资本支出上调到910-930亿美元,Meta上修2025年资本支出至700-720亿美元,Amazon则调升2025年资本支出预估至1250亿美元 [29]
服务器液冷近况解读专家会议
2025-12-08 15:36
行业与公司 * 涉及的行业为**服务器液冷散热行业**,核心讨论围绕**英伟达(NVIDIA)** 及其GB200、GB300、Rubin等系列AI服务器芯片/系统的散热技术演进[1][3] * 涉及的**海外/台系公司**包括:英伟达、Vertiv(负责整体设计)、齐宏(AVC)、双鸿、台达、Cool Edit、Fulmaster、利敏达、威乐(Wilo)、格兰富(Grundfos)、斯陶比尔(Stäubli)、雷默(LEMO)、库里维尔、法国阿克马(Arkema)、台积电、英特尔[1][3][5][6][16][19][21][22][24] * 涉及的**国内公司**包括:工业富联(已进入英伟达供应链)、英维克(与英伟达验证合作)、领益制造、飞龙达、高澜股份、华勤技术、新华三、浪潮信息、中航光电、风光类、永辉电器、UQD、贝斯特、巨化股份、永和股份、湖南智航、天弘科技(为谷歌验证方案)[1][19][21][22][23][24][25] 技术发展现状与趋势 * **技术驱动力**:从GB200开始,芯片发热量大幅增加,风冷方案已无法满足需求,必须采用液冷技术[3] * **当前主流(GB300)**:采用**全液冷板设计**,覆盖芯片、内存和电源部分,一个计算节点上的CPU和两个GPU分别覆盖单独的门板[1][3] * **面临瓶颈**:GB300采用的**单向门板**面临散热负荷上限[1][3] * **未来趋势(Rubin及以后)**:预计2026年Rubin系列需采用**双向门板**或**微通道技术**以解决散热问题[1][3] * **双向门板**:通过相变和更高效的介质选择提升散热能力,是单向门板的改进,成熟度相对较高[1][3] * **微通道技术**:管道直径细化至几十微米,传导效率显著提升,但面临加工难度、均匀性及堵塞等挑战[1][3] * **芯片封装盖板微通道**:台积电和英特尔正在探索的更极端方案,可减少导热环节,但成熟度不及双向门板[1][3] * **静默式液冷**:曾被认为是最终解决方案(如阿里巴巴、字节跳动数据中心项目应用),均温性好[3][4] * 因双向门板和微通道方案出现及产业链希望延续现有红利,其发展受到影响[4] * 英伟达CEO黄仁勋仍认为静默式是未来方向,但尚未全面推进[4][5] * **局部静默实验**:Vertiv为英伟达NV72系统进行实验,每个托盘局部静默,液体总量约360升,较传统700升减少近一半[1][6][7] * **未来高功率挑战**:Rubin Ultra预计采用NV576架构,单芯片TDP高达1,400瓦,可能需结合双向门板微通道与局部静默技术[8] 技术方案对比与进展 * **NV144项目方案**:目前讨论较多的是**双向门板**搭配**传统制冷剂R134**(自7月起选用),但R134沸点低需加压,存在技术难题[9] * 另一种选择是**四代制冷剂R1233**,沸点19度更合适,但仍面临压力问题[9][14] * **技术路线图景**:预计每年3-4月的发布会公布下一代计划,两条路线(双向门板/微通道)可能在2月前有大致图景,散热方案相较于芯片更具灵活性[10] * Rubin可能继续使用**单向门板并强化微通道**[11] * Rubin Ultra可能采用**单向门板加芯片内盖微通道以及部分静默处理**[11] * **微通道制造工艺**:包括3D打印、传统铲齿加工、蚀刻等,加工难度大[12] * 材料上,铝材因相对易加工而受重视,铜材性能更好但加工难[12] * **微通道技术增量与难点**:除加工难外,还面临界面材料选择等挑战,对制造精度和系统稳定性要求更高[13] 关键部件与材料发展 * **液体介质演变**: * 早期:水或乙二醇混溶液、氢氟醚(因介电常数不稳定被淘汰)、二聚体(因微毒性式微)[14] * 当前流行:**R1233制冷剂**(沸点19度),对大气破坏较小,更环保,尽管价格较高,但在系统总成本中占比相对降低[14][15] * 微通道技术中:**氟化液加乙二醇组合**因低表面张力和良好流动性成为重要选择[15] * **泵**:重要性日益凸显,微通道技术因管道细小,对泵的平顺性、稳定性要求极高[16][33] * 国际大厂(威乐、格兰富)已成立专门部门进行改进[16] * 国内厂商正在快速追赶[16][18] * **界面材料**: * 趋势:从传统导热硅脂(导热系数4-7 W/m·K)升级到**液态金属**(导热能力至少是传统材料的十倍),操作难度增加[16][32] * 新材料:石墨烯(导热系数可达20-30 W/m·K)、碳化硼等不断加入竞争[16][31][32] * 升级与相变或微通道技术无直接关系,是为提升门板与其他组件间的导热效率[17] * **快接头**: * GB200到GB300:数量从108对增加至252对[2][24][28] * Ruby时代:预计将增加到252对,可能面临供应紧缺[24] * 供应商变化:从主要由欧美厂商(斯陶比尔、雷默)提供,转向国内供应商(中航光电、风光类、永辉电器、UQD、贝斯特等)开始送样或合作,以满足需求并降低成本[1][24] 成本分析 * **GB200到GB300成本变化**: * 液冷板总成本上升约**20%至30%**[2][29] * 主要成本上升集中在**快接头**和**洗管**部分[2][29] * 快接头数量从26个增加到72个,加工难度和出水口数量大幅增加[29] * 气管的Many fold加工难度提升[29] * GB200液冷板部件总成本从**49,000美元**增加到**59,000美元**[29] * **双向门板对成本的影响**: * 会显著增加系统成本,相比单向系统再增加约**18%** 的成本,从5.9万美元增至6万多美元[30] * 成本增加因素: 1. **冷却液成本高**:制冷剂或氟化液价格远高于水加乙二醇混合物(例如,一个节点制冷剂费用至少60美元 vs 水乙二醇混合物10-20美元)[30] 2. **需额外添加冷凝器**[30] 3. **因需加压,密封材料和泵等部件需升级**[30] * **微通道技术成本**:尚未大规模应用,具体成本难以准确估算[30] 市场竞争格局 * **GB200阶段供应商格局**:齐宏(市场份额约30%)、双鸿(约20%)、台达、利敏达、Cool Edit、Fulmaster等,国内厂商份额较小[19] * **GB300阶段格局变化**:齐宏和双鸿因早期红利仍保持领先,但国内厂商(如工业富联)凭借成本控制和快速反应能力逐渐占据市场,已宣布进入英伟达供应链[1][19] * **技术路线对竞争格局的影响**: * **双向冷板**:管道结构变化不大,竞争格局变化有限,主要是国产厂商与台系厂商的价格战[20] * **微通道技术**:因加工精度要求高(如10微米级别),可能引入新玩家(如大学团队、研究机构),并对传统门板厂商造成较大冲击,但非完全颠覆[20] * **国内外供应链差距**:液冷发展时间短(约三四年),欧美和台系公司因与英伟达早期关系紧密占据第一波红利[21] * 随着技术普及,国产方案设计公司(英维克、华勤、新华三、浪潮等)开始进入,并以进入英伟达供应链为目标,通过并购合作(如东阳光控股中际旭创)增强联系,差距在缩小[21] * **国内厂商进展**: * **英伟达阵营**:英维克在冷板方案设计上与英伟达合作紧密;领益制造对标工业富联;在微通道、门板加工、液体冷却(如制冷剂厂商巨化、永和)等环节有强竞争力[22] * **ASIC阵营(谷歌、Meta等)**:芯片功耗较低,急迫性待观察,但谷歌已通过天弘科技搭载R134a方案6个月验证,计划大规模应用,一年内服务器需求可带来约**3,000吨**制冷剂增长[25] * ASIC阵营更关注成本控制,对厂商排斥性较弱,新兴国产厂商更有机会切入[26][27] 其他重要信息 * **国内高校研究**:浙江大学、湖南大学、中科院、上海交通大学(邓涛教授团队研究仿生气管微通道)等正在积极研究微通道技术[34] * **新材料应用前景**:金刚石、碳化硅等可能用于界面材料,但目前实际应用有限,更多是石墨烯、碳化硼等替代材料的研究[31]
SemiAnalysis深度解读TPU--谷歌冲击“英伟达帝国”
硬AI· 2025-11-29 15:20
市场格局转变 - 2025年AI芯片市场处于微妙转折点,英伟达凭借Blackwell架构维持技术和市场份额的绝对领先,但谷歌TPU的全面商业化正对其定价权构成挑战[1][2] - OpenAI仅凭“威胁购买TPU”这一筹码,就迫使英伟达生态链做出实质性让步,使其计算集群的总拥有成本(TCO)下降约30%[2] - 谷歌正式从“云服务商”转型为直接向外部出售高性能芯片与系统的“商用芯片供应商”,Anthropic高达1GW的TPU采购细节曝光标志着这一战略转变[3] - 当谷歌愿意开放软件生态并提供金融杠杆时,英伟达高达75%的毛利率神话便不再牢不可破[3][7] 重大交易与商业模式创新 - Anthropic确认将部署超过100万颗TPU,此交易采用“混合销售”新模式,首批约40万颗最新的TPUv7 "Ironwood"由博通直接出售给Anthropic,价值约100亿美元[8] - 剩余60万颗TPUv7通过谷歌云进行租赁,估计这部分交易涉及高达420亿美元的剩余履约义务(RPO),直接支撑了谷歌云近期积压订单的暴涨[9] - 谷歌通过“资产负债表外”的信贷支持(IOU)解决AI基础设施建设的期限错配问题,承诺如果中间商无法支付租金,谷歌将介入兜底[16] - 这一金融工具打通了加密货币矿工与AI算力需求之间的堵点,构建了独立于英伟达体系的低成本基础设施生态[17] 技术优势与成本竞争力 - 谷歌TPUv7在成本效率上对英伟达构成碾压优势,从谷歌内部视角看,TPUv7服务器的TCO比英伟达GB200服务器低约44%[13] - 即便加上谷歌和博通的利润,Anthropic通过GCP使用TPU的TCO,仍比购买GB200低约30%[13] - 谷歌通过极致的系统设计弥补单芯片理论算力的不足,TPUv7采用更务实的设计哲学,通过更高的模型算力利用率(MFU)来提升实际产出[20] - 谷歌独步天下的光互连(ICI)技术利用自研的光路交换机(OCS)和3D Torus拓扑结构,允许单个TPUv7集群扩展至惊人的9,216颗芯片,远超英伟达常见的64或72卡集群[23][24] 软件生态战略调整 - 谷歌软件团队的KPI已发生重大调整,从“服务内部”转向“拥抱开源”,全力支持PyTorch Native在TPU上的运行[30][31] - 谷歌不再依赖低效的Lazy Tensor转换,而是通过XLA编译器直接对接PyTorch的Eager Execution模式,使Meta等客户可几乎无缝迁移代码到TPU[33] - 谷歌开始向vLLM和SGLang等开源推理框架大量贡献代码,打通了TPU在开源推理生态中的任督二脉[34] - 这一转变意味着英伟达最坚固的“CUDA护城河”,正在被谷歌用“兼容性”填平[36] 行业影响与竞争态势 - 除了Anthropic,Meta、SSI、xAI等顶级AI实验室也出现在了谷歌TPU的潜在客户名单中[10] - 面对谷歌的攻势,英伟达罕见地展现出防御姿态,其财务团队近期针对“循环经济”的质疑发布长文辩解,显示谷歌的攻势已触及英伟达的神经[10] - Gemini 3和Claude 4.5 Opus这两大全球最强模型均完全在TPU上完成预训练,这为TPU系统处理最高难度任务的能力提供了终极背书[26] - 谷歌在外部客户定价上需要“穿针引线”,但对Anthropic等旗舰客户仍能提供有竞争力的价格,同时保持比商品化GPU交易更优越的息税前利润率[92][93]
SemiAnalysis深度解读TPU--谷歌(GOOG.US,GOOGL.US)冲击“英伟达(NVDA.US)帝国”
智通财经网· 2025-11-29 09:37
行业竞争格局变化 - 谷歌TPU的全面商业化使英伟达在AI算力市场的定价权出现松动,其高达75%的毛利率面临挑战[1] - 谷歌从云服务商转型为直接向外部出售高性能芯片与系统的商用芯片供应商,Anthropic的采购标志着这一战略转变[1][4] - 谷歌TPU已获得包括Anthropic、Meta、SSI、xAI等顶级AI实验室的采购意向,客户名单不断扩大[4][29] 具体交易与成本优势 - Anthropic确认将部署超过100万颗TPU,交易总价值巨大,其中首批40万颗TPUv7由博通直接出售给Anthropic,价值约100亿美元,剩余60万颗通过谷歌云租赁,涉及剩余履约义务高达420亿美元[4][42] - 谷歌TPUv7在总拥有成本上对英伟达构成显著优势,从谷歌内部视角看,TPUv7服务器的TCO比英伟达GB200服务器低约44%,即便加上利润,外部客户通过GCP使用TPU的TCO仍比购买GB200低约30%[7][64][67] - 具体成本数据显示,GB200 NVL72每小时每GPU总成本为2.28美元,而TPU v7外部版本为1.60美元,TPU在每FP8 PFLOP的TCO上优势明显[66] 技术系统与架构优势 - 谷歌通过极致的系统设计弥补单芯片理论算力的不足,TPUv7采用3D Torus拓扑结构和自研光互连技术,单个集群可扩展至9,216颗芯片,远超英伟达常见集群规模[12][15][17] - 光路交换机技术允许动态重构网络拓扑,实现毫秒级故障绕过和高可用性,同时降低功耗和延迟[15][17][101] - 系统级优势使得TPU在实际模型训练中实现更高的算力利用率,有效FLOPs可能超过英伟达Blackwell[69][72] 软件生态战略调整 - 谷歌积极拥抱开源,软件团队KPI从服务内部转向支持外部,全力支持PyTorch Native在TPU上运行,降低开发者迁移门槛[19][20][141] - 通过XLA编译器直接对接PyTorch的Eager Execution模式,并向vLLM、SGLang等开源推理框架贡献代码,提升TPU在开源生态中的兼容性[20][145][146] - 软件生态的开放旨在填平英伟达的CUDA护城河,为外部客户提供更平滑的过渡体验[22][142] 金融与商业模式创新 - 谷歌创新性地提供资产负债表外的信贷支持,承诺为中间商的数据中心租金兜底,解决了AI基础设施建设的期限错配问题,打通了加密货币矿工与AI算力需求之间的堵点[9][43][46] - 这种“超大规模厂商兜底”的金融工具成为Neocloud市场的新融资标准模板,推动了行业增长[46][47] - 在定价策略上,谷歌通过平衡自身盈利和客户竞争力,即使作为外部供应商,其TPU交易的息税前利润率仍优于许多大型GPU云交易[79][80]
SemiAnalysis深度解读TPU--谷歌冲击“英伟达帝国”
华尔街见闻· 2025-11-29 05:07
行业竞争格局演变 - 谷歌TPU的全面商业化正对英伟达在AI算力市场的定价权和主导地位构成实质性挑战,其高达75%的毛利率神话面临松动[1] - 谷歌已从云服务商转型为直接向外部出售高性能芯片与系统的商用芯片供应商,Anthropic、Meta、SSI、xAI等顶级AI实验室均出现在其潜在客户名单中[1][4] - 英伟达面对竞争压力展现出防御姿态,其财务团队近期针对"循环经济"的质疑发布长文辩解,显示出市场攻势已触及公司神经[5] 重大商业交易分析 - Anthropic已确认将部署超过100万颗TPU,此笔交易采用极具破坏力的"混合销售"新模式[4] - 交易中首批约40万颗最新的TPUv7 "Ironwood"由博通直接出售给Anthropic,价值约100亿美元,博通作为联合设计方成为隐形赢家[4] - 剩余60万颗TPUv7通过谷歌云租赁,估算涉及高达420亿美元的剩余履约义务,直接支撑了谷歌云近期积压订单的暴涨[4] 成本效率与TCO优势 - SemiAnalysis模型数据显示,谷歌TPUv7在成本效率上对英伟达构成碾压优势[7] - 从谷歌内部视角看,TPUv7服务器的总拥有成本比英伟达GB200服务器低约44%[7] - 即便加上谷歌和博通的利润,Anthropic通过GCP使用TPU的TCO仍比购买GB200低约30%[7] - 具体数据显示,GB200 NVL72每小时每GPU总成本为2.28美元,而TPU v7对外部客户的成本为1.60美元,内部成本更低至1.28美元[8][65] 技术创新与系统设计 - 谷歌通过极致的系统设计弥补了单颗TPU在理论峰值算力上的不足,TPUv7 "Ironwood"在内存带宽和容量上已大幅缩小与英伟达旗舰芯片的差距[12] - 谷歌独步天下的光互连技术是其杀手锏,利用自研的光路交换机和3D Torus拓扑结构,构建了名为ICI的片间互连网络[15] - 该架构允许单个TPUv7集群扩展至惊人的9,216颗芯片,远超英伟达常见的64或72卡集群,并具备动态重构拓扑、高可用性和低功耗延迟的优势[16][17] 软件生态战略转变 - 谷歌已对TPU软件战略做出重大转变,从固守JAX语言转向全力支持PyTorch Native在TPU上的运行,以拆除阻碍外部客户采用的最大障碍[19][21] - 谷歌不再依赖低效的Lazy Tensor转换,而是通过XLA编译器直接对接PyTorch的Eager Execution模式,使Meta等客户可几乎无缝迁移代码至TPU[21] - 公司开始向vLLM和SGLang等开源推理框架大量贡献代码,这意味着英伟达最坚固的"CUDA护城河"正被谷歌用"兼容性"填平[21][23] 金融工程与商业模式创新 - 谷歌通过"超级云厂商兜底"的金融工具创新解决了AI基础设施建设中的期限错配难题,承诺若中间商无法支付租金将介入兜底[9] - 这一资产负债表外的信贷支持打通了加密货币矿工与AI算力需求之间的堵点,构建了一个独立于英伟达体系的低成本基础设施生态[9] - 在Anthropic交易中,谷歌提供了独特的变通方案,不直接租赁而是提供信用兜底,形成了新的行业融资模板[42] 性能验证与市场影响 - 全球最顶尖的两个模型——Anthropic的Claude 4.5 Opus和谷歌的Gemini 3,其绝大部分训练和推理基础设施都运行在谷歌的TPU上,这是对TPU系统处理最高难度任务能力的终极背书[17][24] - OpenAI仅凭"威胁购买TPU"这一筹码,就迫使英伟达生态链做出了实质性让步,使其计算集群的总拥有成本下降了约30%[1][36] - 行业研究机构强调,客户购买的TPU越多,节省的Nvidia GPU资本支出就越多,这已成为核心商业逻辑[26][36]
20cm速递|科创芯片ETF国泰(589100)涨超1.4%,电子与半导体行业需求持续复苏
每日经济新闻· 2025-11-28 11:37
行业趋势与需求复苏 - 电子与半导体行业需求持续复苏,供给端有效出清 [1] - 存储芯片价格上涨趋势超出预期 [1] - 国内产业链国产化力度持续加大 [1] 公司业绩与技术进展 - 英伟达三季度数据中心营收同比增长66%,主要受GB300加速推广驱动 [1] - 英伟达四季度营收指引达650亿美元,再次超出市场预期 [1] - 谷歌发布自研TPU训练的Gemini 3模型,其多模态推理能力在多项基准测试中显著超越前代,体现AI算力硬件技术突破 [1] 相关指数与产品表现 - 科创芯片ETF国泰(589100)单日涨跌幅达20% [1] - 该ETF跟踪的科创芯片指数(000685)从科创板市场中选取涉及芯片全产业链的上市公司证券作为指数样本 [1] - 指数覆盖上游材料设备、中游设计制造及下游封装测试等环节,以反映中国芯片行业科技创新和高端制造的整体表现 [1]
大族数控20251127
2025-11-28 01:42
公司概况 * 公司为大族数控[1] * 公司明确调整经营策略,将所有资源投入到AI场景中,尤其是集中在盛虹这一核心企业上[3] 核心业务与技术进展 * 公司在HDI和机械钻孔领域,现有产品GB200、GB300已占据主导地位,大规模量产几乎全部由公司提供[2][4] * 公司80%的收入来自于钻孔设备[14] * 面对M9材料(高纯度石英布,硬度极高)的加工挑战,公司采用超快激光技术,该技术不依赖高温原理,通过精细控制实现对超硬材料的轻松加工,并已在苹果产品中大规模应用超快激光切割蓝宝石[2][5] * 针对AI场景下PCB钻孔工艺复杂性增加(线路密度和板厚度提升,需要多次钻孔和备钻工艺)的问题,公司开发了新技术应对多层板机械钻孔挑战[2][4][11] * CCD备钻设备在AI场景中市场表现突出,售价和毛利率几乎是普通设备的两倍,预计占AI场景所需钻机数量的40%-50%[4][12] * 高价值CCD钻机在2025年第三季度销售量有明显提升,占比达到10%至20%之间,其收入约占公司总收入的10%左右[12][13] * 新进入PCB领域公司的激光技术目前尚未对现有市场格局产生显著影响,因缺乏对PCB工艺的深入理解且难以接触顶级客户[15] 发展战略与未来规划 * 公司未来发展战略以钻孔工序为主,同时拓展曝光、成型、压合和测试等产品线,目标是在AI场景中实现价值最大化[2][6] * 公司正通过产品结构和客户结构的变化,转型为高端设备供应商,生产技术要求更高的高端产品,并与全球顶尖客户合作[2][20] * 公司计划在高端市场使核心产品(如钻孔设备)占据主要份额甚至全部市场份额[6] * 公司与全球顶尖客户彭鼎(全球最大的高端产品制造商之一)的合作在2025年取得重要进展,特别是在超快激光钻机方面,未来希望进一步深化合作[19] 财务表现与市场预期 * 公司2025年以来业绩表现出色,无论是同比还是环比,都呈现出稳步提升的态势[3] * 公司当前毛利率约为50%,并计划维持这一水平,若客户批量采购可能会调整价格但仍保持高端定位[21] * AI市场带来的增量市场预计达到一两千万美元,随着技术难度提升,设备价值也会持续提升[22] * 到2030年,PCB的价值量预计将提升至1,000-2,000亿美元(2021年全球PCB价值为800多亿美元),AI产业将催生一个新市场,规模甚至可能达到原来市场的两倍[2][8] * 尽管资本市场存在泡沫论,但行业内并未看到投资收缩迹象,主要科技公司(如谷歌、Meta、微软)和PCB板厂(如盛弘)仍在加大投入,长期行业发展前景乐观[16][17] * 2025年前三个季度公司在AI产业的投资持续增长,表现出显著的增长趋势,预计其他公司将在2026年进入大规模量产阶段[18] 技术路线图与产能规划 * 在二氧化碳激光向超快激光的转换方面,预计2026年中进行超快激光量产[2][7] * 超快激光设备目前尚未大规模出货,仍以实验类设备为主,但预计在1.6T光模块大规模商用后,高阶HDA工艺对超快激光加工需求将增加[2][9] * 超快激光设备细分市场预计将在2025年取得批量订单,并在2026年上半年实现规模化生产[2][9] * AI场景下,PCB制造过程中钻孔工序的价值占比超过20%[10]