B40 chip

搜索文档
全球科技-人工智能供应链 2025 年下半年生产;安卓 AI 手机;AI 工厂分析更新-Global Technology -Correction AI Supply Chain H20 Production; Android AI Phone; AI Factory Analysis Updates
2025-08-27 01:12
关键要点总结 涉及的行业和公司 **行业** * 全球科技行业 特别是人工智能(AI)半导体供应链、AI智能手机和AI数据中心(AI工厂)经济 [1][4][29][43][71] **公司** * **核心公司**:NVIDIA(英伟达)、AMD、TSMC(台积电)、Google(谷歌)、MediaTek(联发科)[2][3][4][13][19][63] * **其他提及公司**:Broadcom(博通)、Astera Labs、Samsung(三星)、Aspeed、Alchip、华为、AWS、Microsoft(微软)、Bytedance(字节跳动)、Apple(苹果)、小米 以及一系列AI半导体供应链上下游企业 [13][14][43][63][64][72] 核心观点和论据 **对NVIDIA及其供应链持乐观态度** * 在8月28日季度业绩公布前 对NVIDIA在亚洲的半导体供应链持看涨观点 [1][11] * 预计NVIDIA 10月季度营收为525亿美元 并有上行潜力 市场部分预期高达550亿美元 [2][11] * 看好NVIDIA股票 因其在未来12个月内的产量增长 尽管公司在供应和中国变量方面预计会保持保守 [12] **H20芯片生产动态与地缘政治影响** * 据CNBC报道 在中国限制采购后 NVIDIA寻求停止H20芯片生产 [2] * NVIDIA CEO重申公司已获美国政府批准恢复H20芯片销售 并明确该芯片没有安全后门 [2] * 亚洲供应链核查显示 H20的CoWoS封装现已确实停止 H20 HGX服务器组装在1-2周前停止 随后H20 GPU模块预测被削减 [2] * 一些中国客户近期对NVIDIA不带HBM(但使用GDDR7)的B40芯片表现出兴趣 预计今年需求200万单位 明年需求500万单位 [2] * 对TSMC而言 中国AI/GPU仍然是重要的长期增长动力 [2] **AI推理需求强劲增长** * AI推理需求正在增长 主要云服务提供商(CSP)处理的token数量快速增长即是证明 [14] * 截至2025年6月底 中国每日token消耗达到30万亿(月度运行速率为900万亿) 相比2024年初的每日0.1万亿增长了300倍 [14] * Google在2025年7月处理了超过980万亿token 较2025年5月的480万亿翻倍 [14] * 截至2025年5月底 字节跳动的每日token消耗达到16.4万亿(月度运行速率为508万亿) 较2025年3月底的12.7万亿增长29% [14] * 微软在2025财年(截至2025年6月)通过其Foundry API处理了超过500万亿token 同比增长超过7倍 [14] **AI工厂(数据中心)经济性分析更新** * 引入混合专家模型(MoE)到TPS计算中 这是AI推理的增长趋势 [3] * 阐明了稀疏性假设 这影响了解码时间(例如 AMD MI355采用稀疏性可比密集配置提高约5%的token输出) [3][31] * 调整了网络带宽假设 例如 AMD MI355X采用其Infinity Fabric将网络带宽比使用PCIe Gen 5(128GB/s)的MI300X提高了约20% 达到154GB/s [3][32] * 修正了对ASIC网络速度的高估 [3] * 对于token价格假设 提供了参考价格范围表 而非单一的0.2美元/百万token点 [3][37][38] * 结论:在0.3美元/百万token的价格下 大多数运行Llama 4 400B MoE的芯片都能产生利润(包括AMD旧一代芯片MI300) [3][38] * 一个100MW的AI工厂在0.2美元/百万token的假设下 估计可产生约12.8亿美元的年收入和7.22亿美元的年利润 平均利润率约52% [51] * 在0.3美元/百万token的假设下 估计可产生约19.1亿美元的年收入和13.6亿美元的年利润 平均利润率约68% [51] * NVIDIA的GB200 NVL72 pod在计算能力、内存能力和快速网络性能方面继续展示出性能主导地位 [48] **AI智能手机的新希望与Google Pixel 10发布** * Google发布了Pixel 10手机系列 其Tensor G5芯片采用TSMC的3nm工艺制造 调制解调器可能由MediaTek供应 [4][19] * Pixel 10配备了市场上所有智能手机中最好的摄像头 新的Pro Res Zoom让用户可以从高达100倍的距离捕捉细节 [19] * Gemini在手机上提供了全面且个性化的AI体验 包括Magic Cue功能、AI健康教练、实时翻译通话(使用通话者自然声音)等 [19] * 关键问题是这些功能多快能扩散到中国智能手机市场并在2026年引发换机周期 [4][9][19] **AI半导体资本支出(Capex)保持强劲** * 摩根士丹利预计2026年云资本支出将增加至5820亿美元 意味着31%的同比增长(对比市场共识仅为16%) [71] * 假设AI服务器资本支出组合(短期资产支出)增加 隐含的AI服务器资本支出在2026年可能同比增长约70% [72] * 这支撑了对美国半导体和大中华区半导体行业的“具吸引力”观点 AI需求保持强劲 [72] **供应链产能与需求预测(CoWoS & HBM)** * TSMC预计在2025年生产510万颗芯片 全年GB200 NVL72出货量预计达到3万架 [89][90] * 硬件团队估计2025年GB200/GB300服务器机架出货量在2.5-3万架左右 [91] * 全球CoWoS需求年增长率预测:2023年95% 2024e 216% 2025e 84% 2026e 48% [98] * 2025年AI计算晶圆消费收入预计高达145亿美元 [110][111] * 2025年HBM消费预计高达16e9 GB(160亿GB) 几乎是2024年水平的两倍 NVIDIA被视为最大客户 [107][108][112] * HBM TSV产能预计在2025年翻倍 [106] 其他重要内容 **投资建议与看好的公司** * 对美国半导体:增持(OW)NVIDIA、Broadcom、Astera Labs [13][63][72] * 对亚洲半导体:增持(OW)TSMC、Samsung、Aspeed、Alchip、MediaTek [13][63][72] * 替代AI半导体组:AMD、Alchip、Andes、Marvell、Broadcom [64] * AI半导体赋能组:TSMC、Synopsys、Cadence、ASML、BESI、Ibiden、KYEC、Advantest [64] **研究局限性** * 理论模型与现实场景之间存在差距 导致计算性能高于实际结果 [57] * 实际AI推理工作负载的规模各不相同 并且分布在单个或多个处理器甚至多个服务器上 使得真实环境比模型更动态 [57] * 延迟、并发性、并行性、软件栈优化和生成token质量等多种因素和性能指标难以量化 [57] * 未考虑解码过程中计算和通信的重叠时间 这也可能影响TPS结果 [57][58] * 评估和折旧人力资源成本(包括劳动力和研发费用)仍然存在挑战 [57][58] **更正声明** * 对文中关于NVIDIA HGX H200机架计算的图表10、11、13和14进行了更正 [10] * 更正了第12页“盈利能力估算”部分的两个要点 [10] * 本文最初发布于2025年8月25日 20:06 GMT 并于2025年8月26日重新发布 [10]
全球科技-人工智能供应链 2025 年下半年生产情况;安卓人工智能手机;人工智能工厂分析更新-Global Technology -AI Supply Chain H20 Production; Android AI Phone; AI Factory Analysis Updates
2025-08-26 01:19
关键要点总结 涉及的行业和公司 **行业** * AI半导体供应链 * AI智能手机 * AI数据中心/算力工厂 * CoWoS先进封装 * HBM存储器 **公司** * **核心公司**:NVIDIA、AMD、TSMC、Google、MediaTek * **其他提及公司**:Broadcom、Astera Labs、Samsung、Aspeed、Alchip、AWS、Microsoft、Meta、Tesla、华为、苹果、小米、百度、腾讯、阿里巴巴、字节跳动等[1][2][4][10][60] 核心观点和论据 **对NVIDIA供应链的乐观看法** * 在8月28日季度业绩公布前,对NVIDIA在亚洲的半导体供应链持乐观态度[1][8] * 10月季度收入预览为525亿美元,并认为存在上行空间,部分卖方预测高达550亿美元[8] * 对股票的看好基于未来12个月的需求增长,但公司在供应和中国变量方面预计将保持保守[9] **NVIDIA H20芯片动态** * 据CNBC报道,在中国限制采购后,NVIDIA寻求停止H20芯片生产[2] * NVIDIA CEO重申公司已获得美国政府批准恢复H20销售,并明确该芯片没有安全后门[2] * 亚洲供应链检查证实H20的CoWoS封装现已停止,H20 HGX服务器组装在1-2周前停止,H20 GPU模块预测近期被削减[2] * 部分中国客户对NVIDIA不带HBM但使用GDDR7的B40芯片表现出兴趣,预测今年需求200万颗,明年需求500万颗[2] **AI推理需求强劲增长** * 主要云服务提供商处理的月度Token数量表明AI推理需求正在增长[11] * 截至2025年6月底,中国的Token消耗量达到每日30万亿(月度运行率为900万亿),较2024年初的每日0.1万亿增长300倍[11] * Google在2025年7月处理超过980万亿Token,较2025年5月的480万亿翻倍[11] * 截至2025年5月底,字节跳动的Token消耗量达到每日16.4万亿(月度运行率为508万亿),较2025年3月底的每日12.7万亿增长29%[11] * Microsoft在2025财年通过其Foundry API处理了超过500万亿Token,同比增长超过7倍[11] **AI工厂经济性分析更新** * 引入了MoE(混合专家)架构到TPS(每秒Token数)计算中,以反映AI推理的增长趋势[3][26] * 澄清了稀疏性假设,这会影响解码时间(例如,AMD MI355采用稀疏性可比密集配置提高约5%的Token输出)[3][28] * 调整了网络带宽假设(例如,AMD MI355X采用其Infinity Fabric将网络带宽提高约20%至154GB/s,而MI300X使用PCIe Gen 5为128GB/s)[3][29] * 修正了对ASIC网络速度的高估[3] * 提供了Token价格的参考范围表,而非单一的0.2美元/百万Token价格点[3][35] * 结论:在0.3美元/百万Token的价格下,大多数运行Llama 4 400B with MoE的芯片都能产生利润(包括AMD旧一代芯片MI300)[3][35] **AI智能手机的新希望:Google Pixel 10** * Google发布了Pixel 10手机系列,拥有市场上所有智能手机中最好的摄像头,支持高达100倍变焦的Pro Res Zoom[16] * Gemini在手机上提供全面个性化的AI体验,包括Magic Cue功能(可预测问题)、AI健康教练、实时翻译通话(使用通话者自然声音)[15][16] * Tensor G5芯片采用TSMC的3nm工艺制造,调制解调器可能由MediaTek供应[4][16] * 关键问题在于这些功能多快能普及到中国智能手机市场并引发2026年的换机周期[4][16] **财务预测与估值** * **AI工厂盈利性**:在0.2美元/百万Token假设下,100MW AI工厂年收入约11.6亿美元,年利润约6.08亿美元,平均利润率约47%;在0.3美元/百万Token假设下,年收入约17.4亿美元,年利润约11.9亿美元,平均利润率约65%[48] * **TSMC AI收入**:AI预计占TSMC 2024年总收入的mid-teens份额,占2025e总收入的25%[65] * **云资本支出**:摩根士丹利预计2026年云资本支出将增至5820亿美元, implying 31% 同比增长(vs. 共识预期仅+16%),AI服务器资本支出可能在2026年同比增长约70%[68][69] * **CoWoS需求**:2025e全球CoWoS需求预计为68万片晶圆,同比增长84%;2026e预计为100.4万片晶圆,同比增长48%[94][95] * **HBM需求**:2025e HBM需求预计接近200万GB,几乎是2024年水平的两倍[104][105] * **AI计算晶圆消费**:2025e AI计算晶圆消费收入预计高达145亿美元[107][108] 其他重要内容 **投资建议与看好的公司** * **美国半导体**:超配NVIDIA、Broadcom、Astera Labs[10][60] * **亚洲半导体**:超配TSMC、Samsung、Aspeed、Alchip、MediaTek[10][60] * **替代AI半导体组**:AMD、Alchip、Andes、Marvell、Broadcom[61] * **AI半导体赋能组**:TSMC、Synopsys、Cadence、ASML、BESI、Ibiden、KYEC、Advantest[61] **CoWoS产能与分配** * **TSMC CoWoS产能**:2025e年底预计达到93k wpm(千片晶圆/月),2026e年底预计达到120k wpm[84][85][91] * **非TSMC CoWoS产能**:2025e年底预计达到13k wpm,2026e年底预计达到15k wpm[84][85][91] * **2026年CoWoS关键客户分配**:NVIDIA (59%), Broadcom (15%), AMD (10%), AWS+Alchip (5%), Marvell (5%)[94][97] **风险与局限** * **中国监管风险**:中国政府可能阻止中国客户购买美国芯片,对NVIDIA在中国的机会评估是指导中的一大变量[9] * **AI工厂研究局限**:理论与现实场景存在差距;实际推理工作负载更具动态性;延迟、并发、并行性、软件栈优化等因素难以量化;未考虑解码过程中计算和通信的重叠时间;评估和折旧人力资源成本仍存在挑战[55] * **定价模式差异**:LLM可以创造竞争壁垒,可能实现更高定价和收入;计算未包含开发此类LLM的研发支出;许多数据中心仅作为AI硬件出租方运营,这可能显著降低整体收入和利润率[46]
ZJK Industrial Co., Ltd. Ramps Up Production to Support Nvidia’s B40 Project, Expecting Significant YoY Revenue Growth
Globenewswire· 2025-06-05 12:00
文章核心观点 - ZJK工业公司宣布提高产量以满足英伟达B40项目不断增长的需求,该项目具有市场优势,有望为公司带来显著的同比收入增长和长期发展机遇 [1][3] 公司情况 - ZJK工业是一家高科技企业,专注于精密紧固件、结构件等精密金属零件的制造和销售,应用于多个行业,拥有专业团队、自动化设备、稳定客户群和质量管理体系 [4] - 公司主要提供标准螺丝、精密螺丝和螺母等多种产品及研发技术服务 [4] 行业动态 - 英伟达正在推进为中国市场定制的AI加速器B40芯片的开发,基于其Blackwell架构,面向中高端市场,最早于2025年6月开始量产 [2] - 供应链预测显示,到2025年底,B40芯片出货量预计将超过100万片 [3] 公司展望 - 公司认为B40项目具有市场优势,与英伟达全球销售的RTX Pro 6000工作站显卡互补,该项目有望带来显著的同比收入增长,助力公司长期增长、业务升级和战略扩张 [3]