Workflow
傅里叶的猫
icon
搜索文档
外媒:H20阉割版预计在7月推出,性能或大幅缩水
傅里叶的猫· 2025-05-09 13:53
英伟达中国市场战略调整 - 公司计划在未来两个月内为中国市场推出降级版H20人工智能芯片 [1] - 目标在7月推出改良后的H20芯片 已通知中国主要云计算供应商 [1] - 此举是为应对美国出口限制 维持在中国关键市场的地位 [1] H20芯片规格变化 - 新版H20芯片较原版大幅降级 内存方面显著降低 [1] - 公司已制定新的技术门槛指导改良芯片设计开发 [1] - 下游客户可能通过修改模块配置来调整芯片性能水平 [2] 中国市场重要性 - 中国市场在截至1月26日的财年为公司贡献170亿美元收入 占总销售额13% [4] - 公司CEO黄仁勋近期访问北京 强调中国是关键市场 [4][5] - 自1月以来累计获得价值180亿美元的H20订单 [6] 行业背景 - 2023年10月美国收紧出口管制后推出H20芯片 [5] - 中国科技巨头如腾讯 阿里巴巴 字节跳动加大H20订单 [5] - 深度求索等初创公司对高性价比AI模型需求增长 [5]
英伟达AI芯片植入定位追踪功能?Jefferies:没啥影响
傅里叶的猫· 2025-05-09 13:53
法案背景与内容 - 民主党众议员Bill Foster计划提交法案,要求受出口管制的美国先进AI芯片配备定位追踪和远程禁用功能,旨在遏制对华非法出口 [1] - 法案矛头直指中国,因英伟达AI芯片通过灰色渠道流入中国市场的现象已被多次报道 [1] 技术可行性分析 - 定位追踪功能较易实现,英伟达或已具备相关技术储备 [2] - 远程禁用功能有效性存疑,存在被黑客攻破的风险,可能导致管控措施失效 [2] - 法案将增加美国AI芯片企业的合规成本,但恐难实现立法预期目标 [2] 立法前景评估 - 提案获两党初步支持,但立法程序漫长且充满变数 [3] - 共和党掌控参众两院理论上有利法案推进,但需特朗普总统签署生效 [3] - 特朗普政府政策导向与法案可能存在分歧,其支持态度存疑 [3] 对中国AI产业影响 - 即使法案立法,对中国AI资本支出和IDC需求影响有限 [4] - 中国AI商业化进程加速,本土大模型(如DeepSeek)推动ToB/ToC应用发展 [4] - 本土7纳米晶圆厂产能扩张将成为算力基建核心驱动力 [4] - 2026年起推理需求将主导增长,本土芯片或游戏GPU可满足需求,降低对GPU集群和CUDA生态依赖 [4] 商业资源与信息渠道 - 提供H200/B200/RTX5090/FPGA等硬件资源采购渠道 [5] - 知识星球提供外资投行科技研报、SemiAnalysis报告及精选付费文章,年费优惠至390元 [6]
国产GPU的性能PK
傅里叶的猫· 2025-05-08 14:11
国产GPU性能对比 - 壁仞科技2022年推出的BR100性能最强,但因制裁无法量产,华为昇腾910C成为实际国产最强[1] - 华为昇腾910C性能达到英伟达H800的60%,海光BW100深算能力约400T(H800的50%),寒武纪590性能为H800的30%-35%[1] - 性能排名:华为910C > 海光BW100C > 华为910B > 百度/阿里自研卡 > 寒武纪 > 沐曦/天数智芯等[2] 产品价格动态 - 海光BW100采购价约10万元/张,华为910B和910C分别为7万和18万元,寒武纪590价格从8万-8.5万降至6万-7万[2] 显存技术现状 - 国内GPU普遍采用HBM2e显存(受制裁无法使用HBM3e),推理任务中显存容量是关键门槛,主流产品显存容量均达64GB[3] - 华为910C显存带宽达3.2TB/s显著领先,壁仞BR100为2.3TB/s,沐曦蔵云C500为1.8TB/s,多数厂商产品在0.5-1.8TB/s区间[4][5] 算力参数细节 - 壁仞BR100的BF16算力达445T,FP16算力1024T为表格中最高,华为910C BF16算力244T,沐曦蔵云C500 FP16算力280T[5] - 昆仑芯RG800显存带宽0.2TB/s,平头哥含光800* FP16算力202T,燧原逐思2.0显存带宽1.8TB/s[5] 技术迭代趋势 - 海光BW100采用先进交换芯片设计,单卡可用性能实测达87%,优于寒武纪590(约80%),反映后发技术优势[2] - 寒武纪MLU370-X8显存容量48GB(带宽0.6TB/s),较早期MLU270-S4(16GB/DDR4)有明显升级[5]
【议程已定】相约北京共探:高算力芯片开发与热管理技术
傅里叶的猫· 2025-05-08 14:11
论坛基本信息 - 论坛名称为“2025第二届高算力芯片开发者论坛暨芯片热管理技术交流会” [1] - 举办时间为2025年5月22日至23日 [1] - 举办地点为北京 [1] - 主办方为车乾信息&热设计网 [1] 论坛核心议题 - 重点探讨国产AI芯片进程 [1] - 关注AI芯片安全议题 [1] - 涉及芯片封装Chiplet技术 [1] - 研讨先进封装材料与封装基板 [1] - 探讨AI芯片热力设计 [1] - 研究芯片直冷技术 [1] - 讨论3DVC均温技术 [1] 论坛规模与活动形式 - 论坛将安排超过20场演讲 [1] - 预计将有超过300位行业专家参会 [1] - 提供参会学习、展台展示、演讲宣传三种主要参与方式 [1]
外资顶尖投行研报分享
傅里叶的猫· 2025-05-07 12:11
资源内容 - 每日上传数百篇外资顶尖投行原文研报 包括大摩、小摩、UBS、高盛、Jefferies、HSBC、花旗、BARCLAYS等机构报告 [1] - 提供SemiAnalysis全部半导体行业分析报告 涵盖半导体行业深度研究内容 [3] - 每日更新Seeking Alpha、Substack、Stratechery精选付费文章 聚焦科技行业分析与投资研究 [3] 服务价值 - 获取上百篇外资顶尖投行科技行业分析报告 支持投资决策与行业深度研究 [3] - 以390元优惠价格获取每日研报更新服务 成本效益较高 [3]
Morgan Stanley:中国 GPU的产能、良率、价格及收入
傅里叶的猫· 2025-05-07 12:11
中国GPU自给率分析 - 2024年中国人工智能GPU自给率为34%,预计2027年提升至82% [3][7] - 云人工智能市场规模预计以28%复合年增长率增长,2027年达2390亿美元,中国市场占比20%约480亿美元 [3][7] - 华为是中国本土主要GPU供应商,寒武纪紧随其后,芯片主要由中芯国际7纳米制程制造 [3][7] - 中芯国际预计为GPU生产分配2.6万片晶圆/月产能,良率假设30-50%支撑自给率提升 [3][7] 中国半导体行业整体自给率 - 中国半导体自给率达24%,高于预期,较2023年20%提升4个百分点 [4] - 中国半导体公司总收入430亿美元,同比增长36%,市场规模1830亿美元占全球29% [4] - 自给率提升驱动因素:家电/消费电子补贴刺激需求、库存消化完成、存储芯片及先进节点产能改善 [4] 细分领域国产化进展 - 存储芯片(长鑫DRAM/长江NAND)产能分别增加4.8万片/月和4万片/月,技术获认可 [5] - 图像传感器和功率半导体受益电动汽车增长及市场份额抢占 [5] - 半导体设备领域增长35%但自给率低于预期,EDA工具在中小设计公司渗透不足 [5] 华为昇腾GPU产能与收入预测 - 中芯国际GPU产能从2024年2kwpm增至2027年26kwpm,910X型号2027年占比达20kwpm [8] - 910B型号2024年产量562k颗,收入35.58亿人民币,2025年后停产 [8] - 910X型号2027年产量2,808k颗,收入196.56亿人民币,成为主力产品 [8] - 总GPU收入2024年42.9亿人民币,2025年同比激增240%至146.1亿人民币 [8]
华为能够挑战英伟达的 CUDA 吗?
傅里叶的猫· 2025-05-06 12:07
英伟达的软件护城河 - 英伟达的竞争优势核心在于CUDA生态系统,包括专有编程模型、丰富库和与PyTorch的深度整合 [2][5] - CUDA起源于2007年,通过免费提供和开发者社区建设解决了先有鸡还是先有蛋的问题,最终在2012年因AlexNet训练成功获得认可 [6][7] - CUDA的转换成本极高,开发者需重写代码并失去成熟库和社区支持,PyTorch等框架也依赖CUDA作为后端 [8][10] 华为的三管齐下战略 - 自主研发CANN软件栈和MindSpore框架,试图复制PyTorch+CUDA的全栈体验 [11][12] - 深化PyTorch兼容性,通过torch_npu适配器连接昇腾硬件,但存在版本兼容性和稳定性问题 [11][20][22] - 投入ONNX开放标准优化,实现跨硬件模型部署,允许英伟达训练模型在昇腾芯片上推理 [25][27] 华为软件生态的现状与挑战 - CANN 8.0版本被宣传为重要进展,但开发者反馈其使用困难且缺乏社区支持,昇腾910C推理性能仅为H100的60% [13][17] - 华为模仿英伟达早期策略,派驻工程师协助客户迁移代码,如百度、腾讯等 [16] - 开发者社区活跃度低,知乎用户抱怨文档杂乱且故障排查资源有限,与英伟达的成熟生态差距显著 [13][16][22] 华为与PyTorch的整合进展 - 华为2023年加入PyTorch基金会,通过torch_npu适配器实现昇腾支持,但代码未并入主库导致维护挑战 [19][21] - PyTorch基金会表态支持硬件多样性,华为的理事会席位可能推动其贡献被正式采纳 [23] - 开发者指出昇腾对PyTorch第三方扩展支持不足,部署大规模模型存在兼容性问题 [22] ONNX在华为战略中的角色 - ONNX作为模型"PDF格式",使英伟达训练模型可导出并在昇腾芯片部署,华为维护专用ONNX Runtime优化内核 [25][26] - 该方案适合中国市场,允许训练依赖英伟达硬件而推理转向华为,但部分PyTorch操作无法完美转换 [27] 长期竞争前景 - 华为需多年构建成熟生态,英伟达CUDA优势积累耗时18年,当前开发者不满可能随社区扩大转化为资源 [29] - 人工智能驱动的软件优化(如AI CUDA工程师技术)可能加速华为性能差距缩小 [18] - 模型部署是近期突破口,如DeepSeek R1案例显示英伟达训练模型可在昇腾运行,但全栈替代仍需时间 [28][29]
外资顶尖投行研报分享
傅里叶的猫· 2025-05-06 12:07
外资研报资源 - 提供数百篇外资顶尖投行原文研报 包括大摩 小摩 UBS 高盛 Jefferies HSBC 花旗 BARCLAYS等机构报告 [1] - 包含半导体行业专业分析平台SemiAnalysis的全部研究报告 [3] - 每日更新Seeking Alpha Substack stratechery的精选付费文章 [3] 订阅服务内容 - 每日可获取上百篇外资投行科技行业分析报告 [3] - 提供每日精选行业研究报告 [3] - 订阅费用为390元(使用优惠券后) [3]
AI服务器市场分析,GPU和ASIC谁的份额更高?
傅里叶的猫· 2025-05-05 10:55
市场整体规模 - 2024年全球人工智能服务器市场规模预计为1,251亿美元,2025年将增至1,587亿美元,2028年有望达到2,227亿美元 [1] - 生成式人工智能服务器占比将从2025年的29.6%提升至2028年的37.7% [1] 英伟达 - 市场份额近70%,预计2025年新的Blackwell平台出货占高端GPU总货量的82% [2] - 计划于2025年下半年推出针对中国市场的B30,并提前至第二季度推出B300和GB300,新芯片预计占年度GPU出货量的60-65% [2] - 2025年高端GPU出货量约660万颗,同比增长49%,其中Blackwell平台占80%以上(约540万颗) [3] - H200出货量从69万颗下调至40万颗,H20出货量从48万颗上调至74万颗 [3] AMD - 2025年高端GPU出货量预计同比增长48%,达58.5万颗 [3] - MI325采用率较低,仅占MI系列的15%,MI350系列预计下半年进入市场 [3] - 计划推出针对中国市场的MI308和新的MI358解决方案 [3][4] 英特尔 - 2025年高端人工智能芯片Gaudi3预计出货量约10万颗 [5] - 未来将推出采用Gaudi3和PCIe接口的服务器型号,与英伟达MGX竞争 [5] 云服务提供商 - 谷歌TPU 2025年出货量约220万颗,同比增长高个位数百分比 [6] - 亚马逊ASIC出货量预计达180万颗,同比增长近一倍,其中Trainium系列占85% [7] - 下一代Trainium v3计划于2025年第四季度发布 [7] 华为 - 昇腾ASIC 2025年出货量预计45万颗,同比增长超过50% [8]
外资顶尖投行研报分享
傅里叶的猫· 2025-05-05 10:55
还有专注于半导体行业分析的SemiAnalysis的全部分析报告: 想要看外资研报的同学,给大家推荐一个星球,在星球中每天都会上传几百篇外资顶尖投行的原文研 报:大摩、小摩、UBS、高盛、Jefferies、HSBC、花旗、BARCLAYS 等。 星球中每日还会更新Seeking Alpha、Substack的精选付费文章, 现在星球中领券后只需要390元,即可 每天都能看到上百篇外资顶尖投行科技行业的分析报告和每天的精选报告,无论是我们自己做投资,还 是对行业有更深入的研究,都是非常值得的。 ...