Workflow
英伟达B30芯片:参数、互联网订单情况更新

AI产业链研究 核心观点 - 英伟达即将推出针对中国市场的阉割版Blackwell芯片B30(或B40),其设计绕开美国技术限制,通过自有技术实现多卡互联(带宽100-200GB/s),虽性能不及H20和国产芯片,但凭借CUDA生态和低价策略仍具竞争力 [1][2] - B30定价6000-8500美元(仅为国产卡一半),性价比突出,已获互联网大厂测试认可并预计下大额订单(如互联网A下单十几万张,金额70亿美元) [2] - B30在中小模型推理和云服务算力池场景中表现优异:8卡集群可提升有效带宽至1.2TB/s,100片集群支持千亿参数模型轻量训练,采购成本较H20降40%,功耗降30% [3][4] 技术参数与性能 - B30取消Nvlink和HBM显存,改用GDDR显存,单卡算力约为H20的75%(处理4096长文本时吞吐量仅达H20的60%) [1][3] - 国产芯片单卡FP16算力远超B30(约200TFLOPS),但B30因CUDA生态适配优势,在主流模型部署效率上仍领先 [4] 市场反馈与订单 - 互联网A:6月下单十几万张(单价7000美元,总金额70亿美元),预计8月到货 [2] - 互联网B:预计Q3资本开支上升,计划采购30万张,9月到货 [2] - 测试效果显示B30在智能客服、文本生成等低带宽需求场景中能效劣势弱化,兼容PyTorch等框架可降低企业迁移成本 [3][4] 应用场景 - 中小模型推理:动态压缩技术使8卡集群有效带宽达1.2TB/s,满足中等并发需求 [3] - 云服务算力池:100片B30集群支持千亿参数模型轻量训练,成本与功耗显著低于H20方案 [4] 行业动态 - B300已在国内上市,可接样品订单 [5] - 行业信息与投行数据通过知识星球和网盘持续更新 [7]