Workflow
超节点
icon
搜索文档
超节点互连技术落地 国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 13:32
同样在今年,华为昇腾384超节点真机在2025世界人工智能大会期间首秀。从华为昇腾384超节点到 scaleX万卡超集群接连真机亮相,国产算力"大基建"正从图纸走进现实。 超节点支撑万卡级集群 随着主流大模型参数从千亿级跃升至万亿级规模,算力需求持续爆发式增长,EFLOPS算力级别、万卡 级别高性能集群成为大模型标配。 超节点(SuperPod)因密度和性能优势,正成为新建万卡集群的首选架构之一。 其应算力需求而生。中科曙光高级副总裁李斌在接受21世纪经济报道等媒体采访时指出,在算力要求不 高的时代,IT组件的解耦设计提供了无与伦比的灵活性,允许通过标准网络轻松扩展。然而,当前算法 对算力的苛刻要求,迫使业界必须牺牲部分通用性,以换取性能的极致优化。 在此之前,国内的万卡集群项目多以分散服务器、技术蓝图或在建工程的形式存在。如三大运营商已投 产运营的万卡集群,多为分散部署在庞大机房内的标准服务器,虽然已实现商业运营,但其物理形态并 非一体化单元。 scaleX万卡超集群由16个曙光scaleX640超节点互连而成。作为世界首个单机柜级640卡超节点, scaleX640采用超高密度刀片、浸没相变液冷等技术,将 ...
超节点互连技术落地,国产万卡超集群首次真机亮相
21世纪经济报道· 2025-12-19 13:24
12月18日,中科曙光(603019)在光合组织2025人工智能创新大会(HAIC2025)上发布并展出了scaleX万卡超集群,这是国产万 卡级AI集群系统首次以真机形式亮相。 在此之前,国内的万卡集群项目多以分散服务器、技术蓝图或在建工程的形式存在。如三大运营商已投产运营的万卡集群,多 为分散部署在庞大机房内的标准服务器,虽然已实现商业运营,但其物理形态并非一体化单元。 作为一种Scale-up(纵向扩展)解决方案,超节点目前已被中科曙光scaleX640、华为Atlas超节点、英伟达NVL72等产品应用。其将 大量AI加速卡以超高密度集成在单个或少数几个机柜内,通过内部高速总线或专用互连网络,实现"物理多机、逻辑单机"的新 型计算单元。 就单机柜而言,中科曙光11月发布的全球首个单机柜级640卡超节点——scaleX640,是全球已公开的、在单个机柜内集成加速卡 数量最多的超节点产品。 "谁家的柜体集成度越高,竞争优势越大。"中科曙光总裁助理、智能计算产品事业部总经理杜夏威指出,在当前技术范式下, 柜内互联采用高效低成本的电信号,柜间则依赖高功耗、高成本的光模块。在单机柜内把芯片互连规模做大,可以让芯片 ...
突破美国垄断,浙江小城跑出一只黑马
虎嗅APP· 2025-12-18 23:54
从上海坐高铁将近2个小时,到诸暨,再驱车 15 分钟,工业园尽头就是老鹰半导体。 出品|虎嗅科技组 作者|陈伊凡、李一飞 编辑|苗正卿 头图|视觉中国 边迪斐本人 照片由老鹰半导体提供 创始人边迪斐的办公室窗外正对老鹰山——公司名字的来历,烟雨朦胧时,能依稀看到一个老鹰的形 状。老鹰山上当然没鹰,但边迪斐却把公司养成了 VCSEL 赛道里最猛的一只,你也很难想象,这个 偏居于浙江诸暨的公司,是一家在全球拥有研发机构的全球化公司,研发人员占比超过50%,并且是 全国唯一一家实现光通信领域100G VCSEL量产的IDM式公司,直接打破了美国公司的垄断。 老鹰半导体拥有全国第一家具备6英寸高端VCSEL芯片全制程量产能力的化合物晶圆工厂。2024年, 单波100G VCSEL芯片在老鹰半导体量产出货,成为国内首家突破该技术的企业。作为参考,2021 年,博通率先实现单波100G VCSEL芯片量产,并正式向云厂商及数据中心客户批量出货,垄断市场 达3年之久。 在与老鹰半导体的创始人边迪斐交流之际,其所在的供应链——光模块一度迎来飞涨。为首的中际旭 创,股价从2025年年初至今,涨了将近330%,市值突破了6000 ...
昆仑芯将赴港上市
半导体芯闻· 2025-12-16 10:57
如果您希望可以时常见面,欢迎标星收藏哦~ 据腾讯科技报道,昆仑芯即将完成股改,加速推进冲刺上市的步伐。 昆仑芯是百度旗下的自研芯片项目,成立时间可追溯至2011年。2021年,昆仑芯开始独立融资, 由百度芯片首席架构师欧阳剑出任昆仑芯公司的CEO。天眼查显示,截至目前,昆仑芯完成了6笔 融资,最新一起是今年7月的融资。百度为昆仑芯的控股股东。 此外,百度还将在2026年上半年上市"天池256超节点"。这台超节点最高支持256张卡互联,相比 今年4月基于P800芯片推出的超节点,"天池256超节点"卡间互联总带宽提升4倍,性能提高50%以 上,主流大模型推理任务单卡tokens吞吐提升3.5倍。 紧接着在2026年下半年,百度预计推出"天池512超节点"。该超节点最高支持512张卡互联,相较 于"天池256超节点", "天池512超节点"的卡间互联总带宽进一步提升1倍,单个天池512超节点即 可完成万亿参数模型训练。 沈抖介绍,"天池256超节点"和"天池512超节点"两款超节点均基于P800芯片。 沈抖表示,超节点方案非常考验AI芯片研发厂商在芯片、内存、通讯、供电、冷却等一系列能力 上的积累。 据沈抖透露, ...
紫光股份(000938):公司点评:积极开展对新华三剩余股权的收购,基本面总体向好
中原证券· 2025-12-16 08:21
投资评级 - 报告给予紫光股份“增持”评级 [3][12] 核心观点 - 公司基本面总体向好,正在积极开展对新华三剩余19%股权的收购,收购完成后外资将不再持有新华三股权 [2][12] - 公司服务器业务和海外业务加速增长,同时正在加大对新华三的持股比例和进行港股融资,整体发展形势向好 [12] - 2025年公司收入增长加快,但产品结构调整导致盈利能力下降,新华三贡献持续增大 [9][12] 财务与经营表现 - **2025年前三季度业绩**:公司总收入773.21亿元,同比增长31.41%;归母净利润同比下滑11.24%,但扣非后归母净利润同比增长5.15% [9] - **新华三业绩**:2025年前三季度收入596.23亿元,同比增长48.07%,净利润25.29亿元,同比增长14.75%;占公司收入的77%,占公司净利润的146% [9] - **盈利能力变化**:由于低毛利的服务器业务占比提升,公司前三季度毛利率为13.72%,较上年同期下降3.87个百分点 [9] - **收入增长趋势**:2025年前三个季度,新华三收入同比增速分别为26.07%、47.66%、67.79%,环比增速分别为3%、38%、10%,呈现逐季加速趋势 [9] - **历史财务数据**:2023年收入773.08亿元,2024年收入790.24亿元,预计2025年收入1010.59亿元,同比增长27.88% [12][34] - **盈利预测**:预计2025-2027年公司每股收益(EPS)分别为0.52元、0.76元、1.00元 [12] 业务分析 - **增长动力**:新华三当前增长动力主要来自国内政企业务和国际业务,2025年前三季度分别同比增长62.55%和83.99%;国内运营商业务受开支下降影响同比减少30.63% [9] - **市场地位**:根据沙利文2024年数据,公司在中国数字基础设施市场排名第3(份额8.6%),网络基础设施市场排名第2(份额12.8%),计算基础设施市场排名第2(份额8.2%),存储基础设施市场排名第5(份额3.1%) [12] - **竞争优势**:在海外GPU供应受政策影响停滞的背景下,国产AI芯片厂商加速发展,市场对服务器厂商系统整体设计能力要求提升,有利于在ICT基础设施领域实现广泛产品覆盖的公司 [12] - **对比优势**:2025年,竞争对手进入美国出口管制名单,公司超越竞争对手的综合能力优势得到凸显;对比BAT资本开支总金额及浪潮信息收入环比波动,公司收入增长优势明显 [9] 资本运作与股权结构 - **新华三股权收购历程**:2016年收购51%股权,2024年9月收购30%股权(持股达81%),2025年11月启动对剩余19%股权的收购,完成后公司将持有新华三87.98%的股权,其中6.98%股权对价为4.98亿美元 [9][12] - **财务压力与融资**:第二次30%股权收购使用自有资金21.43亿美元,给公司带来较大还款和财务压力,利息支出从2024年第三季度的1.78亿元增长到第四季度的4.52亿元,2025年前三季度仍保持3亿元以上;公司于2025年5月开启港交所上市事宜,成功后有望缓解财务费用压力 [9][11][12] - **市场数据**:截至2025年12月15日,公司收盘价24.42元,市净率4.83倍,流通市值698.43亿元 [4]
电子行业2026年投资策略:从云端算力国产化到端侧AI爆发,电子行业的戴维斯双击时刻
东吴证券· 2025-12-10 12:11
核心观点 报告认为,电子行业正迎来“戴维斯双击”时刻,核心驱动力在于云端算力国产化与端侧AI应用的爆发[1]。2026年,行业将受益于晶圆制造资本开支迈入新台阶、AI算力基础设施的持续投入、存储“超级周期”的延续、以及消费电子在AI驱动下的创新与换机潮,多个细分领域将呈现量价齐升的格局[2][5][7]。 算力芯片 云端算力芯片 - **全球CSP资本开支持续上行**:25Q3海外四大CSP(谷歌、亚马逊、微软、Meta)资本开支合计979亿美元,环比增长10%[5][14]。国内算力需求(如字节的Token调用量)已接近海外巨头,但供给投入相对不足,追赶空间广阔[5][14]。 - **国产算力业绩释放可期**:在AI推理和训练需求提升背景下,国产算力厂商如寒武纪、海光信息等有望充分受益[5][17]。中芯国际先进制程产能利用率维持在90%左右,扩产与需求匹配良好[17]。 - **华为昇腾引领国产AI算力底座**:华为推行“超节点”战略,其Atlas 900 A3 SuperPoD已部署超300套,服务超1300家客户[26]。下一代Atlas 950 SuperPoD通过无收敛全互联等技术,FP8算力可达524 EFLOPS[27]。昇腾芯片持续迭代,Ascend 950DT互联带宽达2 TB/s,算力提升至1 PFLOPS FP8[21]。 - **Switch芯片国产逆袭**:推理时代性能瓶颈从“算力”转向“运力”,国产自研超节点方案(如华为、曙光)及第三方Switch芯片厂商(如盛科通信、澜起科技)迎来增长机遇[18][20]。 端侧算力芯片 - **海外端侧AI进入全面落地阶段**:谷歌将Gemini模型集成到搜索、Gmail、Android等核心产品;Meta将AI眼镜视为下一代计算平台;OpenAI的gpt-oss-20B模型可在16GB内存设备上运行[35][36]。这驱动了海外链SoC厂商(如晶晨股份、恒玄科技)的结构性需求[39]。 - **端侧独立NPU元年开启**:端侧AI算力需求催生专用协处理器,瑞芯微已推出RK182X系列协处理器,支持3B–7B LLM推理,并与主处理器灵活组合,应用于车载、智能家居等多场景[5][40][41]。下一代RK1860规划支持13B模型,算力达60–80 TOPS[42]。 - **车载PHY&SerDes芯片国产替代**:25H1中国乘用车摄像头安装量达5239.6万颗,同比增长34.9%[43]。车载SerDes市场由ADI和TI主导(占约92%份额),国产厂商如龙迅股份、裕太微的产品正进入客户导入阶段,有望在2026年放量[44]。 存储 - **行业迎来“超级周期”**:存储板块自25Q2持续上行,有望持续至26年全年[5][49]。DRAM指数在2025年9-11月期间上涨101%,NAND指数同期上涨79%[5][53]。因AI服务器出货紧迫,下游客户对存储价格上涨不敏感,推动价格涨幅超预期[5][49]。 - **企业级SSD需求强劲**:25Q3前五大存储品牌厂的企业级存储营收合计65.4亿美元,环比增长28%[5][58]。预计25Q4 Enterprise SSD平均合约价将季增逾25%[58]。 - **国产厂商双重受益**:国产存储厂商受益于(1)国内CSP厂商资本开支上修(如字节、阿里上修AI Capex预期),(2)国产企业级存储份额提升的双重逻辑[5][58]。 模拟芯片 - **供需格局优化,价格战压制解除**:汽车需求持续增长,工业领域去库结束处于复苏初期,通信领域(基站)开始补库[61]。中美博弈及潜在政策(如成熟制程反倾销)有望极大改善行业供给格局和价格环境[5][61]。 - **AI催生新兴模拟料号机遇**:2026年围绕AI的新兴模拟芯片有广阔发展机遇,核心看好:(1)**Drmos**:跟随国产算力芯片出货及功耗提升(如H100需40~50颗DrMOS,B300功耗达1400W),需求加速[62]。(2)**微泵液冷驱动芯片**:算力芯片功耗提升催生高效散热需求,该方案散热效率较被动方案提升3倍以上,目前全球仅少数厂商布局[66][68]。 晶圆制造与半导体设备 - **半导体设备享受高景气**:国内Fab厂迎来存储与先进逻辑的“扩产大年”,半导体设备板块演绎“β+α”行情[2][71]。成熟类设备公司(如北方华创、中微公司)享受β行情;成长类公司如精智达(FT测试机速率达9Gbps)、中科飞测、芯源微将于2026年迎来技术兑现和国产突破的放量元年[71][72]。 - **晶圆代工景气维持高位**:2026年国内先进制程(尤其是7nm及以下)扩产丰厚,供给严重不足的局面将改善,支撑晶圆代工景气度[2][74]。中芯国际等一线代工厂受益于先进制程扩产红利,晶合集成等二线厂在55/40nm产能饱满,28nm开始放量[74]。 - **光刻机自主可控加速突围**:中国大陆是ASML核心市场,2024年贡献其营收的41%[77]。在外部封锁下,产业链加速构建自主可控能力,芯上微装先进封装光刻机已交付第500台,2024年占据全球35%、国内90%市场份额[82]。光学系统等核心零部件国产化任重道远,茂莱光学、汇成真空、福晶科技等企业在各自领域加速突破[84][86][92]。 - **先进封装成为算力基石**:先进封装是后摩尔时代提升算力密度的关键,中国大陆封测市场规模预计从2024年的3319亿元增长至2029年的4389.8亿元,其中先进封装2024-2029年CAGR达14.4%,远超传统封装[96][97]。盛合晶微作为国产Chiplet技术龙头,其芯粒多芯片集成封装业务营收占比从2022年的5.32%迅速提升至2025年上半年的56.24%[100]。 消费电子 - **AI手机驱动换机潮**:端侧AI正从单点助手向跨应用操作系统的OS Agent形态跃迁[7]。苹果有望通过OS Agent升级引领体验变革,强力驱动iPhone 15 Pro以前的存量用户开启换机周期[7]。 - **AR眼镜产业迈向拐点**:2026年预计将成为AI智能眼镜放量元年与AR产品力质变之年,随着Meta、苹果、三星等巨头新品密集发布,Micro-LED、光波导及SiC材料等光学显示增量赛道迎来明确投资机遇[7]。 PCB/CCL及上游材料 - **AI驱动PCB量价齐升**:全球云厂商进入资本开支扩张期,驱动AI PCB市场规模增长[7]。英伟达机柜架构从GB200迈向Rubin/Kyber,引入正交背板及M9/PTFE等极低损耗材料,使单机柜PCB总价值量成倍增长[7]。预计2026年AI PCB市场规模迈向600亿元,同比增长229.8%[7]。 - **上游核心材料需求爆发**:为满足224Gbps超高速率需求,石英布需求激增,预计到2027年其市场需求达约99亿元,较2026年的30亿元增长230%[7]。同时,HVLP4铜箔出现结构性短缺,加速国内厂商进口替代[7]。 - **先进封装推动PCB技术升级**:CoWoP等先进封装方案去除中间基板,对PCB的平整度、线宽/线距精度(需达15-20微米或更低)、热机械可靠性提出极高要求,直接提升PCB整体价值量[101][102][104]。
单套1.35亿元!华为独家中标中移动超节点采购
观察者网· 2025-12-03 03:53
中国移动超节点采购项目 - 中国移动研究院2025年超节点试验装置采购项目由华为技术有限公司中标,投标报价为1.35亿元人民币,拟中标份额100% [1] - 招标内容包括超节点试验装置1套,内含超节点智算模块48套及超节点存储模块1套 [1] 华为超节点技术特点与优势 - 华为“Scale-up超大规模超节点算力平台”通过高速互联总线形成全对等互联架构,实现共享内存池,使数百、数千个AI处理器像一台计算机一样工作 [1] - 昇腾384超节点将384颗昇腾NPU和192颗鲲鹏CPU互联,算力总规模达300Pflops,为英伟达NVL72的1.7倍 [2] - 网络互联总带宽达269TB/s,比英伟达NVL72提升107%;内存总带宽达1229TB/s,比英伟达NVL72提升113%;单卡推理吞吐量达2300 Tokens/s [2] - 华为董事杨超斌提出超节点应具备总线级互联、平等协同、全量池化等六大特征,旨在构建逻辑上统一的超级计算机 [11] 华为未来超节点发展计划 - 计划2026年四季度上市的Atlas 950超节点基于8192颗昇腾950DT芯片打造,FP8算力达8E FLOPS,FP4算力达16E FLOPS,互联带宽达16PB/s,超过全球互联网峰值带宽10倍 [12] - 相比英伟达NVL144,Atlas 950超节点卡规模是其56.8倍,总算力是其6.7倍,内存容量达1152TB为其15倍,互联带宽达16.3PB/s为其62倍 [14] - 计划构建由64个Atlas 950超节点组成的SuperCluster集群,FP8总算力达524 EFLOPS,规模为xAI Colossus的2.5倍,算力为其1.3倍 [14] - 2027年四季度计划推出基于Atlas 960的SuperCluster,规模达百万卡级,FP8总算力达2 ZFLOPS,FP4总算力达4 ZFLOPS [14] 国内其他厂商超节点进展 - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,单机柜算力密度提升20倍,可实现MoE万亿参数大模型训练推理场景30%-40%的性能提升 [4] - 中科曙光通过30天以上长稳运行测试验证,scaleX640可保障10万卡级集群扩展部署 [5] - 百度昆仑芯超节点方案支持单机柜32至64张加速卡部署,在优化下实现单卡性能提升95%,单实例推理性能提升高达8倍,并已内部大规模部署 [7] - 上海仪电、曦智科技等联合发布国内首个光互连光交换GPU超节点光跃LightSphere X,采用光互连技术,计划实现2000卡部署 [9] 行业趋势与背景 - 大模型对算力需求爆炸式增长,传统计算架构面临资源利用率低等挑战,超节点正成为AI基础设施建设的新常态 [4] - 传统服务器集群的堆卡模式已无法实现算力线性增加,超节点通过创新互联技术应对更高算力集群要求 [4]
江苏迈信林航空科技股份有限公司关于上海证券交易所对公司与关联方共同投资并筹划向关联方控制企业增资事项问询函的回复公告
上海证券报· 2025-11-28 19:09
投资交易核心安排 - 公司计划通过合伙企业“追光时代”向关联方光子算数增资,投资规模为20,100万元至31,100万元,公司作为有限合伙人持有合伙企业99.50%的份额 [9] - 关联方白冰出资100万元,持有合伙企业0.50%的份额,并担任执行事务合伙人,负责执行合伙事务 [9] - 公司已支付1,000万元意向金,若因公司单方面原因导致在排他期内未能完成尽职调查或签订正式投资协议,且目标公司无重大隐瞒事项,该意向金将作为违约金赔付给光子算数且不予退还 [9][12][13] 交易安排与风险控制 - 为保障资金安全,公司拟在合伙协议中约定担任资金支付的复核方,对资金支付流程进行合规性、合理性审核 [11] - 白冰先生承诺,若光子算数业绩目标未达成并触发回购条款,其愿对此承担无限连带责任 [11] - 本次投资定位为财务性投资,公司仅作为参股方,旨在控制资金投入强度,减少对日常经营现金流的占用,同时保持光子算数治理结构的稳定 [10][16] 目标公司光子算数基本情况 - 光子算数成立于2021年,注册资本为669.97万元,公开信息显示其参保人数为0人 [19] - 光子算数专注于光互联算力集群系统领域,其超节点技术旨在实现节点内弹性扩容,并将光连接技术从节点外带入节点内部,以提升计算效率 [37][38] - 2025年8月至10月期间,光子算数出现多家基金和个人财务投资者退出的情形,相关股权转让估值在0.4A亿元至0.5A亿元之间 [27] 业务协同性与战略考量 - 公司自2024年布局算力业务,2025年前三季度算力贸易及租赁业务收入达15,335.30万元,占主营业务收入的53.36%,业务扩张迅速 [30][31] - 公司与光子算数存在产业链协同潜力,光子算数的超节点和光互联技术可应用于公司的算力服务器,提升系统扩展性与综合性能 [37][38] - 尽管仅为参股,公司有权提名一名监事进入光子算数,以行使决策参与权、经营信息知情权等权利,为协同合作提供支持 [39] 财务状况与资金来源 - 截至2025年三季度末,公司货币资金余额为3.06亿元,资产负债率为69.71%,较期初增长6.46个百分点 [41] - 本次投资资金的40%计划来源于公司自有资金(4,000万元至12,400万元),60%计划来源于金融机构借款(18,600万元) [42][49] - 公司测算表明,在业绩不发生大幅波动的情况下,经营业务自身现金流可覆盖借款本金和利息,整体负债覆盖比例为113.58% [49][50] 关联关系说明 - 白冰先生持有公司4.95%股份,为公司关联方,其于2024年通过协议转让从控股股东处获得股份 [9][53] - 公司声明,2024年的股份协议转让与本次对光子算数的投资交易相互独立,不构成一揽子安排 [54][55] - 经自查,除已披露关系外,白冰与上市公司、控股股东及实控人不存在其他关联关系或潜在利益安排 [55]
从 Chiplet 到超节点:奇异摩尔正在塑造中国 AI 算力的“互联底座”
半导体行业观察· 2025-11-26 00:39
行业趋势与核心观点 - AI大模型推动算力竞争从“单卡比拼”转向“集群博弈”,决定算力上限的不再是单颗GPU的峰值算力,而是由芯粒、封装与互联共同构成的系统底座[1] - 算力架构正从单芯片走向多芯粒、超节点,如何在复杂系统中保持高带宽互联、灵活扩展与高效调度成为新一代算力生态的关键命题[1] - 在超节点时代,连接与调度不仅是性能加分项,更是掌握整个算力体系结构主动权的关键,芯片需要“连得上”并“调得活”[15] 互联技术的关键作用与市场差距 - 互联是实现自主算力的关键环节,随着计算规模要求提高,集群算力的发挥离不开互联和调度,AI对网络需求是新的范式,需要超高带宽和效率[3] - 以AI网卡为例,国际最先进水平达800G甚至1.6T,而国内还停留在200G,显示出本土与国际领先厂商在互联底层架构上存在差距[3] - 超节点架构兴起,其互联挑战主要体现在两方面:一是需实现Scale Out网络10倍的高带宽和1/10的低延时,并实现百卡至千卡的全连接;二是缺乏统一标准,目前海外有ESUN、SUE、UALink等,国内有OSA、Ethernet X等,处于百花齐放阶段[5] 公司战略与产品布局 - 公司将自身定位为“AI Networking全栈式互联产品解决方案提供商”,业务本质是连接,品牌LOGO升级融合了莫比乌斯环、Wafer和Die等元素,象征Chiplet概念[9] - 公司产品矩阵已初具雏形,包括片内互联的Die to Die IP、高性能互联芯粒、超节点芯粒以及AI原生的超级网卡,构建全栈互联的高性能架构[12] - 公司提出利用HPDE架构,即可编程的高性能数据处理引擎,通过软件编程方式用一种芯粒支持并兼容多种超节点标准,以平衡性能、功耗、灵活性,帮助行业度过标准不统一的过渡期[6] - 公司展示了通过FPGA实现的Scale Up超节点互联芯粒Demo,将GPU计算Die和超节点互联的网络Die封装在一起,形成支持超节点功能的GPU,实现数据超高速传输[10] - 公司部分产品已量产并有客户采用,部分产品处于量产导入前夕,下一步目标是与客户合作将新技术应用至产品并推向更大规模市场,期待未来一至两年内被更多大规模计算中心和AI芯片系统采用[14] 多元算力融合与生态共建 - 多元算力融合的关键在于互联层和调度层两者缺一不可,互联需要解决带宽和标准问题,而调度需要硬件层面的实时监控和反馈,以有效分配任务和进行数据交换[7] - 公司秉持开放心态,致力于打造AI Networking的基础设施,定位为生态中的互联角色,希望帮助整个AI产业赶超并成为全球领头羊[8] - 行业整体呈现All in AI的趋势,ICCAD 2025上AI相关公司显著增多,涵盖EDA、IP、互联及芯片公司[12]
公布技术参数“颗粒度” 大厂接连“秀肌肉” 自研AI芯片为何不再“闷声干”?
南方都市报· 2025-11-25 23:09
行业战略转变 - 国产AI芯片公司从过去几年力求低调、对最新产品信息秘而不宣的状态,转变为近期华为、百度等大厂高调公开AI芯片迭代路线图,标志着行业沟通策略的里程碑式转折[2][3] - 华为轮值董事长徐直军表示,公司从2020年直到去年“啥都不敢讲”,但在今年开始“秀肌肉”,公开披露未来三年发布四款昇腾AI芯片的详细计划[2] - 百度也接棒公布昆仑芯业务路线图,计划在2026年和2027年分别推出M100和M300芯片,并推出超节点产品[7] 华为昇腾芯片路线图 - 华为计划在2026至2028年相继推出昇腾950、960和970三大系列芯片,其中950系列包括950PR和950DT两种型号,分别于2026年一季度和四季度推出[6] - 昇腾950PR采用华为自研的低成本HBM——HiBL 1.0,能够显著降低推理预填充阶段的成本[6] - 华为将同步推出超节点和集群产品,预计在2026年四季度推出Atlas 950超节点,2027年四季度迭代至Atlas 960超节点,最大可支持15488张昇腾960芯片,并发布算力规模分别超过50万卡和达到百万卡的超级集群[6] 百度昆仑芯路线图 - 百度昆仑芯计划于2026年年初上市针对大规模推理场景优化的M100芯片,2027年年初上市面向超大规模多模态模型训练和推理的M300芯片[7] - 在超节点方面,百度预计在2026年上半年和下半年推出“天池256超节点”和“天池512超节点”,并从2027年下半年开始陆续推出千卡和四千卡超节点,计划于2030年点亮百万卡单集群[7] - 昆仑芯前身为百度智能芯片及架构部,于2021年4月完成独立融资,百度为其控股股东,截至目前已完成6笔融资[8] “超节点+集群”解决方案 - 为应对国产芯片制造工艺落后于海外的现实,华为、百度、阿里等大厂普遍采用“超节点+集群”方案,即通过系统级组网来弥补单颗芯片性能的短板,华为称此为其在极限制裁下被逼出来的范式[4][10] - 华为已面市的CloudMatrix 384超节点搭载384颗昇腾910C芯片,芯片数量是竞争对手英伟达NVL72系统的五倍,足以弥补每颗芯片性能仅为英伟达GB200三分之一的不足,在某些指标上甚至超越了英伟达的机架级解决方案[11] - 市场调查显示,43%的受访者认为云端国产AI芯片的核心竞争力在于万卡以上互联的集群扩展性[10] 性能对比与竞争态势 - 华为将其Atlas 950超节点与英伟达预计在2026年下半年发布的NVL144系统对比,称其卡的规模是英伟达的56.8倍,总算力是其6.7倍,内存容量是其15倍达到1152 TB,互联带宽是其62倍[7] - 一台基于昆仑芯P800的64卡超节点,其单卡算力大致为英伟达A100 SXM版本算力的一半[8] - 英伟达创始人黄仁勋将华为视作“强大的竞争对手”,华为昇腾910的性能曾超过英伟达同时代的V100 GPU[5] 供应链与制造能力 - 对于国内的7纳米先进逻辑芯片产线,在被美国禁止进口、占比约三成的半导体设备上,国产方案已基本填补了空白,国产设备自今年以来已陆续导入量产线,先进制程供应链被认为已度过最艰难阶段,提升了后续产能扩产的确定性[3] - 中国半导体制造工艺将在相当长时间处于落后状态,可持续的算力只能基于实际可获得的芯片制造工艺[4] 市场应用与挑战 - 尽管市面上出现多种训推一体AI芯片,但真正能用于大模型训练的非常稀少,华为昇腾几乎是唯一可用于大模型训练的国产芯片,但即便是其当前主打型号910C,大部分应用仍然是推理[14] - 2025年上半年中国GenAI IaaS服务市场中,推理场景占比上升至42%,训练场景占比则降低至58%,AI应用的普及带动推理算力需求高涨[15] - 基于国产算力开展大模型训练需付出额外成本与时间代价,例如科大讯飞为在国产算力平台训练模型,不得不花费额外两个月时间进行适配,拖慢了模型发布进度[14] 商业模式与竞争策略 - 大厂自研AI芯片的下游需求明确,即使不对外出售,将其并入云服务中让外部客户使用,也等效于卖芯片,相较于外购芯片可避免为外部供应商的高毛利买单,节省大量成本[16] - 昆仑芯等大厂旗下芯片公司并不满足于内部使用,例如昆仑芯中标中国移动集采项目十亿级订单,进入外部市场竞争需要依靠特别突出的性能、为特定场景做的深度优化或比拼性价比[16][17] - 推理芯片市场竞争呈现碎片化,参与者包括训推一体芯片厂商、专门面向推理场景的企业,技术路线上既有GPGPU玩家,也有ASIC厂商[15]