超节点技术
搜索文档
以网强算,破局万亿模型训推瓶颈——新华三超节点打造AI基础设施新范式
环球网· 2025-12-19 08:29
以网强算,超节点技术带来的大模型训推效率跃升 在经历百模大战后的商用落地阶段,各大模型厂商在实现技术落地之外的首要考量便是每Token成本。 虽然目前单台服务器内已经可以基于OAM标准实现最高8卡GPU的直接互联,但更大规模的算力需求下 还是要依靠跨节点的Scale-out方式进行集群组网,在动辄百卡、千卡级的大模型训推需求下,巨大的通 信开销会造成算力利用率的大幅下降,大量GPU的等待和空转使得传统组网在整体训推效率表现上显得 越发吃力。因此,依靠Scale-up技术实现GPU多卡全互联的超节点产品,成为破局智算效率瓶颈的最优 解。 在万亿级参数量成为常态的当下,大模型训练阶段数据的传输量和传输频率激增,同时,张量并行、专 家并行等训练模式以及超长序列多模态等技术场景也对GPU之间的带宽和时延提出了极高要求。基于 Scale-up的节点内互联能够实现每个GPU之间的直接高速通信,相比跨节点的通信提高数倍带宽,从而 大幅提升GPU利用效率,减少GPU空闲;同时,超高带宽、超低时延的互联网络,能够有效打破通信 墙,大幅缩减以传统多机多卡方式布局训练的通信开销,真正实现以网强算。 来源:环球网 摘要:面对万亿级大 ...
未来智造局|抓住国产GPU从“跟跑”到“并跑”的窗口期——专访壁仞科技战略委员会主席李新荣
新华财经· 2025-12-15 14:58
算力需求激增国产GPU发展时机到来 作为GPU领域的一名"老兵",李新荣拥有近35年的GPU设计和管理工作经验,曾任美国超威半导体 (AMD)全球副总裁、中国研发中心总经理。2021年,李新荣加入壁仞科技,参与国内人工智能初创 大潮,因为他认为,"国内GPU产业的发展时机到了。" "随着生成式人工智能、推理模型应用及人工智能体的爆发式发展,全球算力需求陡增。"李新荣表示, GPU作为核心算力载体,其市场前景及技术创新与人工智能技术的加速迭代互相驱动、息息相关。从市 场格局看,海外科技巨头虽主导高端GPU市场,但地缘关系的不确定性风险推动各国加速自主可控技术 布局,这为国产GPU的发展创造了关键机遇期。 目前,国内GPU市场需求旺盛。据业界测算,国内智能算力芯片市场规模预计超过3500亿元,仅今年一 季度英伟达H20相关产品订购金额就达到160亿美元(约合1129亿元人民币)。 "国内算力紧缺既是挑战,更是国产GPU崛起的'练兵场'。"李新荣表示,国产GPU会凭借性价比优势, 抢占互联网、运营商、金融等市场,并逐步向人工智能训练、自动驾驶等领域渗透。未来5年将是国产 GPU实现从"跟跑"到"并跑"的跨越期,要想 ...
国产芯片新气象
经济观察网· 2025-12-06 13:57
文章核心观点 - 2025年国产芯片行业在消费电子、汽车、AI算力及半导体设备材料等多个领域取得显著突破,正从“能用”向“好用”迈进,并加速填补国际巨头退场留下的市场真空 [3][14][15][26] C端消费电子与汽车市场突破 - **PC处理器性能达标**:雷神科技发布首款面向消费级电竞市场的国产主机“黑武士·猎刃Pro”,搭载海光C86处理器,实测运行《黑神话:悟空》帧率接近300帧,远超流畅“及格线”60帧,满足职业电竞需求 [2][5] - **技术路线与生态兼容**:海光信息采用x86指令集实现“原生兼容”,可直接运行Windows和主流游戏,是国产高端算力从专用领域迈向通用消费市场的重要一步 [6] - **智能手机SoC自主化**:小米发布首款自研3nm旗舰SoC芯片玄戒O1,采用第二代3nm工艺,集成190亿个晶体管,搭载于小米15SPro等旗舰机型 [8] - **存储芯片性能跃升**:长鑫存储发布国产首款达到国际高端水准的DDR5产品,最高速率达8000Mbps,单颗容量24Gb;长江存储致态TiPlus7100s固态硬盘顺序读取速度达7400MB/s,写入速度达6900MB/s [8][9][10] - **汽车芯片国产化深入**:广汽昊铂GT“攀登版”实现芯片设计100%国产化,智能座舱由瑞芯微RK3588M芯片驱动,该芯片采用8nm车规工艺,具备94K DMIPS通用算力和6 TOPS AI算力 [3][11][12] - **汽车电子架构创新**:欧冶半导体将于年底量产工布565系列区域控制器主控芯片,面向下一代E/E架构,旨在整合功能、减少ECU数量以降低成本 [13] B端AI算力与产业链协同 - **市场格局剧变与需求承接**:英伟达在中国AI芯片市场份额从95%降至0%,国产算力厂商寒武纪2025年第三季度营收达17.27亿元,同比增长1332.52%,归母净利润5.67亿元,实现扭亏 [15] - **系统级创新弥补单点差距**:国产厂商转向“超节点”技术路线,中科曙光发布scaleX640超节点服务器,单机柜集成640张AI加速卡,算力密度相比传统方案提升20倍 [3][15][16] - **降低算力应用成本**:铨兴科技推出超显存融合解决方案,使训练DeepSeek-671B大模型的硬件部署成本从约2000万元降至200万元左右,降幅达90% [17] - **存储需求与角色转变**:AI算力需求爆发使存储从“成本部件”变为“战略性物资”,OpenAI“星际之门”计划可能消耗全球存储产能的40%,机械硬盘交期长达52周,倒逼云端业者转向国产企业级固态硬盘替代 [18][19] - **产业链协同加强**:下游厂商开始主动开放供应链,为国产芯片提供量产验证机会,推动产业从“点状突破”向“链式协同”过渡 [20] - **高昂的研发投入与资金压力**:GPU厂商研发投入巨大,摩尔线程2022至2024年累计研发投入38.1亿元,同期累计归母净亏损约50亿元;沐曦股份2022年至2025年第一季度累计研发投入24.66亿元,同期累计归母净亏损32.90亿元,企业通过冲刺IPO以维持高强度研发 [21][22] 半导体设备、材料与EDA工具进展 - **光刻设备国产化**:芯上微装发运AST6200型350nm步进式光刻机,实现核心技术自主可控,服务于功率器件、射频芯片等领域,保障汽车芯片供应链安全 [23] - **半导体材料突破**:恒坤新材自产的SOC和BARC材料在2023年境内市场国产厂商中销售规模排名第一,打破国外厂商在光刻环节材料的长期掌控 [24] - **高端测试仪器突破**:万里眼技术有限公司推出带宽高达90GHz的超高速实时示波器,满足7nm及更先进工艺AI芯片的高速接口测试需求,打破西方在高端测试仪器上的封锁 [25] - **EDA工具发展与挑战**:华大九天提出“EDA统一大平台”战略,其全定制设计工具覆盖率近100%,数字流程主要工具覆盖率接近80%,但与国际头部企业相比仍存在工具不全、对先进工艺支撑不足的差距;启云方发布的国产EDA软件支持超大规模电路多人协同设计,已超2万名工程师使用,能将硬件开发周期缩短40% [26]
初灵信息(300250.SZ):产品没有采用超节点技术,也没有与华为合作超节点技术
格隆汇· 2025-12-01 07:17
公司业务与技术澄清 - 公司明确表示其产品未采用超节点技术 [1] - 公司确认未与华为在超节点技术领域存在合作关系 [1]
初灵信息:公司的产品没有采用超节点技术
每日经济新闻· 2025-12-01 04:36
公司业务与技术澄清 - 公司明确表示其产品未采用超节点技术 [2] - 公司确认目前未与华为在超节点技术方面存在合作关系 [2]
计算机行业双周报(2025/10/31-2025/11/13):国内科技巨头积极布局超节点技术,关注国产AI算力投资机遇-20251114
东莞证券· 2025-11-14 12:19
报告行业投资评级 - 行业投资评级:超配(维持)[1] 报告核心观点 - 国内科技巨头正积极布局超节点技术,建议关注国产AI算力产业链的投资机遇[1][3][28] - 以中科曙光、华为为代表的企业通过技术架构创新和生态系统整合,有望突破单芯片制程限制,构建自主可控的国产算力底座[3][28] 计算机行业行情回顾 - 申万计算机板块近两周(2025/10/31-2025/11/13)累计下跌2.64%,跑输沪深300指数2.48个百分点,在31个申万一级行业中排名第28名[10] - 申万计算机板块11月累计下跌3.73%,跑输沪深300指数5.06个百分点[10] - 申万计算机板块今年累计上涨20.45%,跑赢沪深300指数0.95个百分点[10] - 近两周板块涨幅前三公司为英方软件(67.99%)、海峡创新(55.85%)和安博通(39.07%);跌幅前三公司为思维列控(-20.81%)、航天宏图(-19.89%)和信安世纪(-16.42%)[15][16][17] 板块估值情况 - 截至2025年11月13日,SW计算机板块PE TTM(剔除负值)为55.36倍,处于近5年88.40%分位、近10年77.89%分位[10][20] 产业新闻总结 - 月之暗面发布开源思考模型Kimi K2 Thinking,在HLE测试中取得44.9%的成绩,超过GPT5等模型,其智能体工具调用测试得分达93%[21] - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,单机柜算力密度提升20倍,MoE万亿参数大模型训练推理性能提升30%-40%[21][28] - 腾讯2025年第三季度资本开支129.83亿元,低于去年同期的170.94亿元,但表示GPU资源充足[23] - Anthropic计划在美国投资500亿美元建设数据中心,预计2028年营收达700亿美元[23] - 百度发布新一代昆仑芯M100和M300,分别针对AI推理和多模态大模型训练[23] - 阿里云通义千问3-Max模型降价,batch调用半价,缓存计费优惠[23] 公司公告总结 - 金橙子拟以7500万元转让卡门哈斯15%股权,不再持有其股权[24] - 金溢科技拟出资765万元(持股51%)设立合资公司,推进交能融合业务[24] - 太极股份控股股东中电太极及一致行动人电科投资向中电金投转让合计4.6423%股份,每股价格8.41元[25] - 鼎捷数智大股东工业富联计划减持不超过809.47万股(占总股本2.98%)[26] - 达梦数据拟出资1亿元参与设立产业基金,总规模2.02亿元,投资数据库产业链[27] - 远光软件参股公司多禧投资因连续亏损决定解散清算[27] 本周观点总结 - 中科曙光scaleX640超节点采用“一拖二”高密架构,支持千卡级计算单元,并通过30天+长稳运行测试,保障10万卡级集群扩展[28] - 中科曙光联合20余家企业发布“AI计算开放架构”,推动产业生态共进,scaleX640在硬件层面支持多品牌加速卡,软件兼容主流生态[28] 建议关注标的 - 广电运通(002152.SZ):金融科技主业稳健,布局数据要素和算力领域[29] - 神州数码(000034.SZ):作为“鲲鹏+昇腾”产业链核心伙伴,受益国产算力需求[29] - 浪潮信息(000977.SZ):AI服务器全球领先,行业地位稳固[29] - 税友股份(603171.SH):财税信息化服务商,受益财税改革[29] - 软通动力(301236.SZ):华为核心合作伙伴,鸿蒙生态领先[29] - 赛意信息(300687.SZ):布局AI Agent,推出智能体解决方案[30]
计算机行业双周报:国内科技巨头积极布局超节点技术,关注国产AI算力投资机遇-20251114
东莞证券· 2025-11-14 09:43
行业投资评级 - 超配(维持)[1] 报告核心观点 - 国内科技巨头(如中科曙光、华为)正积极布局超节点技术,通过架构创新和生态整合,有望突破单芯片制程限制,构建自主可控的国产算力底座[28] - 中科曙光发布的全球首个单机柜级640卡超节点scaleX640,相比业界同类产品综合算力性能倍增,单机柜算力密度提升20倍,相比传统方案可实现MoE万亿参数大模型训练推理场景30%-40%的性能提升[28] - 建议关注国产AI算力产业链投资机遇[1][28] 计算机行业行情回顾 - 申万计算机板块近2周(2025/10/31-2025/11/13)累计下跌2.64%,跑输沪深300指数2.48个百分点,在31个申万一级行业中排名第28名[10] - 申万计算机板块11月累计下跌3.73%,跑输沪深300指数5.06个百分点[10] - 申万计算机板块今年累计上涨20.45%,跑赢沪深300指数0.95个百分点[10] - 近两周板块涨幅前三个股为英方软件(67.99%)、海峡创新(55.85%)和安博通(39.07%);跌幅前三个股为思维列控(-20.81%)、航天宏图(-19.89%)和信安世纪(-16.42%)[15] 板块估值情况 - 截至2025年11月13日,SW计算机板块PE TTM(剔除负值)为55.36倍,处于近5年88.40%分位、近10年77.89%分位[20] 重点产业新闻 - 月之暗面发布并开源思考模型Kimi K2 Thinking,在HLE测试中取得44.9%的成绩,超过GPT5、Claude4.5、Grok4等美国顶尖闭源模型;在智能体工具调用测试中得分达93%,为第三方机构测量到的最高分[21] - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,采用"一拖二"高密架构设计,可通过双超节点组成千卡级计算单元,并经过30天+长稳运行测试验证可保障10万卡级超大规模集群扩展部署[21] - 腾讯2025年第三季度资本开支129.83亿元,低于去年同期的170.94亿元,预计2025年以AI为重点的资本支出占收入比例达十几个百分点,但可能低于此前指引,目前GPU资源充足[23] - Anthropic计划在美国投资500亿美元建设数据中心,预计2028年营收达700亿美元[23] - 百度发布新一代昆仑芯M100(针对大规模AI推理,预计2026年初上市)和M300(面向超大规模多模态大模型训练和推理,预计2027年初上市)[23] - 阿里云百炼对通义千问3-Max模型实行降价,batch调用半价,隐式缓存命中部分按输入Token标准单价20%计费[23] 公司公告摘要 - 金橙子拟以7500万元转让卡门哈斯15%股权,交易完成后不再持有其股权[24] - 金溢科技拟出资765万元(持股51%)与昱盛智慧设立合资公司,推进交能融合业务[24] - 太极股份控股股东中电太极及一致行动人电科投资拟以每股8.41元向中电金投转让合计4.6423%股份,旨在深化央企战略合作[25] - 鼎捷数智大股东工业富联计划减持不超过809.47万股(占总股本不超过2.98%)[26] - 达梦数据拟认缴出资1亿元(占比49.505%)设立产业基金,投资数据库产业链相关项目[27] - 远光软件参股公司多禧投资因连续亏损决定解散清算,不会对公司日常经营产生重大影响[27] 本周观点与建议关注标的 - 中科曙光scaleX640超节点采用AI计算开放架构,硬件支持多品牌加速卡,软件兼容主流计算生态,推动国产智算"软硬协同、生态兼容"新范式[28] - 建议关注标的包括广电运通(金融科技主业稳健,数据要素、算力布局深化)、神州数码(鲲鹏+昇腾产业链核心伙伴)、浪潮信息(AI服务器全球领先)、税友股份(财税信息化领先)、软通动力(华为核心合作伙伴)、赛意信息(AI Agent领域布局)[29][30]
超节点持续演进,看好国产算力 | 投研报告
中国能源网· 2025-11-12 02:53
市场表现回顾 - 过去一周(11月03日至11月07日)上证综指上涨1.08%,创业板指上涨0.65%,沪深300指数上涨0.82% [1][2] - 同期计算机(申万)行业指数下跌2.54%,表现显著弱于大盘,跑输上证综指3.62个百分点,跑输创业板指3.19个百分点,跑输沪深300指数3.36个百分点 [1][2] - 计算机行业指数在全部行业中排名第30位 [1][2] 超节点技术趋势 - 超节点(Superpod)是一种用于构建大规模算力集群的技术架构,旨在通过高速互联技术优化算力效率 [3] - 英伟达NVLINK技术已迭代至第五代,每块Blackwell GPU拥有18个NVLink连接,总带宽达到1800GB/s,远超PCIe Gen6总线带宽 [3] - 英伟达发布的NVL72系统可将36个Grace CPU和72个Blackwell GPU集成于一个液冷机柜,实现720 PFLOPs的AI训练性能或1440 PFLOPs的推理性能 [3] 国内厂商超节点布局 - 中科曙光发布全球首个单机柜级640卡超节点scaleX640,采用“一拖二”高密架构,单机柜算力密度提升达20倍,双节点可组成千卡级计算单元,支持10万卡级超大规模集群扩展 [4] - 华为CloudMatrix384超节点已销售300余套,服务20余家客户,主要需求来自政企,其可将432个超节点级联成最高16万卡的超大集群 [4] - 阿里云发布磐久128超节点AI服务器,集成自研CIPU2.0芯片和高性能网卡,单柜支持128个AI计算芯片,同等算力下推理性能较传统架构提升50% [4][5] - 百度在2025百度云智大会上宣布昆仑芯超节点上线 [5] - 沐曦股份已发布多种超节点形态,包括光互连超节点、耀龙3D Mesh超节点等 [5] - 中兴通讯自研超节点服务器单机柜搭载64个GPU,机柜内GPU间正交互联,时延降至百纳秒级,可支撑万卡、十万卡级超大规模智算集群 [5] - 浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200” [5] 投资建议关注领域 - 算力领域建议关注寒武纪、海光信息、中科曙光、华丰科技、申菱环境、英维克、欧陆通、中恒电气等公司 [6] - AIDC(AI数据中心)领域建议关注科华数据、云赛智联、弘信电子、润建股份、润泽科技、数据港等公司 [6] - AI应用领域建议关注金山办公、科大讯飞、福昕软件、万兴科技、鼎捷数智、汉得信息、能科科技、卓易信息等公司 [6]
AI光提速电话会议-“光、液冷、国产算力”的全面提速
2025-10-27 00:31
行业与公司 * 涉及的行业主要为人工智能算力产业链 包括光通信 液冷技术 服务器电源 国产算力芯片 AIDC等[1] * 涉及的公司包括国际科技巨头如谷歌 Meta OpenAI 以及国内公司如中际旭创 新易盛 英维克 寒武纪 海光 中兴通讯 欧陆通等[1][3][4][5][7][8][9][11] 核心观点与论据 全球AI产业链全面提速 * 全球AI产业链正在全面提速 各个环节都在加快交付并出现加单情况[2] * 谷歌对2026年TPU需求进行第五次上调 从400万颗提升至490万颗[1][2][3] * 与TPU需求匹配的1 6T光模块也出现大量加单 市场传闻2026年需求量在1,600万只至3,000万只之间[1][3] * 全球AI产业链的虹吸效应显著 成为确定性产业趋势[2] 光通信领域发展机遇 * 光通信领域有四大发展方向 共同构成谷歌链条关键环节[1][5] * 1 6T光模块是核心方向 中际旭创和新易盛等硅光方案领先企业将受益[1][3][5] * 光器件供应商包括长信博创 泰辰光 长飞光纤等[1][5] * 光芯片供应商包括源杰科技 世佳光子等[1][5] * OCS交换机方向包括腾景科技 光库科技等[1][5] 液冷技术应用加速 * 液冷技术在AI算力中应用趋势明确 谷歌V7全面采用液冷[1][4] * 2026年谷歌V7基本以冷板为主 2027年可能有一小部分采用静默式液冷[4] * 英维克与谷歌联合开发通用型CDO液冷方案 适配谷歌自研ASIC和GB300芯片[1][4] * Meta和OpenAI也在积极推进液冷技术应用[1][4] 国产算力发展积极信号 * 2026年国产算力加速度将显著提升 寒武纪 海光等国产算力卡在下半年逐步出货 情况显著好于上半年[3][8] * 国内某巨头启动大型招标项目 中美贸易谈判释放利好 有望推动国产算力发展[1][6] * 预计2026年国内AI投资将大幅增长 甚至可能超过海外 对国产AI产业链产生积极影响[3][8][10] * 国产AI链主要发展方向包括国产芯片 AI服务器和服务器电源 AIDC等[9] 服务器电源与相关市场变化 * 服务器电源市场需求快速增长 在谷歌链条中 欧陆通作为核心标的值得关注[1][7] * 存储涨价及缺货担忧加剧 可能导致服务器电源等产品供不应求[1][7] 超节点技术与AIDC前景 * 超节点技术将在2026年迎来爆发元年 寒武纪 中兴通讯等加速布局[3][11] * 超节点技术带来51 2T交换芯片 整机代工 800G光模块升级 液冷技术 铜连接及高功率服务器电源等机会[3][11] * AIDC板块发展依赖于芯片供应量改善 招标进度加快但整体节奏仍较慢 预计明年芯片供应量增加将促进其基本面改善[9][12] 其他重要内容 * 国内外巨头在AI资本开支方面均呈现加速趋势 阿里 字节跳动和腾讯等国内巨头预计2026年加大AI投入 字节跳动对海外NV GB300机柜需求量大 有望维持100%以上资本开支增速[10] * 当前市场环境下看好光模块升级至800G 液冷技术及国产算力三大方向 巨头加速投入为相关标的提供布局空间和投资机会[13]
锐捷网络:目前基于400G、800G的交换芯片(以太架构)方案已成熟
证券日报网· 2025-10-23 11:45
公司技术优势与市场机会 - 公司超节点技术可满足柜内高带宽互联需求,基于400G、800G的交换芯片方案已成熟,支持数十至数百卡级GPU互联及规模部署 [1] - 公司在以太网互联和光通讯技术方面有积累,可与客户共创方案,已有实践案例,市场前景看好 [1] 行业发展趋势 - 超节点建设为交换机厂商带来新的市场机会,网络节点作用更加突出,与计算节点融合更密切,以发挥超节点整体效能 [1]