Workflow
AI大模型训练
icon
搜索文档
浩云长盛彭轶峰:兼容并蓄和系统性思维是应对IDC行业急速迭代的生存法则
环球网资讯· 2025-12-18 06:31
【环球网科技报道 记者 林迪】当前,数据中心(IDC)正经历着前所未有的深刻变革。它不再仅仅是 数据存储与计算的物理空间,更被赋予了"算力中心"的全新使命,成为支撑AI大模型训练、算法迭代与 生态演进的关键基础设施。如何在这场技术革命中保持领先?IDC行业面临着怎样的挑战与机遇? 来源:环球网 近日,在第二十届中国IDC产业年度大典(IDCC2025)暨数字基础设施科技展(DITExpo)上,浩云长 盛集团技术研发AVP彭轶峰认为核心关键词是"兼容"与"前瞻"。 "今天很多数据中心被淘汰,本质上是因为过去十几年,二十年的路径选择而引起的,因为它不是一个 按照未来的发展去重新建设的路径。"彭轶峰一针见血地指出,"很早以前路径是从改造开始的,也就是 说你的改造就天然的决定了只能用眼前所需要的标准去设计数据中心。"这种源于"改造"的思维惯性, 导致许多从业者的意识形态和认知停留在了起点,一切创新都以当下的标准为蓝本进行想象。 然而,AI时代的需求是动态且不可预知的。彭轶峰强调:"AI的特点就是我们看不到它的全貌,所以它 的不确定性,决定了未来AI的发展其实是有一定的弹性、方向差异和不可预知性。面对如此充满变数 的未 ...
四川1ms城市算网加速成型 重塑算力运载新格局
环球网资讯· 2025-12-11 06:24
国家战略与政策驱动 - 算力是推动城市智慧转型与产业升级的核心动力,国家《算力基础设施高质量发展行动计划》要求提升算力高效运载能力,城区重要算力基础设施间时延不高于1ms,国家枢纽节点内不高于5ms [1] - 四川作为承接“东数西算”国家战略的核心区域,以1ms城市算网建设为抓手,推动算力资源从专业资源转变为城市公共服务,为AI大模型训练、智能制造等产业提供支撑 [1] 区域发展格局与目标 - 成渝地区双城经济圈核心城市成都率先发力,已实现城市内1ms、经济圈内3ms、全省5ms的时延圈布局,推动算力像水电一样融入生产生活 [2] - 城市算网作为算力基建核心载体,对传统产业升级、新生态培育意义重大 [2] - 四川通过“建用研”一体推进,探索出了一条算力产业特色发展之路,为全国算网建设提供了可借鉴的“四川方案” [4] 运营商网络建设与技术架构 - 三大运营商在四川1ms城市算网建设中发挥主力军作用,构筑算力“高速公路”的核心骨架 [5] - **四川移动**:发布F5G-A 1ms天府光网精品网络,打造“1+3+X”算力DC为中心的立体架构,实现全省算力“一张网”管理,城域中型及以上数据中心间光层单向时延均小于1ms,成都全部区县到天府数据中心集群及相邻区县间时延均控制至1ms以内 [6] - **四川电信**:目标构建算存运融合的高品质城市算力网络,2025年投资约1.8亿元建设300PFLOPS国产昇腾智算能力,2026年实施算力能力倍增计划,力争形成国产智算千卡池,算力规模将超1EFLOPS,部署400G超高速算间传输网络实现“一跳直达”,并融合量子加密技术建成量子城域网 [7] - **四川联通**:构建“1+4+21+N”全省算力布局,打造以成都为核心的“1+2”智算集群,三地时延压缩至毫秒级,部署400G立体双平面全光网络打造环“蓉”1-3-5毫秒低时延圈,其算力智联网(AINet)完成1500公里跨域异构混训验证,千亿参数AI大模型跨域训练等效算力达95%以上 [8] 技术融合与创新 - 四川的1ms城市算网融合了全光交换OXC、400G传输、智能调度等多项前沿技术,实现算力资源的“一跳直达” [4] - 四川电信通过全光交叉OXC设备与智能路由算法实现算力节点间“Mesh组网、一跳直达”,并创新推出“算力快线”产品,以“弹性带宽、参数随选、即呼即用”模式应用于TB/PB级数据迁移场景 [7] - 四川联通自研算力智联网(AINet)实现跨域高效协同 [8] 产业应用与场景赋能 - 1ms城市算网为实体经济深度赋能,其提供的确定性低时延保障让工业数据的实时采集、分析和反馈成为可能,在四川省制造业智改数转赋能平台展厅有东方电气的无人车间及黑灯产线、卡诺普的机器人生产车间等数智化成果 [9] - **智能制造案例-四川领克汽车**:在焊点质量管理、AI视觉质检等场景深度应用1ms算网,数百台机器人精准协同,焊接参数实时动态优化,工业相机在毫秒间完成数据分析和缺陷识别,借助超低时延网络将车辆设计迭代周期大幅缩短 [11][12] - **数字文创案例**:景秀子非公司依托1ms算网大带宽、低时延优势,实现虚拟数字人在各分支机构与算力中心间高效协同,降低单站点用算成本并提供“类本地”体验,在数智影视制作中,云端渲染采用算网协同方式提升效率 [12] - **影视特效案例-成都世纪川翔科技**:1ms算网支持的分布式缓存加速和GPU云电脑方案,让制作环境搭建周期缩短至传统模式的1/10,实现“资源秒级发放、数据安全无泄漏、创意不间断” [12] 未来发展方向 - 未来需强化技术创新、深化算力赋能、优化协同机制,政企产学研用需携手共建 [14] - 四川将持续深化算网建设,统筹推进“国家枢纽-区域节点-城市边缘”多层次算力供给体系,落实算力强基揭榜行动推动技术创新,创新服务模式培育“算力超市”“模型即服务”等普惠化服务以降低企业用算门槛,完善开放协作生态 [14]
华安证券:OCS光交换机有望迎来高速成长期 建议关注赛微电子等
智通财经· 2025-12-08 07:49
文章核心观点 - AI大模型训练对通信带宽、时延和功耗要求极高,OCS凭借其高带宽、低延迟特性成为理想的互联解决方案,市场将迎来高速增长 [1][3] OCS技术特性与应用场景 - OCS是一种基于全光信号的交换设备,通过配置光交换矩阵建立光学路径,相比传统电交换机,具备低延迟、低功耗、高可靠性优势,且支持跨代设备无缝互联 [1] - OCS主要应用于AI算力集群的三大场景:Scale-Up(单节点性能强化)、Scale-Out(多节点协同)和Scale-Across(跨数据中心互联) [2] - 在谷歌TPU集群中,一个包含4096个TPU v4芯片的集群需配备48台136端口的OCS,TPU与OCS比例约为85:1;未来TPU v7集群规模扩大至9216芯片时,因采用更高密度的320端口OCS,仍仅需48台,比例提升至192:1,凸显其扩展效率 [2] 市场规模与竞争格局 - 全球OCS光交换机市场规模将从2020年的0.7亿美元增长至2025年的7.8亿美元,年复合增长率达62% [1][3] - 预计到2031年市场规模将达20.2亿美元,2025–2031年复合增长率约17.2% [3] - 市场竞争集中,2025年前四大厂商占据约69%份额,谷歌、Coherent等为主要参与者 [3] 产业链分析 - OCS产业链分为上游核心器件、中游设备集成与下游应用,技术壁垒高,市场参与者多集中于单一环节 [3] - 上游核心是MEMS微镜阵列等光器件,是产业链技术壁垒最高的环节,价值量占比高 [1][3] - 中游由国际厂商主导设备集成,国内厂商参与代工与方案定制 [3] - 下游需求集中于谷歌等巨头的AI数据中心,驱动其在高性能计算中的规模应用 [3] 相关公司分析 - **英唐智控(300131)**:以电子元器件分销为基础,正向半导体设计与制造逐步拓展,公司2025年拟收购桂林光隆集成以强化OCS全制程布局 [4] - 英唐智控子公司英唐微技术已具备MEMS微振镜研发与量产能力,产品覆盖多种规格,2025年4mm产品已在工业领域实现批量订单 [4] - 公司拟通过整合光隆集成的光开关、OCS系统等技术打造OCS全制程平台,有望在AI算力集群建设中打开新成长空间 [4] - **赛微电子(300456)**:为国内MEMS工艺开发与晶圆制造领军者,掌握硅通孔、晶圆键合等核心工艺,客户覆盖激光雷达、AI计算等领域 [4] - 2023年起瑞典Silex开始量产MEMS-OCS,2025年北京Fab3启动MEMS-OCS小批量试产 [4] - 公司营收中MEMS业务占比达83%,2024年毛利率提升至35.1%,随着AI算力需求扩张,公司在MEMS微镜阵列等核心部件的工艺优势有望转化为业绩弹性 [4]
未来网络试验设施正式投入运行,完成120项重大创新试验
环球网资讯· 2025-12-06 01:50
项目概况与定位 - 我国信息通信领域首个国家重大科技基础设施——未来网络试验设施正式投入运行 [1] - 该设施总部位于江苏南京的紫金山实验室,已于2024年8月正式建成 [1] 技术能力与规模 - 设施覆盖全国40个城市,包括88个主干网络节点和133个边缘网络节点 [1] - 光传输总长度超过5.5万公里 [1] - 能支持4096个异构业务并行试验,并可实现与国内外现有网络互联互通 [1] - 网络数据传输具备高效、高速、低延迟、低抖动特性,丢包率仅百万分之一 [1] 应用领域与方向 - 为工业制造、能源电力、教育医疗、低空经济等领域提供开放试验支撑 [1] - 在AI大模型训练、算力调度、算网协同、光电融合等前沿方向开展示范应用 [1] 服务客户与成果 - 已累计服务国家级科研机构(如中国科学院国家天文台、中科院高能所)、四大运营商(中国电信、中国移动、中国联通、中国广电)、多所知名高校(如北京大学、南京大学、浙江大学、香港中文大学)以及龙头企业(如华为、新华三、百度) [1] - 已完成120项重大创新试验 [1] - 试验内容涵盖核心芯片、网络操作系统、路由控制、安全可信、大规模组网、新型AI业务等关键维度 [1]
存储产业“换挡”提速,DDR5普及进入快车道
环球时报· 2025-11-24 03:23
存储市场结构性变化 - 存储市场呈现显著结构性变化,DDR4内存芯片价格持续攀升并反超DDR5,出现罕见价格倒挂现象 [1] - 此现象标志着DDR4退场序幕正式拉开,DDR5时代全面开启,存储产业换挡提速进入新阶段 [1] DDR4与DDR5价格动态 - 自今年6月起,16GB容量的DDR4内存芯片价格开始反超同容量DDR5芯片 [3] - 截至8月末,DDR4单价从6月的7.01美元升至8.59美元,DDR5则从5.85美元涨至6.17美元,两者价差持续扩大 [3] - 价格倒挂源于技术迭代中的供需失衡,头部企业推进DDR4停产计划并将产能转向DDR5,导致DDR4供给收缩 [3] 技术升级驱动因素 - AI写真、云端游戏等消费端新应用对数据处理能力要求极高,DDR4有限带宽已无法满足需求 [3] - DDR5凭借高带宽优势能将图片生成从分钟级缩短至秒级,实现云游戏跟手体验,成为消费端体验升级的必然选择 [3] - 金融高频交易、互联网支付洪峰等行业数字化场景对系统性能要求严苛,DDR4在延迟、带宽等方面的瓶颈日益凸显 [4] DDR5技术优势与行业影响 - DDR5相较DDR4实现代际飞跃,带宽提升两倍,容量与能效显著优化,并集成片上ECC纠错功能 [4] - DDR5能大幅降低数据中心宕机风险,为AI大模型训练等场景提供坚实支撑 [4] - 结合十五五规划中高水平科技自立自强的发展目标,DDR5的普及成为存储产业支撑数字经济发展的关键抓手 [4] 产业发展趋势 - 业内普遍认为此轮DDR4涨价仅为技术更替的周期性波动,无法逆转DDR5全面取代DDR4的大势 [3] - 推动DDR5普及是顺应技术规律、满足消费需求、夯实AI发展基础的战略性举措 [5]
创业板50指数上涨0.88%,光模块和电池板块表现强劲
新浪财经· 2025-11-10 11:41
市场整体表现 - 上周A股市场主要指数普遍上涨,沪深300指数上涨0.82%,中证1000指数上涨0.47%,创业板50指数表现突出,涨幅达0.88% [1] - 市场交易活跃度提升,日均成交额保持在2万亿元左右 [1] - 中证500指数上周略微下跌0.04%,科创50指数微幅上涨0.01% [1] 行业热点与板块表现 - 光伏、新能源等电力设备以及煤炭、钢铁、化工等周期性行业成为市场关注重点 [1] - 光伏板块上周大幅反弹,政策推动行业自律及光伏与储能协同发展,供需格局改善 [2] - 医药生物板块上周出现下跌,处于技术性调整阶段,医保谈判有127个目录外药品参与 [3] - 光模块板块虽出现短期资金流出,但中长期需求强劲,受AI大模型训练推动 [2] 创业板50指数分析 - 创业板50指数2025年第三季度归母净利润同比增速高达49%,高盈利增速缓解估值压力 [1] - 指数聚焦信息技术、新能源、金融科技和医药四个新质生产力赛道,科技成长属性纯粹 [1] - 在光模块、新能源及金融科技的含量上优于创业板指和其他主流宽基指数 [2] - 指数为创新创业企业提供融资平台,支持三创四新发展 [1] 关键领域发展趋势 - 光模块技术快速迭代,800G/1.6T需求提升,1.6T光模块需求预计上修至2000万只,中际旭创1.6T产品已进入量产 [2] - 北美主要云厂商资本开支大幅增长,微软、谷歌、Meta和亚马逊2023年第三季度合计资本开支达964亿美元,同比增长68% [2] - 2025年全球光伏新增装机量预测将超过500GW,储能需求随国内十五五规划推动而增长,电芯价格趋稳 [2] - 医药行业创新驱动逻辑不变,ADC、双抗等新疗法全球授权加速,部分CXO企业2023年第三季度收入同比增速超40% [3] 投资工具与市场数据 - 创业板50ETF(159949)是跟踪创业板50指数的基金,筛选新能车、生物医药、电子、光伏和互联网金融五大科技赛道龙头企业 [3] - 该ETF流动性强,过去一年日均成交额达14.97亿元,最新规模为269.74亿元,是深交所ETF前列产品 [3] - 创业板50ETF含有38%新能源成分,是布局新能源和光伏等领域的工具 [1]
HAMi × NVIDIA:GPU 拓扑感知调度实现详解
AI前线· 2025-10-25 05:32
核心观点 - HAMi v2.7.0版本正式推出针对NVIDIA GPU的拓扑感知调度功能,旨在解决高性能计算和AI大模型训练场景下的多卡通信瓶颈问题 [2] - 该功能通过智能调度,将计算任务精确部署到物理连接最紧密、通信速度最快的GPU组合上,以最大化加速计算任务并提升集群整体的算力效能 [2] - 其设计哲学是用动态发现代替静态配置,用远见决策代替短视分配,构成了一套成熟、高效的GPU调度方案 [27] 核心特性总览 - 核心设计思想是先在节点本地将复杂的物理拓扑精确量化为设备间的“通信分数”,然后调度器基于这些分数做出最优选择 [5] - 具备动态计算拓扑分数特性,Device Plugin能够通过NVML动态探测节点上GPU间的物理连接拓扑(如NVLink、PCIe),并将其量化为通信分数 [6] - 采用双策略防碎片调度,Fit函数内置寻优算法,针对多卡任务和单卡任务自动采用“最佳匹配”与“最小破坏”策略 [6] 实现原理:拓扑注册与调度决策 - 拓扑注册阶段的目标是将GPU物理连接转化为调度逻辑可理解的标准化的数字分数 [9] - 信息探测环节通过NVIDIA的NVML获取所有GPU两两之间的物理连接类型(NVLink或PCIe) [11] - 数据建模与量化环节首先在内存中构建完整的GPU拓扑图,然后根据预设规则将连接关系计算转换为具体的通信分数 [11] - 最终产物是一个记录了每个GPU的UUID以及它与其他所有GPU之间通信分数的“设备分数表”,并被注册到节点的Annotation中 [11] - 调度决策阶段,Fit函数会先过滤掉不满足基本资源需求的GPU,然后基于设备分数表执行考虑了最佳匹配和最小破坏原则的寻优算法 [11] 代码深度解析:拓扑发现与分数计算 - 拓扑信息的发现与量化在Device Plugin本地完成,并最终生成可供上报的分数表 [13] - 构建拓扑图逻辑由`build()`函数完成,它初始化设备列表后,通过双重循环遍历所有GPU对,聚合连接信息,构建包含丰富连接信息的完整拓扑图 [15] - 量化为分数由`calculateGPUScore`函数完成,它会检查两个GPU之间的所有连接并根据详细的switch语句进行评分,最终分数是所有连接分数的总和 [15] 代码深度解析:设备端调度决策 - 调度决策核心逻辑位于设备端的`Fit()`函数中,该函数会根据请求的GPU数量自动切换寻优策略 [14] - 对于多卡任务(请求多于1个GPU),采用“最佳匹配”原则,目标是寻找内部通信总分最高的GPU组合 [19] - 具体实现是找出所有满足资源需求的空闲GPU,生成所有可能组合,计算每个组合内部所有设备对的分数总和,并选择分数总和最高的组合 [20][23] - 对于单卡任务(只请求1个GPU),采用“最小破坏”原则,目标是选择与其他可用GPU连接最“疏远”的卡 [22] - 具体实现是遍历所有可用单个GPU,计算每个GPU与其他所有可用GPU的分数总和,并选择总分最低的GPU,以保护拓扑完整性 [22] 使用方式 - 用户只需一个Annotation即可启用拓扑感知调度,调度器会根据任务请求的GPU数量自动应用相应的策略 [25] - 启用方式为在Pod的metadata annotations中添加`hami.io/gpu-scheduler-policy: "topology-aware"` [26]
中国芯片技术取得多项突破性进展
新浪财经· 2025-10-18 13:27
颠覆性算力芯片 - 北京大学研发全球首款24位精度模拟矩阵芯片,基于阻变存储器,通过动态误差校准算法将传统模拟计算精度从8位提升至24位,误差率低于0.1% [1] - 该芯片在求解128×128矩阵方程时,计算吞吐量达顶级GPU的1000倍以上,能效提升超100倍,应用于6G通信基站信号处理仅需3次迭代即可恢复高清图像,误码率与32位数字计算相当 [2] - 清华大学开发全球首颗集成存储、计算与片上学习的忆阻器芯片,能效较传统ASIC提升75倍,支持硬件端直接训练AI [4] 核心工艺与材料 - 国光量超发布4英寸离子束刻蚀机,精度达0.02纳米,性能较国际主流2nm设备提升百倍,中微半导体实现1纳米等离子刻蚀工艺 [7] - 璞璘科技交付全球首台半导体级步进式纳米压印光刻机,上海微电子浸没式光刻机量产,通过SAQP技术实现等效5nm试产,国产设备配套率超50% [7] - 复旦大学研制全球首颗二维-硅基混合架构闪存芯片"无极",集成5900个晶体管,读写速度比传统闪存快百万倍,良率达94.3% [7] 高端芯片设计与制造 - 小米玄戒O1为中国大陆首款自研3nm手机SoC,集成190亿晶体管,性能接近苹果A18 Pro,能效提升30% [8] - 华为昇腾910B支持8卡互联,大规模应用于政务云及自动驾驶,国产AI算力依赖度从95%降至50% [9] - 龙芯3C6000采用完全自主"龙架构"指令集,64核性能超越英特尔至强8380,车规级芯片东风DF30 MCU实现全流程国产化,功能安全达最高等级ASIL-D [10] 未来方向与挑战 - 北京大学与港城大联合研发全频段6G芯片,速率达120Gbps,支持天地一体化组网 [11] - 国光量超刻蚀机推动量子芯片良率提升,中国电信推出504比特超导量子计算机"天衍504" [12] - 7nm以下先进制程设备仍依赖EUV光刻机,国产EUV预计2027年攻关,GPU工具链与EDA设计软件需加速完善 [13]
下一只“寒王”呼之欲出!算力+机器人共振,英伟达核心伙伴潜力股
新浪财经· 2025-10-08 04:16
算力增长预测与战略重要性 - 到2035年,全社会算力总量将增长10万倍[1] - 2025年中国智能算力规模将达到1037.3 EFLOPS,较2024年增长43%[2] - 2026年中国智能算力规模将达1460.3 EFLOPS,实现两年翻倍增长[2] - 全球主要经济体将算力视为战略资源,美国通过《芯片与科学法案》投入520亿美元补贴半导体产业[2] - 欧盟启动《欧洲芯片法案》,计划2030年占全球20%市场份额[2] 算力需求驱动领域 - AI大模型训练、自动驾驶、智慧城市、工业机器人及军工领域对算力需求激增[4] - 智能汽车领域,单车算力需求年复合增长超50%[4] - 卫星互联网领域,全球低轨卫星数据处理需求激增[4] - 工业4.0领域,智能制造对实时算力要求不断提升[5] 算力产业链相关公司 - 紫光股份旗下新华三为NVIDIA企业级产品总代理,提供全栈解决方案[6] - 英维克向IDC公司提供机房及服务器内部的液冷系统,客户包括华为、英伟达[6] - 工业富联作为英伟达核心供应商,AI服务器产品线成长迅猛,GB200系列实现量产爬坡[7] - 烽火通信旗下长江计算为算力基础设施国家队,与昇腾合作发布解决方案,为华为供货[8] - 某公司液冷方案通过5000次插拔零泄漏验证,达到英伟达GB300架构要求,是华为昇腾910D芯片液冷系统独家供应商[9]
微信WeChat-YATT横空出世,腾讯强化学习布局剑指何方
搜狐财经· 2025-09-24 09:56
WeChat-YATT技术特点 - 基于Megatron-Core和SGLang/vLLM研发 专注强化学习和多模态模型训练[2] - 显著优化强化学习场景参数更新效率 提供灵活多模态数据融合接口 通过模块化设计降低分布式训练门槛[2] - 命名"Yet Another Transformer Trainer"体现腾讯在AI基础设施层的长期投入决心[6] 技术对比优势 - 相比Meta PyTorch在强化学习支持更胜一筹 对比Google JAX在中文场景和多模态处理具明显优势[4] - 与同类强化学习框架Ray RLlib相比 深度整合微信生态独具特色[4] - 特别强调易扩展性 满足大模型快速迭代需求 参数规模突破万亿门槛后训练框架灵活度决定竞赛先机[4] 腾讯AI战略布局 - 开源WeChat-YATT是构建技术生态圈的重要步骤 类似Google开源TensorFlow的路径[2] - 结合申请微信AI服务平台商标 混元大模型全面落地等动作 形成底层技术突破与上层应用落地的双轮驱动[7] - 微信作为十亿级流量入口需强大AI能力支撑 混元大模型持续进化需高效训练工具 WeChat-YATT填补关键环节形成从基础设施到终端应用的完整链条[7] 强化学习战略价值 - 重点投入强化学习训练库 预示在游戏 推荐系统 自动驾驶等核心领域的下一代AI应用场景布局[7] - 大模型时代竞争本质是基础设施竞争 自主可控训练框架将成为头部企业标配[7]