全栈国产化

搜索文档
【数字匠人】中电四公司徐俊:以“国家队”之力赋能智算产业生态
环球网· 2025-08-15 02:51
行业背景与发展机遇 - 算力作为数字经济底座正成为各行各业数字化智能化转型新引擎 智算中心作为支撑AI大模型训练与推理的核心载体迎来前所未有的发展机遇期 [1] - 智算中心建设关乎产业升级 区域经济转型与技术自主可控 成为产业链上下游共同关注的重要命题 [1] 公司战略定位 - 公司定位为国家智算中心基础设施建设与运维的核心参与者 秉承技术引领服务护航的双轮驱动发展理念 [3][8] - 依托央企平台和资源优势探索多方共投共建共赢的发展模式 联合地方企业打造生态协同机制 [8] - 作为全栈技术服务商提供覆盖智算中心从前期规划设计工程建设到后期运维的全生命周期服务能力 [1][8] 技术创新优势 - 在液冷技术和模块化机房建设方面具有明显优势 推出模块式智算基础设施采用标准化预制模块可实现快速部署帮助客户将建设周期压缩30%以上 [10][13] - 提供冷板式液冷和浸没式液冷解决方案支持单机柜功率超过30千瓦满足高密度计算需求 [10] - 累计获得国家专利140余项 主编及参编规范标准15项 编写省级以上工法13项 [5] 业务模式创新 - 创新E+EPC+O一体化模式集融资采购施工运维于一体实现投资建设与运营的资源整合帮助客户降低前期投入成本 [3][9] - 采取多方共投共建的合作模式联合地方企业或运营商降低项目实施风险 内蒙古移动智算中心项目基建投资规模超过44亿元入选2024年央企十大超级工程 [8][10] 行业发展趋势 - AI大模型快速发展带来算力需求指数级增长 但高端芯片液冷设备等核心设施仍深度依赖进口国产化替代推进相对缓慢 [9] - 技术迭代速度极快 单柜功耗从5千瓦提升至30千瓦 高密度液冷技术从试点逐步走向大规模应用 [9] - 全栈国产化是大势所趋 绿色低碳成为重要导向液冷技术广泛应用有望将PUE降至1.2以下 [9] 人才与组织建设 - 成立云数智算事业群整合市场技术交付等资源实现从商机获取到项目履约交付的端到端管理 [3][10] - 建立跨区域跨部门协同机制打破传统工程公司部门壁垒构建市场设计采购交付运维五方联动机制 [11] - 推行管理+技术双通道晋升机制 设立技术专家高级专家首席专家等路径使技术人员享受与管理岗位相同薪酬待遇 [11] 风险管理体系 - 加强市场监测机制从区域经济政策法律法规竞争格局等多维度建立动态风险预警模型 [12] - 形成事前事中事后全流程风险管控体系 事前开展风险识别评估编制风险评估清单和应对措施 事中通过项目管理平台实时监控风险指标 事后对风险进行迭代更新 [12] 项目交付能力 - 具备覆盖策划设计采购施工运维的全生命周期一体化交付保障体系 内蒙古移动项目比客户计划提前30天完工 某重点保密项目在56天内高效交付 [13] - 在半导体厂房建设面板厂房建设等工程中积累洁净工程高密散热经验延伸至智算中心液冷设计模块化交付形成独特技术壁垒 [13]
华为首个!重磅发布!
证券时报· 2025-06-30 04:12
华为开源盘古大模型 - 公司宣布开源盘古70亿参数的稠密模型和720亿参数的混合专家模型(盘古Pro MoE 72B),并同步开源基于昇腾的模型推理技术 [1] - 此举是公司践行昇腾生态战略的关键举措,旨在推动大模型技术研究与创新发展,加速AI在千行百业的应用与价值创造 [1] 盘古Pro MoE 72B性能表现 - 开源的Pro MoE 72B大模型参数量为720亿,激活160亿参数量,通过动态激活专家网络设计实现以小打大的优异性能 [3] - 该模型在Super CLUE 2025年5月排行榜上位居千亿参数量以内大模型排行并列国内第一 [3] 华为大模型技术进展 - 公司在2025年华为开发者大会上发布盘古大模型5.5,包含五大基础模型面向NLP、多模态、预测、科学计算和计算机视觉领域 [4] - 会上还发布基于Cloud Matrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量达2300Tokens/s [4] - 5月30日公司推出参数规模高达7180亿的盘古Ultra MoE模型,并发布相关技术报告 [4] 昇腾生态与国产化突破 - 盘古大模型基于昇腾云全栈软硬件训练完成,实现国产算力+国产模型全流程自主可控 [5] - 公司在集群训练系统性能上实现业界领先,完成从硬件到软件、从训练到优化的全栈国产化和全流程自主可控闭环 [5] 行业应用与落地 - 公司坚持"不作诗,只做事"战略,为千行万业提供智能化解决方案 [5] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域 [5] - 公司同步上线五大盘古行业思考大模型(医学、金融、政务、工业、汽车) [5] 开源战略意义 - 开源举措有助于更多开发者基于国产算力平台开发大模型技术,扩展昇腾生态 [7] - 开源将吸引更多垂直行业以盘古大模型为基础打造智能化解决方案,推动大模型更广泛赋能行业 [7]
华为,重大发布!
新华网财经· 2025-06-20 12:17
盘古大模型进展 - 盘古大模型5.5发布,在自然语言处理、多模态等5大基础模型全面升级,加速行业智能化[1] - 发布盘古医学、金融、政务、工业、汽车五个行业自然语言大模型,6月底正式上线[1] - 盘古大模型已在30多个行业、500多个场景中落地,覆盖政务、金融、制造、医疗等多个领域[1] - 推出参数规模高达7180亿的盘古Ultra MoE模型,全流程在昇腾AI计算平台训练[1] 盘古Ultra MoE技术突破 - 采用Depth-Scaled Sandwich-Norm架构和TinyInit小初始化方法,实现超过18TB数据的长期稳定训练[2] - 使用EP loss负载优化方法,保证专家负载均衡并提升领域特化能力[2] - 采用MLA和MTP架构,使用Dropless训练策略,平衡模型效果与效率[2] - 在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习后训练框架关键技术[3] 训练性能提升 - 预训练系统加速技术迭代升级,万卡集群预训练MFU由30%提升至41%[3] - 盘古Pro MoE大模型参数量720亿,激活160亿,性能媲美千亿级模型[3] - 在SuperCLUE 2025年5月排行榜上,盘古Pro MoE位居千亿参数量以内大模型国内并列第一[3] 鸿蒙6发布 - 鸿蒙6操作系统首次亮相,带来全新互联和智能体验[4] - HMAF鸿蒙智能体框架赋能应用和元服务智能化升级[4] - 鸿蒙生态进入加速阶段,超30000个应用及元服务在开发中,覆盖近20个行业[5] - 注册开发者数量突破800万,生态面临百万级人才缺口[5] 行业影响 - 证明在国产AI算力平台(昇腾)上能高效训练国际顶尖水平的超大规模稀疏模型[4] - 实现从硬件到软件、从训练到优化的全栈国产化和全流程自主可控[4]
重磅!华为发布准万亿大模型
每日经济新闻· 2025-05-30 11:41
华为盘古Ultra MoE模型突破 - 公司推出参数规模高达7180亿的全新模型盘古Ultra MoE,实现全流程在昇腾AI计算平台训练的准万亿MoE模型 [1] - 披露模型架构和训练方法技术报告,体现昇腾在超大规模MoE训练性能上的跨越 [1] - 针对训练稳定性难题,团队创新设计Depth-Scaled Sandwich-Norm架构和TinyInit小初始化方法,实现18TB数据长期稳定训练 [4] - 采用EP loss负载优化方法保证专家间负载均衡并提升领域特化能力,结合MLA/MTP架构及Dropless策略实现效果与效率平衡 [4] 昇腾平台技术进展 - 在昇腾CloudMatrix 384超节点上打通大稀疏比MoE强化学习后训练框架关键技术,使RL后训练进入超节点集群时代 [5] - 通过自适应流水掩盖策略、算子优化、内存管理等技术迭代,万卡集群预训练MFU从30%提升至41% [5] - 盘古Pro MoE模型以720亿参数量实现媲美千亿级模型的性能,在SuperCLUE榜单中位列千亿级以内国内并列第一 [5] 国产AI全栈自主可控意义 - 实现国产算力+国产模型全流程自主可控训练实践,集群训练系统性能达业界领先水平 [3] - 证明昇腾平台可高效稳定训练国际顶尖水平超大规模稀疏模型,完成从硬件到软件的全栈国产化闭环 [6] 其他国产大模型动态 - DeepSeek-R1-0528模型开源,代码能力媲美OpenAI o3高版本,上下文长度扩展至128k且文本理解能力显著提升 [7] - 腾讯在AI产业应用峰会展示混元大模型矩阵升级,涵盖云基础设施、开发工具及场景应用,推动企业AI化转型 [7][8]
重大突破!刚刚,华为发布!
券商中国· 2025-05-30 10:43
中国AI产业重大突破 - 华为发布参数规模高达7180亿的盘古Ultra MoE模型,实现全流程在昇腾AI计算平台训练的准万亿MoE模型,技术细节公开体现昇腾超大规模训练性能跨越 [1] - 盘古Ultra MoE采用Depth-Scaled Sandwich-Norm稳定架构和TinyInit小初始化方法,在昇腾平台实现18TB数据长期稳定训练,EP loss负载优化提升专家领域特化能力 [2] - 华为在昇腾CloudMatrix 384超节点打通大稀疏比MoE强化学习后训练框架,预训练系统MFU从30%提升至41%,盘古Pro MoE以720亿参数量实现媲美千亿级模型的性能 [3] 国产AI全栈能力验证 - 华为实现国产算力+国产模型全流程自主可控训练,集群训练系统性能达业界领先水平,标志国产AI基础设施自主创新能力突破 [1] - 盘古团队在模型架构、训练方法、硬件适配等环节实现全栈创新,包括MLA/MTP架构、Dropless训练策略等,达成模型效果与效率最佳平衡 [2][3] - 行业认为此举证明国产昇腾平台可高效训练国际顶尖水平稀疏模型,完成从硬件到软件、研究到落地的全流程闭环 [4] 国内大模型动态 - 深度求索公司升级DeepSeek-R1模型,其V3版本在海外评测中超越xAI Grok3和OpenAI GPT-4.5,成为得分最高非推理模型 [5] - 腾讯混元大模型战略全景亮相,混元TurboS在Chatbot Arena排名全球前八,代码/数学能力进入全球前十,多款AI应用接入DeepSeek R1-0528 [6] - 深度求索R1模型以数百万美元成本实现优于西方竞品的标准化表现,引发全球科技股震荡 [5]