CATLASS算子模板库
搜索文档
拆解CANN:当华为决定打开算力的「黑盒」
机器之心· 2025-12-19 06:38
文章核心观点 - 华为昇腾将其底层AI基础软件CANN全面开源开放,旨在通过降低AI算力开发门槛、提供灵活的开发工具和构建开放生态,挑战现有计算架构格局,并推动一个独立于CUDA的AI算力生态快速成长 [2][31] CANN开源的核心价值与目标 - CANN作为连接上层AI框架与底层AI芯片的桥梁,其开源使开发者无需关心芯片细节即可调用底层算力,获得了定义算力的权力 [2] - 开源旨在构建“算力多元世界”,不仅仅是替代,更是邀请开发者共同构建新生态 [31] - 一个不同于CUDA路径的AI算力生态正在基于CANN快速成长 [31] 降低开发门槛:实现“AI算子开发自由” - CANN支持与PyTorch、TensorFlow、MindSpore、PaddlePaddle等主流AI框架无缝对接,并开放GE图开发接口,允许自定义图结构 [5] - 大模型支持覆盖广泛,包括Llama、Mistral、Phi等海外模型及Qwen、DeepSeek、GLM等国产模型,总计超过50种,并参与了超过10个大模型开源社区的生态构建 [6] - 为不同背景开发者提供三条算子开发路径 [7] - **路径一(Triton生态)**:实现与Triton深度对接,支持Python语法编写算子,原有Triton代码可低成本迁移至昇腾NPU [9] - **路径二(Ascend C)**:提供采用C/C++语法风格的原生编程语言,开放底层资源管理接口,允许原子级控制以追求极致性能 [10] - **路径三(模板库)**:提供基于Ascend C的CATLASS算子模板库,通过参数配置快速生成矩阵乘等算子,无需重写复杂逻辑 [11][13] - 针对MoE模型推出MLAPO融合算子,将多算子计算融合为单个高效算子,在DeepSeekV3模型量化场景下,能将计算耗时从109us缩减至45us,带来整网性能提升20% [13][15] - 已在AtomGit开放多个核心仓库,并发布官方容器镜像,提供开箱即用的开发环境 [16] - 已预置超过1400个基础算子、100多个融合算子及15个通信算法,提供“开箱即用”能力 [16] 架构创新:分层解耦带来的灵活性 - CANN的核心创新在于宏观架构上的“分层解耦”,将软件栈拆解为多个功能正交、独立演进的组件 [19][22] - 分层解耦贯穿全栈,从底层驱动到上层编译器、加速库,实现物理松耦合,允许按需引入或升级特定组件,降低系统集成和定制门槛 [22][23] - 具体变化体现在: - **加速库组件化**:算子库被精细拆分为ops-math、ops-nn、ops-cv、ops-transformer等独立组件,改变了过去“全量算子一个包”的发布方式 [24] - **通信库与图引擎独立**:HCCL通信库开放通信算子和框架层,支持自定义通信算法;GE图引擎开放图编译和执行接口,支持自定义图融合策略 [26] - **运行时极简化**:Runtime层剥离冗余模块,实现核心功能最小化,并开放aclGraph接口支持图模式下沉,减少Host与Device间交互开销 [27][28] - 架构解耦后,CANN共有20余个安装包,支持各功能独立演进和编译升级,使开发者能在模型、算子、内核、底层资源等多层级分别进行优化 [29] 开源进展与社区现状 - CANN的全面开源开放正在加速推进,其在AtomGit的代码库非常活跃,几乎每天都有新动态 [33] - 截至目前,CANN项目下已有27个子项目,总star数超过3700,总下载量突破35万 [35] - 开源版图持续扩大,例如核心组件GE(图引擎)以及新型编程范式PyPTO框架等正在建设中 [35] - 开源组件覆盖算子库、通信库、图引擎、编程语言和运行时等多个关键领域 [36]
计算产业生态再迎突破,华为创造AI算力新纪录,AI人工智能ETF(512930)连续3日获资金净流入,消费电子ETF(561600)盘中涨超1%
新浪财经· 2025-06-11 03:02
人工智能主题指数及ETF表现 - 中证人工智能主题指数(930713)上涨0.65%,成分股芯原股份上涨4.51%,中科曙光上涨3.77%,全志科技上涨1.94%,均胜电子上涨1.69%,德赛西威上涨1.40% [1] - AI人工智能ETF(512930)上涨0.45%,最新价报1.33元,近1周累计上涨3.12%,涨幅排名可比基金1/3 [1] - AI人工智能ETF盘中换手1.67%,成交3540.27万元,近1周日均成交1.13亿元 [1] - AI人工智能ETF最新规模达20.99亿元,最新份额达15.93亿份,均创成立以来新高 [1] - AI人工智能ETF近3天获得连续资金净流入,合计1.56亿元,日均净流入达5189.56万元 [1] - AI人工智能ETF最新融资买入额达383.16万元,融资余额达8311.68万元 [2] 人工智能行业动态 - 华为昇腾384卡超节点集群单集群算力达300 PFLOPS,相当于3000万台高端PC总和,训练可用度达98%,线性度超95% [4] - 华为发布鲲鹏AI+解决方案和昇腾CATLASS算子模板库,提升算子开发和应用部署效率 [4] - 全球首个AI处理器芯片全自动设计系统"启蒙"发布,设计关键指标达人类专家水平 [4] - 全球首个生成式AI放射系统可在毫秒内识别危及生命的病症,解决放射科医生短缺问题 [5] 消费电子主题指数及ETF表现 - 中证消费电子主题指数(931494)上涨0.97%,成分股龙旗科技上涨5.65%,芯原股份上涨4.70%,生益科技上涨4.16% [8] - 消费电子ETF(561600)盘中涨超1%,现涨0.77%,最新价报0.78元,近1周累计上涨2.77%,涨幅排名可比基金1/5 [8] - 消费电子ETF盘中换手1.41%,成交252.06万元,近1周日均成交1004.31万元 [8] - 消费电子ETF近半年规模增长2456.91万元,近1月份额增长1100.00万份 [8] 线上消费主题指数及ETF表现 - 中证沪港深线上消费主题指数(931481)上涨0.30%,成分股阅文集团上涨3.41%,中旭未来上涨3.34% [11] - 线上消费ETF基金(159793)上涨0.88%,最新价报0.92元,近1周累计上涨3.75% [11] 指数成分及权重 - 中证沪港深线上消费主题指数前十大权重股包括阿里巴巴-W、腾讯控股、美团-W等,合计占比56.98% [13] - 中证消费电子主题指数前十大权重股包括中芯国际、立讯精密、京东方A等,合计占比53.04% [14] - 中证人工智能主题指数前十大权重股包括寒武纪、韦尔股份、海康威视等,合计占比51.56% [15]
夯实算力底座 加速AI应用
人民日报海外版· 2025-05-29 23:04
鲲鹏昇腾开发者大会2025概况 - 大会在北京中关村国际创新中心举办,展示区面积达2000多平方米,包含2场峰会、40多场技术分论坛[4][6] - 截至2025年5月,鲲鹏昇腾已发展超过665万开发者,8800多家合作伙伴,完成23900多个解决方案认证[5] - 大会注重技术深度讲解和代码实操,设置创享周进行12场线上直播,聚焦AI热点话题[6] 技术发布与平台升级 - 鲲鹏推出AI+解决方案,发布开源社区openFuyao,构建人工智能计算引擎[7] - 昇腾发布CATLASS算子模板库,升级大规模专家并行推理解决方案,提升算子开发效率和模型训练性能[7] - 华为持续优化异构融合算力架构,将计算能力沉淀到软硬件平台开放给开发者[6][7] 行业应用案例 - 昇腾联合100多家伙伴打造DeepSeek方案,覆盖互联网、金融、教育、医疗等行业核心场景[9] - 纺织行业应用昇腾家纺大模型,设计成本从数万元降至几十元,开发周期缩短至5天[10] - 教育行业利用昇腾算力构建AI智能体教学解决方案,开发AI助教、命题工具等应用[10] - 制造业应用昇腾AI算力实现机械臂集群动态调度,故障时产线效率仅下降3%[11] 开发者生态建设 - 华为推出专项激励计划覆盖技术研发到商业落地全链条,联合200家企业和50所高校打造产学研共同体[12] - 昇腾社区2025年将升级课程体系,提供更多开发板和算力资源,构建学练训赛完整体系[13] - 昇腾AI创新大赛设立三大旗舰赛道和两大子赛事,吸引全球数万开发者参与[13] 市场前景与战略 - Gartner预测到2027年80%中国企业将部署多模型生成式AI,2029年60%企业将AI作为收入主要驱动力[9] - 华为推进全面智能化战略,通过鲲鹏昇腾计算生态赋能千行万业[9] - AI在制造业正从探索验证向深度应用阶段加速迈进,华为深化"AI+生产""AI+供应"融合[11]
鲲鹏、昇腾加快打造计算产业生态
中国新闻网· 2025-05-26 02:34
国产算力技术体系发展 - 鲲鹏和昇腾作为国产算力技术体系,正为全球开发者构建"所想即所得"的创新土壤,加速生态体系繁荣 [1] - 截至2025年5月,鲲鹏、昇腾已发展超过665万开发者、8800多家合作伙伴,完成23900多个解决方案认证 [1] 生态体系与技术创新 - 生态体系是国产算力突围的关键,华为持续投入根技术创新和系统架构创新 [1] - 昇腾超节点架构通过突破性创新打破集群互联瓶颈,提升节点间协同效率,使集群运行如同一台强大计算机 [1] - 鲲鹏推出鲲鹏AI+解决方案,昇腾发布CATLASS算子模板库并升级CANN能力,简化算子开发、应用部署及模型训练推理 [1] AI开发工具与人才培养 - 华为聚焦易用好用的AI开发系统,累计培养40多万名学昇腾的学生,并与清华、北大等顶尖高校合作建立卓越中心和孵化中心 [2] - 昇腾助力国内AI大模型发展,如科大讯飞通过合作解决超大规模集群稳定训练技术挑战,实现MoE模型落地应用 [2] 行业应用与合作伙伴 - 华为联合100多家伙伴打造DeepSeek方案,支撑500多个客户基于昇腾部署应用,覆盖互联网、运营商、金融、教育、医疗等行业 [2]
华为周军:鲲鹏、昇腾已发展超过665万开发者
快讯· 2025-05-23 14:45
鲲鹏昇腾开发者大会2025技术发布 - 鲲鹏AI+解决方案正式推出,面向通用计算领域构建AI时代卓越引擎 [1] - 开源发布多样化算力集群软件开源社区openFuyao [1] - 昇腾发布CATLASS算子模板库、MindIE Motor推理服务加速库、推理微服务MIS [1] - 持续升级分层开放CANN能力、MindSpeed RL强化学习套件、大规模专家并行推理解决方案 [1] 华为生态策略与成果 - 坚持"硬件开放、软件开源、使能伙伴、发展人才"的生态策略 [1] - 持续投入根技术创新和系统架构创新 [1] - 截至2025年5月已发展超过665万开发者、8800多家合作伙伴 [1] - 完成23900多个解决方案认证 [1] 算力底座建设 - 持续打造坚实、易用的算力底座 [1] - 使能开发者和伙伴加速行业智能化 [1]