CANN

搜索文档
「从追赶者到引领者,路有多远?」 我们和CANN一线开发者聊了聊
机器之心· 2025-09-28 04:50
机器之心报道 编辑:Panda、泽南 AI 行业很多人相信,我们正在或已经进入所谓的「AI 下半场」。在这一轮 AI 的浪潮中,硬件的竞争早已不再是单纯的算力比拼,而是一场围绕软件、开发者与 生态的「护城河」之战。当国产 AI 生态的转型成为科技领域的时代呼声,华为昇腾及其异构计算架构 CANN 正站在了这场变革的聚光灯下。 2025 年 8 月 5 日,华为轮值董事长徐直军宣布, 昇腾硬件使能的 CANN 将全面开源 开 放 ,并承诺在 12 月 30 日 前完成。 从「砖」到「大厦」 这并非一次简单的技术路线调整,而是国产 AI 基础设施在生态战略上一次深刻的自我革命。它标志着昇腾正试图打破过去由硬件厂商自上而下主导的封闭模式, 转而拥抱一种更开放、更依赖社区共建、也更不确定的未来。这不仅是对行业领导者 CUDA 所建立的强大壁垒发起的挑战,更是对自身的一次考验:从「可用」 到「首选」的道路,关键不再仅仅是技术的迭代,更在于 能否真正构建起一个让开发者愿意参与进来的繁荣生态 。 为了探寻 CANN 开源的真实意义,以及它将为整个生态带来怎样的机遇与挑战,我们与三位身处不同位置的核心开发者与观察者进行了深度 ...
徐直军详解华为最强“算力核弹”
观察者网· 2025-09-18 13:24
芯片产品规划 - 昇腾950系列芯片支持FP8/MXFP8/MXFP4等低数值精度格式,算力达1P-2P FLOPS,自研HiF8格式精度接近FP16,包含面向Prefill场景的950PR和面向Decode场景的950DT两款合封芯片,均计划2026年上市 [3] - 昇腾960芯片性能较950翻倍,支持自研HiF4格式,推理精度优于业界FP4方案,计划2027年四季度推出 [7] - 昇腾970芯片FP4/FP8算力及互联带宽较960全面翻倍,内存访问带宽提升1.5倍,计划2028年四季度推出 [7] - 鲲鹏950处理器包含96核/192线程和192核/384线程两个版本,为首款支持机密计算的数据中心处理器,计划2025年一季度推出 [13] - 鲲鹏960处理器包含96核/192线程高性能版和不少于256核/512线程高密版,计划2028年一季度推出 [13] 超节点系统 - Atlas 950超节点基于8192颗昇腾950DT芯片构建,包含160个机柜(128计算柜+32互联柜),占地1000平方米,FP8算力达8E FLOPS,FP4算力达16E FLOPS,互联带宽16PB/s(超全球互联网峰值带宽10倍),计划2026年四季度上市 [11] - 对比英伟达NVL144系统,Atlas 950芯片规模为其56.8倍,总算力为其6.7倍,内存容量1152TB为其15倍,互联带宽16.3PB/s为其62倍 [11] - Atlas 960超节点基于15488颗昇腾960芯片构建,包含220个机柜(176计算柜+44互联柜),占地2200平方米,FP8算力30E FLOPS,FP4算力60E FLOPS,内存容量4460TB,互联带宽34PB/s,计划2027年四季度推出 [13] - TaiShan 950超节点为全球首款通用计算超节点,基于鲲鹏950处理器,最大支持32处理器/48TB内存,支持内存/SSD/DPU池化,计划2025年一季度上市 [13] 算力集群架构 - Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成,集成52万片昇腾950DT芯片,FP8总算力524E FLOPS,规模为xAI Colossus集群2.5倍,算力为其1.3倍 [18] - Atlas 960 SuperCluster集群计划2027年四季度推出,规模达百万卡级,FP8总算力2Z FLOPS,FP4总算力4Z FLOPS [19] - 自研"灵衢(UB)"互联协议支持万卡级超节点架构,具备总线级互联/平等协同/全量池化等六大特性,并开放灵衢2.0技术规范构建生态 [17] 软件生态战略 - CANN编译器与虚拟指令集接口开放,其余软件全开源,基于昇腾910B/C的开源计划2025年12月31日前完成 [22] - Mind系列应用使能套件及工具链全面开源,计划2025年12月31日前完成 [22] - openPangu基础大模型全面开源 [22] 技术突破方向 - 自研两种低成本HBM内存技术,分别适配Prefill推荐场景和Decode训练场景 [3] - 通过光通信/网络/供电技术集成384颗昇腾芯片构建超节点,计算与通信高速并行,已部署超300套 [10] - TaiShan 950超节点结合GaussDB多写架构可实现大型机/小型机替代,性能提升2.9倍 [15] - 推出TaiShan 950与Atlas 950混合超节点,支持PB级推荐系统嵌入表和超低时延推理 [15]
华为“昇腾超节点”发布
深圳商报· 2025-09-18 02:40
昇腾超节点算力方案 - 大模型训练性能达传统节点3倍 支撑千亿级大模型训练 [1] - 突破传统集群通信瓶颈 提升算力基础设施效率 [1] CANN开源生态成果 - AI框架深度适配 算子自动生成技术大幅提升开发效率 [1] - 全量开源推动生态合作 计划两年培育200万开发者 [1] AI CITY标杆城区建设 - 以昇腾算力为底座打通政务与公共服务数据 覆盖城市管理、民生服务与产业赋能 [1] - 主干道通行效率提升18% 社区医院AI辅助诊断准确率超92% [1] 数字生活空间建设 - 提供T级存储、网络、公共资源与智能算力支持 构建"云-网-边-端"一体化服务底座 [1] - 以四大数字权利为核心 实现从城市治理向市民服务转型 [1] 应用场景拓展 - 发布第二批"城市+AI"应用场景清单 涵盖21个领域共424个场景 [1] - 龙岗区城投与华为共建"在地+云端"算力资源池 [1]
从“数字大脑”到私人AI助手 深圳龙岗成体系进入数字世界
南方都市报· 2025-09-16 09:30
昇腾超节点与算力基础设施升级 - 华为发布昇腾超节点解决方案 采用384卡高速总线互联技术 相比传统以太网络架构通信带宽提升15倍 时延降低10倍 训练性能达到传统节点的3倍 [7] - 超节点是超级算力集群概念 专门应对算力消耗大、复杂度高的AI大模型计算任务 解决政务云大规模AI应用的算力瓶颈问题 [7] - 龙岗区将与华为携手推动昇腾384超节点在政务云上部署 构建强大的AI算力核心 率先实现政务云智能化与市民化 [7] 政务AI应用体系与效能提升 - 龙岗已形成政务AI"1+1+4+N"应用体系 包括一个政务智能体百千万共创平台、一个全国产大模型基座、4个核心领域及N个应用场景 [6] - 4个核心领域涵盖市民和企业服务、民意速办、政务办公、城市治理 通过AI原生赋能实现事件秒级直达处置人员 [6] - 居民诉求响应速度从过去一两天缩短至秒级触达 "一网统管"平台通过AI赋能事件处置全流程 [6] 数字生活空间4T for Home项目 - 项目依托4T底座构建八大场景 包括政务办事、数字家园、龙岗家医、虚拟社区、本地生活、信息资讯、学习成长、数据账户 [3] - 4T指T级存储空间、T级网络流量、T级公共资源、亿级人工智能大模型Tokens 实现物理世界权利向数字世界映射 [8][9] - 未来居民可通过"我的龙岗APP"搭建数字生活空间 基于个人数据训练专属私人AI助手 [10] 城市+AI应用场景拓展 - 龙岗首批40个城市+AI应用场景已基本落地 涵盖环卫机器人、医疗大模型导诊系统、智能巡逻机器人等领域 [11] - 新发布第二批应用场景清单 覆盖21个重点领域424个具体场景 其中建筑领域126个场景 医疗领域59个场景 [11] - 计划三年内拿出百亿政府订单支持新技术试点应用 未来两年培育200万名昇腾开发者 [12] 智慧城市战略演进 - 龙岗智慧政务布局超十年 从智慧龙岗1.0政务云底座到2.0"鲲鹏+昇腾"国产底座 现已全面实施All in AI战略 [6] - 年初在政务领域部署满血版DeepSeek 全面赋能政务服务与城市治理 [6] - 通过CANN异构计算架构提升昇腾AI处理器计算效率 构建对上支持多种AI框架、对下服务AI处理器的核心平台 [12]
纳斯达克中国金龙指数收涨0.87%;激光雷达龙头禾赛科技再获Robotaxi公司大订单金额超4000万美元——《投资早参》
每日经济新闻· 2025-09-16 01:36
美股市场表现 - 美股三大指数集体收涨 道指涨0.11% 标普500指数涨0.47% 纳斯达克综合指数涨0.94% 标普500指数和纳指创收盘新高 [1] - 大型科技股普涨 谷歌涨超4% 成为第四家市值超过3万亿美元的美股上市公司 特斯拉和甲骨文涨超3% [1] - 中概股多数上涨 纳斯达克中国金龙指数收涨0.87% 理想汽车涨超6% 哔哩哔哩涨超5% 蔚来涨超4% 小鹏汽车涨超2% 阿里巴巴 拼多多和网易涨超1% [1] 商品及欧洲市场 - 国际贵金属期货普遍收涨 COMEX黄金期货涨0.90% 报3719.50美元/盎司 COMEX白银期货涨0.84% 报43.19美元/盎司 [1] - 国际油价小幅走强 美油主力合约收涨0.94% 报63.28美元/桶 布伦特原油主力合约涨0.69% 报67.45美元/桶 [1] - 欧洲三大股指收盘涨跌不一 德国DAX指数涨0.21%报23748.86点 法国CAC40指数涨0.92%报7896.93点 英国富时100指数跌0.07%报9277.03点 [1] 华为CANN开源 - 华为将于2025年9月19日召开CANN全面开源开放专题会议 开源开放CANN架构旨在打破英伟达对AI开发生态的垄断 [2] - CANN是华为昇腾AI编程语言 对标英伟达CUDA和AMD ROCm 是高效调用昇腾的关键 包含近3000个算子 数量与CUDA相当 [2] - 开源目的是激励开发者使用CANN 创造算子丰富华为生态 扩大昇腾影响力 寻找合作伙伴共建生态 概念股包括同有科技 东方国信和皖通科技 [2] 英伟达散热技术 - 英伟达要求供应商开发MLCP技术 单价为现有散热方案3-5倍 以应对AI新平台Rubin与下一代Feynman平台高达2000W以上的功耗 [3] - MLCP是一种微米级水冷板散热组件 通过蚀刻水道尺寸降低至微米级别 实现均热板 水冷板 IHS封装顶盖和裸晶的高度整合 提升散热效率 [3] - 算力散热产业链正从技术突破转向规模化应用 AI大模型训练算力需求3-4个月翻一番 概念股包括高澜股份 南风股份和飞荣达 [3] 激光雷达产业 - 禾赛科技与美国头部Robotaxi公司签订超过4000万美元激光雷达订单 作为唯一供应商提供远距和近距产品 计划2026年底前完成交付 [4] - 激光雷达单颗成本从数万元降至2000-3000元 价格下降带来主机厂出货量提升 主要主机厂销售毛利率逐步探底回升 [4][5] - 八部门发文推动智能网联技术产业化应用 有条件批准L3级车型生产准入 NOA和Robotaxi渗透率提升 AEB强制上车 概念股包括联合光电 宇瞳光学和万集科技 [4][5] 股东减持动态 - 海力风电持股9.99%股东沙德权计划减持不超过200万股 [6] - 北纬科技持股3.63%董事许建国计划减持不超过507.08万股 占公司总股本0.91% [6] - 日科化学股东赵东升计划减持不超过599.69万股 占公司总股本1.29% [6] - 逸豪新材持股5.51%股东计划减持不超过165.5万股 占公司总股本1% [6] - 华光新材持股9.6%股东铧广投资计划减持不超过270万股 占公司总股本2.9972% [6] - 中源家居持股28.93%实际控制人曹勇计划减持不超过378.57万股 占公司总股本3% [6] - 经纬恒润持股11.51%股东兼董事曹旭明计划减持不超过100万股 占公司总股本0.8336% [7] - 中创环保持股4.22%股东计划减持不超过770.98万股 占公司总股本2% [7] - 德林海持股1.79%董事孙阳计划减持不超过50.56万股 占公司总股本0.4474% [7] - 爱仕达控股股东一致行动人富创投资计划减持不超过1021.92万股 占公司总股本3% [7] 股东增持动态 - 上海医药控股股东上实集团计划通过子公司增持公司H股5500万股至7400万股 不超过公司有投票权股份数的2% [8]
昇腾刘伟:计算产业是生态产业,开源是为让生态加速前进
搜狐财经· 2025-08-28 09:09
公司战略与生态建设 - 华为通过开源开放策略构建算力生态,宣布昇腾硬件使能CANN全面开源开放,Mind系列应用使能套件及工具链全面开源,支持用户自主深度挖潜和自定义开发 [3] - 公司推出"xPN先锋行动"全方位支持伙伴,共同推动千行万业数智化升级,包括投入800万助力伙伴拓展研发、营销和销供服全生命周期 [1][10] - 华为计算产品2025年全面升级,开放鲲鹏模组、昇腾板卡等,支持伙伴开发边端AI产品,部件伙伴业务实现翻番增长 [6] 产品与技术布局 - 昇腾部件产品覆盖AI全场景,从模组到标卡共9款,2025年下半年实施从低算力到高算力全面覆盖边端场景策略,重点投入Atlas 300I A2和310模组 [4] - 鲲鹏模组集成网络、核心电源、桥片及内存,伙伴可快速开发产品,计划推出8核和12核低算力产品实现全系算力覆盖 [9][12] - CANN作为神经网络异构计算架构,连接上层AI训练框架和底层昇腾芯片,2025年底将完成A2版本开源 [3][4] 伙伴生态与协同成果 - 通过APN和KPN两大伙伴计划构建生态,截至2025年昇腾APN伙伴已发展到100多家,累计开发产品100多款,鲲鹏KPN伙伴发展100多家,基于鲲鹏模组开发产品达70多款 [8] - 伙伴协同创新案例包括:图灵智感基于昇腾算力开发智能病房监护系统,北京杰创永恒科技推出算力达20TOPS的启智01开发者套件 [8][9] - 软通华方基于华为全栈方案实现端侧70B、32B模型部署,北京乐研科技基于鲲鹏模组打造高接口密度平台 [11] 市场拓展与目标规划 - 华为2025年xPN伙伴业务目标增长350%,基于客户需求和支撑能力设定,提出"数智世界 一触即达"战略目标 [12] - 营销支持包括全开放营销资源、专项营销资金支持,通过空中覆盖和地面活动支持伙伴,商机共享达30亿 [10] - 供应稳定性表现显著,累计14天齐套比例达成73%,通过满天星计划提升伙伴服务能力 [10] 行业应用与场景落地 - 算力应用覆盖教育、政务、医疗、制造等多个行业,在教育场景支持六四级考试、长文本处理及多模态处理 [11] - 政务应急场景实现部门级算力需求,网络安全领域满足不同场景接口组合需求 [11] - 算力架构实现云边端协同,从数据中心侧延伸到边端,使算力同宗同族更便利 [11]
华为:下半年昇腾将从低算力到高算力全面覆盖边端场景,CANN年底完成A2版本开源
新浪科技· 2025-08-16 10:21
公司业绩与增长 - 2024年公司中国区政企业务同比增长25% [3] - 中国区政企计算产业增长80% [3] - 钻金银伙伴数量增长25% 商业交易伙伴数量增长22% [3] - 部件伙伴业务增长翻番 [3] 产品与技术布局 - 鲲鹏模组和昇腾板卡全面开放 [3] - 昇腾部件产品覆盖AI全场景 从模组到标卡共9款 [4] - 鲲鹏算力增长率10倍于x86算力 [4] - 2025年下半年昇腾将实施从低算力到高算力全面覆盖边端场景的策略 [4] 生态伙伴体系 - 已认证APN伙伴近30家 KPN伙伴20+家 [3] - 推出APN和KPN计划深化合作 [3] - 与50+伙伴打造70+款产品 [4] - 布局"1+N+X"全国生态支持创新中心 [4] 战略举措与规划 - 发布"xPN先锋行动" 从研营销供服全方位支撑伙伴 [1][5] - CANN全面开源开放 2025年底完成A2版本开源 [4] - 昇腾重点投入Atlas 300I A2和310模组 [4] - 鲲鹏持续开放助力伙伴创新 推出多系列模组且算力全覆盖 [4]
计算机行业月报:海外AI投入加大,国产基础软硬加速发展-20250815
中原证券· 2025-08-15 14:09
行业投资评级 - 给予计算机行业"强于大市"的投资评级,维持原有评级不变 [1][4] 核心观点 AI领域 - GPT-5性能虽有提升但未实现代际突破,评分领先但优势有限,API调用价格较R1提升127%-357% [3][34][70] - 阿里Qwen3-235B-A22B-Thinking-2507成为全球最强开源模型,位居第一梯队 [3][35][75] - 2025年7月大模型中标项目574个,金额13.35亿元,同比分别增长422%和540% [3][80][82] - AI在广告、云业务等方向为科技大厂带来显著经济效益,Meta广告转化率提升3-5%,微软Copilot月活超1亿 [92][93] 国产化领域 - 2025年1-6月基础软件收入增长13.8%,连续4个月回升,高于行业增速1.9 PCT [3][19] - 国产AI芯片加速发展,2024年下半年国产化率从20%提升至34%,寒武纪2025Q1收入同比增长4230% [94][100][102] - 华为开源CANN加速AI生态建设,对标英伟达CUDA [115][116] - 鸿蒙电脑操作系统适配应用超2500款,C端销售良好 [126][130] 算力领域 - 2025Q2美国6大科技厂商资本开支达999.73亿美元,同比增长77%,甲骨文增速超200% [4][150][152] - 海外云巨头上调资本开支计划,微软预计2026财年Q1超300亿美元,谷歌上调至850亿美元 [150][153] - 2025年大规模智算中心将集中交付,润泽科技计划交付200MW新一代智算中心 [143][148] - 液冷技术加速落地,微软所有区域支持液冷,超节点全面拥抱液冷 [4][8] 行业数据 整体表现 - 2025年1-6月软件业务收入7.06万亿元,同比增长11.9%,增速较1-5月回升0.7 PCT [13][16] - 软件业务利润总额8581亿元,同比增长12.0%,增速连续两个月放缓 [14][17] - 软件出口金额283亿美元,同比增长5.3%,为2022年1-9月以来最高值 [15][18] 细分领域 - IC设计子行业增长18.8%,高于行业增速6.9 PCT [18][23] - 云服务和大数据服务增长12.1%,受AI应用带动增速加快 [18][23] - 基础软件增长13.8%,连续4个月回升,高于行业增速1.9 PCT [19][24] - 工业软件增长8.8%,景气度偏弱 [20][24]
计算机行业双周报(2025、8、1-2025、8、14):GPT-5正式发布,关注AI应用及AI算力投资机遇-20250815
东莞证券· 2025-08-15 08:07
行业投资评级 - 计算机行业评级为"超配"(维持)[1] 核心观点 - GPT-5正式发布,推动AI应用向深度自主决策演进,建议关注AI应用及AI算力投资机遇[1][26] - GPT-5系列模型在编程能力、幻觉降低和价格优势方面显著提升,API定价低于GPT-4o及竞品[26] - 中国多数AI模型使用的中文数据占比超60%,部分已达80%,中文数据供给能力持续增强[20][22] 行业行情回顾 - 申万计算机板块近2周累计上涨3.17%,跑赢沪深300指数0.77个百分点,年内累计上涨16.67%[9][12] - 板块PE TTM为56.04倍,处于近5年91.48%分位、近10年82.35%分位[19][21] - 涨幅前三公司:淳中科技(79.38%)、佳缘科技(77.50%)、华胜天成(63.10%)[15] 产业动态 - OpenAI发布GPT-5,编程能力刷新纪录,事实错误率较GPT-4o降低45%[20][26] - 华为开源昇腾CANN并发布UCM推理加速技术,计划9月开源[20][22] - 谷歌DeepMind推出世界模型Genie 3,可生成实时交互式3D环境[20] - 浪潮信息发布超节点AI服务器"元脑SD200",支持万亿参数大模型单机运行[22] 重点公司公告 - 海康威视:上半年营收418.18亿元(+1.48%),创新业务占比提升至28.14%[23] - 中科曙光:上半年净利润7.31亿元(+29.89%),参股子公司收益增长显著[23] - 城地香江:签订IDC托管协议,6年合同总价预计不超过45.27亿元[24] - 德赛西威:智能驾驶业务收入41.47亿元(+55.49%),带动整体业绩增长[25] 建议关注标的 - 广电运通:金融科技主业稳健,布局数据要素与算力[27] - 神州数码:鲲鹏+昇腾产业链核心伙伴[27] - 浪潮信息:AI服务器全球市占率连续3年第一[27] - 软通动力:鸿蒙生态核心合作伙伴,1100余款产品接入鸿蒙智联[27]
AI落地的关键堵点,华为用“黑科技”打通了
观察者网· 2025-08-15 04:06
AI推理性能瓶颈 - 传统Scaling Law遇到明显瓶颈 企业开始关注模型推理性能体验以推动商业落地和变现 [1] - AI推理算力需求已超过训练 GPT-5开放首周API调用量超20亿次/分钟 70%请求为复杂推理任务 火山引擎日均token调用量达16.4万亿 70%以上来自线上推理 [4] - 长文本处理 多轮对话以及复杂业务流程的推理需求日益增长 对推理性能要求愈发严苛 [4] 中国AI推理困境 - 基础设施投资仅为美国十分之一 面临算力卡阉割 HBM涨价禁运等困境 [1][6] - 国外主流大模型输出速度达200 tokens/s(时延5ms) 国内普遍小于60 tokens/s(时延50-100ms) 最大差距达10倍 [7] - 海外模型支持100万级Token上下文窗口 国内头部模型仅50万 长文本分析中遗漏关键信息概率超50% [7] 键值缓存技术挑战 - KV Cache需占用GPU显存存储历史Key/Value向量 长文本生成会挤爆HBM和DRAM [6] - Agentic AI时代到来导致KV Cache容量增长超出HBM承载能力 频繁内存溢出造成推理"失忆"和卡顿 [6] - 中国企业无法无限制堆卡 面临出口管制无法获得最先进算力卡和HBM [6] 华为UCM技术突破 - 通过分级缓存管理在HBM DRAM SSD等存储介质中按数据热度缓存 扩大推理上下文窗口10倍 [10][15] - 采用注意力稀疏技术识别KV Cache数据重要程度 分层分级缓存并流动 降低向量数量提升吞吐量 [17] - 将历史已处理结果缓存至外置共享存储 首token延迟降低90% 节省token by token时间 [13] 性能提升与成本优化 - 长序列场景下TPS提升2-22倍 降低每Token推理成本 为企业减负增效 [17] - 维持算力投入不变 仅增加小部分外置存储投资 改善推理效率并摊薄成本 [18] - 推动形成"用户体验提升-用户增长-企业加大投资-技术迭代"的正循环 [18] 金融场景应用验证 - 与中国银联合作解决长序列输入 并发时延和算力耗费三大核心难题 [19] - 在"客户之声"业务场景推理速度提升125倍 10秒精准识别客户高频问题 [21] - "营销策划"场景生成时间从数分钟缩短至10秒内 单台服务器支持超5人同时在线协作 [21] 技术开源与生态建设 - 华为宣布9月开源UCM 包含推理引擎插件 功能库和高性能存取适配器三大组件 [26] - 开放统一接口适配多类型推理引擎框架 算力及存储系统 推动生态繁荣 [28] - 差异化在于将专业存储纳入 通过软硬协同和算法库贡献丰富可靠的加速算法 [26] 行业意义与发展前景 - 降低对HBM依赖 将HBM优势发挥在更合适地方 填补中国AI推理生态关键环节 [18][26] - 解决Agentic AI时代显存不足和推理Token成本问题 可应用于千行百业 [23] - 推动中国AI产业进入良性商业正循环 为长远发展注入更强动力 [28]