寒武纪芯片
搜索文档
沐曦上市,他们投出四个千亿新贵
36氪· 2025-12-21 07:51
核心观点 - 联想创投作为联想集团的科技型CVC,凭借其“研究驱动”的投资策略和对“计算”作为硅基智能革命核心驱动力的前瞻判断,在中国算力崛起浪潮中取得了卓越的投资成果,其早期布局的“算力四贵”(寒武纪、海光信息、摩尔线程、沐曦)合计市值已超1.6万亿元,并构建了覆盖AI芯片、CPU、GPU及多元异构算力等领域的完整生态矩阵[1][3][7][11] 联想创投的投资策略与逻辑 - 投资策略根植于联想集团“端-边-云-网-智”新IT战略,将AI算力视为智能世界的“心脏”,并判断应用导向的大计算将使未来十年算力需求有百倍增长[4] - 坚持“研究驱动型”投资,每年从12月底到次年2月进行三个月深度行业研究,期间不投任何项目,以发现下一个大趋势[7] - 投资逻辑强调捕捉拥有国内稀缺、稳定的全建制世界级技术团队,且经历过完整芯片研发周期的企业[5][7] - 作为“科技型CVC”,其高命中率得益于集团基因与长久不变的研究驱动特点,并提醒自身需跳出主营业务视角,以更独立、前瞻的视角思考科技前沿[7][12] 关键投资案例与成果 - **寒武纪**:2017年从A轮开始投资,是当时中国市场上极少数从底层指令集和芯片架构层面为AI专门设计和优化的先行者,联想创投是仅有的参与其四轮融资的机构,公司市值最高突破6000亿元[4] - **海光信息**:投资时是少数几家同时具备高端CPU和GPU研发能力的企业之一,2024年9月股价达270元/股,较发行价翻超7倍,市值一度超6000亿元[5] - **摩尔线程与沐曦**:于2021年国产GPU尚在概念验证期时,即在两家企业的A轮融资中坚定出手,两家公司均在近期登陆科创板,市值达3000亿元级别[1][5] - **芯驰科技**:早期投资的车载计算芯片企业,2023年7月获得北京市、区两级10亿元战略投资,投后估值超140亿元[8] - **此芯科技**:2021年天使轮投资,其AI CPU芯片“此芯P1”端侧AI异构算力达45TOPS,可运行100亿参数以内的端侧大模型[8] - **无问芯穹**:公司成立仅一年四个月时累计完成近10亿元融资,联想创投参与了其2023年9月近5亿元的A轮融资及2024年11月近5亿元的A+轮融资[9] 构建的算力生态与技术矩阵 - 已构建技术互补的算力生态矩阵:寒武纪主打AI专用芯片;海光信息走x86兼容路线;摩尔线程做全功能GPU;沐曦聚焦数据中心GPU[7] - 生态协同价值显著:寒武纪芯片集成于联想AI服务器;海光CPU/DCU用于联想超算集群;摩尔线程GPU适配联想游戏本与工作站;与沐曦联合推出“DeepSeek国产AI一体机”[10] - 生态合作缩短被投企业市场验证期,实现规模化落地,同时反哺联想全产业链布局,创造远超账面回报的价值[10] 对未来投资方向的判断与布局 - 坚信中国在“超级科技大工程”时代拥有独特优势,重点关注颠覆性计算架构的革命,包括存算一体、量子计算、RISC-V及类脑计算等技术驱动的突破[11] - 认为硅基智能革命的核心驱动力是“计算”,其广义概念包含存储、计算、互联通信,构成AI的计算底座,并需辅以大量的新型AI终端(如AI PC、穿戴、具身、低空设备等)[11] - 已在存算一体、量子计算、RISC-V、类脑计算等颠覆性技术领域布局华翊量子、图灵量子、进迭时空、清程极智等企业[12] - 投资历程紧跟科技发展:2016年投产业互联网、AI 1.0;2017年起投资芯片半导体;前几年布局算力;近两年押注AI 2.0、机器人2.0[13]
寒武纪获评钛媒体2025EDGE AWARDS「最具投资价值上市公司」
搜狐财经· 2025-12-21 06:01
公司荣誉与市场认可 - 寒武纪入选钛媒体2025 EDGE AWARDS全球创新评选的年度上市公司价值榜,荣膺最具投资价值上市公司 [1] 公司近期财务表现 - 第三季度实现营业收入17.27亿元人民币,同比增长1332.52% [1] - 第三季度实现归母净利润5.67亿元人民币,同比实现扭亏为盈 [1] - 前三季度累计实现营业收入46.07亿元人民币,同比增长2386.38% [1] - 前三季度累计实现归母净利润16.05亿元人民币,同比实现扭亏为盈 [1]
商汤日日新Seko系列模型与寒武纪成功适配,国产算力&多模态AI实现关键跨越
格隆汇· 2025-12-15 06:05
▪提升算力利用率与成本效率:通过算子融合、算子自动调优等,推进更高效的计算与存储方式,降低 模型运行所需的资源占用,让更多企业能够以更低成本获得高性能的多模态能力。 ▪强化大规模并行处理能力:基于计算与通信并行等优化技术,优化跨硬件的调度与通信策略,提升复 杂任务在大规模集群中的运行效率与稳定性。 12月15日,商汤科技基于在生成式AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多 剧集生成智能体。该智能体在多剧集视频生成的一致性方面展现出显著优势,其背后依托的是商汤自研 的日日新Seko系列模型,包括SekoIDX、SekoTalk等图像与视频生成多模态模型所构建的技术底座。 商汤日日新Seko系列模型已完成对国产AI芯片寒武纪的适配,国产算力对AIGC核心场景的支持实现了 从语言到多模态的关键跨越。这不仅是技术协同的深化,更是国产AI生态的重要完善,为视觉内容的 创新开发提供了更坚实、自主的底层支撑。 其中,商汤LightX2V框架设计了强兼容的国产化适配插件模式,可快速完成各类国产硬件的适配,目 前已支持寒武纪等多款国产芯片;为了更好释放国产算力优势,Seko系列模型与LightX2V ...
多项成果登上国际榜单 中国大模型正跻身全球第一梯队
科技日报· 2025-12-08 02:12
中国大模型全球竞争力 - 中国大模型在全球竞技场排名名列前茅,例如百度文心大模型文本能力位列全球第二、国内第一,视觉理解能力位居国内第一、全球前列,智谱GLM-4.6模型在代码能力方面比肩国际主流模型 [1] - 中国大模型正进入全球第一梯队,成为引领生产力跃迁式发展的智能底座 [1] - 截至今年7月,中国已发布1509个大模型,数量位居全球首位,占全球大模型总数的40% [2] - 到2024年底,中外顶尖模型之间的性能已不相上下 [2] 技术创新与架构突破 - 技术迭代速度被视为唯一的“护城河”,大模型能力已逐步走出聊天机器人范畴,在数字人、代码智能体及寻找“全局最优解”等技术上均有长足发展 [1] - 百度文心大模型5.0作为新一代原生全模态大模型,参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力 [2] - 模型底层设计摒弃了“拼接”不同信息模块的思路,构建了单一连贯的框架,使其能同时理解和生成文本、图像、音频、视频等多元信息,为实现更深层次“通感”智能奠定基础 [2] 开源生态与全球影响力 - 过去一年,中国研发的开源人工智能模型全球下载量占比达到17.1%,超越美国的15.8%,位居全球第一 [3] - 百度文心多模态思考模型接连登顶Hugging Face全球模型总趋势榜和全球多模态模型趋势榜 [3] - 百度已主导1000多项开源项目,累计社区贡献者超2.1万 [3] 全产业链自主可控与生态构建 - 大模型的竞争是底层硬件、平台生态等的全方位竞争,国产AI算力芯片(如昆仑芯、昇腾、寒武纪)快速崛起 [3] - 百度最新发布的新一代昆仑芯产品在性能和成本上实现大幅改善,提供更具性价比的AI算力 [3] - 百度飞桨、华为昇思、旷视天元等自主AI开发平台为大模型落地提供了“好上手、接地气”的成套解决方案 [3] - 百度已构建覆盖“芯片—框架—模型—应用”的全链条自主可控能力 [4] 应用落地与市场规模 - 中国凭借超大规模人口和丰富行业应用场景,已成为全球规模最大、场景最丰富、发展最迅速的大模型“试验场” [3] - 在电力领域,百度支持国家电网推出光明电力大模型,建成覆盖总部及27家省级分公司的统一AI平台,推广无人机智能巡检实现年巡检杆塔500万基,减少人工登塔次数40% [4] - 大模型技术已广泛应用于教育、医疗、金融、智能制造等领域 [4] - 飞桨文心生态开发者已达到2333万,服务企业达到76万家 [4]
“小作文”突袭 尾盘猛拉!寒武纪 严正声明
中国基金报· 2025-12-04 15:18
市场传言与公司澄清 - 12月4日下午市场流传关于寒武纪产品、客户、供应及产能预测的“小作文” [1] - 传言称寒武纪明年将大幅提升产能,目标为填补英伟达退出中国市场的空白份额 [4] - 公司于12月4日晚间发布严正声明,称上述信息均为误导市场的不实信息 [1][2] - 公司提醒投资者以公开披露信息为准,并保留追究散布不实信息者法律责任的权利 [3] 股价市场反应 - 受市场传言影响,寒武纪股价于12月4日尾盘放量快速拉升 [1][4] - 公司股价收盘上涨2.75%,报1369元/股 [6][7] - 当日早盘,公司股价一度下跌近3% [6] - 截至12月4日收盘,公司总市值为5773亿元 [7] - 今年以来,公司股价累计涨幅达108% [7] 机构观点与行业前景 - 华尔街知名投资机构Bernstein将寒武纪评级上调至“跑赢大盘”,目标价为2000元 [8] - 第一上海证券指出AI应用加速落地,寒武纪大客户需求展望积极 [8] - 寒武纪产品在特定场景大模型训练与推理、智能视觉、语音处理、推荐系统等典型AI场景中表现优异 [8] - 国产算力替代加速,供需缺口亟待填补,面对万亿元级市场,国产供应链已取得积极进展 [8] - 国产芯片将在未来数年持续抢占市场,寒武纪凭借技术能力和先发优势,有望在新一轮国产算力投资周期中获得显著市场份额 [8]
“小作文”突袭,尾盘猛拉!寒武纪,严正声明
中国基金报· 2025-12-04 14:49
公司声明与市场传闻 - 公司于12月4日晚间发布严正声明,称当日媒体及网络传播的关于其产品、客户、供应及产能预测等相关信息均为误导市场的不实信息[2][4] - 公司提醒投资者以公开披露信息为准,并表示将保留追究捏造、散布不实信息者法律责任的权利[6][7] - 12月4日下午,市场流传“小作文”传言,称公司明年将大幅提升产能,目标为填补英伟达退出中国市场的空白份额[9] 股价市场表现 - 受市场传闻影响,公司股价于12月4日尾盘放量快速拉升,收盘上涨2.75%[2][11] - 公司股价当日早盘一度下跌近3%,随后震荡拉升,最终收于1369元/股,总市值达5773亿元[11] - 今年以来,公司股价累计涨幅已达108%[11] 机构观点与行业前景 - 华尔街知名投资机构Bernstein将公司评级上调至“跑赢大盘”,目标价为2000元[13] - 第一上海证券指出,AI应用加速落地,大客户需求展望积极,公司产品在特定场景大模型训练与推理、智能视觉、语音处理、推荐系统等典型AI场景中表现优异[13] - 行业层面,国产算力替代加速,供需缺口亟待填补,面对万亿元级市场,国产供应链已取得积极进展,国产芯片将在未来数年持续抢占市场[13] - 公司凭借自身技术能力和先发优势,有望在新一轮国产算力投资周期中获得显著市场份额[13]
重大利好传来,消费股尾盘爆发,电子半导体狂掀涨停潮
21世纪经济报道· 2025-11-26 08:20
市场整体表现 - 深成指收盘12907.83点,上涨130.52点,涨幅1.02% [1][2] - 创业板指收盘3044.69点,上涨63.76点,涨幅2.14%,盘中一度涨超3% [1][2] - 上证指数收盘3864.18点,下跌5.84点,跌幅0.15% [2] - 沪深两市成交额1.78万亿,较上一个交易日缩量288亿 [1] - 全市场1689只个股上涨,超3500只个股下跌 [1] 消费板块 - 大消费板块尾盘爆发,海欣食品、广百股份、东百集团、三江购物等多股涨停 [2] - 欢乐家、益客食品等多股快速拉升 [2] - 消息面上,工信部等六部门印发促消费重磅文件,计划到2027年形成3个万亿级消费领域和10个千亿级消费热点 [3] 半导体及电子板块 - 半导体、电子板块全日走高,光模块、光通信、光芯片等概念股活跃 [5] - 长光华芯、明微电子、东芯股份20%涨停,英集芯、赛微电子、乾照光电大涨超10% [5] - 博通集成、国晟科技10%涨停,新易盛、微导纳米、剑桥科技、燕东微、灿芯股份等个股跟涨 [5] - 中际旭创涨超13%,再创历史新高,总市值突破6000亿元,近120个交易日涨近500%,年内涨幅达342% [5] - 消息面上,阿里巴巴2026财年第二季度云收入同比增长34%,AI相关产品收入连续9个季度实现三位数同比增长 [5] - 上海芯上微装自主研发的首台350nm步进光刻机正式完成出厂调试与验收 [5] - 国产AI芯片自主可控进展顺利,阿里自研含光系列AI推理芯片、华为昇腾、寒武纪等自研AI芯片持续迭代 [5] 下跌板块 - 军工板块走弱,久之洋跌超12% [6] - 林业、游戏等板块跌幅居前 [6] 万科相关 - 万科债普遍下跌,"22万科02"盘中跌超30%,收盘跌超17% [7] - "21万科06"、"21万科04"跌超11%,"22万科04"跌超8%,"21万科02"跌超7% [7] - 多只万科债因跌幅较大而临停 [7] - 万科A股收跌2.5%,盘中创下阶段新低 [9] - 港股万科企业跌超6%,股价跌破4港元,创2024年9月以来新低 [9] - 深铁集团将向万科提供不超过220亿元的股东借款额度,专项用于偿还公司公开市场债券本息及指定借款利息 [9]
重大利好传来,消费股尾盘爆发,电子半导体狂掀涨停潮,中际旭创120个交易日涨近500%
21世纪经济报道· 2025-11-26 07:56
市场整体表现 - 创业板指低开高走 收盘上涨2.14% 盘中一度涨超3% [1] - 沪深两市成交额1.78万亿元 较前一交易日缩量288亿元 [1] - 全市场1689只个股上涨 超过3500只个股下跌 [1] 消费板块 - 大消费板块尾盘爆发 多只个股涨停 包括海欣食品、广百股份、东百集团、三江购物 [1] - 欢乐家、益客食品等多股快速拉升 [1] - 工信部等六部门印发促消费文件 目标到2027年形成3个万亿级消费领域和10个千亿级消费热点 [1] 半导体及电子板块 - 半导体、电子板块全日走高 光模块、光通信、光芯片等概念股活跃 [2] - 长光华芯、明微电子、东芯股份20%涨停 英集芯、赛微电子、乾照光电大涨超10% [2] - 博通集成、国晟科技10%涨停 新易盛、微导纳米、剑桥科技、燕东微、灿芯股份等个股跟涨 [2] 中际旭创个股表现 - 中际旭创股价上涨超13% 再创历史新高 总市值突破6000亿元 [3] - 该股近120个交易日涨幅近500% 年内涨幅达342% [3][4] - 5日涨幅11.18% 20日涨幅4.32% 60日涨幅73.18% 250日涨幅288.58% [4] 半导体及AI产业利好 - 阿里巴巴2026财年第二季度云收入同比增长34% AI相关产品收入连续9个季度实现三位数同比增长 [5] - 上海芯上微装自主研发的首台350nm步进光刻机完成出厂调试与验收 [5] - 国产AI芯片自主可控进展顺利 阿里含光系列、华为昇腾、寒武纪等自研AI芯片持续迭代 [5] 下跌板块 - 军工板块走弱 久之洋股价下跌超12% [6] - 林业、游戏等板块跌幅居前 [6] 万科相关债券及股票 - 万科债普遍下跌 "22万科02"盘中跌超30% 收盘跌超17% [7] - "21万科06"、"21万科04"跌超11% "22万科04"跌超8% "21万科02"跌超7% [7] - 多只债券因跌幅较大触发临停 [7] - 万科A股收跌2.5% 盘中创阶段新低 港股万科企业跌超6% 股价跌破4港元创2024年9月以来新低 [9] - 深铁集团将向万科提供不超过220亿元的股东借款额度 专项用于偿还公开市场债券本息及指定借款利息 [9]
重大利好传来,消费股尾盘爆发,电子半导体狂掀涨停潮,中际旭创120个交易日涨近500%
21世纪经济报道· 2025-11-26 07:52
市场整体表现 - 深成指收盘12907.83点,上涨130.52点,涨幅1.02% [1][2] - 创业板指收盘3044.69点,上涨63.76点,涨幅2.14%,盘中一度涨超3% [1][2] - 上证指数收盘3864.18点,下跌5.84点,跌幅0.15% [2] - 沪深两市成交额1.78万亿元,较上一交易日缩量288亿元 [1] - 全市场1689只个股上涨,超过3500只个股下跌 [1] 大消费板块 - 大消费板块尾盘爆发,海欣食品、广百股份、东百集团、三江购物等多股涨停 [3] - 欢乐家、益客食品等多股快速拉升 [3] - 工信部等六部门印发促销费文件,目标到2027年形成3个万亿级消费领域和10个千亿级消费热点 [3] 半导体及电子板块 - 半导体、电子板块全日走高,光模块、光通信、光芯片等概念股活跃 [4] - 长光华芯、明微电子、东芯股份20%涨停,英集芯、赛微电子、乾照光电大涨超10% [4] - 博通集成、国晟科技10%涨停,新易盛、微导纳米、剑桥科技、燕东微、灿芯股份等个股跟涨 [4] - 中际旭创涨超13%,再创历史新高,总市值突破6000亿元,近120个交易日涨近500%,年内涨幅达342% [4][5] - 上海芯上微装自主研发的首台350nm步进光刻机正式完成出厂调试与验收 [5] - 阿里巴巴云收入同比增长34%,AI相关产品收入连续9个季度实现三位数同比增长 [5] AI芯片国产化进展 - 国产AI芯片自主可控进展顺利,阿里自研含光系列AI推理芯片,叠加华为昇腾、寒武纪等自研AI芯片持续迭代 [6] - 自有芯片可替代外部供给,确保模型迭代与规模部署的连续性与可预期性 [6] 下跌板块及个股 - 军工板块走弱,久之洋跌超12% [6] - 林业、游戏等板块跌幅居前 [6] 万科债券及股价表现 - 万科债普遍探底回弹,"22万科02"盘中跌超30%,收盘跌超17% [7] - "21万科06"、"21万科04"跌超11%,"22万科04"跌超8%,"21万科02"跌超7% [7] - 盘中"22万科02"一度跌超35%,"21万科04"一度跌超30%,均二次临停 [7] - 万科A收跌2.5%,盘中创阶段新低,港股万科企业跌超6% [7] - 深铁集团将向万科提供不超过220亿元的股东借款额度,专项用于偿还公司公开市场债券本息及指定借款利息 [7]
2025年国产AI芯片软件生态白皮书
搜狐财经· 2025-11-21 20:17
行业背景与核心观点 - 在国际科技竞争背景下,国产AI芯片已形成多厂商、多技术路线并行的竞争格局,用户关注点从硬件算力转向软件生态的成熟度、兼容性与易用性,软件生态成为决定芯片价值释放与商业化落地的关键[1] - 国产AI芯片软件生态已从"基础可用"迈向"特定场景可用",形成"全栈生态"与"兼容生态"两大主流路径,行业协同与标准化建设初见成效,但在工具链完备性、生态成熟度及开发者规模上与国际主流仍有差距[1] - 未来需坚持"标准化、开源化、协同化"发展,通过产学研协同发力,推动国产AI芯片软件生态从"好用"向"卓越"跨越,筑牢自主可控的技术体系[1] AI芯片软件生态核心架构 - AI芯片软件生态由基础支撑层、核心工具层、框架适配层与管理监控层四层架构构成,各模块通过"技术依赖-功能协同"形成闭环,共同作用于AI模型的训练与推理过程[1][14] - 基础支撑层作为"翻译与调度中枢"负责硬件算力抽象与资源调度,主要包括芯片驱动、底层库和系统运行时等组件,相当于AI芯片的操作系统[1][17] - 核心工具层作为"性能优化引擎"涵盖编译器、算子库、通信库等优化工具,是让算力真正高效发挥的关键[1][20] - 框架适配层通过"国际主流框架+国产插件"与"国产自研框架+多硬件适配"两条路径降低开发者迁移成本[1][25] - 管理监控层提供监控与调度保障系统稳定运行,是系统稳定的"运维保障屏障"[1][31] 国产AI芯片分类及厂商生态 - 国产AI芯片可分为专用加速芯片(华为昇腾、寒武纪等)、通用计算型芯片(海光DCU等)、图形计算型芯片(摩尔线程、壁仞科技等)[1] - 代表性厂商生态各有侧重:华为昇腾构建全栈自主生态,摩尔线程以兼容CUDA降低迁移成本,寒武纪侧重推理场景优化,海光DCU适配"HPC+AI"融合负载[1] - 以华为昇腾、寒武纪、地平线、沐曦、燧原科技、海光信息、壁仞科技、摩尔线程及天数智芯等为代表的一批本土企业,已成功推出一系列具有市场竞争力的AI芯片产品,在国内市场形成了多厂商、多技术路线并行的活跃竞争格局[10] 基础支撑层技术实践 - 基础支撑层通过抽象硬件复杂性,让上层开发者无需直接处理寄存器、DMA等细节,例如摩尔线程的MUSA SDK提供了底层编译器和运行时库,屏蔽了GPU硬件细节[17] - 华为昇腾提供的CANN包含基础支撑层部分,封装了异腾AI处理器的指令集和算子,实现对硬件的抽象和使能,并已全面开源[17] - 寒武纪的NeuWare基础系统同时支持云端、边缘和终端各类芯片,提供统一的底层接口,方便智能应用在不同算力设备间迁移和调优[19] - 基础支撑层还需提供健康检测、故障隔离与版本兼容的能力,华为昇腾提供了npu-smi作为GPU信息查询接口,通过K8S设备插件等工具,上层调度器可感知AI芯片资源状态[19] 核心工具层技术实现 - 核心工具层涵盖模型编译器、算子库、性能分析和调优工具等,核心组成是AI编译器/执行引擎,负责将上层训练好的模型转换为适配芯片的高效执行方案[20] - 寒武纪的MagicMind推理加速引擎可将用户在PyTorch、TensorFlow等框架训练好的模型一键编译为思元芯片可执行的代码,内部集成了基于MLIR的图编译技术[22] - 高度优化的算子库和性能库提供基础数学运算和深度学习常用算子的实现,例如摩尔线程MUSA SDK包含muBLAS、muDNN等加速库,寒武纪的NeuWare提供CNNL以加速卷积、矩阵乘等算子运算[22] - 通信库是实现多芯片协同计算的关键工具,寒武纪NeuWare软件栈内置了CNCL通信库和Horovod分布式框架适配,摩尔线程MUSA SDK包含自研的MCCL,沐曦联合开源社区提供拓扑感知的通信方案[23][24] 框架适配层迁移路径 - 框架适配层通过扩展现有框架的设备类型和算子实现,让原有模型代码以极少改动跑在国产芯片上,典型做法是为框架增加新的设备标识(如npu、mlu、musa)[25] - 华为昇腾社区维护的torch npu仓库是面向Ascend NPU的PyTorch扩展,寒武纪提供CATCH/Torch-MLU等扩展,摩尔线程开源torch musa项目在PyTorch中新增MUSA设备类型[26] - 国产通用软件栈通过插件方式支持多家国产芯片,PaddlePaddle及其部署组件FastDeploy、PaddleX已支持在NVIDIA GPU、百度昆仑XPU、华为Ascend NPU、寒武纪MLU、海光DCU等多种硬件上无缝切换[27] - 国产自研框架如MindSpore+Ascend、MagicMind+MLU将框架执行后端与国产芯片紧密绑定,PaddlePaddle、计图等国产通用框架从设计之初就面向多家国产加速硬件[28][29] 管理监控层运维保障 - 管理监控层负责系统运行维护和资源管控,随着AI训练集群规模扩大,监控硬件状态并调度资源变得至关重要,成熟的算力生态配套完善的监控和调度系统[31] - 监控工具充当AI芯片运行状态的"实时感知载体",帮助运维人员和上层调度实时了解系统健康和性能状况,包括硬件层面的温度、电压、功耗、利用率等指标[33] - 国产AI集群将GPU或NPU的关键指标对接到现有运维平台,华为云ModelArts平台支持用户接入Prometheus来获取Ascend异腾集群的监控指标,沐曦开发mx-smi监控工具,寒武纪提供cambricon-smi[33] - 调度工具的核心任务是在多用户、多任务共享AI芯片集群的场景下合理分配硬件资源,提升集群吞吐,避免资源碎片,防止任务互相干扰,现代AI调度工具引入GPU切分共享、拓扑感知调度等创新机制[36]