夸娥万卡智算集群 - 财报，业绩电话会，研报，新闻

夸娥万卡智算集群

搜索文档

中金在线· 2025-12-21 07:42

核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及两款核心芯片，展示了其在AI训练、推理及图形渲染领域的性能突破，并宣布进军个人智算终端，标志着公司正从硬件供应商向平台级算力基础设施商转型 [1][2][10] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”，算力密度较上一代提升50%，能效提升10倍，支持从FP4到FP64全精度，集成AI生成式渲染架构和第二代光线追踪硬件加速引擎，计划明年量产 [1][2] - 基于“花港”架构公布两款核心芯片：“华山”主打AI训推一体和超智融合，内置新一代异步编程模型和全精度MMA，配备MTFP8/6/4混合低精度计算技术 [3] - 另一款芯片“庐山”专攻高性能图形渲染，AI计算性能较前代提升64倍，几何处理性能提升16倍，完整支持DirectX 12 Ultimate [3] 智算中心与集群性能 - 发布“夸娥”万卡智算集群，浮点运算能力达10 Exa-Flops，在Dense大模型上训练算力利用率达60%，在MOE大模型上为40%，有效训练时间占比超90% [5] - 展示推理性能突破：与硅基流动合作，在DeepSeek R1 671B全量模型上，MTT S5000单卡Prefill吞吐量突破4000 tokens/s，Decode吞吐量突破1000 tokens/s [6] - 分享面向下一代智算中心的MTT C256超节点架构规划，旨在通过高密硬件设计提升集群能效 [6] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本，核心计算库muDNN的GEMM/FlashAttention效率超98%，通信效率达97% [7] - 宣布开源计划，将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [7] - 计划推出兼容跨代GPU指令架构的中间语言MTX，以及面向渲染与AI融合计算的编程语言muLang，以降低开发适配门槛 [7] 个人智算终端与市场战略 - 正式进军个人智算终端硬件领域，发布首款AI算力本MTT AIBOOK，售价9999元（32GB+1TB版本），预计2026年1月10日开售 [8][9] - MTT AIBOOK搭载自研智能SoC芯片“长江”，集成高性能全大核CPU及全功能GPU，异构AI算力达50 TOPS，内置AI智能体、2D数字人和预装Qwen3-8B大模型，支持0.5秒生成数字人形象 [9] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统，旨在将MUSA生态从云端下沉至开发者桌面端，实现开发闭环 [9] 行业背景与公司定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [10] - 公司通过展示“花港”架构及“芯-边-端-云”全栈体系，试图摆脱单一硬件供应商身份，转向平台级算力基础设施商 [10] - 中国工程院院士郑纬民指出，发展“主权AI”核心在于算力自主、算法自强与生态自立，强调必须构建易用的国产芯片开发环境以留住开发者社群 [9] 资本市场表现 - 公司股价近期波动明显，12月19日收报664.10元/股，跌幅5.9%，较12月11日高点累计下跌29.4% [10] - 相较于发行价，当前股价涨幅仍超过481%，公司总市值维持在3121.46亿元的高位 [10]

摩尔线程发布“花港”GPU新架构，万卡AI训练与推理能力，剑指英伟达

凤凰网· 2025-12-21 06:18

凤凰网科技讯12月20日，摩尔线程在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU 架构"花港"，并展示了其万卡规模AI训练集群及多项技术进展。此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构"花港"支持从FP4到FP64的全精度计算，算力密度提升50%，能效实现10倍提升。基于该架构，公司计划推出专注于AI训练与推理的"华山"芯片，以及面向图形渲染的"庐山"芯片。在训练集群方面，摩尔线程推出"夸娥"万卡智算集群，称其具备全精度通用计算能力，训练算力利用率在稠密模型上达到60%，在混合专家模型上达40%，训练线性扩展效率为95%。在推理侧，公司与硅基流动合作，在DeepSeek R1671B模型上实现单卡Prefill吞吐量超过4000tokens/s，Decode吞吐量超过 1000tokens/s。软件生态方面，MUSA5.0版本对编程模型、计算库和编译器进行了优化，核心计算库muDNN的GEMM 与FlashAttention效率超过98%，通信效率达97%。公司还计划逐步开源部分核心组件，包括计算加速库与系统管理框架。在图形领域，新架构集成硬件 ...

全新架构、万卡集群、智算平台，摩尔线程（688795.SH）开发者大会还有哪些亮点？

智通财经网· 2025-12-20 23:23

核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品，展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局，战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”，算力密度较上一代提升50%，能效提升10倍，支持从FP4到FP64全精度，集成AI生成式渲染架构（AGR）和第二代光线追踪硬件加速引擎，计划明年量产 [1] - 基于“花港”架构公布两款核心芯片：“华山”主打AI训推一体和超智融合，内置新一代异步编程模型和全精度MMA，配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染，AI计算性能较前代提升64倍，几何处理性能提升16倍，完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群，浮点运算能力达10 Exa-Flops，在Dense大模型上的训练算力利用率（MFU）达60%，在MOE大模型上为40%，有效训练时间占比超90% [4] - 展示与硅基流动的合作成果，在DeepSeek R1 671B全量模型上，MTT S5000单卡的Prefill吞吐量突破4000 tokens/s，Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划，旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本，核心计算库muDNN的GEMM/FlashAttention效率超98%，通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX，以及面向渲染与AI融合计算的编程语言muLang，以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域，发布首款AI算力本MTT AIBOOK，售价9999元（32GB+1TB版本），预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”，集成高性能全大核CPU及全功能GPU，异构AI算力达50 TOPS，内置AI智能体和2D数字人“小麦”，支持0.5秒生成数字人形象，并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统，旨在将MUSA生态从云端下沉到开发者桌面端，实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系，反映出其试图摆脱单一硬件供应商身份，转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出，发展“主权AI”的核心在于算力自主、算法自强与生态自立，并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显，12月19日收报664.10元/股，跌幅5.9%，相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价，当前股价涨幅仍超过481%，公司总市值维持在3121.46亿元的高位 [9]

加速构建国产计算产业生态，多项国产GPU技术成果发布

北京日报客户端· 2025-12-20 13:43

除主论坛外，大会还设置了20余场技术分论坛与超过1000平方米的"MUSA嘉年华"沉浸式展区，全面呈现了国产GPU在AI大模型、科学智能、数字孪生、工业仿真、数字文娱、智慧医疗等前沿与产业场景中的应用潜力。海淀区委书记、中关村科学城党工委书记张革说，摩尔线程自2020年成立以来扎根海淀，专注于全功能 GPU自主研发，以"一年一芯片"的迭代速度推出四代产品，在AI智算、数字孪生等领域填补了国内技术空白，是海淀区硬科技企业创新发展的典型代表。本次大会不仅是企业技术成果的集中展示，也是海淀区人工智能与集成电路产业生态协同共进、向优发展的生动体现。 12月20日，首届摩尔线程MUSA开发者大会在中关村国际创新中心举办。大会上，不久前刚成功登陆资本市场的海淀全功能国产GPU企业摩尔线程集中发布了一系列技术与产品新成果，如计算提升50%、效能提升10倍的全功能GPU架构"花港"，在多项关键精度指标上达到国际主流水平的夸娥万卡智算集群等，推动国产GPU技术与生态实现进一步突破。中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲时指出，发展"主权AI"是提升未来国家竞争力的关键，其核心在于实现"算力自 ...

举办首届MUSA开发者大会摩尔线程现场展示落地成果

21世纪经济报道· 2025-12-20 13:39

推理性能实现跨越：摩尔线程联合硅基流动，在DeepSeek R1 671B全量模型上实现性能突破，MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，树立国产推理性能标杆。全新个人智算平台：正式发布搭载智能SoC芯片"长江"的AI算力本MTT AIBOOK，迷你型计算设备 MTT AICube。（文章来源：21世纪经济报道） 12月20日，摩尔线程于北京举办首届MUSA开发者大会。会上，摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果，并在现场展示落地成果。包括： "夸娥万卡"高效训练：发布夸娥万卡智算集群，展示了其支撑万亿参数模型训练的工程化能力与可靠性，在多项关键精度指标上达到国际主流水平。 ...

中国基金报· 2025-12-20 13:32

【导读】摩尔线程发布新一代GPU架构"花港"等 12月20日上午，备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此次大会上，摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果，包括新一代GPU架构"花港"、未来将发布的"华山"芯片和"庐山"芯片，以及夸娥万卡智算集群。发布新一代GPU架构"花港" MUSA是摩尔线程自主研发的元计算统一计算架构，是其战略基石，覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。 "华山"专注AI训推一体与超大规模智能计算，为万卡级智算集群提供稳定高效的算力支撑，是构建下一代"AI工厂"的坚实底座。 "庐山"专攻高性能图形渲染，其AI计算性能提升64倍，几何处理性能提升16倍，光线追踪性能提升50 倍，并显著增强纹理填充、原子访存能力及显存容量。推出夸娥万卡智算集群在此次大会上，摩尔线程还正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力，在万卡规模下能实现高效稳定的AI训练与推理。据摩尔线程介绍，其核心突破包括：浮点运算能力达到10Exa-Flops，训练算力利用率（MFU）在Dense ...

21世纪经济报道· 2025-12-20 13:32

记者丨彭新编辑丨朱益民在登陆科创板近半月之际，12月20日，摩尔线程（688795.SH）于北京举办首届MUSA开发者大会。构和上一代Hopper架构之间，而在访存容量指标上优于上述两个架构。同步发布的"庐山"芯片则侧重于高性能图形渲染，其AI计算性能提升64倍，几何处理性能提升 16倍，光线追踪性能提升50倍，并增强了纹理填充和显存容量。会上，摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果，并发布下一代全功能 GPU架构"花港"。基于该架构，摩尔线程推出面向AI训推一体的"华山"芯片及高性能图形渲染的"庐山"芯片，并展示了"夸娥"万卡智算集群技术成果与搭载"长江"SoC芯片的端侧AI产品。 MUSA（Meta-computing Unified System Architecture）为摩尔线程自主研发的"元计算"统一计算架构，覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。其中，新一代GPU架构"花港"最受关注。 "大家知道，目前的芯片代工工艺发展确实面临一些客观的、缓慢的挑战。但我们要不要停下来等？不能。'花港'的意义在于，我们通过全新的指令 ...

上海证券报· 2025-12-20 13:24

核心观点 - 摩尔线程在首届MUSA开发者大会上，首次公开了其全功能GPU技术路线图，并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展，标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈，并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本，在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”，基于新一代指令集，支持FP4到FP64的全精度计算，算力密度提升50%，能效提升10倍，可支持十万卡以上规模智算集群 [3] - 基于“花港”架构，公布了未来两款芯片技术路线：“华山”专注AI训推一体与超大规模智能计算，支持从FP4至FP64的全精度计算，为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染，其AI计算性能提升64倍，几何处理性能提升16倍，光线追踪性能提升50倍，并显著增强纹理填充、原子访存能力及显存容量，集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群，具备全精度、全功能通用计算能力，在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops，训练算力利用率在Dense大模型上达60%，在MOE大模型上达40%，有效训练时间占比超过90%，训练线性扩展效率达95% [7] - 推理侧，联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破，MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧，基于原生FP8能力完整复现顶尖大模型训练流程，Flash Attention算力利用率超95%，并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划，采用计算与交换一体化的高密设计，旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API，并将完整支持DirectX 12 Ultimate，与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破：基于“花港”架构的硬件光线追踪加速引擎，可支持DirectX Raytracing；推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台，深度融合物理、渲染与AI三大引擎，构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在，致力于以开放创新深化与生态伙伴的协同，共同构建国产计算产业生态 [11] - 以摩尔学院为平台，已构建产教融合的开发者成长体系，目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校，吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK，提供50TOPS的端侧AI算力，实现了专业AI开发的“开箱即用”，并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube，进一步丰富端侧计算产品形态 [12]

虎嗅APP· 2025-12-20 13:20

出品 | 虎嗅科技组作者 | 丸都山编辑 | 苗正卿头图 | 摩尔线程在资本市场的热度趋于平静之时，摩尔线程又在产业端将人们的视线拉回。 12月20日，摩尔线程举行了首届"MUSA开发者大会"，发布全新一代全功能GPU架构"花港"，以及基于"花港"架构打造的AI训推一体芯片"华山"，以及专用于高性能图形渲染的芯片"庐山"。此外，摩尔线程创始人张建中在现场还公布了"夸娥万卡智算集群"，以及未来即将发布的MTT C256超节点结构规划。如果说上述内容还属于"可预测的"技术迭代内，那么诸如中间语言MTX，以及光刻计算库、量子计算融合框架等技术，就真的完全在人意料之外了。在此前几次版本迭代中，MUSA主要集中在编程生态的扩充，比容兼容更多编程语言，或是丰富算子库上，而今天提到的"中间语言MTX"属首次出现。简单解释下中间语言MTX是什么。它的核心作用是兼容不同代际GPU的指令架构，让开发者无需为每一代新GPU重新适配代码，大幅降低开发者适配成本，同时为上层软件生态提供稳定的底层支撑。用个更直观的例子来说明下：在英伟达CUDA生态下，其核心底层组件之一，就是这个中间语言技术，英伟达将其命名 ...

是说芯语· 2025-12-20 11:56

公司战略与架构发布 - 在首届MUSA开发者大会上，公司董事长兼CEO张建中系统阐述了以MUSA为核心的全栈发展战略，并发布了新一代GPU架构“花港” [1] - 新一代“花港”架构基于新一代指令集，算力密度提升50%，能效提升10倍，可支持十万卡以上规模智算集群 [1] - 公司全功能GPU主要包括四大功能引擎：AI计算加速引擎、图形渲染引擎、物理仿真和科学计算引擎、超高清视频编解码引擎，MUSA是支撑这些引擎的系统架构 [1] 产品与技术迭代 - 公司MUSA架构基本保持一年迭代一代，已从2022年的“苏堤”、2023年的“春晓”、2024年的“曲院”进化到2025年的“平湖” [2] - “花港”架构支持FP4到FP64的全精度计算，未来将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片 [2] - 公司分享了面向下一代超大规模智算中心的MTT C256超节点架构规划 [2] - 公司在图形领域实现硬件级光线追踪加速与自研AI生成式渲染技术，并在具身智能、科学智能（AI4S）、AI for 6G等前沿领域深度布局 [4] 新产品发布 - 公司发布搭载自研智能SoC芯片“长江”的AI算力本MTT AIBOOK，其AI算力为50TOPS，支持Linux/Windows/Android多系统切换 [2][3] - MTT AIBOOK 32GB、1TB版本预售价为9999元，已于京东开放预售，将于2026年1月10日正式开售 [2][3] 市场表现与财务概况 - 公司被视为“中国版英伟达”，于12月5日以“国产GPU第一股”称号登陆A股，上市首日大涨超400%，股价一度突破940元/股，近期股价回调至664.1元/股 [4] - 2025年1—9月，公司营业收入为7.85亿元，归属于母公司所有者的净利润为-7.24亿元 [6] - 公司预计2025年全年归属于母公司股东的净利润为-11.68亿元至-7.30亿元 [6]