Workflow
夸娥万卡智算集群
icon
搜索文档
全新架构、万卡集群、智算平台 摩尔线程开发者大会还有哪些亮点?
中金在线· 2025-12-21 07:42
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及两款核心芯片,展示了其在AI训练、推理及图形渲染领域的性能突破,并宣布进军个人智算终端,标志着公司正从硬件供应商向平台级算力基础设施商转型 [1][2][10] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [1][2] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [3] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [3] 智算中心与集群性能 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超90% [5] - 展示推理性能突破:与硅基流动合作,在DeepSeek R1 671B全量模型上,MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [6] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [6] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [7] - 宣布开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [7] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发适配门槛 [7] 个人智算终端与市场战略 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [8][9] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体、2D数字人和预装Qwen3-8B大模型,支持0.5秒生成数字人形象 [9] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉至开发者桌面端,实现开发闭环 [9] 行业背景与公司定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [10] - 公司通过展示“花港”架构及“芯-边-端-云”全栈体系,试图摆脱单一硬件供应商身份,转向平台级算力基础设施商 [10] - 中国工程院院士郑纬民指出,发展“主权AI”核心在于算力自主、算法自强与生态自立,强调必须构建易用的国产芯片开发环境以留住开发者社群 [9] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,较12月11日高点累计下跌29.4% [10] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [10]
摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达
凤凰网· 2025-12-21 06:18
凤凰网科技讯12月20日,摩尔线程在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU 架构"花港",并展示了其万卡规模AI训练集群及多项技术进展。 此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构"花港"支持从FP4到FP64的全 精度计算,算力密度提升50%,能效实现10倍提升。基于该架构,公司计划推出专注于AI训练与推理 的"华山"芯片,以及面向图形渲染的"庐山"芯片。 在训练集群方面,摩尔线程推出"夸娥"万卡智算集群,称其具备全精度通用计算能力,训练算力利用率 在稠密模型上达到60%,在混合专家模型上达40%,训练线性扩展效率为95%。在推理侧,公司与硅基 流动合作,在DeepSeek R1671B模型上实现单卡Prefill吞吐量超过4000tokens/s,Decode吞吐量超过 1000tokens/s。 软件生态方面,MUSA5.0版本对编程模型、计算库和编译器进行了优化,核心计算库muDNN的GEMM 与FlashAttention效率超过98%,通信效率达97%。公司还计划逐步开源部分核心组件,包括计算加速库 与系统管理框架。 在图形领域,新架构集成硬件 ...
全新架构、万卡集群、智算平台,摩尔线程(688795.SH)开发者大会还有哪些亮点?
智通财经网· 2025-12-20 23:23
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品,展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局,战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构(AGR)和第二代光线追踪硬件加速引擎,计划明年量产 [1] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上的训练算力利用率(MFU)达60%,在MOE大模型上为40%,有效训练时间占比超90% [4] - 展示与硅基流动的合作成果,在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉到开发者桌面端,实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出,发展“主权AI”的核心在于算力自主、算法自强与生态自立,并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [9]
加速构建国产计算产业生态,多项国产GPU技术成果发布
北京日报客户端· 2025-12-20 13:43
除主论坛外,大会还设置了20余场技术分论坛与超过1000平方米的"MUSA嘉年华"沉浸式展区,全面呈 现了国产GPU在AI大模型、科学智能、数字孪生、工业仿真、数字文娱、智慧医疗等前沿与产业场景 中的应用潜力。 海淀区委书记、中关村科学城党工委书记张革说,摩尔线程自2020年成立以来扎根海淀,专注于全功能 GPU自主研发,以"一年一芯片"的迭代速度推出四代产品,在AI智算、数字孪生等领域填补了国内技术 空白,是海淀区硬科技企业创新发展的典型代表。本次大会不仅是企业技术成果的集中展示,也是海淀 区人工智能与集成电路产业生态协同共进、向优发展的生动体现。 12月20日,首届摩尔线程MUSA开发者大会在中关村国际创新中心举办。大会上,不久前刚成功登陆资 本市场的海淀全功能国产GPU企业摩尔线程集中发布了一系列技术与产品新成果,如计算提升50%、效 能提升10倍的全功能GPU架构"花港",在多项关键精度指标上达到国际主流水平的夸娥万卡智算集群 等,推动国产GPU技术与生态实现进一步突破。 中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲时指出,发展"主权AI"是提升未来国家竞 争力的关键,其核心在于实现"算力自 ...
举办首届MUSA开发者大会 摩尔线程现场展示落地成果
21世纪经济报道· 2025-12-20 13:39
推理性能实现跨越:摩尔线程联合硅基流动,在DeepSeek R1 671B全量模型上实现性能突破,MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s,树立国产推理性能标杆。 全新个人智算平台:正式发布搭载智能SoC芯片"长江"的AI算力本MTT AIBOOK,迷你型计算设备 MTT AICube。 (文章来源:21世纪经济报道) 12月20日,摩尔线程于北京举办首届MUSA开发者大会。会上,摩尔线程展示了其基于MUSA统一架构 为核心的全栈技术成果,并在现场展示落地成果。包括: "夸娥万卡"高效训练:发布夸娥万卡智算集群,展示了其支撑万亿参数模型训练的工程化能力与可靠 性,在多项关键精度指标上达到国际主流水平。 ...
摩尔线程 突发大消息!
中国基金报· 2025-12-20 13:32
【导读】摩尔线程发布新一代GPU架构"花港"等 12月20日上午,备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此 次大会上,摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果,包括新一代GPU架构"花 港"、未来将发布的"华山"芯片和"庐山"芯片,以及夸娥万卡智算集群。 发布新一代GPU架构"花港" MUSA是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令集、编程模 型到软件运行库及驱动程序框架等的全栈技术体系。 "华山"专注AI训推一体与超大规模智能计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一 代"AI工厂"的坚实底座。 "庐山"专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50 倍,并显著增强纹理填充、原子访存能力及显存容量。 推出夸娥万卡智算集群 在此次大会上,摩尔线程还正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力, 在万卡规模下能实现高效稳定的AI训练与推理。 据摩尔线程介绍,其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense ...
摩尔线程,发布新一代GPU架构
21世纪经济报道· 2025-12-20 13:32
记者丨 彭新 编辑丨朱益民 在登陆科创板近半月之际,12月20日,摩尔线程(688795.SH)于北京举办首届MUSA开发者 大会。 构和上一代Hopper架构之间,而在访存容量指标上优于上述两个架构。 同步发布的"庐山"芯片则侧重于高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升 16倍,光线追踪性能提升50倍,并增强了纹理填充和显存容量。 会上,摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果,并发布下一代全功能 GPU架构"花港"。 基于该架构,摩尔线程推出面向AI训推一体的"华山"芯片及高性能图形渲染的"庐山"芯片,并 展示了"夸娥"万卡智算集群技术成果与搭载"长江"SoC芯片的端侧AI产品。 MUSA(Meta-computing Unified System Architecture)为摩尔线程自主研发的"元计算"统一 计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体 系。其中,新一代GPU架构"花港"最受关注。 "大家知道,目前的芯片代工工艺发展确实面临一些客观的、缓慢的挑战。但我们要不要停下 来等?不能。'花港'的意义在于,我们通过全新的指令 ...
周末重磅!摩尔线程 首次公开
上海证券报· 2025-12-20 13:24
核心观点 - 摩尔线程在首届MUSA开发者大会上,首次公开了其全功能GPU技术路线图,并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展,标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈,并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本,在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”,基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [3] - 基于“花港”架构,公布了未来两款芯片技术路线:“华山”专注AI训推一体与超大规模智能计算,支持从FP4至FP64的全精度计算,为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [7] - 推理侧,联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并将完整支持DirectX 12 Ultimate,与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破:基于“花港”架构的硬件光线追踪加速引擎,可支持DirectX Raytracing;推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在,致力于以开放创新深化与生态伙伴的协同,共同构建国产计算产业生态 [11] - 以摩尔学院为平台,已构建产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,实现了专业AI开发的“开箱即用”,并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态 [12]
上市15天,摩尔线程剑指英伟达腹地
虎嗅APP· 2025-12-20 13:20
出品 | 虎嗅科技组 作者 | 丸都山 编辑 | 苗正卿 头图 | 摩尔线程 在资本市场的热度趋于平静之时,摩尔线程又在产业端将人们的视线拉回。 12月20日,摩尔线程举行了首届"MUSA开发者大会",发布全新一代全功能GPU架构"花港",以 及基于"花港"架构打造的AI训推一体芯片"华山",以及专用于高性能图形渲染的芯片"庐山"。 此外,摩尔线程创始人张建中在现场还公布了"夸娥万卡智算集群",以及未来即将发布的MTT C256超节点结构规划。 如果说上述内容还属于"可预测的"技术迭代内,那么诸如中间语言MTX,以及光刻计算库、量子 计算融合框架等技术,就真的完全在人意料之外了。 在此前几次版本迭代中,MUSA主要集中在编程生态的扩充,比容兼容更多编程语言,或是丰富 算子库上,而今天提到的"中间语言MTX"属首次出现。 简单解释下中间语言MTX是什么。它的核心作用是兼容不同代际GPU的指令架构,让开发者无需 为每一代新GPU重新适配代码,大幅降低开发者适配成本,同时为上层软件生态提供稳定的底层 支撑。 用个更直观的例子来说明下:在英伟达CUDA生态下,其核心底层组件之一,就是这个中间语言 技术,英伟达将其命名 ...
摩尔线程,重大发布!
是说芯语· 2025-12-20 11:56
公司战略与架构发布 - 在首届MUSA开发者大会上,公司董事长兼CEO张建中系统阐述了以MUSA为核心的全栈发展战略,并发布了新一代GPU架构“花港” [1] - 新一代“花港”架构基于新一代指令集,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [1] - 公司全功能GPU主要包括四大功能引擎:AI计算加速引擎、图形渲染引擎、物理仿真和科学计算引擎、超高清视频编解码引擎,MUSA是支撑这些引擎的系统架构 [1] 产品与技术迭代 - 公司MUSA架构基本保持一年迭代一代,已从2022年的“苏堤”、2023年的“春晓”、2024年的“曲院”进化到2025年的“平湖” [2] - “花港”架构支持FP4到FP64的全精度计算,未来将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片 [2] - 公司分享了面向下一代超大规模智算中心的MTT C256超节点架构规划 [2] - 公司在图形领域实现硬件级光线追踪加速与自研AI生成式渲染技术,并在具身智能、科学智能(AI4S)、AI for 6G等前沿领域深度布局 [4] 新产品发布 - 公司发布搭载自研智能SoC芯片“长江”的AI算力本MTT AIBOOK,其AI算力为50TOPS,支持Linux/Windows/Android多系统切换 [2][3] - MTT AIBOOK 32GB、1TB版本预售价为9999元,已于京东开放预售,将于2026年1月10日正式开售 [2][3] 市场表现与财务概况 - 公司被视为“中国版英伟达”,于12月5日以“国产GPU第一股”称号登陆A股,上市首日大涨超400%,股价一度突破940元/股,近期股价回调至664.1元/股 [4] - 2025年1—9月,公司营业收入为7.85亿元,归属于母公司所有者的净利润为-7.24亿元 [6] - 公司预计2025年全年归属于母公司股东的净利润为-11.68亿元至-7.30亿元 [6]