主权AI
搜索文档
全新架构、万卡集群、智算平台 摩尔线程开发者大会还有哪些亮点?
中金在线· 2025-12-21 07:42
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及两款核心芯片,展示了其在AI训练、推理及图形渲染领域的性能突破,并宣布进军个人智算终端,标志着公司正从硬件供应商向平台级算力基础设施商转型 [1][2][10] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [1][2] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [3] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [3] 智算中心与集群性能 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超90% [5] - 展示推理性能突破:与硅基流动合作,在DeepSeek R1 671B全量模型上,MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [6] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [6] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [7] - 宣布开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [7] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发适配门槛 [7] 个人智算终端与市场战略 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [8][9] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体、2D数字人和预装Qwen3-8B大模型,支持0.5秒生成数字人形象 [9] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉至开发者桌面端,实现开发闭环 [9] 行业背景与公司定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [10] - 公司通过展示“花港”架构及“芯-边-端-云”全栈体系,试图摆脱单一硬件供应商身份,转向平台级算力基础设施商 [10] - 中国工程院院士郑纬民指出,发展“主权AI”核心在于算力自主、算法自强与生态自立,强调必须构建易用的国产芯片开发环境以留住开发者社群 [9] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,较12月11日高点累计下跌29.4% [10] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [10]
国产GPU第一股,周末大动作!
金融时报· 2025-12-21 02:19
当然,当下的中国GPU产业仍处于构建核心技术栈与完整生态的起步阶段。摩尔线程此前在IPO招股书中也表示,英伟达的CUDA生态在行业生态内处于 垄断地位,未来拓展业务将面临越来越高的研发难度及计算生态壁垒构建困难等挑战。 摩尔线程创始人、董事长兼CEO张建中表示,新架构相较前代架构,密度提升50%,效能提升10倍,支持十万卡以上规模智算集群。未来摩尔线程将基于 该架构推出高性能AI训推一体"华山"芯片与专攻高性能图形渲染的"庐山"芯片。此外,摩尔线程还宣布推出搭载智能SoC芯片"长江"的AI算力本,作为连 接开发者与MUSA生态的核心入口。 生态建设是GPU行业的核心壁垒之一。例如,CUDA生态便是英伟达构建起近二十年的市场领先地位、并实现从硬件厂商向计算平台巨头转型的核心护城 河。 中国工程院院士、清华大学计算机系教授郑纬民在大会主题演讲中表示,发展"主权AI"是提升未来国家竞争力的关键,其核心在于实现"算力自主、算法 自强、生态自立"的完整体系。他认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级别的超大规模智算系统 存在难度,但这是必须完成的产业基础设施任务。他特别指出, ...
全新架构、万卡集群、智算平台,摩尔线程(688795.SH)开发者大会还有哪些亮点?
智通财经网· 2025-12-20 23:23
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品,展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局,战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构(AGR)和第二代光线追踪硬件加速引擎,计划明年量产 [1] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上的训练算力利用率(MFU)达60%,在MOE大模型上为40%,有效训练时间占比超90% [4] - 展示与硅基流动的合作成果,在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉到开发者桌面端,实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出,发展“主权AI”的核心在于算力自主、算法自强与生态自立,并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [9]
从“能用”到“好用”!中国工程院院士郑纬民详解“主权AI”三大支柱 直指国产算力核心痛点
每日经济新闻· 2025-12-20 14:20
12月20日,摩尔线程首届MUSA开发者大会(MDC 2025)在北京中关村国际创新中心开幕。 在主论坛环节,中国工程院院士、清华大学计算机系教授郑纬民提出,在芯片产业全球化分工遭遇技术封锁的背景下,构建中国"主权AI"计算引擎成为紧迫 任务。要实现"主权AI",需从算力自主、算法自强、生态自立三方面入手。 从"主权AI"基建的角度出发,发展国产万卡/十万卡系统是不得不走的一步,但仍需解决互联网络与拓扑、可靠性与运维、能耗与供电散热等方面的问题。 至于国产芯片厂商都要面对的终极问题——生态建设,在郑纬民看来,真正决定"主权AI"生态成败的,是有没有足够多的开发者愿意长期在这套栈上写代 码。未来国产平台要提高用户的开发体验,还需解决迁移成本高、工具链不成熟、文档/社区与支持不足等问题。 郑纬民教授现场演讲,图片来源:每经记者杨卉摄 "主权AI"三大支柱:算力自主、算法自强、生态自立 过去很长一段时间,芯片产业一直处于全球化分工的状态,架构设计、制造装备、代工、封测等环节均涉及不同领域。然而,近年来高端AI芯片面临出口 管制、技术封锁等困境,算力从一般生产要素上升为战略资源,"主权AI"也从学术讨论逐步变为每个国 ...
加速构建国产计算产业生态,多项国产GPU技术成果发布
北京日报客户端· 2025-12-20 13:43
除主论坛外,大会还设置了20余场技术分论坛与超过1000平方米的"MUSA嘉年华"沉浸式展区,全面呈 现了国产GPU在AI大模型、科学智能、数字孪生、工业仿真、数字文娱、智慧医疗等前沿与产业场景 中的应用潜力。 海淀区委书记、中关村科学城党工委书记张革说,摩尔线程自2020年成立以来扎根海淀,专注于全功能 GPU自主研发,以"一年一芯片"的迭代速度推出四代产品,在AI智算、数字孪生等领域填补了国内技术 空白,是海淀区硬科技企业创新发展的典型代表。本次大会不仅是企业技术成果的集中展示,也是海淀 区人工智能与集成电路产业生态协同共进、向优发展的生动体现。 12月20日,首届摩尔线程MUSA开发者大会在中关村国际创新中心举办。大会上,不久前刚成功登陆资 本市场的海淀全功能国产GPU企业摩尔线程集中发布了一系列技术与产品新成果,如计算提升50%、效 能提升10倍的全功能GPU架构"花港",在多项关键精度指标上达到国际主流水平的夸娥万卡智算集群 等,推动国产GPU技术与生态实现进一步突破。 中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲时指出,发展"主权AI"是提升未来国家竞 争力的关键,其核心在于实现"算力自 ...
周末重磅!摩尔线程 首次公开
上海证券报· 2025-12-20 13:24
核心观点 - 摩尔线程在首届MUSA开发者大会上,首次公开了其全功能GPU技术路线图,并发布了包括新一代GPU架构“花港”、夸娥万卡智算集群、AI算力本等一系列技术与产品进展,标志着公司已构建起贯穿“芯-边-端-云”的完整自主技术栈,并致力于加速构建国产计算产业生态 [2][3][11] 新一代GPU架构与芯片路线图 - 公司宣布其自主研发的元计算统一架构MUSA升级至5.0版本,在全栈统一性、效能与生态开放性上取得关键突破 [3] - 基于MUSA发布了新一代GPU架构“花港”,基于新一代指令集,支持FP4到FP64的全精度计算,算力密度提升50%,能效提升10倍,可支持十万卡以上规模智算集群 [3] - 基于“花港”架构,公布了未来两款芯片技术路线:“华山”专注AI训推一体与超大规模智能计算,支持从FP4至FP64的全精度计算,为万卡级智算集群提供算力支撑 [3] - “庐山”专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍,并显著增强纹理填充、原子访存能力及显存容量,集成AI生成式渲染等新技术 [5] 夸娥万卡智算集群与算力突破 - 发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力,在万卡规模下实现高效稳定的AI训练与推理 [7] - 该集群浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达60%,在MOE大模型上达40%,有效训练时间占比超过90%,训练线性扩展效率达95% [7] - 推理侧,联合硅基流动在DeepSeek-R1 671B全量模型上实现单卡推理性能突破,MTT S5000单卡Prefill吞吐突破4000tokens/s、Decode吞吐突破1000tokens/s [7] - 训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,Flash Attention算力利用率超95%,并突破FP8累加精度等关键技术瓶颈 [7] - 发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力 [7] 图形计算与具身智能布局 - 图形产品已全面支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流API,并将完整支持DirectX 12 Ultimate,与国产主流CPU及操作系统完成了全栈适配 [8] - 在核心渲染技术上取得两项关键突破:基于“花港”架构的硬件光线追踪加速引擎,可支持DirectX Raytracing;推出全自研的AI生成式渲染技术MTAGR 1.0 [8] - 发布了MT Lambda具身智能仿真训练平台,深度融合物理、渲染与AI三大引擎,构建开发、仿真、训练的统一环境 [8] - 推出基于智能SoC芯片“长江”、AI模组MTT E300和夸娥智算集群的MT Robot具身智能解决方案 [8] - 公司计划于2026年第一季度开源关键仿真加速组件Mujoco-warp-MUSA [9] - MUSA生态还与合作伙伴在科学智能、量子科技、AI for 6G等前沿交叉领域展开探索 [10] 生态建设与开发者体系 - 公司认为生态体系是GPU行业的核心护城河与价值所在,致力于以开放创新深化与生态伙伴的协同,共同构建国产计算产业生态 [11] - 以摩尔学院为平台,已构建产教融合的开发者成长体系,目前汇聚近20万名开发者与学习者 [11] - 通过“国产计算生态与AI教育共建行动”将前沿技术与产业实践带入全国200多所高校,吸引超10万名学子参与 [11] 端侧计算产品 - 发布了搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,提供50TOPS的端侧AI算力,实现了专业AI开发的“开箱即用”,并打破了Linux开发、Windows办公与Android应用之间的场景壁垒 [12] - 预告了基于“长江”SoC打造的迷你型计算设备MTT AICube,进一步丰富端侧计算产品形态 [12]
摩尔线程,展现最新成果
财联社· 2025-12-20 11:18
核心观点 - 公司举办首届开发者大会,发布历时五年研发的新一代全功能GPU架构“花港”,并基于此公布了两款核心芯片、万卡智算集群及个人AI终端产品,展示了从芯片到软件再到系统与终端的全栈技术布局,战略意图从单一硬件供应商转向平台级算力基础设施商 [1][17] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,采用新一代指令集,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成第一代AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [2] - 基于“花港”架构公布两款核心芯片规划:“华山”芯片主打AI训推一体与超智融合,内置新一代异步编程模型,拥有全精度MMA及MTFP8/6/4混合低精度计算技术 [3][4] - “庐山”芯片专攻高性能图形渲染,优化任务分配与平衡,其AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [4] 智算系统与性能展示 - 发布“夸娥”万卡智算集群,浮点运算能力达10Exa-Flops,在Dense大模型上的训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超过90% [6] - 展示与硅基流动合作的推理性能成果:在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [7] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [8] 软件生态与开发者工具 - 自研MUSA架构迎来全栈软件升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超过98%,通信效率达97% [9] - 明确开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [10] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [11] 终端产品与市场拓展 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [12][13] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,预装Qwen3-8B大模型,支持多操作系统,意图将MUSA生态从云端下沉至开发者桌面端 [14] 行业背景与战略定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [17] - 发展“主权AI”的核心在于算力自主、算法自强与生态自立,构建国产十万卡级别智算系统是必须完成的产业基础设施任务,且需构建易用的开发环境以留住开发者社群 [15] - 公司通过展示的全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [17] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4%,但相较于发行价涨幅仍超过481%,总市值维持在3121.46亿元 [16]
摩尔线程公布新GPU架构和万卡集群
观察者网· 2025-12-20 07:27
12月20日上午,刚刚登陆科创板的GPU新秀摩尔线程,召开了首届MUSA开发者大会(MDC 2025)。 会上,摩尔线程公布了新一代GPU架构"花港",AI训推一体芯片"华山",用于游戏和图形渲染等场景的 芯片"庐山",以及"夸娥"万卡训练集群等产品。 现场,中国工程院院士、清华大学计算机系教授郑纬民发表主题演讲。他指出,发展"主权AI"是提升未 来国家竞争力的关键,其核心在于实现"算力自主、算法自强、生态自立"的完整体系。 霸狂女 为什么 "万卡甚至十万卡系统"是必选项 算力基石 模型时代的基本单位是集群总算力,不是单卡性能 预训练超大规模模型、服务国民级推理需求,需要 持续可用的万卡级训练集群 分布在全国的推理集群与第力网络 num SSICAL Partist 从主权 Al 角度 国产万卡/十万卡系统 = 本土大模型与行业模型的 "母机"与基座 图 郑纬民认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级 别的超大规模智算系统存在难度,但这是必须完成的产业基础设施任务。他特别指出,开发者是生态建 设的关键,国产芯片平台必须构建起友好、易用的开发环境,以有效服务开发者社群 ...
摩尔线程亮出全栈技术底牌:“花港”新架构与万卡集群冲击高端GPU市场格局
环球网· 2025-12-20 07:00
【环球网科技报道 记者 李文瑶】12月20日,摩尔线程在首届MUSA开发者大会(MDC 2025)上,系统展示了其在全功能GPU领域从架构 创新、集群能力到生态建设的突破。 其中最引人关注的是新一代GPU架构"花港"的亮相,以及可支撑万亿参数模型训练的"夸娥"万卡智算集群的实际效率披露。 架构迭代:"花港"亮相,双芯片路线瞄准AI与图形 大会的核心发布之一是新一代全功能GPU架构"花港"。根据摩尔线程公布的信息,该架构在计算密度上提升50%,效能提升最高达10倍, 并完整支持从FP4到FP64的全精度计算。尤为关键的是,架构层面集成了自研的MTLink高速互联技术,为十万卡规模以上的集群扩展提供 了底层支持。 这一架构与产品路线的发布,标志着摩尔线程不再局限于单一场景的加速卡产品,而是向覆盖AI计算、图形渲染、科学计算等全场景 的"全功能GPU"平台迈进。在业内人士看来,这既是技术能力的体现,也是应对市场多元需求、构建更宽生态护城河的战略选择。 集群能力:万卡训练效率指标首度公开 如果说芯片架构是"点"的突破,那么集群能力则是"面"的验证。本次大会上,摩尔线程首次系统披露了其"夸娥"万卡智算集群的关键工程 效 ...
摩尔线程发布新一代GPU架构,打造MUSA生态对标英伟达CUDA
新浪财经· 2025-12-20 06:42
来源:钛媒体 图片由AI生成 登陆A股科创板引发国产芯片股狂欢后,市场对这家公司后续的研发、产品、经营愈发关注。 GPU行业的竞争,本质上也是开发者生态的竞争。为此,摩尔线程在12月20日-21日举办首届MUSA(MUSA Developer Conference)开发者大会。 在今天(12月20日)上午的发布会上,摩尔线程创始人、董事长兼CEO张建中发布了新一代GPU架构"花港",AI训推一体新GPU"华山",游戏领域专业图形 GPU"庐山"、智能SoC"芯片"长江等产品,以及KUAE万卡智算集群。 根据发布会现场的介绍,即将于2026年量产的相关产品较上一代性能大幅提升。而这背后,继续对标、追赶甚至挑战以英伟达为代表的国际领先芯片产品、 架构及生态,成为了发布会的隐含主题。 摩尔线程在经营模式、产品体系和发展方向上,也一直对标着英伟达,尤其是在生态和基础算力设施构建、对物理AI的布局、高毛利率等方面,相比于"国 产GPU四小龙"中刚刚上市的沐曦股份,以及宣布赴港IPO的壁仞科技等公司来说。 不过,摩尔线程也正在尝试超越英伟达。其高调宣扬的"全功能GPU",是尝试在一颗GPU芯片上集成支撑AI计算、图形渲染 ...