AI计算生态
搜索文档
摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达
凤凰网· 2025-12-21 06:18
凤凰网科技讯12月20日,摩尔线程在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU 架构"花港",并展示了其万卡规模AI训练集群及多项技术进展。 此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构"花港"支持从FP4到FP64的全 精度计算,算力密度提升50%,能效实现10倍提升。基于该架构,公司计划推出专注于AI训练与推理 的"华山"芯片,以及面向图形渲染的"庐山"芯片。 在训练集群方面,摩尔线程推出"夸娥"万卡智算集群,称其具备全精度通用计算能力,训练算力利用率 在稠密模型上达到60%,在混合专家模型上达40%,训练线性扩展效率为95%。在推理侧,公司与硅基 流动合作,在DeepSeek R1671B模型上实现单卡Prefill吞吐量超过4000tokens/s,Decode吞吐量超过 1000tokens/s。 软件生态方面,MUSA5.0版本对编程模型、计算库和编译器进行了优化,核心计算库muDNN的GEMM 与FlashAttention效率超过98%,通信效率达97%。公司还计划逐步开源部分核心组件,包括计算加速库 与系统管理框架。 在图形领域,新架构集成硬件 ...