量子位 - 财报，业绩电话会，研报，新闻

量子位

搜索文档

量子位· 2025-12-21 14:13

核心观点 - 摩尔线程在上市后迅速召开首届全功能GPU开发者大会，围绕其自主研发的MUSA架构，发布了一系列从云到端、从算力到生态的新产品与技术，标志着国产GPU能力进入新阶段[1][2][4] MUSA全功能GPU架构 - MUSA是公司自主研发的元计算统一系统架构，定义了从芯片设计到软件生态的统一技术标准，支持AI计算、图形渲染、物理仿真、科学计算及视频编解码等全场景高性能计算[6][7][10] - 发布第五代全功能GPU架构“花港”，在同等芯片面积下算力密度提升50%，计算能效提升10倍，并新增对FP4/FP6低精度计算及混合低精度端到端加速技术的支持，专为AI低比特训练与推理优化[8][13][17] - 花港架构原生支持矩阵rowmax计算以提升混合精度SIMT吞吐量，内置在线量化/反量化、随机舍入等硬件加速能力，为下一代Transformer引擎提供底层支撑[13] - 架构支持通过MTLink高速互联构建十万卡集群，为超大规模模型训练铺平道路[17] 软件栈与开发生态 - 同步推出MUSA软件栈5.0，构建从编译器、算子库到AI框架的全栈工具链，并宣布将逐步开源MATE算子库、MUTLASS、MT DeepEP通信库、KUAE云原生工具包等核心组件[16] - 软件生态广泛适配主流AI框架，除PyTorch、PaddlePaddle外新增对JAX、TensorFlow的支持，并新增强化学习训练框架MT VeRL[18] - 推理引擎深度优化自研MTT推理引擎与TensorX，同时适配SGLang、vLLM、Ollama等新兴推理框架[18] - 核心库muDNN实现GEMM/FlashAttention效率超98%，通信效率达97%，编译器性能提升3倍[18] - 推出面向AI+渲染融合的编程语言muLang，兼容TileLang、Triton，原生支持MUSA C，并发布GPU中间表示语言MTX 1.0以提升开发者调优自由度[18] - 公司打造“摩尔学院”作为开发者成长平台，截至2025年12月已汇聚20万名开发者，目标培育百万规模社群，并通过走进全国200所高校进行产教融合[59][61] 新产品发布：芯片 - 基于花港架构发布两款芯片路线：聚焦AI训推一体及高性能计算的GPU“华山”，以及专为图形计算而生的GPU“庐山”[21][22][28] - “华山”GPU全精度支持从FP4到FP64，具备MTFP4/MTFP6混合低精度加速能力，硬件级优化专为大模型训练定制，标志着公司正式具备支撑万亿参数大模型训练的能力[25][27] - “庐山”GPU引入AI生成式渲染架构和硬件光追引擎，支持DirectX 12 Ultimate，相比上一代产品AI计算性能提升64倍，3A游戏渲染性能提升15倍[30][31] - 首次推出面向端侧场景的智能SoC芯片“长江”，提供50 TOPS的异构AI算力，应用于具身智能、车载、AI计算终端等领域[32][34] 新产品发布：硬件与集群 - 基于长江芯片发布两款硬件：为AI学习与开发者打造的个人智算平台“MTT AIBOOK”，以及桌面高性能AI计算设备“AICube”[36][37][43] - MTT AIBOOK运行MT AIOS操作系统，预置完整AI开发环境，内置智能体“小麦”支持2K高清渲染、本地大模型及端侧ASR/TTS，并预装智源悟界Emu3.5多模态模型[37][40][42] - 发布“夸娥（KUAE 2.0）”万卡智算集群，在Dense大模型上的算力利用率达60%，在MOE大模型上达40%，有效训练时间占比超过90%[46][47] - 公司已完整复现DeepSeek V3的FP8训练，自研FP8 GEMM算力利用率高达90%[47] - 前瞻性披露下一代高密硬件基石“MTT C256超节点”，采用计算与交换一体化设计以提升万卡集群的能效比和训练效能[49][50] 性能验证与行业意义 - 公司与硅基流动合作，在MTT S5000 GPU上成功完成对DeepSeek V3 671B满血版大模型的深度适配与性能验证[53] - 在FP8低精度推理技术加持下，MTT S5000单卡实测Prefill吞吐突破4000 tokens/s，Decode吞吐超1000 tokens/s，创下当前国产GPU在大模型推理场景下的新高[53] - 这一成果表明，在成熟软件工程体系协同优化下，国产算力硬件正从“能跑”迈向“跑得快、跑得稳、跑得值”，单位算力有效利用率成为关键落地指标[54][55] - MUSA架构的创新不仅是对下一代AI基础设施的系统性回答，更是对未来AI产业格局的一次主动定义，使其成为多模态智能、具身智能及物理AI时代的关键使能平台[16][19]

AI生成操作系统新突破！上海交大提出文件系统开发新范式：从此只需写规约

量子位· 2025-12-21 14:13

非羊整理自凹非寺量子位 | 公众号 QbitAI 还记得《流浪地球2》里的那台 550W量子计算机吗？电影里，MOSS最让人印象深刻的点，除了其强大算力，还有它可以根据需求，实时生成底层操作系统的能力。如果现在告诉你，我们已经在从"人类需求"生成"底层系统"这件事上迈出了关键一步呢？来自上海交大IPADS实验室的研究团队，面对自动生成操作系统核心组件的难题，做出了全新的尝试。这项研究成果也即将亮相文件系统与存储领域顶级学术会议 USENIX FAST'26 。操作系统：与时俱进的沉重负担操作系统（OS），是整个数字世界的基石。向下，它要管理和调度硬件资源（CPU、内存、硬盘等）；向上，它要为应用软件提供稳定可靠的运行环境。无论是你手机上的App，还是云端强大的AI模型，都构建在这块基石之上。然而，OS必须与时俱进，来满足硬件和应用的双重需求：一方面，硬件的发展日新月异，例如存储设备，在短短数年内，就从机械硬盘演进到闪存甚至非易失性内存，OS必须快速迭代，才能榨干这些新硬件的性能；另一方面，新应用也层出不穷，例如大数据分析、AI训练等，每一个新型应用的出现，都可能对OS的 ...

量子位· 2025-12-21 14:13

编辑部发自凹非寺量子位 | 公众号 QbitAI AI热潮还在汹涌，但如果你还不知道如何参与……那为什么不来量子位呢？我们是一家以追踪AI新进展为核心的内容平台，经过8年积累，目前拥有顶流影响力，广泛且备受认可的产业资源，以及时代风口的最佳观测和学习生态位。目前，我们有三大方向岗位招聘，希望你是（或者能成为）这三个方向的内容专家：岗位均为全职，工作地点：北京中关村。岗位面向：加入我们，你可以获得：以下是岗位详情：所有岗位不同能力层级职位均在开放，欢迎结合个人履历和经验申请。 AI产业方向岗位职责： AI产业方向：关注基建层创新，包含芯片、AI Infra、云计算； AI财经方向：关注AI领域创投和财报，跟踪产业链资本动向； AI产品方向：关注AI在应用和硬件终端方向的进展。社招：覆盖编辑、主笔、主编各个层级，按能力匹配岗位；校招：应届毕业生，接受实习且可转正。站在AI浪潮之巅：第一时间接触和了解AI领域最新技术和产品，构建完整的AI认知体系。玩转AI新工具：将各种AI新技术、新工具应用于工作，提升工作效率和创造力。打造个人影响力：通过撰写独家原创内 ...