Workflow
GPU生态
icon
搜索文档
上市15天,摩尔线程剑指英伟达腹地
虎嗅APP· 2025-12-20 13:20
出品 | 虎嗅科技组 作者 | 丸都山 编辑 | 苗正卿 头图 | 摩尔线程 在资本市场的热度趋于平静之时,摩尔线程又在产业端将人们的视线拉回。 12月20日,摩尔线程举行了首届"MUSA开发者大会",发布全新一代全功能GPU架构"花港",以 及基于"花港"架构打造的AI训推一体芯片"华山",以及专用于高性能图形渲染的芯片"庐山"。 此外,摩尔线程创始人张建中在现场还公布了"夸娥万卡智算集群",以及未来即将发布的MTT C256超节点结构规划。 如果说上述内容还属于"可预测的"技术迭代内,那么诸如中间语言MTX,以及光刻计算库、量子 计算融合框架等技术,就真的完全在人意料之外了。 在此前几次版本迭代中,MUSA主要集中在编程生态的扩充,比容兼容更多编程语言,或是丰富 算子库上,而今天提到的"中间语言MTX"属首次出现。 简单解释下中间语言MTX是什么。它的核心作用是兼容不同代际GPU的指令架构,让开发者无需 为每一代新GPU重新适配代码,大幅降低开发者适配成本,同时为上层软件生态提供稳定的底层 支撑。 用个更直观的例子来说明下:在英伟达CUDA生态下,其核心底层组件之一,就是这个中间语言 技术,英伟达将其命名 ...
“国产GPU第一股” 再传利好
上海证券报· 2025-11-28 09:30
公司技术进展 - 公司正式发布PyTorch深度学习框架的MUSA扩展库Torch-MUSA v2.7.0,新版本在功能集成、性能优化与硬件支持方面实现突破 [1] - Torch-MUSA在短短一个月内连续完成v2.5.0和v2.7.0两次版本更新,体现公司在MUSA生态建设上的持续投入与快速迭代能力 [4] - 新版本新增动态双精度转换、分布式检查点等特性,并集成muSolver与muFFT等计算加速库,显著提升复杂计算任务执行效率 [6][10] - 目前Torch-MUSA专属支持的算子总数已超过1050个,系统在性能与稳定性方面均实现提升,为大模型训练与推理提供更高效可靠的底层支持 [5][6] - 新版本新增对统一内存设备的UMM支持,有效优化内存使用效率 [10] - 公司计划下一版本支持PyTorch 2.9.0,并进一步优化性能与功能,持续构建和完善基于MUSA架构的深度学习生态 [10] MUSA架构与生态 - MUSA架构是公司自主研发的融合GPU硬件和软件的全功能GPU计算加速统一系统架构 [10] - 基于MUSA架构,公司率先实现了单芯片架构同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破 [12] - MUSA是其GPU架构、软件、生态的总称,具备替代由英伟达及其CUDA主导的国际主流GPU生态的能力 [15] - 公司从0构建了底层硬件架构、指令集、编译器、驱动等组件,提供算子加速库、通信库、监控管理工具等,并向上对接人工智能框架及应用生态 [15] - MUSA软件栈原生支持FP8混合精度计算,显著提升大模型训练和推理效率,同时支持FP64的高精度科学仿真计算 [15] - 越丰富的算子库越有助于充分释放GPU算力、提升计算效率、降低开发者应用门槛、提升生态兼容性和支撑更丰富的应用场景 [15] 公司上市与业务拓展 - 作为“国产GPU第一股”,公司从IPO受理到过会仅用时88天 [17] - 公司IPO发行价格为114.28元/股,预计募集资金总额为80亿元,扣除发行费用后预计募集资金净额为75.76亿元 [17] - 公司与国家信息中心签署战略合作协议,将在算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发等方面开展全方位合作 [18][20] - 双方合作旨在共同推进全国一体化算力网体系建设,助力数字经济高质量发展 [20]