公司技术进展 - 公司正式发布PyTorch深度学习框架的MUSA扩展库Torch-MUSA v2.7.0,在功能集成、性能优化与硬件支持方面实现进一步突破[1] - 新版本新增动态双精度转换、分布式检查点等特性,并实现多项功能增强,专属支持的算子总数已超过1050个[5] - 新版本进一步集成muSolver与muFFT等计算加速库,显著提升复杂计算任务的执行效率,同时新增对统一内存设备的UMM支持,有效优化内存使用效率[9] 生态建设与迭代能力 - 公司在短短一个月内连续完成Torch-MUSA v2.5.0和v2.7.0两次版本更新,体现了在MUSA生态建设上的持续投入与快速迭代能力[4] - Torch-MUSA版本号已与PyTorch主版本号保持同步,便于开发者进行版本识别与管理,并计划下一版本支持PyTorch 2.9.0,持续构建和完善基于MUSA架构的深度学习生态[9] - MUSA架构是公司自主研发的融合GPU硬件和软件的全功能GPU计算加速统一系统架构,具备替代由英伟达及其CUDA主导的国际主流GPU生态的能力[12][15] 技术架构与应用价值 - 基于MUSA架构,公司率先实现了单芯片架构同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码的技术突破[12] - MUSA软件栈能够释放全功能GPU在AI计算、科学计算、图形渲染和多媒体等场景的极致性能,原生支持FP8混合精度计算,显著提升大模型训练和推理效率,同时支持FP64的高精度科学仿真计算[15] - 越丰富的算子库越有助于充分释放GPU算力、提升计算效率、降低开发者应用门槛、提升生态兼容性和支撑更丰富的应用场景[15] 业务发展与合作 - 公司从IPO受理到过会仅用时88天,IPO发行价格为114.28元/股,预计募集资金总额为80亿元,扣除发行费用后预计募集资金净额为75.76亿元[16] - 公司与国家信息中心签署战略合作协议,将在算力领域前瞻性研究、算力产业生态培育、算力网共性技术研发等方面开展全方位合作,共同推进全国一体化算力网体系建设[18]
摩尔线程Torch-MUSA重磅升级,支持1050+算子,深度学习生态持续跃升
上海证券报·2025-11-28 09:43