庐山芯片
搜索文档
投资前瞻(12.22—12.28)| A股新股发行市场持续活跃,港股下周将迎密集上市期
和讯· 2025-12-21 12:47
01 宏观与金融 (一)回顾 1、海南自贸港全岛 封关于 12月18日正式启动,"零关税"税目扩至6600余个(占全部商品税目 74%),加工增值内销免关税政策优化。 封关首日,"零关税"货物进口货值达3.6亿元,加工增值免 关税货物出岛货值1468.9万元,整体通关高效顺畅。 2、多国央行政策分化加剧: 12月19日,日本央行将政策利率从0.5%上调25个基点至0.75%,创 1995年以来新高。通胀连续44个月高于2%目标,日元疲软加剧输入性通胀压力,同时2024年春季 工资涨幅达5.1%,创33年新高,为退出宽松提供了底气;俄罗斯央行12月19日连续第五次降息50 基点至16%,旨在支持经济增长,同时控制通胀;英国央行12月18日年内第四次降息25基点至 3.75%,以求刺激经济增长,同时维持物价稳定。墨西哥、智利同步降息。 3、中央财办12月16日详解中央经济工作会议精神,明确将从供需两端稳定房地产市场。 供给端要严控增量、盘活存量,鼓励收购存量商品房用于保障性住房等合理用途,加快消化库存,同 时有序推动"好房子"建设;需求端要采取更多针对性措施,充分释放居民刚性和改善性需求。 积极推动房地产企业转型 ...
摩尔线程发布新一代GPU架构“花港” 支持十万卡集群
证券日报网· 2025-12-21 12:45
本报讯(记者李乔宇)2025年12月20日,摩尔线程智能科技(北京)股份有限公司(以下简称"摩尔线程")首届 MUSA开发者大会(MDC2025)于北京中关村国际创新中心正式开幕。 摩尔线程创始人、董事长兼CEO张建中在主题演讲中强调了MUSA架构作为全功能GPU基石的先进性与 技术引领性,并表示:"生态体系是GPU行业的核心护城河与价值所在,依托MUSA架构的优势,我们 持续加大研发投入,致力于攻克从硬件到软件的核心技术挑战,以开放创新不断深化与生态伙伴的协 同,共同构建自立自强的国产计算产业生态。此次大会是行业首个聚焦全功能GPU的开发者盛会,大家 的热情令我们备受鼓舞,期待与更多开发者聚力共创,推动MUSA生态繁荣发展。" 此次大会上,摩尔线程集中发布了一系列技术与产品进展,其中全功能GPU架构"花港"正式亮相,支持 FP4到FP64的全精度计算,密度提升50%,效能提升10倍,可以直接支持十万卡以上的计算集群。未来 摩尔线程将基于该架构推出高性能AI训推一体"华山"芯片与专攻高性能图形渲染的"庐山"芯片,两款芯 片将于明年量产上市。 此外,摩尔线程还在此次大会上发布夸娥万卡智算集群,展示了其支撑万亿参 ...
全新架构、万卡集群、智算平台 摩尔线程开发者大会还有哪些亮点?
中金在线· 2025-12-21 07:42
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及两款核心芯片,展示了其在AI训练、推理及图形渲染领域的性能突破,并宣布进军个人智算终端,标志着公司正从硬件供应商向平台级算力基础设施商转型 [1][2][10] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构和第二代光线追踪硬件加速引擎,计划明年量产 [1][2] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [3] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [3] 智算中心与集群性能 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上为40%,有效训练时间占比超90% [5] - 展示推理性能突破:与硅基流动合作,在DeepSeek R1 671B全量模型上,MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [6] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [6] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [7] - 宣布开源计划,将逐步向开发者社区开放计算加速库、通信库及系统管理框架的核心组件 [7] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发适配门槛 [7] 个人智算终端与市场战略 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [8][9] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体、2D数字人和预装Qwen3-8B大模型,支持0.5秒生成数字人形象 [9] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉至开发者桌面端,实现开发闭环 [9] 行业背景与公司定位 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [10] - 公司通过展示“花港”架构及“芯-边-端-云”全栈体系,试图摆脱单一硬件供应商身份,转向平台级算力基础设施商 [10] - 中国工程院院士郑纬民指出,发展“主权AI”核心在于算力自主、算法自强与生态自立,强调必须构建易用的国产芯片开发环境以留住开发者社群 [9] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,较12月11日高点累计下跌29.4% [10] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [10]
摩尔线程发布“花港”GPU新架构,万卡AI训练与推理能力,剑指英伟达
凤凰网· 2025-12-21 06:18
凤凰网科技讯12月20日,摩尔线程在北京首届MUSA开发者大会(MDC2025)上公布了新一代全功能GPU 架构"花港",并展示了其万卡规模AI训练集群及多项技术进展。 此次发布的核心内容涵盖架构升级、集群能力与推理性能等方面。新架构"花港"支持从FP4到FP64的全 精度计算,算力密度提升50%,能效实现10倍提升。基于该架构,公司计划推出专注于AI训练与推理 的"华山"芯片,以及面向图形渲染的"庐山"芯片。 在训练集群方面,摩尔线程推出"夸娥"万卡智算集群,称其具备全精度通用计算能力,训练算力利用率 在稠密模型上达到60%,在混合专家模型上达40%,训练线性扩展效率为95%。在推理侧,公司与硅基 流动合作,在DeepSeek R1671B模型上实现单卡Prefill吞吐量超过4000tokens/s,Decode吞吐量超过 1000tokens/s。 软件生态方面,MUSA5.0版本对编程模型、计算库和编译器进行了优化,核心计算库muDNN的GEMM 与FlashAttention效率超过98%,通信效率达97%。公司还计划逐步开源部分核心组件,包括计算加速库 与系统管理框架。 在图形领域,新架构集成硬件 ...
国产GPU第一股,周末大动作!
金融时报· 2025-12-21 02:19
当然,当下的中国GPU产业仍处于构建核心技术栈与完整生态的起步阶段。摩尔线程此前在IPO招股书中也表示,英伟达的CUDA生态在行业生态内处于 垄断地位,未来拓展业务将面临越来越高的研发难度及计算生态壁垒构建困难等挑战。 摩尔线程创始人、董事长兼CEO张建中表示,新架构相较前代架构,密度提升50%,效能提升10倍,支持十万卡以上规模智算集群。未来摩尔线程将基于 该架构推出高性能AI训推一体"华山"芯片与专攻高性能图形渲染的"庐山"芯片。此外,摩尔线程还宣布推出搭载智能SoC芯片"长江"的AI算力本,作为连 接开发者与MUSA生态的核心入口。 生态建设是GPU行业的核心壁垒之一。例如,CUDA生态便是英伟达构建起近二十年的市场领先地位、并实现从硬件厂商向计算平台巨头转型的核心护城 河。 中国工程院院士、清华大学计算机系教授郑纬民在大会主题演讲中表示,发展"主权AI"是提升未来国家竞争力的关键,其核心在于实现"算力自主、算法 自强、生态自立"的完整体系。他认为,国产计算显卡与国外主流产品的性能差距正在持续缩小,虽然构建国产万卡乃至十万卡级别的超大规模智算系统 存在难度,但这是必须完成的产业基础设施任务。他特别指出, ...
新华财经早报:12月21日
新华财经· 2025-12-21 00:59
互联网平台监管与规则 - 国家发展改革委、市场监管总局、国家网信办联合印发《互联网平台价格行为规则》,旨在规范平台价格行为,保护消费者和经营者权益,推动平台经济健康发展 [2] - 规则明确禁止平台经营者强制或变相强制平台内经营者降价、让利、返现促销,或强制其在该平台价格不得高于其他渠道,或强制开通自动跟价、降价系统等限制自主定价权的行为 [2] 自动驾驶与汽车产业 - 重庆市公安局交通管理总队向长安汽车授予国内首块L3级自动驾驶专用正式号牌“渝AD0001Z”,标志着长安汽车在国内率先开启L3级自动驾驶时代 [2] - 长安汽车的L3级自动驾驶系统已在重庆真实道路测试累计超过500万公里 [2] 人工智能与半导体产业 - 《2026年我国人工智能产业发展形势展望》预计,2026年我国人工智能产业将维持高速增长,其中智能算力占比有望突破35%,国产芯片将在部分场景实现规模化应用 [2] - 摩尔线程宣布,基于其最新一代GPU架构“花港”的系列芯片——华山、庐山,将于明年量产上市 [2] - 基于“花港”架构的“庐山”高性能图形渲染芯片,将实现3A游戏渲染性能提升15倍,AI性能提升64倍,光线追踪性能提升50倍,并支持CAD、CAE等图形设计渲染 [2] 能源与电力发展 - 中国海油宣布,我国海上最大油田渤海油田2025年累计生产油气当量突破4000万吨,创历史新高,全年钻完井作业量亦创历史新高,高效推动多个亿吨级油田项目建成投产 [2] - 全球首台商用超临界二氧化碳发电机组(“超碳一号”示范工程)在贵州六盘水成功商运,这是全球首套15兆瓦超临界二氧化碳烧结余热发电工程 [2] - 在2026年电力外送交易中,黑龙江电力外送成交电量146.68亿千瓦时,同比增长19.3%,其中绿电外送成交电量34.31亿千瓦时,创历史新高 [2] 农业与种业发展 - 农业农村部发布新一批非主要农作物品种登记公告,登记推出特色农作物新品种1048个,同时撤销“仿种子”问题品种226个,强化品种登记动态管理 [2] - 目前全国登记品种已覆盖特色粮食、油料、糖料、蔬菜、果树、茶树及橡胶树等七大类29种作物 [2] 国际贸易与全球经济 - 世贸组织成员同意授权欧盟根据相关裁决,对美国进口商品实施反制措施,欧盟每年可对价值不超过1364万美元的美国商品实施反制 [3] - 世贸组织《2025年世界贸易报告》指出,在配套政策到位的情况下,人工智能有望到2040年将跨境货物和服务贸易额提高34%至37%,全球GDP增长12%至13% [3] - 荷兰中央银行2025年秋季预测报告显示,今年该国经济增长率将达1.7%,明显高于预期,国际贸易和政府支出是主要动力 [3] - 世界银行批准为巴基斯坦“公共资源促进包容性发展多阶段规划式方案”提供7亿美元融资,中期发展政策贷款将总共提供高达13.5亿美元的融资 [3] 公司动态与事件 - 上海市消保委就“南极磷虾油”相关问题发布对北京同仁堂集团声明的表态,欢迎其正视问题的态度,并希望各项整改举措落实到位 [2] - 美国特拉华州最高法院裁定,恢复特斯拉公司首席执行官埃隆·马斯克原总值560亿美元的薪酬方案 [3]
全新架构、万卡集群、智算平台,摩尔线程(688795.SH)开发者大会还有哪些亮点?
智通财经网· 2025-12-20 23:23
核心观点 - 摩尔线程在首届开发者大会上发布了新一代全功能GPU架构“花港”及一系列软硬件产品,展示了其在AI训推、图形渲染、智算集群及个人终端等领域的全栈布局,战略意图从硬件供应商转向平台级算力基础设施商 [1][8][9] 技术架构与芯片发布 - 发布新一代全功能GPU架构“花港”,算力密度较上一代提升50%,能效提升10倍,支持从FP4到FP64全精度,集成AI生成式渲染架构(AGR)和第二代光线追踪硬件加速引擎,计划明年量产 [1] - 基于“花港”架构公布两款核心芯片:“华山”主打AI训推一体和超智融合,内置新一代异步编程模型和全精度MMA,配备MTFP8/6/4混合低精度计算技术 [2] - 另一款芯片“庐山”专攻高性能图形渲染,AI计算性能较前代提升64倍,几何处理性能提升16倍,完整支持DirectX 12 Ultimate [2] 智算中心与集群能力 - 发布“夸娥”万卡智算集群,浮点运算能力达10 Exa-Flops,在Dense大模型上的训练算力利用率(MFU)达60%,在MOE大模型上为40%,有效训练时间占比超90% [4] - 展示与硅基流动的合作成果,在DeepSeek R1 671B全量模型上,MTT S5000单卡的Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s [5] - 分享面向下一代智算中心的MTT C256超节点架构规划,旨在通过高密硬件设计提升集群能效 [5] 软件生态与开发者工具 - 自研MUSA架构升级至5.0版本,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97% [6] - 计划逐步向开发者社区开源计算加速库、通信库及系统管理框架的核心组件 [6] - 计划推出兼容跨代GPU指令架构的中间语言MTX,以及面向渲染与AI融合计算的编程语言muLang,以降低开发者适配门槛 [6] 个人智算终端硬件 - 正式进军个人智算终端硬件领域,发布首款AI算力本MTT AIBOOK,售价9999元(32GB+1TB版本),预计2026年1月10日开售 [7] - MTT AIBOOK搭载自研智能SoC芯片“长江”,集成高性能全大核CPU及全功能GPU,异构AI算力达50 TOPS,内置AI智能体和2D数字人“小麦”,支持0.5秒生成数字人形象,并预装Qwen3-8B大模型 [7][8] - 该设备支持Windows、Linux、安卓容器及所有国产操作系统,旨在将MUSA生态从云端下沉到开发者桌面端,实现开发闭环 [8] 行业背景与战略意图 - 行业正处于从追求参数规模向追求推理效能和生态落地的转型期 [9] - 公司展示的“芯-边-端-云”全栈体系,反映出其试图摆脱单一硬件供应商身份,转向平台级算力基础设施商的战略意图 [9] - 中国工程院院士郑纬民指出,发展“主权AI”的核心在于算力自主、算法自强与生态自立,并强调国产芯片平台必须构建易用的开发环境以留住开发者社群 [8] 资本市场表现 - 公司股价近期波动明显,12月19日收报664.10元/股,跌幅5.9%,相较于12月11日高点累计跌幅达29.4% [9] - 相较于发行价,当前股价涨幅仍超过481%,公司总市值维持在3121.46亿元的高位 [9]
摩尔线程 突发大消息!
中国基金报· 2025-12-20 13:32
【导读】摩尔线程发布新一代GPU架构"花港"等 12月20日上午,备受市场关注的摩尔线程首届MUSA开发者大会在北京中关村国际创新中心召开。在此 次大会上,摩尔线程展示了以自主MUSA统一架构为核心的全栈技术成果,包括新一代GPU架构"花 港"、未来将发布的"华山"芯片和"庐山"芯片,以及夸娥万卡智算集群。 发布新一代GPU架构"花港" MUSA是摩尔线程自主研发的元计算统一计算架构,是其战略基石,覆盖从芯片架构、指令集、编程模 型到软件运行库及驱动程序框架等的全栈技术体系。 "华山"专注AI训推一体与超大规模智能计算,为万卡级智算集群提供稳定高效的算力支撑,是构建下一 代"AI工厂"的坚实底座。 "庐山"专攻高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50 倍,并显著增强纹理填充、原子访存能力及显存容量。 推出夸娥万卡智算集群 在此次大会上,摩尔线程还正式发布了夸娥万卡智算集群。该集群具备全精度、全功能通用计算能力, 在万卡规模下能实现高效稳定的AI训练与推理。 据摩尔线程介绍,其核心突破包括:浮点运算能力达到10Exa-Flops,训练算力利用率(MFU)在Dense ...
摩尔线程,发布新一代GPU架构
21世纪经济报道· 2025-12-20 13:32
记者丨 彭新 编辑丨朱益民 在登陆科创板近半月之际,12月20日,摩尔线程(688795.SH)于北京举办首届MUSA开发者 大会。 构和上一代Hopper架构之间,而在访存容量指标上优于上述两个架构。 同步发布的"庐山"芯片则侧重于高性能图形渲染,其AI计算性能提升64倍,几何处理性能提升 16倍,光线追踪性能提升50倍,并增强了纹理填充和显存容量。 会上,摩尔线程展示了其基于MUSA统一架构为核心的全栈技术成果,并发布下一代全功能 GPU架构"花港"。 基于该架构,摩尔线程推出面向AI训推一体的"华山"芯片及高性能图形渲染的"庐山"芯片,并 展示了"夸娥"万卡智算集群技术成果与搭载"长江"SoC芯片的端侧AI产品。 MUSA(Meta-computing Unified System Architecture)为摩尔线程自主研发的"元计算"统一 计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体 系。其中,新一代GPU架构"花港"最受关注。 "大家知道,目前的芯片代工工艺发展确实面临一些客观的、缓慢的挑战。但我们要不要停下 来等?不能。'花港'的意义在于,我们通过全新的指令 ...
上市15天,摩尔线程剑指英伟达腹地
虎嗅APP· 2025-12-20 13:20
出品 | 虎嗅科技组 作者 | 丸都山 编辑 | 苗正卿 头图 | 摩尔线程 在资本市场的热度趋于平静之时,摩尔线程又在产业端将人们的视线拉回。 12月20日,摩尔线程举行了首届"MUSA开发者大会",发布全新一代全功能GPU架构"花港",以 及基于"花港"架构打造的AI训推一体芯片"华山",以及专用于高性能图形渲染的芯片"庐山"。 此外,摩尔线程创始人张建中在现场还公布了"夸娥万卡智算集群",以及未来即将发布的MTT C256超节点结构规划。 如果说上述内容还属于"可预测的"技术迭代内,那么诸如中间语言MTX,以及光刻计算库、量子 计算融合框架等技术,就真的完全在人意料之外了。 在此前几次版本迭代中,MUSA主要集中在编程生态的扩充,比容兼容更多编程语言,或是丰富 算子库上,而今天提到的"中间语言MTX"属首次出现。 简单解释下中间语言MTX是什么。它的核心作用是兼容不同代际GPU的指令架构,让开发者无需 为每一代新GPU重新适配代码,大幅降低开发者适配成本,同时为上层软件生态提供稳定的底层 支撑。 用个更直观的例子来说明下:在英伟达CUDA生态下,其核心底层组件之一,就是这个中间语言 技术,英伟达将其命名 ...