MTT S5000

搜索文档
摩尔线程上会在即,乐观估值已达5000亿!国产GPU四小龙技术实力究竟如何?(附生态合作公司)
天天基金网· 2025-09-25 10:09
文章核心观点 国产GPU企业"四小龙"(摩尔线程、沐曦集成、燧原科技、壁仞科技)在技术性能、融资生态及产业链协同方面取得显著进展,理论指标接近甚至部分超越英伟达同类产品,但实际应用效率、软件生态及供应链成熟度仍存差距 [9][55][67] 企业技术特点与性能对比 摩尔线程 - 定位全功能GPU,覆盖AI计算、图形渲染及视频编解码,产品线包含消费级显卡MTT S80(FP32算力14.4 TFLOPS)及智算芯片S5000(FP32算力32 TFLOPS)[11][16][20] - 消费级显卡MTT S80理论算力超英伟达RTX 3060(14.4>12.7 TFLOPS),但实际游戏帧率仅为后者40%-50%,多卡集群通信带宽(256 GB/s)显著低于英伟达NVLink 4(900 GB/s)[20][21] - 软件生态适配不足千款游戏,远低于英伟达数千款水平 [21] 沐曦集成 - 专注通用GPU,产品线包括曦云C系列(大模型训练)、曦思N系列(AI推理)及曦彩G系列(图形渲染)[26][28] - 曦云C600显存容量144GB HBM3e,超英伟达H20(96GB)50%,FP8算力达1000 TFLOPS(推算值超H20的296 TFLOPS),但实际互连带宽效率未达NVLink水平 [30][32] - 通过MXMACA软件栈实现CUDA生态兼容,降低客户迁移门槛 [27][32] 壁仞科技 - 采用Chiplet技术及7nm工艺,旗舰产品BR100系列宣称峰值算力为英伟达A100的三倍,显存带宽2.3TB/s(超A100 15%)[39][42][44] - 实际算力利用率仅60%(英伟达A100达90%以上),异构GPU协同训练方案(HGCT)支持多芯片千卡混合训练,通信效率超98% [40][44] - 软件生态BIRENSUPA已与浪潮信息、百度飞桨合作,但实际优化仍需完善 [44] 燧原科技 - 聚焦云端AI算力,产品涵盖训练卡、推理卡及智算集群,第三代推理加速卡云燧S60支持低延迟推理 [49][50] - 训推一体架构产品L600显存容量144GB HBM3e(为英伟达H20的1.5倍),但存储带宽(3.6TB/s)及互联带宽(800GB/s)较英伟达(4.0TB/s、900GB/s)低11%-12.5% [52][54] - 推出异构GPU协同训练技术(HGCT),解决算力孤岛问题 [49] 融资与资本布局 摩尔线程 - 完成六轮股权融资及Pre-IPO轮,投后估值从不足10亿元跃升至246.2亿元,创国产GPU领域估值纪录 [57] 沐曦集成 - 国有资本占比超60%,深度参与国家级"东数西算"项目,融资侧重政府算力场景绑定 [59] 燧原科技 - 累计完成11轮融资近70亿元,腾讯作为第一大机构股东持股20.49%,产品直接嵌入腾讯云及AI业务 [62][64] - 获国家大基金二期及上海国际集团战略注资,当前估值160亿元 [62][64] 壁仞科技 - A轮融资11亿元创国内芯片设计领域纪录,2025年获上海及广东省政府背景基金领投,国资持续加码 [65] 产业链合作生态 股权与合作模式 - 摩尔线程与和而泰(直接参股1.244%)、ST华通(间接持股4.343%)、联美控股(直接投资1亿元)等形成股权及业务协同 [70] - 沐曦集成与淳中科技(直接持股0.2373%)、中科蓝讯(间接持股0.24%)等通过资本纽带强化技术整合 [72] - 燧原科技与中科蓝讯(间接持股0.23%)、广脉科技(行业解决方案测试)等推进基础设施共建 [75][77] 技术及供应链协同 - 弘信电子与摩尔线程共建AI软硬件基础设施,润欣科技负责GPU封装测试及量产 [71][72] - 壁仞科技与海兰信合作海底数据中心、与科华数据优化智算中心平台,强化绿色算力及异构算力布局 [80]
Deepseek发布V3.1 为何火的却是官方留言?
环球网资讯· 2025-08-23 05:26
DeepSeek-V3.1技术升级 - 公司正式推出DeepSeek-V3.1 在混合推理架构、思考效率和Agent能力方面全面升级 [1] - 官方补充说明UE8M0 FP8技术针对下一代国产芯片设计 [1] 资本市场反应 - DeepSeek官方留言引发连锁反应 寒武纪和海光信息等企业股价短期内上涨 [3] - 市场普遍认为FP8技术优化将推动国产芯片在AI训练和推理场景下的性能提升并扩大市场份额 [3] FP8技术特性 - FP8是8位浮点数格式 能在几乎不损失模型精度情况下大幅提升计算速度并降低功耗 [3] - 该格式尤其适用于大规模神经网络训练和推理场景 [3] 国内芯片产业现状 - 目前国内仅极少数GPU厂商支持FP8 如摩尔线程旗舰产品MTT S5000是国内首批原生支持FP8并大规模量产的GPU [3] - 摩尔线程MUSA架构原生支持硬件FP8张量加速计算 相对传统FP16计算可实现两倍浮点算力提升 [3] UE8M0 FP8技术价值 - 该技术通过对FP8格式深度优化 为下一代国产芯片提供底层支持 [4] - 通过减少数据存储和传输耗损 显著提升芯片吞吐量和能效比 [4] - 进一步强化国产AI芯片在国内外市场的竞争力 [4] 行业技术趋势 - 英伟达和AMD等国际巨头纷纷布局FP8 该格式有望成为下一代AI训练和推理的通用标准 [5] - DeepSeek此时推出UE8M0 FP8技术意味着中国企业在标准制定阶段已深度参与 可能影响全球技术路线走向 [5] 软硬件协同发展 - 公司从AI算法向芯片技术延伸体现软件定义硬件趋势 [5] - 优秀软件栈和算法优化能力正成为提升硬件性能的关键因素 [5]
DeepSeek昨天悄悄扔的炸弹,今天爆了
虎嗅APP· 2025-08-22 13:24
文章核心观点 - DeepSeek发布V3 1并补充UE8M0 FP8技术细节 引发资本市场强烈反应 算力与芯片板块大涨 反映国产芯片在算力赛道切入国际前沿的可能性 [5][6][15] - UE8M0 FP8格式通过创新数据压缩与动态范围管理 显著提升国产芯片在AI大模型训练与推理中的性能 降低对显存带宽的依赖 并减少75%带宽开销 [8][11][12] - 该技术突破被视为国产算力产业链的共振时刻 标志软硬件协同成果显现 为国产芯片生态提供差异化竞争力 并逐步减少对英伟达的依赖 [6][13][15] 技术解析:UE8M0 FP8 - FP8是一种8位浮点格式 用于压缩数据以减少AI大模型对显存带宽的压力 但国产芯片此前仅少数支持FP8 多数支持FP16导致性能折损一半 [8] - UE8M0是MX格式中的关键缩放因子 采用无符号8位指数表示法 无尾数设计 实现"只调档位不调微刻度"的高效数据管理 动态范围达2⁻¹²⁷至2¹²⁸ [10][11] - 该格式硬件执行简单 仅需整数次幂运算 避免复杂浮点操作 提升能效并几乎消除数值溢出或信息损失问题 错误率大幅降低 [11] - 相较于传统32位FP32缩放因子 UE8M0仅追加8位即可管理32个FP8数据 带宽开销降低75% 对HBM带宽受限的国产芯片至关重要 [12] 产业影响与市场反应 - DeepSeek官方表态触发A股市场超2800只个股上涨 算力股全线爆发 云天励飞等多股涨停 芯片股寒武纪涨停创历史新高 中芯国际大涨14% 海光信息涨停 [6] - 技术突破被视为国产芯片与国际前沿接轨的信号 头部国产芯片公司如摩尔线程 寒武纪等均已支持FP8 思元590及690系列均兼容 [13][14] - 摩尔线程MUSA架构原生支持硬件FP8张量加速 结合UE8M0 FP8 Scale可实现相对于FP16两倍的浮点算力提升 带宽效率及存储容量利用率优化 [14] - DeepSeek主动推动国产芯片生态发展 通过编译器优化 训练框架适配等全栈打通 实现渐进式对英伟达的生态解绑 [13][15]
DeepSeek昨天悄悄扔的炸弹,今天爆了
虎嗅· 2025-08-22 10:12
核心观点 - DeepSeek发布V3 1版本并补充UE8M0 FP8算力支持细节 引发资本市场强烈反应 国产算力及芯片板块集体大涨 标志国产芯片在算力赛道上切入国际前沿的技术突破和生态共振 [1][3][4][17] 技术突破 - UE8M0 FP8由FP8数据格式和UE8M0缩放因子构成 FP8以8位存储压缩数据 降低AI大模型训练推理的显存带宽压力 但国产芯片多数仅支持FP16 导致性能折损至少50% [5] - UE8M0是MX格式中的关键缩放因子 采用无符号8位指数设计(U代表无符号 E8代表8位指数 M0代表无尾数) 硬件执行时仅需整数次幂运算 极大缩短计算路径并提升能效 [8][9] - 动态范围达2⁻¹²⁷至2¹²⁸ 避免数值溢出或舍入导致的信息损失 错误率大幅降低 使国产芯片运行大模型时更快更省且能处理大数值 [10][11] - 相较于传统32位FP32缩放因子 UE8M0仅需追加8位即可高效管理32个FP8数据 带宽开销降低75% 突破内存墙限制 为HBM带宽追赶中的国产芯片提供架构级优化 [12] 产业生态影响 - DeepSeek主动支持国产芯片生态 被视为对英伟达捆绑的渐进式解绑 官方下场为国产芯片发展站位 推动产业软硬件协同全栈打通 [13][14][17] - 头部国产芯片公司均与DeepSeek接触 寒武纪思元590/690系列、摩尔线程MTT S5000等旗舰产品原生支持FP8 摩尔线程MUSA架构通过硬件原生FP8实现浮点算力提升2倍 并优化带宽效率及存储利用率 [5][15][16] - 清程极智等企业专门针对国产芯片做软件适配 提升运行DeepSeek时的性能 国内算力产业链在编译器优化、训练框架适配等环节实现突破 [6][14] 市场反应 - A股超2800只个股上涨 算力股全线爆发 云天励飞等多股涨停 芯片股集体大涨 寒武纪涨停创历史新高 中芯国际大涨14% 海光信息涨停 [3] - 资本市场反应反映国产芯片获得国际话语权的起点 中国芯片迎来技术前沿突破的窗口期 [4][17]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 05:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
国产GPU“全能选手”冲刺科创板 摩尔线程的技术长跑
21世纪经济报道· 2025-07-11 04:07
行业前景与市场规模 - 全球GPU市场规模预计在2029年将达到36119.74亿元,中国GPU市场规模将达到13635.78亿元,全球占比从2024年的30.8%提升至37.8%[1] - 中国AI芯片市场规模将从2024年的1425.37亿元激增至2029年的13367.92亿元,年均复合增长率为53.7%,GPU市场份额预计从69.9%上升至77.3%[8] - AI大模型、数字孪生、自动驾驶等前沿技术推动GPU成为下一代算力基建的核心引擎[8] 公司技术路线与产品矩阵 - 公司选择"全功能GPU"技术路线,同时实现图形图像处理、AI张量计算、物理仿真和超高清视频编解码等多种任务协同处理能力[3] - 自研MUSA架构是国内首个单芯片支持AI智算、图形加速、物理仿真的全功能GPU架构,已迭代至第四代[4][6] - 消费级产品MTT S80性能与英伟达RTX 3060相当,AI智算产品MTT S5000构建的千卡集群效率超过国外同代系GPU[4] - 智能终端产品"长江"SoC实现全功能GPU统一内存架构突破,边缘计算产品E300性能超越英伟达同代系[5][6] 商业化进展与财务表现 - 主营业务收入从2022年的4584万元增至2024年的4.32亿元,三年复合增长率达208%[8] - AI智算业务占比77.6%,毛利率从2022年的-70.08%回升至2024年的72.32%[9] - 应收账款周转率9.34远超行业平均1.88,账上货币资金近49亿元[9] 研发投入与知识产权 - 2024年研发投入13.59亿元,研发费用率309.88%,研发人员占比近八成[6] - 截至2024年底获得450项专利授权,包括442项境内专利、33项软件著作权和37项集成电路布图设计专有权[6] 团队背景与战略定位 - 创始团队来自英伟达、惠普、戴尔等国际巨头,创始人张建中曾任英伟达全球副总裁[6] - 构建"芯片+板卡+一体机+算力集群"全线产品矩阵,形成"自研+生态+市场"闭环能力[8][10] - 科创板IPO符合"硬科技"标准:三年研发投入超38亿元,可产业化发明专利超400项[10] 政策与产业环境 - 科创板深化改革为具备核心技术但未盈利的集成电路企业提供上市便利[10] - 国产GPU面临"缺芯"矛盾,全功能GPU路径顺应自主可控趋势[8][11]
摩尔线程冲刺科创板:国产GPU的破局者。从技术积累到商业变现
格隆汇· 2025-07-10 02:57
公司IPO进展 - 摩尔线程智能科技科创板IPO申请正式获受理,即将登陆资本市场 [1] - 招股说明书首次全面展示公司在全功能GPU领域的技术积累与商业化潜力 [1] 技术优势 - 构建全栈技术壁垒,核心为自主研发的MUSA架构,涵盖芯片架构、指令集、编程模型等关键要素 [2] - MUSA架构实现单芯片同时支持AI计算加速、图形渲染、物理仿真、科学计算及超高清视频编解码的技术突破 [2] - 在FP8技术研发上取得系统性突破,成为国内少数掌握该项技术的GPU厂商 [2] - 2020年成立以来共发布5颗芯片,完成四代全功能GPU架构迭代,覆盖云到端的智能计算场景 [2] - "平湖"架构增加FP8和FP64精度支持,提升AI算力,支持万卡集群智算中心解决方案 [2] - 最新AI旗舰产品MTT S5000性能对标英伟达H100,计算效率实现部分超越 [3] - 自主研发并国内率先推出支持DirectX 12的图形加速引擎 [3] 技术对比与迭代速度 - 架构迭代速度领跑国内GPU行业,2020年至今快速缩小与英伟达差距 [4] - MTT S80显卡单精度浮点算力性能接近英伟达RTX 3060 [4] - 基于MTT S5000的千卡GPU智算集群效率超过同等规模国外同代系GPU集群 [4] 知识产权布局 - 截至2024年末拥有402项境内发明专利,全面覆盖GPU核心领域 [5] - 专利布局聚焦"卡脖子"环节,形成从芯片到集群、软件到硬件的全方位保护 [5] 营收与增长 - 2022年至2024年营业收入从4608.83万元增长至43845.95万元,复合增长率达208.44% [6] - 产品打入大模型训练推理、数字孪生、消费电子、云计算等多个关键市场 [6] - 净利润从2022年-183955.22万元改善至2024年-149193.77万元,亏损缩窄幅度约19% [6] 研发投入与商业化 - 单位研发投入创收从2022年0.041元提升至2024年0.323元,提升幅度约7.88倍 [7] - 80亿元募资计划中近70亿元将投入三款新一代芯片研发,包括AI训推一体芯片、图形芯片及AI SoC芯片 [10] - 研发项目直指提升千卡集群计算效率、突破端侧AI算力瓶颈及完善自主开发生态 [10] 发展路径 - 技术投入与商业回报形成正向循环,有望加速走向J曲线拐点 [8][10] - 从技术投入期向价值回报期跃迁,商业化能力和可持续性得到市场初步验证 [7][11]
AI算力行业跟踪点评:沐曦股份及摩尔线程获科创板IPO受理,算力自主化趋势再明确
申万宏源证券· 2025-07-06 14:43
报告核心观点 6月30日国产GPU芯片公司沐曦股份和摩尔线程的科创板IPO申请获受理,分别拟募资39.04亿元和80亿元,看好AI算力带动核心环节国产化,除待上市的AI芯片标的外,还推荐基础设施、先进制造、服务器等领域相关公司[3]。 分组1:沐曦股份情况 累计出货与产品规划 - 2020年成立于上海,主营全栈GPU产品及配套,2022 - 24营收复合增长率4075%,截至25Q1,GPU累计销量超25,000颗,C500于2024年2月量产,C600预计26Q1大规模量产,C700预计27Q3大规模量产[7][8] 团队背景 - 管理层有顶尖技术背景和丰富经验,创始人兼CEO陈维良曾任职AMD,控制公司22.94%股份表决权,硬件、软件负责人及高管团队均有知名芯片厂商任职经历[10] 性能与生态优势 - 完成AI GPGPU软硬件全栈技术布局,全系列用统一XCORE架构,GPU硬件在计算、存储、互联能力等维度领先,自研MXMACA软件框架兼容CUDA,单卡、集群性能及生态兼容性领先[13] 市场策略与国产化推动 - 采用“1 + 6 + X”市场策略,销售分直销和经销,主营收入中经销占比逐步提升,正推动核心环节国产化,下一代旗舰产品曦云C600已完成流片[26] 分组2:摩尔线程情况 产品与收入情况 - 2020年成立于北京,以全功能GPU为核心,形成多元产品矩阵,交付模式多样,截至2024年底,AI智算产品合计收入3.36亿元,S4000于2023年底推出,S5000提升性能,KUAE1支持千卡互联,KUAE2支持万卡互联[33] 团队背景 - 管理层有英伟达技术或销售背景,创始人张建中控制公司36.36%股份,核心人员负责芯片架构、研发、市场推广等工作[38] 技术与集群优势 - 自主研发的MUSA GPU架构迭代四代,单卡性能好,KUAE2支持万卡级规模扩展,MUSA软件栈可实现CUDA程序迁移[44][46] 市场策略与国产化推动 - 采用直销与经销并存模式,主营收入中直销占比逐步提升,市场策略为消费和商业及政企市场双轮驱动,正推动国产化供应替代[51] 分组3:行业相关推荐 - 看好AI算力带动核心环节国产化,除待上市AI芯片标的外,推荐基础设施领域的澜起科技、德明利等,先进制造领域的中芯国际、华虹公司等,服务器领域的浪潮信息、神州数码等[3]
科创板年内新增最大IPO融资项目拆解:摩尔线程的商业化初探
华尔街见闻· 2025-07-03 13:09
国产GPU行业竞争格局 - "国产GPU四小龙"中摩尔线程和沐曦集成科创板IPO已获受理,壁仞科技、燧原科技、格兰菲智能处于IPO辅导阶段,行业集体迈向资本化[1] - 摩尔线程计划募资80亿元,为2024年上半年科创板最大IPO募资规模,沐曦集成募资额约为其一半[5][6][7] - 行业竞争焦点在于谁能率先成为"国产GPU第一股",市场高度关注[8] 摩尔线程核心竞争力 - 核心团队来自英伟达,MTT S80显卡单精度浮点算力接近RTX 3060,千卡GPU智算集群效率超过国外同代产品[2] - 2024年收入达4.38亿元同比增长超2倍,AI智算产品首次创收3.36亿元占比超7成[3][11] - 研发投入达13.59亿元,净亏损14.92亿元但同比减亏10%[4] 产品与技术进展 - 产品线覆盖AI智算、专业图形加速、桌面级图形加速和智能SoC,形成全功能布局[9][10] - 2023年推出第三代GPU芯片MTT S4000,2024年披露新品MTT S5000,FP32算力达32TFLOPS超越A100但低于H100和MI325X[12][13][15][17] - 基于MTT S5000构建的千卡集群效率超过国外同代产品,计划投资25亿元研发新一代AI训推一体芯片[16] 商业化策略与财务表现 - 消费级产品MTT S80/S70累计收入仅0.72亿元,因国际品牌竞争采取低价策略导致毛利率为负[20] - 转向聚焦B端市场,AI智算和专业图形加速板卡毛利率分别达90.7%和83.13%,显著高于沐曦集成同类产品[21][22] - 在手订单4.4亿元,管理层预计2027年可实现盈利[23][24] 行业技术发展趋势 - FP8低精度浮点格式成为技术突破方向,可在保持低精度同时实现准确性、效率、内存和能耗的平衡[14][15] - 摩尔线程通过支持FP8计算与存储实现训练加速和内存占用降低,与BF16基线相比精度损失控制在0.25%以内[15]
国产GPU,还有多少硬骨头要啃?
虎嗅· 2025-07-02 00:46
国产GPU企业IPO动态 - 摩尔线程和沐曦集成电路科创板IPO申请获上交所受理,标志着国产GPU赛道进入新阶段 [1][3] - 沐曦拟募资39亿元,摩尔线程计划募资80亿元,显示行业高投入特性 [4][5] - 两家公司营收呈现快速增长趋势:沐曦从2022年42.64万元增至2024年7.43亿元,摩尔线程从2022年4608.8万元增至2024年4.38亿元 [7][9] 财务与研发投入 - 沐曦2022-2024年累计研发投入22亿元,净亏损分别为7.77亿/8.71亿/14亿元 [4] - 摩尔线程同期累计研发投入38亿元,净亏损分别为18.4亿/16.73亿/14.92亿元 [5] - 与国际巨头相比仍有差距:英伟达2024财年研发费用达129.14亿美元 [6] 产品与技术布局 - 沐曦产品矩阵覆盖计算和渲染全场景,包括曦思N系列、曦云C系列和曦彩G系列 [7] - 摩尔线程基于MUSA架构推出智算卡和消费级GPU,支持AI计算加速等多项功能 [9][10] - 两家公司产品结构显示业务重心:沐曦训推板卡占比97.55%,摩尔线程AI智算集群占比75.38% [8][11] 行业竞争格局 - 国产GPU企业可分为NVIDIA系、AMD系、国家队和拆分系等不同流派 [12][13] - 主要厂商包括天数智芯、壁仞科技、景嘉微等,成立时间和技术路线各异 [13] - 行业面临洗牌压力,上市成为决定企业发展的关键因素 [12][26] 技术挑战与发展路径 - 突破CUDA生态困局是首要挑战,需构建兼容层+自研框架方案 [15] - Chiplet和HBM技术成为性能提升关键路径 [16][17] - 兼容性和集群能力是产品市场化的重要保障 [19][20] 市场前景与AI机遇 - 中国AI芯片市场规模预计从2024年1425.37亿元增至2029年13367.92亿元 [25] - GPU市场份额将从69.9%提升至77.3%,增长潜力显著 [25] - AI算力需求激增为国产GPU创造发展窗口,但需避免"田忌赛马"式宣传 [22][27]