Workflow
曦云C600
icon
搜索文档
摩尔线程上会在即,乐观估值已达5000亿!国产GPU四小龙技术实力究竟如何?(附生态合作公司)
天天基金网· 2025-09-25 10:09
文章核心观点 国产GPU企业"四小龙"(摩尔线程、沐曦集成、燧原科技、壁仞科技)在技术性能、融资生态及产业链协同方面取得显著进展,理论指标接近甚至部分超越英伟达同类产品,但实际应用效率、软件生态及供应链成熟度仍存差距 [9][55][67] 企业技术特点与性能对比 摩尔线程 - 定位全功能GPU,覆盖AI计算、图形渲染及视频编解码,产品线包含消费级显卡MTT S80(FP32算力14.4 TFLOPS)及智算芯片S5000(FP32算力32 TFLOPS)[11][16][20] - 消费级显卡MTT S80理论算力超英伟达RTX 3060(14.4>12.7 TFLOPS),但实际游戏帧率仅为后者40%-50%,多卡集群通信带宽(256 GB/s)显著低于英伟达NVLink 4(900 GB/s)[20][21] - 软件生态适配不足千款游戏,远低于英伟达数千款水平 [21] 沐曦集成 - 专注通用GPU,产品线包括曦云C系列(大模型训练)、曦思N系列(AI推理)及曦彩G系列(图形渲染)[26][28] - 曦云C600显存容量144GB HBM3e,超英伟达H20(96GB)50%,FP8算力达1000 TFLOPS(推算值超H20的296 TFLOPS),但实际互连带宽效率未达NVLink水平 [30][32] - 通过MXMACA软件栈实现CUDA生态兼容,降低客户迁移门槛 [27][32] 壁仞科技 - 采用Chiplet技术及7nm工艺,旗舰产品BR100系列宣称峰值算力为英伟达A100的三倍,显存带宽2.3TB/s(超A100 15%)[39][42][44] - 实际算力利用率仅60%(英伟达A100达90%以上),异构GPU协同训练方案(HGCT)支持多芯片千卡混合训练,通信效率超98% [40][44] - 软件生态BIRENSUPA已与浪潮信息、百度飞桨合作,但实际优化仍需完善 [44] 燧原科技 - 聚焦云端AI算力,产品涵盖训练卡、推理卡及智算集群,第三代推理加速卡云燧S60支持低延迟推理 [49][50] - 训推一体架构产品L600显存容量144GB HBM3e(为英伟达H20的1.5倍),但存储带宽(3.6TB/s)及互联带宽(800GB/s)较英伟达(4.0TB/s、900GB/s)低11%-12.5% [52][54] - 推出异构GPU协同训练技术(HGCT),解决算力孤岛问题 [49] 融资与资本布局 摩尔线程 - 完成六轮股权融资及Pre-IPO轮,投后估值从不足10亿元跃升至246.2亿元,创国产GPU领域估值纪录 [57] 沐曦集成 - 国有资本占比超60%,深度参与国家级"东数西算"项目,融资侧重政府算力场景绑定 [59] 燧原科技 - 累计完成11轮融资近70亿元,腾讯作为第一大机构股东持股20.49%,产品直接嵌入腾讯云及AI业务 [62][64] - 获国家大基金二期及上海国际集团战略注资,当前估值160亿元 [62][64] 壁仞科技 - A轮融资11亿元创国内芯片设计领域纪录,2025年获上海及广东省政府背景基金领投,国资持续加码 [65] 产业链合作生态 股权与合作模式 - 摩尔线程与和而泰(直接参股1.244%)、ST华通(间接持股4.343%)、联美控股(直接投资1亿元)等形成股权及业务协同 [70] - 沐曦集成与淳中科技(直接持股0.2373%)、中科蓝讯(间接持股0.24%)等通过资本纽带强化技术整合 [72] - 燧原科技与中科蓝讯(间接持股0.23%)、广脉科技(行业解决方案测试)等推进基础设施共建 [75][77] 技术及供应链协同 - 弘信电子与摩尔线程共建AI软硬件基础设施,润欣科技负责GPU封装测试及量产 [71][72] - 壁仞科技与海兰信合作海底数据中心、与科华数据优化智算中心平台,强化绿色算力及异构算力布局 [80]
越涨越“吸金”,科创半导体ETF(588170)近一周涨7.8%,近5日资金流入超3.6亿
每日经济新闻· 2025-09-22 06:30
截至2025年9月22日13点21分,上证科创板半导体材料设备主题指数强势上涨1.05%,成分股中芯 国际上涨4.48%,盛美上海上涨2.82%,华海诚科上涨2.53%,艾森股份,安集科技等个股跟涨。科创半 导体ETF(588170)上涨0.7%,最新价报1.3元。拉长时间看,截至2025年9月19日,科创半导体ETF近1 周累计上涨7.83%。 从资金净流入方面来看,截至2025年9月19日,科创半导体ETF近3天获得连续资金净流入,最高单 日获得1.36亿元净流入,近5日合计"吸金"3.68亿元。 方正证券最新分析指出,在摩尔定律放缓和我国先进制程技术受限的现状下,先进封装成为国产算 力芯片突破性能瓶颈的重要方向。 华为 、 寒武纪 、 海光信息等公司的算力芯片正加速迭代,国产供 应链积极配套以实现算力芯片自主可控。2025世界人工智能大会上沐曦重磅发布基于国产供应链的旗舰 GPU曦云C600, 摩尔线程则表示正联合国内封装测试厂商,完成Chiplet与2.5D封装(国产硅中介层) 量产和测试。先进封装产能扩张需求愈发迫切,先进封装产业链上下游迎来重大发展机遇。 华泰证券看好2026年AI相关需求和中国先 ...
2025外滩大会丨上海全球金融科技中心展区:生态构建、平台引领与数智未来
证券时报网· 2025-09-15 06:47
作为年度备受瞩目的科技盛会,主题为"重塑创新增长"的2025外滩大会9月10日至13日在上海黄浦世博 园区举行。为全球科技、金融和产业界搭建起一个开放对话平台,并展现AI时代全球科技创新趋势。 今年的外滩大会设置了10000平米科技展览、5000平米科技集市,吸引了近200家企业参展。科技展区的 三大板块:"探索智能上限"、"深入产业实践"、"全球创新协作"分别展示了从LLM到通用人工智能等前 沿技术布局、AI与健康出行等行业的结合应用,以及全球金融科技领域创新示范应用。 上海全球金融科技中心展区围绕《上海高质量推进全球金融科技中心建设行动方案》主题展开,展示 了"行动方案"发布以来上海在金融科技方面取得的一系列成果,全面呈现了上海在金融科技领域的创新 实践、技术突破和应用场景,展示了上海金融科技良好的发展环境和政策支持。 上海证券交易所、国泰海通证券股份有限公司、上海浦东发展银行股份有限公司、中国工商银行股份有 限公司、中国太平洋保险(集团)股份有限公司、上海库帕思科技有限公司、上海财跃星辰智能科技有 限公司、上海商汤智能科技有限公司、上海智谱寰宇科技有限公司、无限光年(上海)技术有限公司、 上海临港新片区 ...
上海全球金融科技中心展区:生态构建、平台引领与数智未来
证券时报网· 2025-09-15 06:40
作为年度备受瞩目的科技盛会,主题为"重塑创新增长"的2025外滩大会9月10日至13日在上海黄浦世博 园区举行。为全球科技、金融和产业界搭建起一个开放对话平台,并展现AI时代全球科技创新趋势。 今年的外滩大会设置了10000平米科技展览、5000平米科技集市,吸引了近200家企业参展。科技展区的 三大板块:"探索智能上限"、"深入产业实践"、"全球创新协作"分别展示了从LLM到通用人工智能等前 沿技术布局、AI与健康出行等行业的结合应用,以及全球金融科技领域创新示范应用。 上海全球金融科技中心展区围绕《上海高质量推进全球金融科技中心建设行动方案》主题展开,展示 了"行动方案"发布以来上海在金融科技方面取得的一系列成果,全面呈现了上海在金融科技领域的创新 实践、技术突破和应用场景,展示了上海金融科技良好的发展环境和政策支持。 上海证券交易所、国泰海通证券股份有限公司、上海浦东发展银行股份有限公司、中国工商银行股份有 限公司、中国太平洋保险(集团)股份有限公司、上海库帕思科技有限公司、上海财跃星辰智能科技有 限公司、上海商汤智能科技有限公司、上海智谱寰宇科技有限公司、无限光年(上海)技术有限公司、 上海临港(60 ...
沐曦回复IPO首轮问询:与英伟达H20芯片不构成直接竞争
南方都市报· 2025-08-28 07:19
公司IPO进展 - 科创板IPO申请于6月30日获受理 拟募资39.04亿元 7月19日进入问询阶段 [1] - 首轮审核问询回复中披露新一代旗舰AI芯片曦云C600及下一代曦云C700进展 [1] 市场竞争定位 - 公司认为与英伟达H20芯片主要客户群体存在较大差异 不构成直接竞争 [1][2] - 英伟达H20主要面向字节跳动、腾讯、阿里巴巴、百度等互联网厂商 四家合计占87%采购份额 [2] - 公司现有主力产品曦云C500系列下游客户以国家人工智能公共算力平台、运营商智算平台、商业化智算中心及教科研、金融等行业客户为主 [3] 产品技术对比 - 曦云C600在显存容量、互连带宽和多精度计算能力三方面具备替代H20能力 [3] - C600采用HBM3e显存 容量达144GB(超过H20的96GB版本) FP8精度计算能力为1000 TFLOPS [3] - 互连带宽达到与英伟达4纳米制程工艺产品相当性能 支持FP8低精度计算单元 [3] - C500系列总处理性能达到英伟达A100的77% 部分场景核心指标比肩国际主流产品 [7][8] 产品研发进展 - 曦云C600于7月完成回片并成功点亮 正在进行功能测试 预计2025年底进入风险量产 [8] - 下一代曦云C700已于4月立项 性能接近英伟达H100 将支持FP4低精度计算 [8] - 正在研发智算推理芯片曦思Nx系列 主要用于生成式AI推理 [9] 供应链与客户拓展 - C600研发构建了从设计、制造到封装测试的国产供应链闭环 [8] - 已引起上海、杭州等地人工智能公共算力平台、头部互联网企业及商业银行关注并要求试用测评 [8] - 公司在互联网企业客户开拓方面进度滞后 因缺乏互联网股东背景及采用通用型架构GPU [6] 市场环境与趋势 - 国产替代化趋势下 中国AI市场外购英伟达等芯片比例预计从2024年63%降至2025年49% [5] - 国内互联网厂商采用"双轨制"采购策略 同时采购境外产品与国产芯片 [5] - H20被曝存在"追踪定位"及"远程关闭"安全漏洞 凸显国产芯片战略意义 [5] 财务状况与销售表现 - GPU产品累计销量超过2.5万颗 营收高度依赖曦云C500系列(2024年占比97.28% 2025年前三月97.87%) [7] - 2022-2025年前三月净亏损分别约7.77亿元、8.71亿元、14.09亿元和2.33亿元 [9] - 2025年1-6月销售收入与毛利大幅增长 亏损趋势改善 预计最早2026年达盈亏平衡点 [9]
国产GPU六龙争霸,工信部发声支持行业突破
新浪财经· 2025-08-25 17:26
行业背景与政策支持 - 工信部发声支持GPU发展 推动国产GPU行业竞争加剧[1] - 科技股行情带动指数突破3800点 行业处于政策利好周期[1] 主要企业竞争格局 - 国产GPU领域形成六家企业主导的竞争格局 被喻为"六龙争霸"[1] - 摩尔线程为全功能GPU厂商 MTT S80可运行3A级游戏大作 驱动每月更新 S2000智算集群推动OISA标准 Pre-IPO估值达255亿元[1] - 景嘉微被誉为行业"黄埔军校" JM9系列性能接近GTX1050 在党政/金融领域国产替代占比达40% JM11系列瞄准通用计算领域[1] - 壁仞科技BR100算力超越国际旗舰产品3倍 主要服务国家超算中心与行业巨头 虽被美国列入实体清单 但成为国产替代急先锋[2] - 沐曦集成曦云C500已实现量产并交付万卡规模 C600将支持FP8精度 兼容CUDA生态 成为国产规模化主力军[3] - 砺算科技计划2025年推出6nm制程产品 性能可超越RTX4060 支持数字孪生与乱序渲染 采用纯自研架构 为科创板东芯股份联营公司[4] - 海光信息为全市场唯一CPU、GPU(DPU)双龙头企业 也是唯一形成生态的通用芯片公司 产品包括海光7000 CPU和深算一号/二号GPU 广泛应用于服务器、金融、互联网及AI领域 具备显著稀缺性[5] 技术发展现状与差距 - 国产GPU短期难以赶上英伟达、AMD、英特尔等国际巨头 国内初创企业研发投入规模在10亿元级别、团队规模数百人、研发时间两三年 与国际企业存在巨大差距[5] - 行业发展趋势可参考家电、汽车、手机等产业路径 预计需要10-20年时间可能实现技术追赶[5] 行业前景与投资机遇 - 人工智能行业类似早期互联网行业 将深刻改变人类生活 孕育大批高增长企业 发展周期将持续较长时间[5] - 投资参考微软上市初期或互联网泡沫破裂后的布局时机 存在长期投资机遇[5]
尺素金声|算力全球第二,数字中国建设基座更稳固
人民日报· 2025-08-23 01:25
算力基础设施规模与地位 - 截至2025年6月底中国算力总规模位居全球第二 数字基础设施在规模和技术方面处于世界领先地位 [1] - 5G基站总数达455万个 千兆宽带用户达2.26亿户 [1] 智能算力发展现状 - 智能算力是人工智能技术迭代发展的重要基础 占2024年算力总规模32% [4][5] - 2024年底智能算力规模达90EFLOPS 预计2025年增长超40% [5] - 北京人工智能公共算力平台智算规模突破10000P 支撑万亿参数级大模型训练 [5] - 济南人工智能算力中心规模达1000P 系山东省首个E级高性能智算集群 [5] 算力产业链技术进步 - 国产算力软硬件实现突破 涵盖芯片、服务器到智算中心全环节 [6] - 集成电路产业形成设计/制造/封装测试/材料/装备完整链条 [6] - 国产GPU企业涌现新产品 如沐曦训推一体GPU曦云C600 [6] - 华为推出昇腾384超节点真机 实现芯片集群高效调度 [6] 绿色算力发展成效 - 全国数据中心平均PUE降至1.46 超140个数据中心达4A级以上绿色标准 [8] - 西部科学城数据中心采用浸没液冷技术 PUE降至1.04 [8] - 张家口算力企业使用绿电占比超三成 海南海底数据中心年减碳5万吨 [8] - 预计2030年数据中心能耗超4000亿千瓦时 [7]
寒武纪涨停 距贵州茅台股价仅差近200元
YOUNG财经 漾财经· 2025-08-22 10:54
寒武纪股价表现 - 寒武纪涨停 股价达1243.20元 距贵州茅台仅差近200元 [2] - 单日成交额超158亿元 [2] 寒武纪业务与财务表现 - 公司为国内主要AI芯片厂商 产品涵盖云端智能芯片 加速卡 训练整机及边缘端产品 应用于云服务器和数据中心 [2] - 2023年第四季度营收9.89亿元 净利润2.81亿元 实现上市以来首次单季度盈利 [2] - 2024年第一季度营收11.11亿元 较上年同期0.26亿元大幅增长 净利润3.55亿元 [2] AI芯片技术进展 - DeepSeek发布DeepSeek-V3.1 采用UE8M0 FP8参数精度 专为下一代国产芯片设计 [2] - 摩尔线程基于MUSA架构提供原生FP8计算能力 通过FP8混合精度技术实现大模型训练性能提升20%-30% [3][4] - 燧原科技发布第四代L600芯片 沐曦推出曦云C600 均支持训推一体架构和FP8精度 [4] 国产算力生态与应用 - 国产算力已适配DeepSeek模型 数据中心算力利用率提升 [4] - 科大讯飞讯飞星火大模型基于全国产算力训练 [4] - 腾讯在推理环节采用多芯片选择方案 [4] 行业研报观点 - 天风证券指出7月半导体供应链设备与材料增长稳定 晶圆代工产能持续上升 行业维持景气 [5] - 中信建投认为DeepSeek新精度格式指向国产AI芯片应用扩大 腾讯多选择策略凸显国产推理芯片替代价值 [5]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 05:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
寒武纪、海光信息领涨 多家AI芯片厂商已适配DeepSeek模型
第一财经· 2025-08-22 04:49
算力领域个股表现 - 22日多只算力领域个股开盘大涨 中芯国际盘中涨6.29% 芯原股份涨5.39% [1] - AI算力相关个股中 海光信息涨17.19% 中科曙光涨10% 寒武纪涨12.4% [1] - 寒武纪股价创新高 盘中一度超1170元/股 市值突破4900亿元 [1] 寒武纪业务与业绩 - 寒武纪为国内主要AI芯片公司 产品包括云端智能芯片 加速卡及训练整机和边缘端产品 应用于云服务器 数据中心 [3] - 去年第四季度营收9.89亿元 净利润2.81亿元 实现上市以来首次单季度盈利 [3] - 今年第一季度营收11.11亿元 较上年同期0.26亿元大幅增长 净利润3.55亿元 [3] FP8精度计算技术进展 - DeepSeek发布DeepSeek-V3.1 使用UE8M0 FP8 Scale参数精度 针对下一代国产芯片设计 [3] - 摩尔线程基于MUSA Compute Capability 3.1计算架构提供原生FP8计算能力 通过FP8混合精度技术实现大模型训练性能提升20%-30% [4] - 燧原科技发布第四代L600芯片 采用训推一体架构 支持DeepSeek模型训练使用的FP8精度 [4] - 沐曦推出曦云C600 采用训推一体方案 支持FP8精度 [4] 国产算力产业链动态 - 国产算力对DeepSeek进行适配 采用国产算力的数据中心算力利用率提高 国内AI公司已使用国产芯片做测试性工作 [4] - 科大讯飞的讯飞星火大模型为目前国内基于全国产算力训练的大模型 [4] - 腾讯管理层表示在推理方面有不同的芯片选择 [4] - 天风证券研报称7月半导体供应链设备和材料增长稳定 晶圆代工产能持续上升 半导体行情延续景气 [5] - 中信建投证券研报表示基于DeepSeek模型的训练与推理有望更多应用国产AI芯片 国产推理算力芯片在国际供应链波动背景下有望提供助力 [5]