国产GPU

搜索文档
成立 5 年最高估值超百亿,摩尔线程之后,又一家AI芯片独角兽争当“国产 GPU 第一股”
AI前线· 2025-06-25 04:15
公司动态 - 沐曦集成电路已完成科创板IPO辅导工作 状态变更为"辅导工作完成" 由华泰联合证券担任辅导机构 即将提交上市申报材料 [1][2] - 公司成立于2020年9月 总部位于上海 在北京、南京等7地设立全资子公司及研发中心 [5] - 控股股东为上海骄迈企业咨询合伙企业(有限合伙)持股22.83% 实际控制人陈维良受益股份39.26% [5] - 创始团队核心成员均来自AMD 包括董事长兼CEO陈维良(曾任AMD全球GPU设计负责人) CTO彭莉(AMD首位华人女科学家) 软件CTO杨建(AMD大中华首位科学家) [5] 产品与技术 - 专注于高性能GPU计算领域 推出三大产品线:曦云®C系列(通用计算) 曦思®N系列(智能计算推理) 曦彩®G系列(图形渲染) [6][10] - MXC500曦云系列产品对标英伟达A100/A800 FP32算力达15 TFLOPS(英伟达A100为19.5 TFLOPS) 采用通用GPU架构并兼容CUDA [7] - 采用完全自主研发的GPU IP 拥有自主指令集和架构 配套MXMACA®软件栈 构建软硬件一体生态 [6] - 2024年交付9个算力集群 覆盖华东/华中/香港地区 总规模超1万张GPU卡 [6] - 与上海人工智能实验室合作 支持书生・浦语3.0大模型的推理和微调训练 [6] 财务与融资 - 2023年营收1.07亿元 亏损8.46亿元 2024年营收12.55亿元 亏损5亿元 [9] - 累计完成8轮融资 总额超20亿元人民币 投资方包括上海科创基金/浦东资本/国调基金等国资 以及红杉中国/经纬创投等创投机构 [11] - 融资历程:2020年10月天使轮→2021年Pre-A轮→2021年6月A轮→2022年7月Pre-B轮(10亿元)→2023年两轮→2024年8月最新轮 [12] 行业竞争 - 国产GPU主要厂商包括华为海思/寒武纪/海光信息/壁仞/沐曦/燧原/摩尔线程等 [14] - 华为昇腾系列依托生态体系在智能安防/边缘计算领域优势明显 寒武纪在AI推理训练芯片技术领先 海光信息"深算一号"性能媲美国际产品 [14][15] - 燧原科技(2024年8月) 壁仞科技(2024年9月) 摩尔线程(2024年11月) 沐曦(2025年1月)相继启动IPO辅导 摩尔线程已率先完成辅导 [17][18][19] - 胡润研究院估值:摩尔线程255亿元 燧原160亿元 壁仞155亿元 沐曦100亿元 [20] 行业趋势 - DeepSeek大模型推动国产芯片适配浪潮 沐曦/摩尔线程/海光信息等均完成适配 [20] - DeepSeek的算法优化和计算效率提升为国产芯片提供软硬件协同设计新思路 低精度计算和开源模式助力生态建设 [21][22] - IDC分析认为DeepSeek适配推动国产GPU软件生态突破 促进厂商技术交流与资源共享 加速自主可控生态体系构建 [22]
国产GPU厂紧急澄清!
是说芯语· 2025-06-23 08:05
国产GPU芯片G100性能争议 - 砺算科技首款6nm自研GPU芯片G100在GeekBench平台曝光OpenCL通用计算得分仅15524分 性能被指与13年前的英伟达GTX 660 Ti相当 [1] - 公司紧急澄清称芯片仍在性能测试阶段 测试进展符合预期 产品信息以官方发布为准 计划7月底正式发布 [1] - G100采用自研TrueGPU架构 官方宣称性能对标英伟达RTX 4060系列 支持DirectX 12、Vulkan 1 3等主流图形API并集成AI加速能力 [1] G100测试数据详情 - 测试平台配置为锐龙7 8700G处理器、64GB DDR5-4800内存及七彩虹主板 运行Windows 10系统 [2] - G100配备32个计算单元 核心频率最低300MHz(最高未公开) 显存容量仅256MB [2] - RTX 4060同项测试得分超10万分 是G100当前成绩的6 5倍 [2] 性能差异原因分析 - 业内人士指出早期样片可能面临驱动优化不足、固件限制等问题 256MB显存容量可能是驱动程序误报 [3] - 300MHz核心频率可能未完全释放性能 GeekBench对新架构支持可能不完善 实际性能需待驱动更新后评估 [3] - TrueGPU架构采用统一渲染架构与张量引擎核心 理论上可兼容AI生态并提供高效计算能力 [3] TrueGPU架构技术特点 - TrueGPU是业界首个融合高性能图形渲染和AI推理能力的GPU架构 基于unified shader+tensor engine核心运算单元 [4] - 架构可驾驭高分辨率高帧率3A游戏场景 满足专业图形设计软件需求 原生支持DirectX12 2、Vulkan1 3等主流API [4] - 相比其他GPU厂商基于Imagination IP研发的方案 TrueGPU具有自主创新性 [4]
英伟达中国一把手造国产GPU,冲刺IPO了
量子位· 2025-06-19 09:07
公司上市进展 - 摩尔线程IPO辅导状态变更为"辅导验收",辅导机构为中信证券[1][2] - 公司于2020年6月成立,注册资本3.3亿元,实控人张建中持股44.07%[7][8] - 2023年11月启动上市时估值达255亿元,累计完成6轮融资超45亿元[3][4] 创始团队与技术背景 - 创始人张建中曾任英伟达全球副总裁兼中国区总经理,团队具备近20年GPU行业经验[3][8] - 公司成立19个月即交付国产全功能GPU"苏堤",采用MUSA架构集成四大计算引擎[9] - 当前产品线覆盖芯片/显卡/集群,提供AI加速计算基础设施解决方案[9] 产品布局与技术突破 B端产品 - 推出大模型智算加速卡MTT S4000、训推一体机MCCV D800等AI基础设施[10] - 2024年3月通过中国信通院大模型适配认证,支持DeepSeek开源项目[11] - 专业显卡MTT X300在数字孪生/GIS领域性能提升,5月完成渲染优化[13] C端产品 - 2022年推出支持DirectX 12的消费级显卡MTT S80,配备PCIe Gen5接口[13] - 2024年5月显卡驱动升级使3DMark测试成绩提升35%[13] 资本市场表现 - 投资方包括红杉中国、腾讯、字节跳动、小马智行等头部机构[5] - 2024年2月获高粱基金战略投资,概念股和而泰盘中涨幅超8%[4][6] 行业竞争格局 - 同期启动IPO的GPU企业包括燧原科技(融资近70亿元)和壁仞科技[14] - 燧原专注AI芯片,腾讯持股20.49%;壁仞2024年获上海国投领投融资[14]
摩尔线程完成上市辅导,国产 GPU 第一股呼之欲出
是说芯语· 2025-06-19 06:37
公司IPO进展 - 摩尔线程IPO辅导状态变更为"辅导验收",距离登陆资本市场更近一步[1] - 若成功上市将成为国内真正意义上的GPU第一股[1] - 公司成立于2020年,已完成6轮融资累计超45亿元,投资方包括红杉中国、腾讯、字节跳动等40多家机构[1] 产品与技术实力 - 自主研发GPU芯片采用MUSA架构,集成AI计算加速、图形渲染、视频编解码、物理仿真和科学计算四大引擎[2] - 2023年12月落地全国产千卡千亿模型训练平台摩尔线程KUAE夸娥智算中心[2] - 2024年3月MTT S4000计算卡与DeepSeek-R1671B大模型通过中国信通院评测验证[2] 资本市场反应 - 参股公司和而泰当日股价涨幅近7%,带动相关概念股上涨[2] - 市场预期上市后将扩大产能、加大研发投入,提升市场份额[2] - 分析师认为其市值表现值得期待,代表国产算力芯片行业阶段性成果[2] 行业竞争格局 - AI算力需求爆发式增长,信创政策推动国产替代加速[3] - 竞争对手包括寒武纪、壁仞科技等企业[3] - 与国际巨头英伟达相比在技术成熟度和市场份额仍有较大差距[3] 上市挑战 - 股东结构复杂,股东穿透核查工作量巨大[3] - 需在竞争中实现盈利是上市后的重要挑战[3] 行业意义 - 完成上市辅导是国产GPU行业发展的重要里程碑[3] - 对国产算力芯片产业具有深远意义[3]
昇腾910系列全年出货量下调
是说芯语· 2025-06-12 00:38
国产GPU采购情况 - 字节跳动对国产GPU态度最为积极,主要采用寒武纪和昇腾,并广泛测试昆仑芯、天数、沐曦、摩尔等其他品牌,2025年计划追加购买昇腾和寒武纪卡,同时采购海光卡 [2] - 阿里巴巴对国产GPU态度较为谨慎,上线部分昇腾卡但性能表现不佳,2025年预计首次采购海光和寒武纪卡,同时继续加大英伟达产品储备,自研芯片平头哥尚未商业化推广 [2][3] - 腾讯对国产GPU态度最保守,首选英伟达,其次为华为产品,最后考虑寒武纪和海光,2025年资本支出计划包括400亿用于GPU采购,110亿用于高性能服务器采购 [2][3] 昇腾910系列出货及性能 - 昇腾910B累计出货量达16万张,主要客户为地方超算中心和运营商,910C因量产延迟仅出货2.7万张,预计后续单月出货量增至5万张,主要客户为大型互联网公司如字节跳动 [5][6] - 昇腾910C单卡性能在国产芯片中领先,但集群能力仍逊于NVIDIA产品,全年出货目标从85万张下调至70万张,其中910B和910C各占一半 [5][6] - 昇腾卡应用场景中15%-20%用于模型训练,其余用于推理,训练场景面临成本高和技术难题限制,仅DeepSeek、科大讯飞等少数头部企业尝试使用 [6] 行业技术趋势与竞争 - FP8成为推理侧硬件基本要求,多模态模型推动更高标准硬件需求,如CloudMatrix 384超节点方案,国产芯片厂商正加紧追赶国际领先品牌 [7] - NVIDIA即将推出适配中国市场的新一代算力卡,推理场景下仍有竞争力,寒武纪、海光等国产品牌在生态系统建设上取得进展 [7] - 互联网大厂与昇腾合作定制化开发需投入大量人力资源适配,相比直接使用NVIDIA卡增加时间成本和技术难度 [8] 市场动态与需求变化 - 互联网巨头采购策略波动较大,受训练卡缺口大、推理卡需求小及910C出货延迟影响,字节跳动占据昇腾910C近三分之一需求份额 [6] - 一体机市场热度下降导致出货量低于预期,阿里平头哥自研芯片逐步替代也对昇腾市场需求产生影响 [6]
昇腾910系列全年出货量下调
傅里叶的猫· 2025-06-11 11:31
国产GPU行业动态 - 美国对GPU的限制政策促使国产GPU快速发展 华为昇腾系列性能被英伟达CEO提及已超越H200 但表述存在夸张成分[1] - 互联网巨头资本开支计划显示国产GPU采购趋势:字节跳动2025年计划投入1600亿 阿里未来3年投入3800亿 腾讯2025年投入900亿用于云和AI基础设施[2] 国内大厂采购策略 - 字节跳动最积极采用国产GPU 主要采购寒武纪和昇腾 并广泛测试其他国内品牌 2025年计划增加采购量[2] - 阿里巴巴态度谨慎 除自研平头哥外上线部分昇腾卡 但性能表现不佳 2025年计划首次采购海光和寒武纪卡 同时继续储备英伟达产品[2] - 腾讯最保守 首选英伟达 其次考虑华为产品 最后评估寒武纪和海光 已认证摩尔线程 2025年资本支出包含大规模GPU采购和算力租赁[2] 昇腾910系列出货与性能 - 昇腾910B累计出货达16万张 保持稳定 而910C因量产延迟仅出货2.7万张 预计后续单月出货将提升至5万张[3] - 910C在国产芯片中集群能力领先 单卡性能获市场认可 但服务端支持和生态系统建设仍是短板[3] - 全年出货目标从85万张下调至70万张 其中910B和910C各占一半 调整主因包括互联网巨头需求波动及阿里自研芯片替代影响[6] 应用场景与市场需求 - 昇腾卡15%-20%用于模型训练 其余主要用于推理 但训练场景面临高成本和技术难题 仅DeepSeek、科大讯飞等头部企业尝试使用[6] - 910B主要客户为地方超算中心和运营商 910C则更多被大型互联网公司采用 字节跳动占其需求近三分之一[6] - 一体机产品因市场热度下降 出货量预计低于预期[6] 技术发展趋势 - FP8成为推理侧硬件基本要求 多模态模型推动更高标准需求 CloudMatrix 384超节点方案逐渐成为行业标杆[7] - 国产芯片厂商在生态系统建设上取得进展 寒武纪、海光等品牌已解决部分兼容性问题 长期有望扩大市场份额[7][8] - 互联网大厂与昇腾合作定制化开发需投入大量人力资源适配 相比直接使用英伟达卡增加时间成本和技术难度[8]
消息称砺算科技首款高性能GPU芯片成功点亮,国产GPU再添新锐力量
是说芯语· 2025-05-26 10:36
公司动态 - 东芯股份子公司砺算科技首款6nm高性能GPU芯片成功回片并点亮 标志着国产GPU在图形渲染与AI计算领域取得重大突破 [2] - 该芯片基于自研TrueGPU架构 拥有完全自主知识产权 支持主流图形API 具备高算力、大显存和低功耗特性 [2] - 芯片性能对标英伟达RTX4060系列 能支持3A游戏大作 已收获逾亿元预订单 [2] - 砺算科技由S3核心高管创立 产品性能达国际主流水平 获上市公司东芯股份强力支持 [3] 技术突破 - TrueGPU架构是业界首个融合高性能图形渲染和AI推理能力的GPU架构 [2] - 芯片在游戏、专业设计、智能汽车等领域有广泛应用前景 [2] - 有望打破海外长期垄断 填补国内高端GPU市场空白 [2] 产业影响 - 东芯股份作为国内领先存储芯片企业 持续加码半导体产业链布局 [3] - 砺算科技突破验证东芯股份在自研项目上的远见 有望强化其在高端芯片领域竞争力 [3] - 双方将在芯片研发、生态建设等方面深化合作 推动国产半导体产业升级 [3]
中电信息以4.84亿挂牌转让GPU企业中微电32.5%股权
巨潮资讯· 2025-05-17 03:46
股权转让 - 深圳中微电科技有限公司32.4778%股权被国资股东挂牌转让,转让底价4.84亿元,对应公司估值14.9亿元 [1] - 股权转让方为中国中电国际信息服务有限公司,为国务院国资委监管企业,此次"清仓式"转让已获股东批准 [2] 公司背景 - 公司为中国电子信息产业集团旗下企业,属于GPU研发领域的"国家队" [2] - 公司自2020年专注GPU研发,2022年首款高性能桌面GPU"南风一号"成功点亮并实现量产,2024年"南风二号"核心IP研发完成 [2] - 公司股权结构显示,除国资股东外,还吸引了红杉资本、力合创投等多家知名投资机构入股 [3] 财务状况 - 2023年公司营收5521万元,亏损8905万元 [2] - 2024年前十月亏损3854万元 [2] 行业现状 - 当前GPU赛道动辄百亿估值,中微电14.9亿元估值显得尤为低调 [1] - GPU研发面临持续巨额投入与激烈市场竞争的双重挑战,国际巨头占据主导地位 [2] - 在信创产业加速发展背景下,国产芯片企业需平衡技术突破与商业可持续性 [3] 未来发展 - 此次股权变动将影响公司未来发展,能否找到新的战略投资者接盘成为观察国产GPU产业走向的重要窗口 [3]
国产GPU的性能PK
傅里叶的猫· 2025-05-08 14:11
国产GPU性能对比 - 壁仞科技2022年推出的BR100性能最强,但因制裁无法量产,华为昇腾910C成为实际国产最强[1] - 华为昇腾910C性能达到英伟达H800的60%,海光BW100深算能力约400T(H800的50%),寒武纪590性能为H800的30%-35%[1] - 性能排名:华为910C > 海光BW100C > 华为910B > 百度/阿里自研卡 > 寒武纪 > 沐曦/天数智芯等[2] 产品价格动态 - 海光BW100采购价约10万元/张,华为910B和910C分别为7万和18万元,寒武纪590价格从8万-8.5万降至6万-7万[2] 显存技术现状 - 国内GPU普遍采用HBM2e显存(受制裁无法使用HBM3e),推理任务中显存容量是关键门槛,主流产品显存容量均达64GB[3] - 华为910C显存带宽达3.2TB/s显著领先,壁仞BR100为2.3TB/s,沐曦蔵云C500为1.8TB/s,多数厂商产品在0.5-1.8TB/s区间[4][5] 算力参数细节 - 壁仞BR100的BF16算力达445T,FP16算力1024T为表格中最高,华为910C BF16算力244T,沐曦蔵云C500 FP16算力280T[5] - 昆仑芯RG800显存带宽0.2TB/s,平头哥含光800* FP16算力202T,燧原逐思2.0显存带宽1.8TB/s[5] 技术迭代趋势 - 海光BW100采用先进交换芯片设计,单卡可用性能实测达87%,优于寒武纪590(约80%),反映后发技术优势[2] - 寒武纪MLU370-X8显存容量48GB(带宽0.6TB/s),较早期MLU270-S4(16GB/DDR4)有明显升级[5]