Workflow
通用GPU
icon
搜索文档
万芯大战
小熊跑的快· 2025-09-15 00:32
大模型行业竞争格局 - 经过3年发展 大模型行业未出现预期中的"万模大战" 而是走向收敛状态 [1] - 海内外第一轮淘汰赛已经结束 市场上剩余的模型数量显著减少 [1] AI芯片行业竞争态势 - 全球进入"万芯大战"阶段 AI芯片竞争激烈程度远超模型领域 [2] - 通用GPU市场主要参与者包括英伟达 AMD 华为 海光等公司 [2] - ASIC定制芯片领域参与者众多 包括Meta 字节 OpenAI AWS 微软 阿里 百度等科技巨头 [2] - 近期Xai等新兴厂商进入市场 许多小型厂商也正在加入竞争 [2] 国内AI芯片市场格局 - 国内市场存在数十家知名和不知名的通用GPU及定制ASIC厂商 [3] - 在AI芯片制造环节 台积电被认定为最具优势的厂商 [3]
定制化AI芯片订单井喷频抢风头,英伟达酝酿“反攻”
南方都市报· 2025-09-13 04:59
行业趋势 - AI ASIC芯片市场受降低算力成本和分散供应链风险需求驱动快速增长 海外巨头博通和迈威尔业绩表现突出 同时国产ASIC芯片公司订单高涨 [1][8][10] - 2023年全球AI ASIC市场规模约66亿美元 预计2028年达到554亿美元 2023-2028年复合年均增长率达53% [9] - 2024年中国AI芯片市场规模达1425.37亿元 其中GPU芯片占约69.9%的市场份额 ASIC等其它AI芯片约占30.1% [3] 技术路线对比 - 通用GPU适用于模型训练场景 具有通用性强和生态成熟的优势 英伟达在该领域一家独大 [2][18] - ASIC芯片为特定任务定制 在模型推理场景具有更高性能和能效 成本优势显著 谷歌TPU和亚马逊Trainium单位算力成本仅为英伟达H100的70%和60% [1][2] - 模型推理分为预填充和解码两个阶段 预填充阶段需要高计算能力 解码阶段依赖快速内存传输 英伟达新推出的Rubin CPX芯片针对预填充阶段优化 采用成本较低的GDDR7内存 物料清单成本仅为R200芯片的25%但提供其60%的计算能力 [13][15][17] 国产ASIC发展 - 芯原股份2024年7月1日至9月11日新签订单12.05亿元 较2024年第三季度全期大幅增长85.88% 其中AI算力相关订单占比约64% [1] - 公司2025年上半年芯片设计业务收入中 AI算力相关收入占比约52% 拥有六类自主处理器IP和1600多个数模混合IP 2024年半导体IP授权业务市场占有率中国第一全球第八 [3][4] - 国产AI ASIC阵营包括互联网大厂和云厂商如华为昇腾、阿里巴巴平头哥、百度昆仑芯 以及专门的芯片设计公司如寒武纪和燧原科技 [6][8] - 国产芯片用于大模型训练难度较高 华为昇腾可能是唯一可用于大模型训练的芯片 科大讯飞基于昇腾芯片训练大模型但需额外两个月适配时间 [18][20] 海外ASIC动态 - 博通2025财年第三季度AI业务实现52亿美元营收 同比增长63% 市值高达1.6万亿美元 全球芯片企业中仅次于英伟达 [10] - 博通新增第四位重量级客户 订购价值超过100亿美元的定制AI芯片 媒体报道可能是OpenAI 现有三大客户为谷歌、Meta和字节跳动 [10] - 马斯克旗下xAI和苹果公司也与博通开展ASIC芯片开发合作 博通在高速网络与连接技术方面积累深厚 具备AI定制芯片设计优势 [10][11] - 英伟达发布专门面向AI推理的Rubin架构芯片Rubin CPX 预计2026年底上市 通过缩减高成本配置提升性价比 回应ASIC竞争 [12][13] 市场格局展望 - AI芯片市场上ASIC和通用GPU将长期共存 通用GPU适应模型训练和频繁迭代 ASIC在模型推理场景具有定制化优势 [18][21] - 国产通用GPU厂商通过兼容CUDA生态降低用户迁移成本 长期将发展自有核心技术构建自主生态系统 [20][21] - 国际形势变化与供应链重构背景下 中国芯片供应商及云厂商投入自研ASIC的必要性愈发凸显 [8]
博通CEO陈福阳:AI收入将在两年内超越其他收入总和,云大厂主导ASIC芯片、企业将继续依赖GPU
美股IPO· 2025-09-10 08:04
支撑这一野心的是一份新提交的"Tan PSU Award"高管激励计划。该方案的核心条款是,若博通在2030财年 (FY2030)前实现特定的AI收入门槛,CEO陈福阳将获得相应奖励。 这也意味着陈福阳的薪酬与AI收入强绑 定。 芯片巨头博通正将人工智能置于其战略版图的核心。 博通CEO陈福阳预计,公司AI相关收入预计在两年内将超过软件和非AI业务收入的总和。同时,其设定了到 2030财年AI收入最高达到1200亿美元的目标,并与CEO薪酬直接挂钩。他指出,未来AI芯片市场将出现分化 ——大型云服务商将主导定制化ASIC芯片的应用,而广大企业级客户将继续依赖通用GPU。 据高盛9月9日发布的会议纪要报告,公司总裁兼CEO陈福阳(Hock E. Tan)在近日举行的高盛Communacopia + 科技大会上明确表示,满足特定客户的AI计算需求是公司的首要任务,并预计在未来两年内,公司的AI相关收 入将超过软件及其他非AI业务收入的总和。 AI收入激增:两年内或成绝对支柱,2030剑指1200亿 报告中最引人注目的信息,莫过于陈福阳对AI收入的激进预测。他明确表示, 满足少数核心客户的AI计算需求 是公司的首要 ...
中国芯片突围战进入深水区
财富FORTUNE· 2025-07-03 12:55
国产AI芯片行业动态 - 寒武纪股价去年上涨近4倍,今年一度涨至818 87元历史高点,但此后回调约30% [1] - 摩尔线程、沐曦股份与壁仞科技三家国产芯片企业近期集体冲刺IPO,市场认为这将加剧寒武纪的竞争压力 [1] - 西门子等EDA巨头宣布解除对华出口限制,行业局面更加复杂 [1] 企业IPO进展 - 壁仞科技计划三季度赴港上市,最快8月递交申请 [1] - 摩尔线程与沐曦股份科创板IPO申请获上交所受理,从辅导到提交招股书仅耗时半年左右 [1] - 摩尔线程拟募资80亿元投入AI训推芯片及图形芯片研发,沐曦股份拟募资39亿元加码通用GPU及AI推理芯片研发 [2] 企业财务与技术 - 摩尔线程2024年营业收入4 38亿元,净亏损14 9亿元 [2] - 沐曦股份营业收入7 4亿元,净亏损14亿元左右 [2] - 摩尔线程推出三款全功能GPU芯片,MTTS4000计算卡支持全开源大模型 [2] - 沐曦股份曦云C系列GPU已应用于国家AI训练场并完成百度飞桨兼容认证 [2] 壁仞科技战略选择 - 壁仞科技选择港股上市,因A股IPO通道拥挤且港股更具吸引力 [3] - 壁仞科技BR100系列GPU因台积电代工受限导致量产受限 [3] - 香港财政司司长曾表示希望壁仞科技参与香港国际科创中心建设 [4] 行业资本与产能 - 招商资本投资了壁仞科技和沐曦股份,招商局创投参与摩尔线程融资 [4] - 台积电与三星拒绝对华提供7纳米及以下先进制程代工服务,中芯国际承接国内80%先进制程需求但全球市占率仅6% [5] - 西门子等EDA软件出口限制取消,但窗口期仅90天且美方保留回调权利 [5] 行业挑战与博弈 - 美国在放开EDA出口同时加码"芯片制造回流"政策,税收抵免从25%提至35% [5] - 华大九天在模拟电路、概伦电子在器件建模领域取得突破,但数字芯片设计工具链仍被国际巨头垄断 [5] - 行业核心矛盾在于资本市场催生估值泡沫但无法替代技术攻坚 [6]
AI服务器狂飙:从芯片到应用,谁是千亿市场真赢家?丨热门赛道
创业邦· 2025-06-07 00:54
行业定义与特点 - AI服务器是专为人工智能工作负载设计的高性能计算服务器,在硬件配置、计算能力和数据处理能力上优于传统服务器[3] - 核心特点包括:搭载多颗高性能CPU和多个GPU支持加速计算、配备TB级内存和高速SSD/NVMe存储、支持InfiniBand和PCIe 4.0/5.0高速互联技术、兼容主流AI框架如TensorFlow/PyTorch、配备先进散热系统[4] - 与传统服务器对比差异显著:AI服务器专用于模型训练/推理、采用CPU+GPU协同架构、配置大容量高速存储、支持AI专用软件框架[7] 应用场景与产业链 - 主要应用于大模型训练(GPT等)、计算机视觉/语音识别/NLP推理、智能制造/自动驾驶/金融风控/生物医药等高技术领域[6] - 产业链上游为英伟达/英特尔/AMD等硬件供应商,中游为系统集成商,下游覆盖自动驾驶/医疗影像等应用领域[7][8] 融资趋势与市场动态 - 2020-2024年融资事件呈波动上升趋势:2021年达40起峰值,2023年回升至30起,反映大模型兴起重新激活算力基础设施投资热度[9] - 近期行业热点包括:微软Azure在印度投资5亿美元建设亚洲最大AI数据中心(部署2万颗NVIDIA B200 GPU)[28]、戴尔推出搭载H200 GPU的XE9640服务器(能耗降低20%)[29]、英伟达启动美国本土AI服务器产业链建设(目标4年产值5000亿美元)[30] 代表企业分析 国鑫数智 - 全产业链服务器厂商,产品覆盖通用/智算/边缘计算服务器,年产能超30万台,获国家高新技术企业等认证[12] - 2024年12月完成数千万元A轮融资(同创伟业投资)[13][15] 天数智芯 - 专注国产通用GPU研发,核心产品包括7nm工艺Big Island系列和"智铠100"推理芯片,通过开源社区DeepSpark构建生态[16][17] - 融资活跃:2021年C轮融资12亿元,2023-2025年连续完成D轮系列融资(红杉中国/厚朴投资等参与)[18][20] 长江计算 - 聚焦多样性计算产业,产品线含AI服务器/液冷整机柜(单柜64CPU+128GPU),自研AI质检系统缺陷识别效率提升3倍[22][23] - 2024年1月完成5亿元天使轮融资(国开科创/光谷烽火创投等参与)[24][25] 技术突破 - NVIDIA在2025年GTC大会发布DGX H2000超算系统(单机柜算力40 PetaFLOPS)、Quantum-X800光交换机(8Tb/s速率)、Earth-2气候建模平台(整合1000颗B200芯片)[32] - 长江计算全液冷整机柜技术使数据中心PUE值显著优化,华为云与车卫士合作构建多模态AIGC汽车服务生态[22][31]
4000亿国产算力航母:芯片巨头合并超算巨头
量子位· 2025-05-26 05:27
合并公告 - 海光信息拟通过换股方式吸收合并中科曙光,并募集配套资金[1] - 两家公司A股股票自5月26日起停牌,预计不超过10个交易日[2][3] - 合并方案需履行内部决策程序及监管审批,存在不确定性[26] 海光信息业务与财务 - 公司聚焦高端CPU、通用GPU研发,产品覆盖3000/5000/7000系列[7] - 2016年与AMD成立合资公司获得x86指令集授权,拥有891项全球专利[9] - 2025年Q1营收24亿元(同比+50.76%),净利润5.06亿元(同比+75.33%)[12][14] - 研发投入7.64亿元占营收31.82%,总资产310亿元[14] - 中科曙光为第一大股东持股27.96%[14][15] - 当前股价136.13元/股,总市值3164亿元居科创板首位[15][18][19] 中科曙光业务与财务 - 专注服务器、高性能计算、云计算领域,拥有3大生产基地和5大研发中心[21][22] - 2025年Q1营收25.86亿元(同比+4.34%),净利润1.86亿元(同比+30.79%)[24][25] - 经营活动现金流净流出11.18亿元(上年同期-4.94亿元)[24][25] - 当前股价61.90元/股,总市值905.72亿元[25] 合并影响 - 合并将实现芯片设计与超算资源的垂直整合[5][21] - 海光信息在AI计算领域已适配DeepSeek等大模型,中科曙光提供算力基础设施[11][22] - 合并后实体将覆盖从芯片到云服务的全产业链[10][22]