Workflow
AI推理
icon
搜索文档
计算机行业跟踪周报:构建数据库的“CUDA”,英伟达存储变革下软件重构-20251207
东吴证券· 2025-12-07 08:46
报告行业投资评级 - 增持(维持)[1] 报告的核心观点 - 随着AI推理时代的到来,传统的以CPU为中心的存储与计算架构已成为瓶颈,行业正经历从“以CPU为中心”到“以GPU为中心”的根本性变革[4][9] - 为满足AI推理“小块高频”的极致I/O需求,硬件上出现GPU直连SSD的新架构,软件上则需要重构以GPU为核心的数据库(GPU-Native数据库),这将为数据库产业带来新的机遇[4][18][25] 根据相关目录分别进行总结 1. AI推理时代来临,GPU直连SSD存储新架构出现 - AI推理与训练对存储的需求差异巨大:训练需要大数据块(10MB-1GB)、少并发、总容量相对较低(1-10TB);而推理需要小数据块(低至8B、64B、512B)、高并发(数千条)、大存储容量(高达1PB或数百TB)[4][9][10] - AI工作负载分化推动存储评估指标从传统的“每TB成本”(TB/TCO)转向“每IOPS成本”(IOPS/TCO),推理和预测式AI的性能瓶颈在于处理海量、高并发、小I/O请求的能力(IOPS)[9][10] - 传统以CPU为中心的架构无法满足AI推理的高并发需求,成为瓶颈,需要提升GPU地位,使其成为数据访问的控制中心,实现从CPU“推送”数据到GPU“拉取”数据的转变[4][11][14] - 解决方案是通过GPU直连SSD硬件(如通过NVMe-of、RDMA、GPUDirect Storage等技术)和SCADA软件架构,让GPU绕过CPU直接、高效地从SSD读写数据,彻底旁路CPU在数据流中的角色[4][14][16] 2. 存储架构变化带来数据库架构的变化 - 架构层面发生根本变化:从“以CPU为中心”转向“以GPU为中心”,GPU成为主计算单元,CPU角色退化为任务调度器、事务协调器和元数据管理器[4][18] - 数据库核心组件需要升级改造:1) 存储引擎革新,新的缓存管理器需直接管理GPU显存和直连SSD间的数据流动;2) 数据布局优化,为匹配GPU的SIMD架构,可能采用纯列式或混合存储格式并原生支持Apache Arrow等零拷贝格式;3) 查询执行引擎重构,核心算子需深度重写为GPU内核并能直接从SSD流式消费数据,实现计算与I/O的完全重叠[4][19][21] - 查询优化器面临挑战,成本模型需纳入GPU计算核心占用率、HBM与SSD间带宽、PCIe传输延迟等新因素,并优先考虑数据本地性优化[21] - GPU直连SSD技术将使得数据库从一个在通用操作系统上运行的应用程序,演变为一个直接调度和管理GPU、SSD的“数据中心级操作系统内核”[4][21] 3. 产业进展逐步加快 - 硬件方面:1) 2025年8月,闪迪与SK海力士签署谅解备忘录,共同制定高带宽闪存(HBF)技术规范,目标在2026下半年发布HBF样品,首批搭载HBF的AI推理系统预计于2027年初面世[4][21][22];2) 2025年9月,铠侠宣布将与英伟达合作,开发可直接连接到GPU并进行数据交换的SSD,目标性能需达到2亿IOPS,并计划支持PCIe 7.0标准[4][22] - 软件方面:1) Hammerspace通过优化元数据读取和GPU服务器直连存储驱动器中的数据放置策略,加速了其数据编排平台软件的性能[4][23];2) Cloudian HyperStore通过RDMA over S3技术,实现对象存储与GPU内存的直接数据传输,使基于S3接口的向量数据库性能提升8倍[4][24] 4. 投资建议 - 投资逻辑基于AI推理爆发驱动GPU地位提升及硬件架构变革(GPU直连SSD),进而引发软件生态(尤其是数据库)的重大重构需求,数据库产业有望迎来新机遇[4][25] - 报告提及的相关标的包括:【星环科技】、达梦数据、海量数据、MongoDB、Snowflake等[4][26]
云天励飞副总裁郑文先:AI进入推理时代 国产芯片迎窗口期
21世纪经济报道· 2025-12-06 04:55
文章核心观点 - 人工智能发展当前面临深度应用与高成本两大瓶颈 但作为第四次工业革命的底层根技术 其长期发展前景依然广阔 中国AI芯片企业正迎来国产化机遇 需通过选对赛道、技术创新和生态构建来应对挑战并把握未来智能硬件与Agent智能体等方向的机会 [1][2][3][4] AI行业发展现状与瓶颈 - **应用瓶颈**: AI进入深度应用阶段 在C端大模型价值已验证 但在To B侧因数据壁垒、深度场景挖掘及行业Know-how不足 尚未出现真正意义上的杀手级应用 [1] - **成本瓶颈**: AI推理成本偏高 大模型训练所需的算力资源、数据中心电力等成本推高企业研发投入 限制了AI的大规模应用 [2] - **泡沫争议**: 人工智能作为第四次工业革命的关键技术 未来将是底层“根技术” 即便存在泡沫也只是阶段性短暂过热 [2] 云天励飞的公司战略与技术布局 - **芯片研发历程**: 公司自2014年成立起持续投入AI推理芯片研发 已推出四代自研NPU 并基于最新NPU架构推出多款应用于端侧与边缘侧AI推理场景的芯片 [2] - **新一代芯片架构**: 正在研发采用GPNPU架构的新一代芯片 以更好适应GPU的CUDA生态并兼顾NPU的高效灵活 在成本端更具优势 更符合大模型在端侧与边缘侧规模化落地的需求 [2] - **供应链国产化**: 2022年成为国内首批采用国产先进工艺推动AI推理芯片量产的企业之一 目前芯片底层工具链、指令集、算子库及封装测试环节已全部实现国产化 [3] - **生态融合**: 已与DeepSeek、千问等开源模型以及鸿蒙系统完成适配 下一代产品将瞄准云端大算力推理芯片 [3] 中国AI芯片产业的机遇与挑战 - **发展机遇**: 国内集成电路发展进入快车道 更有自信推动全链条国产化技术的全面升级 人工智能正进入推理时代 应用需求爆发对推理算力的巨大需求为国产NPU类芯片带来广阔空间 [3][4] - **主要挑战**: 国产生态尚未形成合力 更多是企业单打独斗 而英伟达GPU的成功离不开CUDA生态提供的模型部署能力 此外 需求碎片化对芯片通用性提出更高要求 [3] 行业突围路径与未来展望 - **突围路径**: 首先选对赛道 抓住推理算力需求爆发的机会 其次坚持技术创新 通过架构和系统设计对冲国产先进工艺与国际顶尖水平的代际差距 第三是以系统化思维构建软硬一体的产品与生态 满足客户整体需求 [4] - **未来方向**: 未来三到五年重点看好两个方向 一是智能硬件 2025年将成为“AI+智能硬件”元年 智能眼镜、手表等产品将加速普及 公司已成立消费品全资子公司并推出AI拍学机和AI宠物产品 二是Agent智能体应用 将在企业流程再造和业务重构中发挥重要作用 [4] - **企业建议**: 未来每家公司的CEO都需要具备AI思维 主动审视并重塑业务流程 用人工智能推动提质增效 每位CEO都应成为公司的CAIO 每家公司都应设立人工智能官 [4]
亚马逊云科技首席执行官 Matt Garman:亚马逊云业务年增220亿美元,增量超半数《财富》500强企业全年收入
新浪财经· 2025-12-04 11:47
公司财务与业务规模 - 亚马逊云科技业务规模已达1320亿美元,同比增长速度加快至20% [1][1] - 过去一年业务新增220亿美元,该绝对增长额超过《财富》500强企业中一半以上公司的全年收入 [1][1] 核心产品与服务表现 - Amazon S3客户存储对象数量超过500万亿个,数据规模达数百EB,日均处理超2亿次请求 [1][1] - 连续第三年,新增到云中的CPU能力有超过一半来自Graviton5 [1][1] - 数百万客户使用其数据库服务 [1][1] - Amazon Bedrock已为全球超过10万家企业提供AI推理能力 [1][1] 人工智能与新兴技术进展 - Amazon Bedrock AgentCore为企业级安全部署和运行高能力Agent提供基础构件,发展势头强劲 [1][1] - AgentCore SDK发布仅几个月,下载量已超过200万次 [1][1] - 发布首款量子计算芯片原型Ocelot,将量子纠错的实现成本降低90%以上 [1][1] 基础设施与网络能力 - 拥有全球规模最大、部署最广的AI云基础设施 [1][1] - 全球数据中心网络覆盖38个区域、120个可用区,并已宣布规划新增三个区域 [1][1] - 过去一年新增3.8吉瓦数据中心容量,规模位居全球首位 [1][1] - 拥有世界上最大的私有网络,过去12个月增长50%,已铺设超过900万公里的陆地与海底光纤电缆 [1][1]
云天励飞陈宁对话Hinton:推理时代来临 GPNPU架构如何破局?
证券日报· 2025-12-03 06:41
行业趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,未来需探索模拟计算、类脑芯片及基于类器官的计算等新形态[3] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,推理/处理芯片有望达到4万亿美元,占比约80%[3] - 2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段[5] 技术发展路径 - 未来AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备中,实现无处不在的按需取用[3] - “推理异构化”成为行业趋势,单一芯片难以兼顾AI任务中高算力的需求理解阶段与高带宽的答案生成阶段[6] - 行业核心竞争力将聚焦于芯片架构的灵活适配能力,以应对多模型混合应用的常态[6] 公司战略与创新 - 公司以NPU为核心,推出GPNPU架构,走“推理优先架构”路线,目标实现推理效率百倍级提升[5] - 公司研发第五代GPNPU架构,核心是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新[6] - 公司致力于通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”[6] 公司竞争优势 - 公司自2005年参与并行计算指令集与芯片架构设计,掌握算法芯片化的第一性原理,可实现软硬结合的高性价比设计[7] - 公司沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才[7] - 公司地处粤港澳大湾区,可利用全球最完善的人工智能与机电一体化产业链,以及深圳的芯片设计、硬件制造、供应链与营销网络,以市场需求驱动研发[7] 行业生态与愿景 - 真正有意义的AI必须让更多人用得起、用得上,当AI使用成本接近水电气基础设施水平时,才能惠及偏远地区学生、基层医院和中小企业[4] - 公司呼吁建立全球统一的推理算力网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域[7]
上证早知道|AI手机,来了!《疯狂动物城2》,超20亿元!万科债,继续大跌!谷歌芯片,上调预测200万块!
上海证券报· 2025-12-02 11:44
今日提示与市场动态 - 2025企业家博鳌论坛系列活动将于12月2日至12月5日在海南博鳌举办 [1] - 2025年中国国际海事会展将于12月2日至12月5日在上海举办 [1] - 截至12月1日18时30分,影片《疯狂动物城2》票房突破20亿元 [2][6] - 沐曦股份发行初步询价日为12月2日,申购日为12月5日 [3] 政策与监管动态 - 广期所调整多晶硅期货PS2601合约规则:自12月3日结算时起,投机交易保证金标准调整为13%,套期保值交易保证金标准调整为12%;自12月3日交易时起,单日开仓量不得超过500手 [5] - 上海市政府印发人才引进落户新办法,明确引进本市紧缺急需的国内优秀人才可申办本市常住户口,自12月1日起施行 [5] - 国家发展改革委印发《基础设施领域不动产投资信托基金(REITs)项目行业范围清单(2025年版)》,新增数据中心类、人工智能基础设施项目 [5] - 瑞士投票否决了一项对超级富豪征收50%遗产税的提案 [5] 资本市场与公司事件 - 交易所债券市场12月1日收盘,万科债普遍继续下滑:“21万科04”跌超45%,“22万科02”跌超36%,“21万科02”跌超20%,“23万科01”跌超17% [6] - 万科将召开债权人会议讨论“22万科MTN004”的展期事项,会议时间为12月10日 [6] - 芯原股份股东兴橙投资方计划减持不超过525.86万股,国开基金计划减持不超过78.86万股(占总股本不超过0.15%),减持期间为2025年12月23日至2026年3月20日 [13] AI与科技产业 - DeepSeek于12月1日同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新 [4][6] - 豆包手机助手技术预览版推出,搭载该助手的努比亚M153工程样机少量发售,豆包正与多家手机厂商推进合作落地 [7] - 12月1日AI手机概念掀涨停潮,广和通、福蓉科技、中兴通讯、鹏鼎控股、道明光学等涨停 [7] - 研究机构认为,端侧产业链催化剂密集,包括华为“智能憨憨”产品热销、理想AI眼镜发布会、字节火山大会等,苹果Siri也正考虑谷歌Gemini的驱动支持 [8] - 摩根士丹利基于供应链排查,大幅上调谷歌自研AI芯片TPU产量预测:将2027年预测从约300万块上调至约500万块,增幅约67% [9] - 报告测算,每销售50万块TPU芯片,有可能在2027年为谷歌增加约130亿美元的收入 [9] - 随着生成式AI走向规模化应用,全球AI产业重心正加速从训练转向推理;麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40% [10] - 巴克莱预测,2026年AI推理计算需求将达到训练需求的4.5倍,占通用AI总计算需求的70%以上 [10] 大宗商品与原材料 - 12月1日百川盈孚数据显示,氧化镨钕、金属镨钕、钕铁硼价格集体上涨,幅度在3-6%之间 [11] - 研究机构认为,稀土供应端偏紧,部分分离企业开工率下降;需求端磁材企业保持较高开工率,海外市场需求逐步恢复,出口预期向好 [11] 上市公司公告摘要 - **佰维存储**:将回购股份资金总额由“不低于2000万元,不超过4000万元”调整为“不低于8000万元,不超过15000万元”;回购价格上限由“不超过97.90元/股”调整为“不超过182.07元/股” [12] - **工业富联**:截至2025年11月30日,公司累计回购931.99万股,占总股本0.05%,使用资金总额2.47亿元 [12] - **千味央厨**:将在2025年12月2日至12月16日期间开展股东回馈活动,符合条件的自然人股东可领取1份价值200元的产品礼包 [12] - **立中集团**:与伟景智能签署《人形机器人零部件委托加工技术协议》,受托进行机器人零部件的材料选型、设计研发及深加工 [12] - **恒逸石化**:控股股东及其一致行动人计划6个月内增持公司股份,增持金额不低于15亿元,不高于25亿元,增持价格不超过10元/股 [13] - **拓普集团**:拟筹划发行境外股份(H股)并在香港联交所上市 [13] - **卧龙新能**:同意通过下属公司建设包头威俊20万千瓦/120万千瓦时电网侧独立储能示范项目,总投资8.04亿元 [13] - **探路者**:拟以自有资金3.21亿元收购深圳贝特莱电子科技股份有限公司51%股权;拟以3.57亿元收购上海通途半导体科技有限公司51%股权 [13] 资金动向与机构观点 - 12月1日,**北京君正**获机构席位净买入2.51亿元,占总成交额比例3.98% [14] - 华安证券认为,存储产品在消费市场呈现周期向上趋势,公司更多型号DRAM产品将于今年下半年至明年陆续投片,DDR4及LPDDR4产品性价比将提升 [14] - 12月1日,**光启技术**获机构席位净买入1.47亿元,占总成交额比例3.70% [15] - 兴业证券认为,公司深耕超材料尖端装备行业,现有装备需求量提升及新型装备研制转批产提速,有望驱动业绩持续增长 [15] - 四季度以来截至11月28日,创新药主题ETF净申购额为191.31亿元,其中汇添富港股通创新药ETF净申购36.17亿元,广发港股创新药ETF净申购33.27亿元 [16] - 10月21日以来,有8只创新药主题指数基金上报;近一个月机构密集调研百济神州、安科生物、阳光诺和等公司 [16] - 平安基金经理周思聪表示,在创新药投资中坚持国内商业化主线和出海主线,看好ADC、多抗、细胞基因治疗、自免类产品以及医疗设备、CXO、医疗服务等领域 [16] 机构调研信息 - **伊戈尔**:泰国工厂完全投产后具备月产700台新能源变压器的能力,已与北美部分头部EPC客户达成合作,欧美体系储能客户合作也在推进 [18] - **复旦微电**:在FPGA领域保持国内领先,正布局算力从4TOPS至128TOPS的谱系化产品研发,首颗32TOPS算力芯片推广进展良好 [18] - **迈威生物**:旗下双靶点小核酸药物2MW7141与Kalexo Bio, Inc.达成全球独家授权协议,总交易额达10亿美元 [18]
12月2日早餐 | Deepseek发布新模型;大摩大幅上调谷歌TPU产量预测
选股宝· 2025-12-02 00:00
海外市场表现 - 美股主要指数收跌,道指跌0.9%,纳指跌0.38%,标普500跌0.53% [1] - 大型科技股走势分化,谷歌A跌1.65%,Meta跌1.09%,微软跌1.07%,而苹果涨1.52%,英伟达涨1.65% [1] - 纳斯达克金龙中国指数收涨0.96%,成分股中网易涨4.9%,阿里巴巴涨4.4%,小鹏汽车跌2.2%,理想汽车跌2.5%,蔚来跌5.7% [1] - 英伟达宣布向EDA巨头新思科技投资20亿美元入股 [1] 科技巨头动态与AI进展 - 苹果AI主管将离职,接班人曾在谷歌DeepMind和微软工作,公司正加速推进首款可折叠iPhone研发,预计2026年秋季发布 [2] - 谷歌将Gemini 3人工智能模式引入谷歌搜索,覆盖近120个国家和地区 [2] - 大摩大幅上调谷歌TPU产量预测,2027年预测从300万块上调至500万块,增幅约67% [1][8] - 报告测算谷歌TPU若开启外销模式,每销售50万块芯片可能在2027年为其增加约130亿美元收入 [1][8] 大宗商品与金属市场 - 伦钴收盘涨穿5万美元整数位心理关口,出口禁令到期后刚果(金)仍未恢复出口 [3] - 国际铜夜盘收涨0.73% [3] - 国内夜盘金属多数上涨,沪银收涨超5%,沪铜涨0.62%,沪锌涨0.98% [9] - 稀土磁材价格上涨,氧化镨钕、金属镨钕、钕铁硼价格集体上涨3-6%,近一周稀土价格持续上行 [8] 存储芯片市场 - 2025年11月主流NAND Flash wafer合约价全面大幅上涨,各类产品平均月涨幅达20%至60%以上 [7] - 需求受AI应用与企业级SSD订单强力拉动,行业位元供应增幅受限于厂商资本开支重点转向先进制程而非新产能扩张 [7] - TrendForce预测NAND市场供给紧缩将延续至2026年全年 [7] 人工智能与模型发展 - DeepSeek推出V3.2正式版,强化Agent能力,在智能体评测中达到当前开源模型最高水平 [6] - V3.2-Speciale模型版本成功斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌 [6] - 伴随阿里QWEN大模型等竞品快速迭代,国内AI产业整体景气度有望继续提升 [6] - 麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40% [10] 国内产业与公司动态 - 光大证券表示市场放量连续反弹,考虑到12月两场重磅会议的利好预期,指数有望延续反弹之势 [5] - 航天科技集团全力攻关突破可重复使用火箭等关键技术,推动太空经济发展 [9] - 上海闵行区330公里自动驾驶测试道路即将开放,滴滴自动驾驶在广州试运行全天候全无人Robotaxi服务 [9] - 电动车11月销量表现亮眼,鸿蒙智行突破8万辆创新高,小米再破4万辆,理想i6和i8累计订单突破10万辆 [9] 上市公司公告精选 - 探路者拟3.57亿元收购上海通途半导体51%股权,标的公司从事IP技术授权及芯片设计研发 [13] - 恒逸石化控股股东拟15亿元-25亿元增持公司股份 [13] - 卧龙新能投资8.04亿元建设包头威俊20万千瓦/120万千瓦时电网侧独立储能示范项目 [13] - 中超控股子公司中标合计13.18亿元项目,占公司2024年度经审计营业总收入的23.97% [13]
大摩上调谷歌TPU产量预测,产量预期呈爆炸式增长
选股宝· 2025-12-01 14:39
谷歌TPU芯片产量与市场前景 - 摩根士丹利研报显示谷歌自研AI芯片TPU供应链不确定性消退,未来两年产量预期呈爆炸式增长,可能意味着谷歌准备向第三方大规模销售TPU芯片 [1] - 基于供应链排查,将谷歌TPU在2027年产量预测从约300万块大幅上调至约500万块,增幅约67% [1] - 报告测算,每销售50万块TPU芯片,有可能在2027年为谷歌增加约130亿美元收入 [1] AI推理市场发展趋势 - 随着生成式AI走向规模化应用,全球AI产业重心正加速从训练转向推理 [1] - 麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40%,远高于训练市场的20% [1] - 巴克莱预测2026年AI推理计算需求将达到训练需求的4.5倍,占通用AI总计算需求的70%以上 [1] 光学电路交换(OCS)市场机遇 - 谷歌TPU芯片的放量销售将给光学电路交换(OCS)等新增细分市场带来发展机遇 [1] - 腾景科技前期已签订YVO4(钒酸钇晶体)单笔采购订单8760.60万元,订单签订速度超预期,钒酸钇晶体为OCS核心材料 [2] - 光库科技积极布局OCS光器件业务,拓展OCS光交换机代工领域 [3]
云天励飞:第四代NPU研发完成,正在推进下一代高性能NPU研发
巨潮资讯· 2025-11-29 01:08
芯片技术研发进展 - 已完成第四代NPU的研发,并正在推进下一代高性能NPU的研发,新产品将更适合AI推理应用 [2] - 正在开发多款芯片以适配多样化应用场景 [2] - 已推出多代芯片系列,包括Deep Eye系列、Deep Edge系列及在研的Deep Verse系列、Deep XBot系列 [2] 产品应用与商业化 - 2024年推出的IPU-X6000加速卡已开始与软件企业、AI应用企业、互联网厂商等多个客户进行研发对接、生态融合并开始商业化应用 [2] - 2025年11月与金蝶软件达成战略合作,共同打造“国产算力引擎+企业级软件生态”的融合标杆,推动AI推理能力嵌入更广泛的企业数字化流程 [2] - 向客户的家庭主机产品提供DeepEdge10Max芯片,已有小批量出货,未来计划向其他边缘智能硬件产品提供AI芯片及相关服务 [2] 目标应用场景 - 芯片产品使用场景覆盖车路云、云端大模型推理、具身智能机器人等领域 [2]
英伟达:祝贺谷歌TPU成功,但GPU领先一代
量子位· 2025-11-26 04:21
文章核心观点 - 谷歌正通过向其他公司推广其自研TPU芯片的本地部署方案,直接挑战英伟达在AI算力市场的领导地位,此举可能为谷歌带来数十亿美元年收入,并抢占英伟达约10%的年营收 [5][7] - 英伟达对此采取积极反击策略,主要通过向关键AI客户(如Anthropic、OpenAI)进行巨额投资,以换取其继续使用英伟达GPU的承诺,试图巩固其市场地位 [27][28] - 两家巨头的竞争正搅动整个AI产业格局,反映出AI算力市场从英伟达一家独大向多元化竞争的潜在转变 [10][33] 谷歌的TPU扩张战略 - 谷歌推出关键举措:向Meta及大型金融机构等客户推荐在其自有数据中心本地部署TPU方案,Meta计划在2027年斥资数十亿美元使用TPU,并于明年从谷歌云租用芯片 [5] - 谷歌TPU推广的两大卖点:强调安全合规以满足敏感数据要求,以及展示性能优势,如Gemini 3已证明TPU能高效运行AI模型,尤其适合低延迟场景 [17][18] - 为降低客户使用门槛,谷歌开发了“谷歌版CUDA”——TPU command center,并承诺客户可借助PyTorch生态与TPU交互,无需精通其编程语言Jax [19] - 谷歌通过提供有竞争力的条款(如为合作伙伴Fluidstack提供高达32亿美元的兜底担保)和接触英伟达的盟友(如Crusoe、CoreWeave)来加速TPU生态扩张 [22][23] - 谷歌已推出多代TPU产品,最新一代Ironwood TPU计划于2025年第四季度发布 [24] 英伟达的市场防御与反击 - 英伟达采取直接资本投入的方式进行反击:在谷歌宣布向Anthropic供应100万个TPU后,英伟达随即宣布向Anthropic投资数十亿美元;在OpenAI计划租用谷歌TPU时,与OpenAI达成初步协议,可能投资高达1000亿美元 [27] - 公司积极拉拢可能使用谷歌TPU的大客户(如OpenAI、Anthropic、Meta),并可能通过与Meta达成独家合作来阻止其与谷歌的TPU合作 [25][26] - 英伟达公开强调其解决方案的独特优势:是唯一能兼容所有AI模型、覆盖所有计算场景的硬件平台,并声称其方案相较于专用芯片具备更卓越的性能、更广泛的适用性和更灵活的通用性 [3][4] - 尽管面临挑战,英伟达云业务(向客户出租搭载英伟达芯片的服务器)收入目前仍远高于谷歌的TPU相关收入 [32] 行业竞争格局与市场影响 - AI算力市场竞争加剧,除谷歌外,亚马逊、微软等云服务商以及OpenAI、Meta等大型AI开发商均已启动自有AI芯片研发 [33] - 有分析师认为,挑战英伟达霸权的最大机会在于推理芯片领域,而非其优势明显的训练芯片领域 [34] - 市场数据显示,2025年1月至11月期间,谷歌母公司Alphabet与英伟达股价均大幅跑赢标普500指数,其中Alphabet后期涨势更为强劲,而英伟达股价波动相对剧烈 [11][12] - 英伟达CEO黄仁勋坦言公司面临的市场预期极高,其市值波动巨大,曾提及“史上没人能几周内蒸发5000亿美元市值” [40][41]
中国AI芯片在推理赛道寻突破
中国经营报· 2025-11-25 14:36
AI算力需求结构性转变 - AI算力需求正从训练阶段向推理阶段倾斜,智能体AI算力从2025年开始逐渐攀升并将超越传统训练和微调算力,成为驱动AI算力增长的核心动力[1] - 2023年之前训练与推理算力需求占比约为6:4,到2025年这一比例已实现反转[4] - 未来80%的AI计算将花在推理领域,其中智能体AI是产生客户价值的核心场景[4] 国产AI芯片产业现状与挑战 - 国内AI芯片主流采用12纳米与7纳米工艺,而北美地区已向2纳米工艺推进,工艺差距约两代[2] - 受工艺差距影响,国内单颗AI芯片算力仅为北美同类产品约30%,内存容量和数据带宽等关键性能指标仅为北美芯片40%至70%[2] - 在地缘政治影响下,国内智算发展在先进工艺、高带宽存储器、封装技术及设计工具等关键环节面临外部限制[2] 国内产业突破路径与策略 - 通过算力组网、超节点架构设计等技术路径创新,在384组卡部署规模下国内AI系统整体算力可达北美同类系统2.1倍[2] - 推理芯片更强调场景适配性、低功耗与成本控制,这契合中国芯片企业在特定领域的技术积累与产业链优势[5] - 国产芯片已基本解决"有无"问题,下一阶段产业核心目标将从"可用"向"好用"升级并提升性价比[5] 推理芯片市场机遇 - 推理端尤其是面向视频生成、边缘计算和行业应用的推理场景,正成为中国AI芯片企业实现差异化突围的赛道[1] - 高性能训练芯片市场增长空间收窄,而高性价比推理芯片市场仍是一片蓝海[4] - 智能体AI复杂度远超传统推理任务,其Token使用量达到传统方法100倍,对推理芯片性能、能效与兼容性提出更高要求[4] 国产芯片产业发展方向 - 中国芯片产业正加速向全球产业链中高端冲击,涵盖CPU、GPU等通用计算领域及车规级芯片等垂直细分领域[3] - VPU芯片凭借在视频AI推理、超高清处理等场景的专用性优势,为产业提供"换道超车"机遇[3] - 国内AI产业快速发展对推理算力需求呈爆发式增长,为国产芯片提供广阔应用空间[3]