TPU v7

搜索文档
GenAI系列报告之64暨AI应用深度之三:AI应用:Token经济萌芽
申万宏源证券· 2025-09-24 12:04
行业投资评级 - 报告对AI应用行业持积极态度 投资评级为看好 [4] 核心观点 - AI应用Tokens消耗量大幅增长体现落地进展加速 大模型实现大规模商业化且收入向头部集中 OpenAI年化收入达到120亿美元 [4] - AI视频工具已迈入1亿美元ARR台阶 大规模商业化节点即将到来 [4] - AI编程为最热门融资方向 商业模式已跑通并加速兑现收入 Anysphere实现5亿美元ARR [4] - 企业级AI软件商业化偏慢 但具备坚实应用场景的AI法律 招聘 客服等领域已渐次兑现收入 [4] - 互联网巨头通过AI推荐系统升级和AI应用孵化推动商业化 META业绩已体现生成式推荐系统效果 [4] AI应用总览 - 大模型API调用量2025年后增长明显 OpenRouter平台显示谷歌Gemini Anthropic Claude OpenAI GPT等模型竞争格局高波动 [11] - 互联网公司AI Chatbot成为核心算力消耗场景 ChatGPT周活跃用户达8亿 谷歌Gemini月活用户达4.5亿 [14] - 微软Tokens消耗量从2024Q1的20万亿增长至2025年3月的400万亿 谷歌Tokens消耗量从2024年5月的9.7万亿增长至2025年7月的980万亿 [13] - 初创公司商业化进展分化 OpenAI估值3000亿美元 Anthropic拟以1700亿美元估值融资 xAI估值1130亿美元 [16] - AI视频工具Runway ARR达8400万美元 Synthesia ARR达1亿美元 Midjourney年营收预计3亿美元 [16] - AI编程工具Anysphere估值99亿美元 ARR达5亿美元 Replit估值30亿美元 ARR达1.4亿美元 [18] - 垂类AI应用Scale AI年营收预计20亿美元 Surge AI年营收超10亿美元 ElevenLabs ARR达1亿美元 [22] 互联网巨头进展 - 生成式推荐架构正替代传统DLRM模型 META GRs 快手OneREC 字节HLLM等方案推动推荐系统升级 [34] - META生成式推荐系统使Facebook用户使用时长提升7% Instagram提升6% 广告转化率提升5% [42] - 谷歌AI搜索功能AI Overview月活用户超20亿 AI Mode月活达1亿 Gemini月活达4.5亿 [47] - OpenAI年化收入120亿美元 其中C端订阅55亿 B端订阅36亿 API收入29亿 [53] - Anthropic年化收入50亿美元 其中API收入31亿(60%来自编程工具) 编程工具Claude Code ARR达4亿美元 [53] AI编程领域 - AI编程工具ARR总和超30亿美元 GitHub Copilot用户达2000万 Cursor ARR从1亿快速提升至5亿 [61] - 应用层公司仍需完成代码库感知 编辑器整合 UI优化等工作 具备独立竞争壁垒 [65] - Cursor通过VS Code集成 影子工作区验证 多模型智能路由等技术实现出色用户体验 [68] - 长期看AI编程可能演进为UGC应用程序平台 降低开发门槛并丰富应用生态 [73] 企业级AI软件 - 企业级AI部署前期需3-18个月完成数据清洗 工作流结合等工作 大规模落地节点或在2026年后 [80] - 定制化AI平台更适合企业落地 ServiceNow AI ACV订单达2.5亿美元 指引2026年达10亿美元 [77] - 竞争壁垒来自数据获取能力和行业Know-how Palantir Snowflake ServiceNow SAP等公司具优势 [85] - Palantir通过数据层归一化 逻辑层模型结合 行动层人工审核等构建企业AI操作系统 [91] 内容生产工具 - AI视频工具Runway Synthesia ARR接近1亿美元 但文本忠实度等仍有提升空间 [96] - 设计软件市场分化 Adobe面向专业设计者市场 Figma Canva面向传播者市场 [99] - Figma高价值客户数量高速增长 超过1万美元ARR客户达11107家 超过10万美元客户达1031家 [101] - 多邻国Max会员渗透率达8% 定价29.99美元/月 高于Super会员的12.99美元 [109] 国内AI应用 - 2025H1中国大模型公有云服务Tokens调用量达537万亿 2024全年为114万亿 [112] - 互联网公司通过推荐系统升级 AI Chatbot和云业务推动AI落地 [115]
GPU跟ASIC的训练和推理成本对比
傅里叶的猫· 2025-07-10 15:10
芯片供应商及产品规划 - NVIDIA全球市场AI GPU产品线从A100到GB100覆盖2020至2027年,制程从7nm演进至3nm,HBM容量从80GB提升至1024GB [2] - NVIDIA中国市场特供版包括A800/H800/H20等型号,HBM容量最高96GB,部分型号采用GDDR6显存 [2] - AMD MI系列从MI100到MI400规划至2026年,HBM3e容量达288GB,MI400将采用HBM4技术 [2] - Intel AI GPU产品包括MAX系列和Gaudi ASIC,Habana 2采用HBM3e技术容量达288GB [2] - Google TPU v5e至v6采用5nm/3nm制程,HBM3e容量最高384GB [2] - AWS Tranium系列采用Marvell/Alchip设计,Tranium3 Ultra将使用3nm制程和HBM3e [2] 大模型训练成本分析 - 训练Llama-3 400B模型时,TPU v7成本显著低于GPU,呈现断档式优势 [7] - NVIDIA GPU中GB200超级芯片训练成本最低,H100成本最高,验证"买得越多省得越多"规律 [7] - Trainimium2训练成本异常高企,与迭代预期不符 [7] - 硬件成本占比最高的是GPU部分,电力成本占比相对较低 [5][7] 推理成本比较 - AI ASIC在推理场景成本优势显著,比GB200低10倍 [10] - GPU产品中高端型号推理成本反而更高,与训练成本趋势相反 [11] - TPU v5p/v6和Tranium2在推理场景展现最佳性价比 [10][11] 技术参数对比 - GB200超级芯片峰值算力达5000 TFLOPS,是H100的5倍 [12] - HBM3e技术成为2024年主流,NVIDIA/AMD/Intel均采用该内存方案 [2] - 能效比方面GB200达2.25 TFLOPS/Watt,优于H100的1.41 TFLOPS/Watt [12] - MI300X与H100算力接近(981 vs 990 TFLOPS),但能效低7% [12] 供应链动态 - B200芯片已进入期货阶段,国内可接样品订单 [13] - 主要设计合作伙伴包括Broadcom、Marvell和Alchip等厂商 [2] - 行业信息显示3nm制程将在2025-2026年大规模应用于AI芯片 [2][12]
IP 设计服务展望:2026 年 ASIC 市场动态
2025-05-22 05:50
纪要涉及的行业和公司 - **行业**:IP/设计服务、ASIC市场 - **公司**:AWS、Google、META、Microsoft、Alchip、eMemory、GUC、Faraday、M31、Andes、Broadcom、Marvell、Apple、OpenAI、xAI、Intel、Bytedance、Li - auto、Furiosa、Qualcomm、MediaTek 纪要提到的核心观点和论据 各公司ASIC进展 - **AWS**:Trainium 3问题解决,继续与下游供应商接单,预计签署Trainium 4合同,实际项目已启动 [2] - **Google**:从TPU v6到v8进展稳定,规格高于其他CSP的ASIC,TPU v6p和v7p配置不同且ASP可能提升,未来难不与Broadcom合作 [2] - **META**:从MTIA v2向MTIA v3代际迁移,2026年MTIA v2产量10 - 20万片,MTIA v3产量20 - 30万片 [2] - **Microsoft**:Maia v2计划2026年量产50万片,原分配计划改变,Marvell获40万片;Maia v3供应商选择竞争激烈,预计年底出结果,MSFT/GUC团队分配量可能较少 [3][4] - **非CSP公司**:Apple、OpenAI、xAI等系统厂商构建自己的ASIC服务器,多在2H25流片,2H26量产,选择与Broadcom合作的规格高端,2027年非CSP服务器增多,利好Broadcom [7] - **Apple**:加速器预计4Q26量产,2026年出货10万片 [8] - **OpenAI**:3nm ASIC预计9月流片,2026年6月量产,2026年产量30 - 40万片,生命周期1 - 1.5年 [9] - **xAI**:3nm ASIC项目预计2H25流片,2H26量产,2026年产量30 - 40万片 [9] 公司业绩与业务情况 - **GUC**:FY25因Google CPU和加密项目收入可能超预期,Google 3nm服务器CPU收入提前至3Q25,预计成前5大客户;FY26即使无加密收入,代工收入仍有增长,CEO认为Google CPU和第三CSP客户潜在收入高于Maia v2 [10][11] - **M31**:今年重点是前季度签署合同的第二次付款;与Qualcomm合作紧密,Qualcomm 2H25启动2nm智能手机SoC项目,1Q26启动2nm AI PC处理器项目,MediaTek 2nm智能手机SoC项目未启动 [12][13] - **Faraday**:1Q25收入增长源于中国客户购买三星HBM2E的预付款,若客户被列入实体清单,剩余价值小且客户自行处理库存核销 [14] 其他重要但可能被忽略的内容 - 展示了多家公司的股票信息,包括市值、评级、价格、目标价、EPS、PE、PB、ROE、股息率等 [6] - 给出了CSPs的ASIC订单分配给设计服务提供商的情况 [15] - 呈现了ASIC的规格信息 [15] - 展示了ASIC MP的时间线 [17] - 给出了2026年各公司ASIC的芯片数量、晶圆发货量和收入贡献估算 [18]