ROCm 7

搜索文档
AMD 在 AI 推理领域悄然领先
美股研究社· 2025-09-23 11:46
AMD ( NASDAQ: AMD ) 在过去数年中从落后者成长为有力竞争者,这得益于其在数据中心 CPU 领域的某些优势以及向 AI 加速器迁移的加 速。上个季度该公司表现强劲,但过于关注 短期波动的投资者却忽略了整体情况。 AMD 构建了涵盖 CPU、GPU、AI PC 以及未来机架式系统的多引擎增长基础设施。后者将推动 CPU 的长期增长周期,并将在未来十年内规划 其未来发展。 分析 师仍然看好AMD。最近的回调与其说是疲软,不如说是健康的调整,并重新定位至新的高点,此前其已从 最初看涨的97美元 上涨了62% 。 AMD 未来最关键的战场就在数据中心 —— 因为现在推理任务的算力需求已经超过了训练,成了算力需求的第一驱动力。不管是超大规模科技 公司、各国政府,还是普通企业,都在想办法降低成本,同时支撑更大规模的模型落地。 这说到底,其实是改变了 AMD 的竞争逻辑:以前比的是训练速度,现在 "每单位 token 的成本" 才是核心指标。 AMD 2025 年第二季度数据中心收入达到 32.4 亿美元 ,同比增长 14%,这得益于创纪录的 EPYC CPU 销量。Turin 的采用率正在极快增长, EP ...
AI Spending Could Soar 500%: 3 Brilliant AI Stocks to Buy (Hint: Not Nvidia)
Yahoo Finance· 2025-09-18 09:55
行业前景 - 人工智能基础设施支出预计在未来几年内增长五倍 [1] 博通公司 - 博通成为人工智能领域关键参与者 大型超大规模数据中心运营商寻求英伟达替代方案以降低成本并实现供应链多元化 [3] - 博通帮助客户设计定制专用集成电路 其效率更高且运营成本低于图形处理器 [3] - 博通曾帮助Alphabet设计张量处理单元 该单元现为谷歌云的关键组成部分 [4] - 博通的设计赢得了Meta Platforms和字节跳动等客户 这三家客户代表了到2027财年600亿至900亿美元的商业机会 [4] - 第四家客户(普遍认为是OpenAI)已下达100亿美元的定制芯片订单 将于明年交付 [5] - OpenAI与Oracle达成协议 计划在未来五年内投资3000亿美元建设数据中心 为博通带来巨大机遇 [5] 超微半导体公司 - 超微半导体在人工智能推理领域占据稳固利基市场 将受益于市场发展趋势 [6] - 其最新软件平台ROCm 7专为推理设计 虽不及英伟达CUDA 但普遍认为足以满足推理需求 [7] - 一家最大的人工智能运营商已将大部分推理流量运行于超微半导体的图形处理器上 十大人工智能参与者中有七家使用其部分硬件 [7] 关键机遇 - 博通在定制芯片领域拥有巨大机遇 [8] - 推理业务应成为超微半导体的增长驱动力 [8]
AMD与英伟达的差距正在缩小
36氪· 2025-08-28 02:18
公司股价表现 - AMD股价在过去六个月内飙升50%以上,华尔街认可其正在缩小与英伟达的差距 [1] 技术竞争力分析 - AMD的MI355在关键训练和推理工作负载方面达到甚至超过英伟达B200,在部分场景提供与GB200相当性能且成本显著降低 [5] - MI355在高端推理场景的每美元代币收益最高可提升40% [5] - ROCm 7软件平台实现重大升级,推理和训练性能较上一代提升3倍以上,并增强对大规模训练和分布式推理的支持 [7] - AI公司Tiny Corp指出AMD软件差距正在缩小 [9] 财务表现 - 第二季度数据中心业务收入3.24亿美元,环比下降11.8%,同比增长14.3% [2] - 客户端业务收入2.499亿美元,环比增长8.9%,同比增长67.5% [2] - 数据中心收入环比下降主因MI308出口管制影响,目前管制已解除 [3] 市场机会与估值 - 预计2029年数据中心市场规模达3790亿美元,2030年可能达到4840亿美元(按27%增长率测算) [10] - 若获得20%市场份额,AMD数据中心收入2030年将达968亿美元 [12] - 当前市销率略低于10倍,假设15倍市销率测算,数据中心业务估值可达1.45万亿美元 [15] - 英伟达当前市销率接近30倍 [12] 战略布局 - 与IBM达成量子计算协议,旨在创建可扩展开源计算平台,整合量子处理器与CPU/GPU/FPGA [14] - 人工智能公司倾向于多元化供应商选择,当前英伟达占据AI数据中心市场约90%份额 [9] 增长驱动因素 - 数据中心收入呈现指数级增长趋势 [16] - 技术差距缩小将推动市场份额扩张 [9] - 出口管制解除恢复对中国市场销售能力 [3]
AMD与英伟达的差距正在缩小
美股研究社· 2025-08-27 12:08
股价表现与市场认知 - 公司股价在过去六个月内飙升50%以上 反映市场对其技术追赶的认可 [1] - 华尔街意识到公司正在缩小与英伟达的技术差距 这将成为估值提升的关键驱动力 [1] 财务表现与业务动态 - 第二季度营收超出预期且公司上调业绩指引 但数据中心业务同比增长仅14% [2] - 数据中心收入环比下降11.8%至32.4亿美元 主要受MI308出口管制影响 [3][4] - 客户端业务表现亮眼 收入环比增长8.9%至24.99亿美元 同比增长67.5% [3] - 出口管制现已解除 公司恢复对中国市场的销售能力 [4] 技术竞争力分析 - MI355在关键训练和推理工作负载方面达到甚至超过英伟达B200性能水平 [7] - MI355在高端推理场景中每美元代币收益最高可提升40% [7] - ROCm 7软件平台实现重大升级 推理和训练性能较上一代提升3倍以上 [10] - 软件生态持续完善 增加对大规模训练、分布式推理和低精度数据类型的支持 [10] 市场份额与增长潜力 - 当前在人工智能数据中心市场份额约10% 存在翻倍空间 [14][15] - 数据中心市场规模预计到2029年达3790亿美元 2030年可能达到4840亿美元 [15] - 若获得20%市场份额 2030年数据中心收入将接近1000亿美元 [17] - 市销率目前低于10倍 较英伟达30倍存在显著折价 [17] 战略合作与创新布局 - 与IBM达成量子计算协议 旨在创建可扩展的开源计算平台 [22] - 项目将量子处理器与传统CPU、GPU和FPGA技术相结合 [22] 行业前景与估值预期 - 基于数据中心收入968亿美元预测 采用15%市销率估值达1.45万亿美元 [19] - 数据中心业务单独估值可能超过一万亿美元 未包含其他业务部门价值 [19] - 人工智能革命将持续推动数据中心收入呈指数级增长 [26][27]
业绩超预期后的大跌:AMD终将沦为二线玩家?
36氪· 2025-08-08 00:02
核心观点 - AMD Q2业绩超预期但股价下跌 反映市场对公司定位分歧 传统半导体公司视角下估值过高 AI视角下存在上涨空间 但收入结构问题及竞争压力导致投资者信心不足 [1] - 公司面临向上难以突破英伟达生态壁垒 向下受ASIC厂商挤压的竞争格局 数据中心业务疲软及盈利增长乏力加剧市场担忧 [2][6][13] 财务表现 - Q2营收77亿美元 同比增长32% 超市场预期74.3亿美元 主要受客户端业务同比增67%和游戏部门同比增73%驱动 [3] - 数据中心业务同比增14%且环比降12% 为2023年Q3以来首次连续季度收缩 主因对中国出口禁令导致约8亿美元收入损失 [4] - non-GAAP毛利率维持在54% 连续两季度停滞 定价权弱化导致MI300系列较英伟达产品售价低约20% [6] 业务结构分析 - 客户端与游戏业务增长强劲但市场空间有限 PC出货量预计2025年仅增0.2% 游戏显卡市场规模约400亿美元 [7] - 数据中心业务增速从2024年Q2的115%降至14% 增长依赖CPU而非GPU 难以支撑当前2600亿美元市值所需的高增长 [9] 竞争环境 - 缺乏CUDA生态使AI芯片难以起量 同时面临博通等ASIC厂商在推理和边缘部署领域的竞争 [2][12] - ASIC在AI推理和边缘部署具性价比优势 与英伟达GPU在训练和开发领域的优势形成互补 博通市值已突破1.4万亿美元 [12][13] 技术进展 - 新一代MI400芯片FP4运算能力达40 petaflops 内存带宽较竞品高50% Helios平台支持72个GPU互联 称可实现10倍性能提升 [10] - ROCm 7软件栈使推理和训练性能提升3倍 扩展对vLLM等框架的原生支持 获得甲骨文2.7万节点AI集群订单 [10][11] 前景与挑战 - Q3营收指引87亿美元 同比增28% 但增速环比放缓 毛利率维持54% 管理层未明确数据中心业务复苏信号 [13] - 当前90倍PE隐含未来三年净利润复合增速超50%的预期 在半导体行业属极高水平 [14] - 公司陷入规模与利润平衡困境 需通过技术突破或细分市场突破竞争循环 [15]
突破落地瓶颈,AMD Mini AI工作站峰会揭晓端侧AI实现新路径
36氪· 2025-07-10 14:58
行业趋势与峰会背景 - AI智能体加速普及,工作与生活方式正经历深刻变革,AI落地"最后一公里"成为核心难题[1] - AMD联合36氪举办"AMD Mini AI工作站行业解决方案峰会",聚焦"超大模型端侧部署",展示30款基于锐龙AI MAX+ 395处理器的设备,联合200+生态链伙伴[1] AMD战略与技术布局 - 端侧AI是产业战略性机遇,AMD将开放合作推动超大模型端侧规模化部署[2] - 锐龙AI MAX+ 395处理器采用CPU+GPU+NPU三合一架构:Zen5核心16核32线程 CPU、RDNA3.5 40CU GPU(性能媲美4060-4070独显)、50TOPS算力NPU[4] - 统一内存架构(UMA)支持96GB超大显存,可运行70B+参数模型及混合模态AI智能体[4] 行业应用案例 企业效率提升 - 模优优科技利用AMD大显存特性本地部署DeepSeek-V3及Qwen3-235B大模型,结合多智能体为投资决策团队提供安全高效的研报预处理方案[6] 个人生产力革新 - 首界科技推出"玲珑星核"AI主机,基于ROCm开源生态实现软硬件一体化AI体验,支持双机互联扩展为微型集群[8] 办公场景优化 - ChatExcel本地化方案使Mini AI工作站成为安全数据分析一体机,财务部门可通过自然语言交互完成复杂分析[10] 垂直行业赋能 - 无问芯穹为教育行业提供推理加速方案,Mizar引擎提升终端效率同时保障模型精度[10] - 清昴智能为家纺行业设计从设计到门店合规检查的一体化解决方案,保护敏感信息并提升效率[13] - 中科加禾打造家庭AI Hub,实现多模态大模型驱动的家庭智能中枢[15] 生态共建计划 - 启动"AMD Mini AI工作站赋能行业计划",系统性支持伙伴创新解决方案[17] - 魔搭社区设AMD专题赛道,鼓励开发者挖掘硬件潜力创造AI原生应用[21] - 推出ROCm 7开源AI软件堆栈,提升框架兼容性与开发工具链,构建开放生态[23] 产品与生态成果 - 锐龙AI MAX+ 395处理器具备工作站级性能:16核Zen5 CPU、40CU RDNA3.5 GPU、50TOPS NPU,是端侧部署超大模型的最优平台[25] - AMD已形成从硬件设备、模型调优伙伴到行业应用联盟的完整端侧AI生态[27]
摩根士丹利:AMD 人工智能进展活动 -MI350 表现尚可,但 MI400 才是更具长期潜力的转折点
摩根· 2025-06-16 03:16
报告行业投资评级 - 股票评级为Equal - weight(等权重),行业观点为Attractive(有吸引力),目标价格为$121.00,2025年6月12日收盘价为$118.50 [7] 报告的核心观点 - AMD按预期推出MI350,但市场焦点在明年的机架级MI400/450产品,若能交付或带来更大转变,但目前维持等权重评级 [2] - 现有云客户对AMD评价积极但未改变整体观点,市场份额情况在英伟达结束供应分配后仍不乐观 [4] - 虽7/10的大型AI公司使用AMD产品,但在客户中拓展份额能力是关键,AMD在云业务中可能在推理需求飙升时失去份额 [5][10] - OpenAI CEO评价提升了AMD AI营收预测可信度,但AMD仍需执行到位,MI400可能改变局面但有待验证 [11][9] - 公司执行产品路线图使其在较小研发预算下获得份额,AI生态系统采用需时间,AMD早期成功反映市场整体优势 [39] 根据相关目录分别进行总结 产品发布情况 - 正式推出基于CDNA 4的MI300系列,包括MI350和355产品,二者均有288GB HBM3E,拓展数据格式兼容性,MI355性能稍高但功耗预算更高,产品性能相比MI300X有显著提升,与英伟达部分产品相当 [12] - 更大亮点是MI400系列及新“Helios”机架架构,将于明年正式推出,2027年还有迭代版本,MI400系列硅片有432GB HBM4,性能有大幅提升 [13] - 软件方面,AMD持续投资软件生态系统,推出下一代ROCm 7和新的AMD开发者云,ROCm 7有性能提升和更多支持 [13] - 系统解决方案上,AMD为MI400系列GPU推出首个机架级架构,整体机架性能与英伟达产品相当且有内存优势,CPU将采用2026年“Venice” EPYC,系统可扩展至72个GPU,并集成新的UEC capable 3nm “Vulcano” NIC [14][15] 客户反馈情况 - 现有云客户(甲骨文、微软、Meta等)对AMD评价积极,Meta有扩大合作意向,但客户评论更多聚焦MI300或MI400系列,MI350似乎只是渐进式改进 [4] - 客户在财报电话会议中表示计算资源短缺,但AMD营收趋势显示客户在此期间减少了对AMD产品的使用 [4] - OpenAI CEO评价提升了AMD AI营收预测可信度,但不能据此判断12个月后的竞争格局 [11] 市场份额及营收情况 - 7/10的大型AI公司使用AMD产品,但AMD在最大客户中为Mi350系列实现增长有难度,可能低于2025年instinct 25%的同比增长预期 [5] - AMD在云业务中可能在推理需求飙升时失去份额,不利于看多观点 [10] 财务数据情况 - 2024 - 2027财年EPS分别为$3.33、$4.20、$6.12、$6.69,P/E分别为49.3、33.6、21.6、20.0 [7] - 摩根士丹利对AMD的$121目标价格相当于2026财年预期每股收益$5.49的约22倍,反映其从英特尔手中夺取更多份额,数据中心同比增长21%(AI增长约25%) [25] - 摩根士丹利估计与市场共识在销售/收入、EBITDA、净利润、EPS等方面存在差异 [38] 风险与机会情况 - 机会在于AMD继续执行产品路线图,在较小研发预算下获得份额,PC和Zen服务器份额因Zen采用增加而加速增长,服务器更新推动数据中心收入超预期,数据中心GPU表现超预期 [39][40] - 风险在于英特尔在2024 - 2025年的服务器CPU可能抑制AMD势头使其失去份额,AMD在图形领域份额被英伟达夺取,数据中心GPU表现不及预期 [40]
“强得不可思议!” 英伟达对手放大招
中国基金报· 2025-06-16 00:28
公司动态 - 超威半导体公司发布新一代AI芯片MI350X和MI355X 将于2024年三季度通过云服务公司提供 并计划2026年推出下一代产品MI400 [1] - 新产品性能宣称超越英伟达旗舰产品B200 在大语言模型测试中多项指标优于英伟达产品 [1] - 同等成本下数据处理性能最高可提升40% 计划以更低定价推出替代方案 [1] - 客户拓展取得进展 产品已获Meta 微软 甲骨文等巨头采用 覆盖十大顶尖AI企业中的七家 [1] - 发布全新开发平台ROCm 7 以开源模式免费开放 支持非超威芯片兼容适配 [4] 行业竞争 - 超威选择在英伟达三个月前举办发布会的同一场地公布发展规划 显示对抗意图 [1] - 英伟达仍占据AI芯片市场超70%的份额 在生成式AI领域保持绝对领先优势 [2] - 行业重心正从学习转向以推理为核心的数据处理模式 为超威提供提升竞争力机遇 [3] - 英伟达构建的CUDA生态系统构成壁垒 开发者黏性极强 [3] - AI芯片领域出现类似基础模型领域的竞争格局 挑战者通过技术开放方式发起挑战 [4] 市场反应 - OpenAI首席执行官盛赞超威新品性能强悍得不可思议 凸显公司行业地位提升 [2] - 市场对摆脱英伟达高价芯片依赖的需求强烈 [1] - 超威选择在生成式AI规模化发展阶段以低价产品发起挑战 [3]
AMD 推进人工智能:MI350X 与 MI400 UALoE72、MI500 UAL256——SemiAnalysis
2025-06-15 16:03
纪要涉及的公司和行业 - **公司**:AMD、英伟达(Nvidia)、AWS、Meta、OpenAI、x.A、微软(Microsoft)、甲骨文(Oracle)、字节跳动(ByteDance)、台积电(TSMC) - **行业**:半导体、云计算、人工智能 纪要提到的核心观点和论据 AMD新产品竞争力 - **M50X/M55X**:在中⼩型LLMs推理的每TCO性能上可与英伟达HGX B200竞争,但M55X⾮机架级产品,在尖端模型推理或训练上⽆法与英伟达GB200 NVL72抗衡;M55X功耗⾼1.4倍,但TFLOPS吞吐量仅⽐M50X快不到10%,实际性能优势预计超10%;M50X和M55X在BF1/FP8/FP数据类型纸⾯规格能与HGX B200抗衡,M55X FP性能⽐B200 FP快2.2倍,但实际受功耗限制[7][11][15][16][17]。 - **M00系列**:有望在202年下半年成为与英伟达VR200 NVL1竞争的机架级解决⽅案;虽未采⽤真正UALink技术,但其基于以太⽹UALink在纵向扩展带宽上可与VR200 NVL1的NVLink竞争,且⽀持72个逻辑GPU纵向扩展规模;AMD宣布开发者云服务将M00按需定价降⾄1. 美元/⼩时/GPU,或使租⽤AMD GPU具竞争⼒[8][11][12][13]。 - **M500 UAL25**:2027年末发布,将配备25个物理/逻辑芯⽚,⽽VR00 NVL57仅1个[13]。 市场与客户 - **超⼤规模企业与AI实验室**:AMD产品总体拥有成本和每TCO性能潜⼒获超⼤规模企业和⼤型AI实验室共鸣,订单势头强劲;AWS⾸次⼤规模采购并部署AMD GPU⽤于租赁;Meta开始⽤AMD训练,参与M55X和M00项⽬;OpenAI欣赏AMD发展态势,x.A将⽤AMD系统进⾏⽣产级推理;甲骨文计划部署 万台M55X;微软少量订购M55,对M00部署持积极态度[58][59][60][61][62][64][65]。 - **Neocoud租赁市场**:专注AMD的Neocoud服务商少,导致AMD GPU租赁价格⾼,削弱成本竞争⼒;M00X和M25X需达特定租赁价格才能与英伟达H200竞争;AMD通过回租算⼒激励Neocoud支持,构建低风险商业模式;开发者云推出降低M00X租赁价格,但默认配额设置待优化[67][68][69][70][74][75][76][77]。 软件与技术 - **ROCm软件**:AMD发布专注推理性能的ROCm 7,宣称推理吞吐性能相⽐ROCm 平均提升3.5倍,服务DeepSeek R1时相⽐Nvidia B200有1. 倍优势;支持分布式推理,支持vLLM、SGLang和m - d编排框架,但m - d缺乏KVCache管理器等功能;对Triton内核编写库支持提升,对字节跳动Triton Distributed感兴趣;整合Mooncake Transfer Engine和DeepEP未开源;推出开发者云平台与积分计划及Python包“rocm”[82][83][84][86][88][89]。 - **PyTorch持续集成与测试**:AMD为M55芯⽚在PyTorch添加持续集成和⾃动化测试;英伟达积极推动开源B200 PyTorch持续集成,承诺捐赠8台B200给PyTorch Foundation;英伟达应加⼤对Backwe PyTorch持续集成投⼊,将消费级GPU纳⼊持续集成体系[91][92][93]。 - **MLPerf训练基准测试**:AMD⾸次提交单节点Lama2 70B LoRA微调和BERT训练的MLPerf训练测试结果,应参与更多实际场景训练基准测试;AMD MLPerf运⾏指南易复现,与英伟达形成对⽐[94][95][96]。 竞争与市场格局 - **英伟达DGX Lepton**:其商业战略可能推动AI计算资源商品化,使客户在不同云平台迁移推理⼯作负载,吸引关注推理和⼩规模训练的⽤⼾;但引发Neocoud不满,为AMD创造合作机会;对终端⽤⼾提升总体拥有成本效益,实现体验标准化[37][38][40][41][42][45]。 - **M55X营销话术**:AMD将M55X宣传为“机架级解决⽅案”不实,其集体性能⽐GB200 NVL72差18倍,在专家混合模型推理和训练的全对全通信及2D并⾏策略的全规约操作中性能远低于GB200 NVL72[46][47][48][49][54][55]。 其他重要但是可能被忽略的内容 - **AMD GPU分区项目**:AMD将⼤量资源浪费在GPU分区项⽬上,客户⽆此需求,客户希望AMD为多节点推理提供更好⽀持[98][99][100]。 - **M55X制造工艺**:AMD优化M55X芯粒架构,调整布局优化⼩芯⽚间通信,节省功耗与⾯积,但使D堆叠良率更重要;基础芯⽚速度升级,内存控制器支持更快HBME;计算芯⽚XCD从台积电N5制程升级⾄NP节点,启⽤计算单元数量变化,布局⽅向改变[104][105][106][107][108][109][111][112]。