Workflow
MI325X
icon
搜索文档
低谷翻倍,AMD又行了?
格隆汇· 2025-08-10 12:37
核心观点 - AMD在AI芯片领域与英伟达竞争,但市场份额和性能仍落后[1][6][9] - MI300系列推动数据中心业务增长,但出货量受供应链限制[3][6] - MI350系列发布后股价反弹,但软件生态和产能仍是短板[12][17][27] - 公司服务器CPU市场份额从2%提升至36.5%,"CPU+GPU"组合助力增长[12] - 美国政府放宽出口限制,AMD计划在中国销售MI308芯片[15] 产品与技术 - MI300系列内存是英伟达H100的2.4倍,带宽是1.6倍,但出货量低于预期[3][6] - MI325X性能落后于英伟达B200,销量不佳[7][8][9] - MI350采用台积电3nm工艺,晶体管1850亿,算力达20PFLOPS(MI300X的4倍)[17] - MI355X推理吞吐量比B200高20-30%,训练性能与B200/GB200相当[26] - MI400系列将集成72颗芯片的Helios机架系统,目标英伟达DGX生态[19] 市场表现与竞争 - 2023年四季度至2024年一季度股价上涨75%,2024年4月至今涨幅超100%[3][12] - 英伟达占据台积电60%的CoWos产能,AMD供应链受限[6] - 英伟达B200性能全面领先MI325X,且提前一个季度出货[8][9] - AMD数据中心收入同比增长14%,英伟达增长154%[24] - AMD毛利率40%(调整后54%),英伟达达75%[15][24] 客户与生态 - OpenAI承诺使用AMD GPU,甲骨文和IBM关注性价比[17][27] - 英伟达CUDA覆盖90%开发者,AMD ROCm7优化不足[27] - 英伟达中短期租赁服务供应商超100家,AMD供应稀缺[27] - 英伟达Blackwell产能已被预定至2024年底[28] 行业趋势 - 美国科技公司2024年AI基础设施支出预计达4000亿美元[19] - 算力需求远超预期,下游探索高性价比方案[17][20] - AMD将AI芯片发布周期从两年缩短至一年,但仍慢于英伟达[24]
低谷翻倍,AMD又行了?
格隆汇APP· 2025-08-10 08:41
核心观点 - AMD作为英伟达的主要竞争对手,市场对其AI芯片业务寄予厚望,但实际表现与预期存在差距 [2][3][4] - 公司股价经历大幅波动,近三个月复苏并创下新高,主要受MI350系列发布、出口限制放宽及服务器市场份额提升推动 [5][21][22][25] - AMD在AI芯片市场的竞争力受限于供应链能力、产品迭代速度及软件生态,难以撼动英伟达主导地位 [16][18][44] - 公司通过提升产品迭代速度、优化性价比策略及拓展客户群,试图在快速增长的市场中分得更大份额 [40][42][49] 产品与技术 - MI300系列内存是英伟达H100的2.4倍,带宽是1.6倍,性价比出色但出货量受供应链限制 [10][11][15][16] - MI325X因迭代速度落后,性能不及英伟达B200,销量不佳 [17][18] - MI350系列采用台积电3nm工艺,集成1850亿晶体管,算力达20PFLOPS,是MI300X的4倍 [28][40] - MI355X推理吞吐量比B200高20-30%,训练性能与B200相当,性价比优势吸引甲骨文等客户 [42] - MI400系列将集成72颗芯片的Helios机架系统,目标直指英伟达DGX SuperPod生态 [32] 市场表现与竞争 - 2023年四季度至2024年一季度股价上涨75%,但随后因销量预期弱于市场信心动摇 [12][15] - 2024年4月至今股价涨幅超一倍,从76.48美元低点反弹至170美元以上 [21] - 数据中心业务同比增长14%,远低于英伟达的154% [40] - 服务器市场份额从2%逆袭至36.5%,"CPU+GPU"组合推动份额稳中有升 [22] - 英伟达占据台积电60%的CoWoS封装产能,AMD供应链受限 [16] 客户与需求 - OpenAI CEO承诺使用AMD最新GPU [29] - 美国科技公司今年AI基础设施资本支出预计达4000亿美元,远超欧盟国防开支 [32] - 大型云服务商和AI大模型玩家需求远超预期,英伟达产能无法完全满足 [31] - 中短期租赁市场英伟达性价比更优,因供应充足且生态成熟 [43][44] 挑战与短板 - 软件生态落后,ROCm 7优化深度和社区支持不足,易用性差 [44] - 产品迭代速度比英伟达慢一代,发布节奏从"两年一更"提速至"一年一更"仍显不足 [40] - 市场份额短期难以与英伟达抗衡,定位为市场的"多一种选择" [48][49] - 二季度库存减记导致毛利率降至40%,不计减记为54%,仍低于英伟达的75% [26][40]
Buy AMD Stock for New Peaks as Q2 Earnings Approach?
ZACKS· 2025-08-04 20:45
公司业绩与市场表现 - AMD将于8月5日盘后发布第二季度财报 市场关注其能否延续近期股价强势表现 该股近期触及52周高点182美元 年内涨幅达45% 远超标普500(6%)和纳斯达克(8%) 甚至超过英伟达(32%)的同期表现 [1][4] - 第二季度营收预计同比增长27%至74 1亿美元(去年同期58 4亿美元) 但每股收益可能从0 69美元降至0 47美元 主要受CPU/GPU市场竞争定价及下一代GPU研发投入增加影响 [5][6] - 公司已连续25个季度达到或超越Zacks每股收益预期 最近四个季度平均超出预期2 3% 2025及2026财年仍有望保持双位数收入与利润增长 [6][8] AI与数据中心业务 - MI355X GPU计算性能达前代MI325X的7倍以上 获得甲骨文 特斯拉和OpenAI等巨头采用 正成为英伟达产品的有力竞争者 [2] - AI加速器需求强劲推动MI350系列芯片涨价至2万美元以上 第一季度数据中心收入因此激增57% [3] - 美国政策放宽使公司恢复对华芯片出口 可能带来数亿美元新增收入 [4] 估值比较 - 公司远期市盈率44倍 高于标普500(23 3倍) 但与博通(44倍)相当 接近英伟达(40 7倍) [10] - 远期市销率8 7倍显著低于英伟达和博通(均超20倍) 在AI芯片厂商中估值更具合理性 [11] 市场预期 - 华尔街重点关注第三季度业绩指引 以判断增长持续性 尽管近期股价三个月暴涨70% 但新财报可能推动股价再创新高 [4][13]
SemiAnalysis--为什么除了CSP,几乎没人用AMD的GPU?
傅里叶的猫· 2025-05-23 15:46
测试背景与目标 - 研究团队耗时6个月对比AMD与NVIDIA的AI服务器推理性能,验证AMD在总体拥有成本(TCO)下是否优于NVIDIA [2] - 结果显示不同任务类型(聊天、文档处理、推理)下两者性能差异显著:超大规模企业直接运营GPU时,NVIDIA在部分工作负载的perf/$更优,而AMD在另一些场景表现更佳 [2] - 中短期(不足6个月)租赁市场因AMD服务供应商稀缺导致价格高企,NVIDIA凭借超100家Neocloud提供商形成竞争市场,租赁成本优势显著 [2] 硬件性能对比 - MI325X(2025Q2出货)作为H200竞品面临时间劣势,比HGX B200晚一季度出货导致供应商偏好NVIDIA [5] - B200(2025Q1末出货)当前软件未完善,如FP8格式DeepSeek V3在TRT-LLM/vLLM/SGLang上运行不全 [5] - MI355X(2025Q3出货)比B200晚两季度,H200/H100在内存带宽(最高4.8TByte/s)和节点容量(1.152GByte)上弱于MI325X(6TByte/s, 2.048GByte) [6] 基准测试方法 - 采用在线吞吐量与端到端延迟结合的测试方法,模拟真实推理场景 [10] - 模型选择覆盖密集架构(Llama3 70B/405B)和稀疏MoE架构(DeepSeekV3 670B),输入输出组合涵盖4K/1K(摘要)、1K/1K(翻译)、1K/4K(推理)三类典型场景 [10][11] - 推理引擎选择vLLM(Llama3)、TRT-LLM(H200)、SGLang(DeepSeek),系统评估所有可行张量并行配置 [12][13] 关键测试结果 Llama3 70B FP16 - 1K/1K场景:低延迟时H100/H200+vLLM领先,高并发下MI325X反超 [15] - 1K/4K场景:H100性能稳定在900 tokens/GPU/s,MI325X在450秒延迟时吞吐量最高 [16] - 4K/1K场景:H200+TRT-LLM从20秒延迟起持续领先,MI325X的TP=1配置高并发表现突出 [16] Llama3 405B FP8 - 1K/1K场景:MI325X持续优于H200+vLLM,H200+TRT-LLM单GPU达1000 tokens/s [17] - 4K/1K场景:MI325X全延迟范围碾压竞品,MI300X在250秒延迟时超越H200+vLLM [19] DeepSeekV3 670B FP8 - 1K/1K场景:H200全延迟级别击败MI300X,MI325X仅在25-35秒延迟区间有竞争力 [20] - 4K/1K场景:H200低延迟优势明显,MI325X在>100秒延迟时性能比H200高20% [25] 总拥有成本(TCO)分析 - AMD硬件成本优势显著:MI300X单位每小时总成本1.34美元(资本占比70.5%),低于H200的1.63美元(资本占比76.4%) [21] - Llama3 405B场景:MI325X服务成本持续低于H200+vLLM,但H200+TRT-LLM在>60秒延迟后凭借性能优势逆转 [24] - DeepSeekV3场景:MI325X在摘要任务中每美元性能比H200高20-30%,但低延迟场景仍属NVIDIA [25] 市场采用率差异原因 - 租赁市场结构失衡:NVIDIA有超100家Neocloud供应商竞争,AMD仅少数导致租金溢价 [26] - 价格敏感度测算:MI300X需降至1.9美元/小时(1K/1K场景)或2.1-2.4美元/小时(1K/4K场景)才具竞争力,当前实际租金超2.5美元/小时 [30] - 软件生态差距:AMD研发集群投入仅1300万美元(上季度),远低于7.49亿美元股票回购,ROCm的CI覆盖率不足CUDA的10% [5][12] Blackwell(B200)初步表现 - 在Llama3 70B/405B的1K/4K测试中,B200-TRT全延迟范围碾压MI325X/MI300X,最高请求率下未现性能瓶颈 [28] - 当前软件支持局限:主流框架(vLLM/SGLang)对B200稳定支持不足,TRT-LLM优化仅覆盖少数模型 [27]
财报点评| AMD:营收、指引均超预期,CPU端全力追赶,GPU端仍未得青眼
贝塔投资智库· 2025-05-08 03:55
财务表现 - Q1收入74.4亿美元,同比增长36%,优于分析师预期的71.2亿美元 [2] - 毛利37.4亿美元,同比增46%,环比跌4%,毛利率50%,环比跌一个百分点 [2] - 营业利润率达11%,利润7.1亿美元,调整后EPS为0.96美元,好于预期的0.94美元 [2] 分业务部门表现 - 数据中心部门收入37亿美元,同比增57%,主要得益于EPYC CPU和Instinct GPU销售额增长 [5] - 客户端和游戏部门收入29亿美元,同比增28%,其中客户端收入23亿美元,同比增68%,游戏收入6.47亿美元,同比降30% [5] - 嵌入式部门收入8.23亿美元,同比降3%,终端市场需求喜忧参半 [6] 关税影响与指引 - 4月起AMD中国特供MI308需许可证出售,预计Q2销售额减少7亿美元,年度营收影响15亿美元 [7] - Q2收入指引约74±3亿美元,好于预期的72.3亿美元,非GAAP毛利率预计43%(Q1为54%) [7] - 公司预计关税影响集中在Q2和Q3,但下半年新品有望推动销售增长,实现2025年两位数收入增长 [7] CPU市场竞争 - CPU市场占有率从38.7%提升至40.1%,所有细分领域均实现份额增长 [8] - 台式机端市占50.3%,笔电端从22.9%提升至28.2%,服务器端从16.2%跃升至31.6% [10] - 英伟达计划发布Arm消费级CPU,x86领域AMD已超越英特尔 [10] GPU与云业务 - 北美四大云厂商25Q1总资本支出773亿美元,同比增长62%,但AMD未显著提升云业务份额 [11][12] - MI325X已量产,MI350提前至25年中生产,MI400将于26年推出 [12] - AMD取消三星4nm订单,转向台积电美国晶圆厂 [12] 目标价调整 - 汇丰目标价从70美元上调至75美元,瑞穗从120美元下调至117美元 [13] - 杰富瑞从120美元下调至100美元,摩根大通从130美元下调至120美元 [13]
semianalysis-AMD 2.0-新的紧迫感 MI450X 有望击败英伟达 英伟达的新护城
2025-04-24 01:55
纪要涉及的行业和公司 行业为半导体行业,尤其是人工智能GPU领域;公司主要涉及AMD和NVIDIA,还提及了Google、Microsoft、OpenAI、Oracle等相关企业 纪要提到的核心观点和论据 AMD现状与进展 - **积极变化**:自2024年12月文章发布后,AMD有了紧迫感,在AI软件栈上进步显著,如2025年1月推出开发者关系功能、采用开发者优先策略、将MI300加入PyTorch CI/CD等,且在基准测试和性能声明的可重复性上超越NVIDIA [4][10][24][25][30] - **产品竞争力**:MI325X和MI355X市场表现不佳,MI325X推出时间晚,MI355X规模扩展性不如NVIDIA的GB200 NVL72,但在特定场景下,MI355X对小型和中型模型有一定竞争力;预计2026年下半年推出的MI450X IF64和MI450X IF128可能与NVIDIA的VR200 NVL144竞争 [7][169][171][172][173][200][228] - **开发者生态**:认识到开发者对CUDA成功的重要性,采取开发者优先策略,但开发者关系团队规模小,缺乏类似NVIDIA GTC的开发者大会 [26][36][37][40] - **软件问题**:ROCm软件存在诸多问题,如缺乏一流的Python支持、Python内核DSL不足、RCCL与NCCL差距大、软件基础设施层进展慢、缺乏推理功能支持等 [11][86][89][107][131][142] - **人才与资源**:AI软件工程师薪酬缺乏竞争力,难以吸引和留住人才;内部开发集群资源不足,限制创新和发展 [59][61][69][70] NVIDIA优势与进展 - **软件生态**:CUDA拥有庞大的开发者生态系统,新想法和突破通常先在CUDA上出现,问题发现和修复更快;在Python支持和内核DSL方面领先,不断推出新功能和库 [31][32][77][89] - **产品优势**:产品推出节奏和性能领先,如GB200 NVL72在规模扩展性上优于AMD产品;NCCL功能不断改进和增强,拉开与RCCL的差距 [7][110][114] - **开发者支持**:通过GTC开发者大会等方式为开发者提供学习和交流平台,开发者生态完善 [39] 对AMD的建议 - **人才与薪酬**:调整薪酬结构,提高AI软件工程师的RSU,吸引和留住人才 [67] - **研发投入**:增加研发预算,为团队提供更多GPU资源,转向长期、多年的集群采购策略 [9][75] - **开发者生态**:招聘20多名开发者关系工程师,举办“ROCm开发者大会”,捐赠GPU给学术实验室 [40][45] - **软件改进**:投资Python接口,加强RCCL团队资源,解决软件基础设施层问题,支持分解预填充推理和NVMe KV缓存分层等功能 [164] - **产品宣传**:公布模型FLOPS利用率(MFU)和TFLOP/s/GPU [164] 对NVIDIA的建议 - **API扩展**:继续快速扩展API表面积,保持领先地位 [167] - **开发者支持**:探索将消费级GPU纳入PyTorch CI/CD的策略,提高用户体验 [168] - **功能集成**:将用户缓冲区注册功能集成到整个PyTorch栈,与Meta PyTorch团队合作集成快速RMSNorm内核等 [170] - **开源与规范**:遵循开源精神,避免过度夸大FLOP/s规格 [170] 其他重要但可能被忽略的内容 - **MI355X微架构**:采用Hopper SM90风格微架构,但picoJoules per bit和picoJoules per FLOP高于Blackwell的SM100 uarch,且浪费过多硅面积在FP64核心上 [175][178] - **MI400系列灵活IO**:采用144条IO通道支持多种标准,提供了极大的灵活性,但增加了硅工程的难度和风险 [183][184][187] - **MI430X UL4**:是HPC聚焦的CDNA - NEXT芯片,因UALink开关限制,只能在4个GPU之间进行点对点连接 [188][189] - **MI450X Infinity Fabric over Ethernet**:预计2026年下半年推出,有IFoE64和IFoE128两种SKU,在理论上具有竞争力,但IFoE128面临电缆管理和信号完整性挑战 [200][214][223][226] - **产品定价与TCO**:AMD的MI300X和MI325X服务器级成本和集群前期总成本比NVIDIA的H100低20 - 30%,运营成本相似,总体拥有成本低于NVIDIA [230][232][236]
AMD vs. Broadcom: Which Semiconductor Stock Has Greater Upside?
ZACKS· 2025-04-09 20:00
文章核心观点 在当前充满挑战的宏观经济背景下,分析AMD和博通(AVGO)两家半导体公司的投资价值,认为博通是更好的买入选择 [1][2][5] 行业趋势 - 半导体行业协会预计2025年行业将实现两位数增长,2024年半导体销售额飙升19.1%,达到6276亿美元 [1] 公司股价表现 - 受特朗普征收关税引发贸易战担忧及科技股抛售影响,AMD和博通股价年初至今下跌,AMD股价下跌35.3%,博通下跌32.1% [2] AMD公司情况 业务亮点 - 凭借第五代、第四代和第三代EPYC处理器、Instinct加速器和ROCm软件套件,在云数据中心和AI芯片市场获得发展 [6] - 2024年数据中心AI收入超50亿美元,受Meta和微软部署MI300X推动,2024年EPYC实例增加27%超1000个,多家云服务提供商对Instinct加速器需求强劲 [7] - 正在生产MI325X,基于CDNA 4架构的下一代MI350系列AI计算性能将提升35倍,计划本季度向主要客户交付样品并年中加速生产发货,MI400系列预计2026年推出 [8] - 通过收购ZT Systems、Silo AI、Nod.ai和Mipsology等加强AI生态系统 [9] 盈利预测 - 过去30天,2025年盈利共识预期稳定在每股4.59美元,较2024年增长38.67% [15] - 过去四个季度盈利均超Zacks共识预期,平均超预期幅度为2.32% [16] 估值情况 - 估值方面,价值评分均为D,显示被高估,但AMD未来12个月的市销率为3.77倍,低于博通的10.99倍 [17] 博通公司情况 业务亮点 - 特定应用集成电路(ASIC)需求强劲,有助于营收增长,定制AI加速器(XPU)是训练生成式AI模型的必要设备 [10] - 下一代3纳米XPU是该制程节点首个推向市场的产品,计划2025财年下半年向超大规模客户批量发货,还计划开发行业首个2纳米AI XPU封装3.5D,并为超大规模客户扩展50万个加速器集群 [11] - 预计到2027年,三大超大规模客户每家将在单一架构上部署100万个XPU集群,2027财年XPU和网络的潜在市场规模预计在600亿至900亿美元之间,丰富的合作伙伴关系是关键催化剂 [12] - 预计2025财年第二季度AI收入同比增长44%至44亿美元,半导体收入同比增长17%至149亿美元 [13] 盈利预测 - Zacks对博通2025财年盈利的共识预期为每股6.60美元,较过去30天上涨4美分,较2024财年报告数据增长35.52% [14] - 过去四个季度盈利均超Zacks共识预期,平均超预期幅度为3.44%,优于AMD [16] 估值情况 - 估值方面,价值评分均为D,显示被高估,未来12个月的市销率为10.99倍,高于AMD [17] 投资建议 - 博通AI产品组合不断扩大,合作伙伴丰富,营收增长潜力大,而AMD近期因游戏和嵌入式业务疲软以及数据中心领域竞争激烈,前景黯淡,博通目前Zacks评级为1(强烈买入),AMD为3(持有),博通是更好的买入选择 [19]
Game-Changing News for Advanced Micro Devices
MarketBeat· 2025-03-31 15:21
文章核心观点 公司宣布将Rapt.AI集成到GPU产品线,有望提升其AI市场地位和市场份额;完成对ZT Systems的收购,打通AI基础设施收入流;分析师虽有价格目标下调和评级调整,但公司股票处于深值水平,有潜在上涨机会 [1][6][10] 产品技术 - 公司将Rapt.AI集成到MI300X、MI325X和即将发布的MI350 GPU产品线,有助于释放其AI半导体技术潜力,加速增长和提升市场份额 [1] - Rapt.AI是GPU、GPU集群和GPU云的工作负载自动化和优化平台,可帮助数据科学家利用AI最大化GPU计算能力,具有分配资源、防止瓶颈、缩短训练时间、降低成本和自动化繁琐任务等功能 [2] 市场表现 - 公司在CPU市场Q1首次超过英特尔,2024年市场份额增长4.5%,关键产品线包括数据中心的Epyc系列和PC的Ryzen系列 [4] - 公司GPU虽仍落后于英伟达的先发地位,但正在迅速追赶,CPU和PC业务正在抢占市场份额 [4] 公司收购 - 公司在2025年第一季度完成对ZT Systems的收购,预计到年底对股东有增值作用,该收购对数据中心、可扩展性和上市时间至关重要 [6] - 收购使公司AI基础设施收入流完全畅通,提供从芯片到软件再到大规模部署专业知识的端到端AI基础设施解决方案 [7] 股价分析 - 分析师对公司股票持乐观态度,但2025年初出现价格重置,有多次价格目标下调和评级调整,形成“适度买入”共识,但市场反应可能过度修正 [8][9] - 公司股票在第二季度初处于深值水平,较分析师最低价格目标低10%,较共识价格低50%,仅为2028年收益的10倍,有强劲增长预期,潜在催化剂包括季度业绩超预期、加速增长、市场份额增加和分析师情绪转变 [10] - 公司股价从2024年高点到2025年低点下跌超55%,在接近100美元处获得支撑,市场未考虑AI溢价和增长,存在定价错误 [11] - 随机指标和MACD指标显示与新低背离,随机指标出现看涨交叉,MACD可能在4月开始看涨摆动,公司定于月底公布财报 [12]