AMD Instinct MI355X
搜索文档
黄仁勋台上最强GPU炸场,台下感叹“中国芯片爆发”,瞄准6G投资诺基亚
36氪· 2025-10-29 08:55
公司新产品发布 - 英伟达发布新一代Vera Rubin超级芯片,该芯片搭载一颗Vera CPU和两颗Rubin GPU,采用HBM4高带宽内存,在FP4精度下浮点计算性能达50PFLOPs [5] - Vera CPU采用Arm架构,拥有88个核心及176线程,与GPU的NVLINK-C2C互联带宽达1.8TB/s [5] - 基于Vera Rubin的Vera Rubin NVL144平台计划于2026年下半年推出,FP4推理算力达3.6Exaflops,FP8训练算力达1.2Exaflops,较GB300 NVL72提升约3.3倍 [10] - 升级版Rubin Ultra NVL576计划于2027年下半年推出,FP4推理算力达15Exaflops,FP8训练算力达5Exaflops,较GB300 NVL72提升14倍 [10] - Vera Rubin计算托盘采用高度集成设计,完全无线且100%液冷,内置两个Vera CPU和四个Rubin封装,并新增Bluefield 4数据处理器以应对AI上下文处理需求 [7] - 公司已收到由台积电生产的首批Rubin GPU样品,预计明年实现量产 [3] 公司战略布局与订单 - 公司宣布与OpenAI达成千亿大单,Vera Rubin芯片是该订单第一阶段部署的芯片 [3] - Blackwell架构芯片已实现量产并大规模部署,公司与美国能源部合作新建7座超算集群,其中Mission和Vision两台基于Vera Rubin的超算为洛斯阿拉莫斯国家实验室建造,预计2027年投入使用 [12] - 公司首席执行官黄仁勋透露,涵盖至2026年的出货量,Blackwell和Rubin的订单总销售额将达到5000亿美元 [12] - 公司公布GPU未来三年计划,承诺每年一次重大更新,计划到2028年推出Feynman芯片 [12] 量子计算领域进展 - 英伟达发布NVQLink互连架构,可直接连接量子处理器与GPU,首次实现AI超算与量子处理器的无缝连接,能以每秒数千次速度传输高达TB级数据 [15][17] - NVQLink架构具有完全可扩展性,可处理从数百个量子比特扩展到未来数万甚至数十万个量子比特的纠错需求 [17] - 公司推出CUDA-Q开放平台,将CUDA扩展至支持量子处理器,实现在经典计算机上模拟量子运算或实现量子与经典加速计算的协同 [17][18] 6G通信领域进展 - 英伟达宣布推出名为NVIDIA Arc的新产品线,专门用于6G,由Grace CPU、Blackwell GPU及ConnectX Melanox网络技术构建 [21] - Arc运行在Aerial无线通信系统上,目标是创建首个能同时进行无线通信和AI处理的软件定义可编程计算机 [21] - 公司与诺基亚合作推出AI原生6G加速计算平台Aerial RAN Computer Pro,这是一款AI基站主机,实现了无线与AI共生 [21] - 公司对诺基亚进行投资,总金额为10亿美元,此举推动诺基亚股价创下6年多新高 [23] 市场竞争格局 - AMD获得两台超算订单,金额为10亿美元,其中首台名为Lux,搭载AMD Instinct MI355X加速器,板载功率高达1400瓦,人工智能性能将是现有超级计算机的三倍,预计六个月内投入使用 [26][27] - 高通宣布推出AI200和AI250两款AI芯片,正式进军数据中心市场,主打低总拥有成本和高能效,分别预计于2026和2027年商用 [28] - 在量子计算领域,IBM成功用AMD芯片实现了无GPU的量子计算,其算法运行速度比实际需求快10倍,仅需FPGA芯片与量子计算机配合 [30] - 在6G领域,中国科研团队取得进展,北邮团队成功搭建国际上首个通信与智能融合的6G试验网,北京大学与香港城市大学合作研发出全球首款全频段6G芯片,利用光子技术实现100Gbps传输速率,芯片尺寸仅11×1.7mm [32] 市场反应 - 英伟达股价上涨4.98%,收盘报201.03美元每股,盘后价格达204.43美元,创历史新高 [34] - 以盘后价格计算,公司市值增长3154亿美元,折合人民币近3万亿,增长部分相当于1.59个英特尔 [34]
How AMD, Nvidia, Broadcom Can Ride Oracle’s $455B Cloud Surge
Forbes· 2025-09-12 09:30
甲骨文公司业绩与展望 - 云计算部门剩余履约义务同比激增359%至4550亿美元 上一季度仅为1380亿美元 [2] - 股价在周三交易中上涨近36% 创下多年来最大单日涨幅 [2] - 预计未来数月将获得多个数十亿美元级客户 推动剩余履约义务突破5000亿美元门槛 [2] 基础设施投资计划 - 将2026财年资本支出预测上调至350亿美元 较之前增长65% [3] - 基础设施扩张面临电力供应、监管审批和高性能GPU持续短缺的挑战 [3] - 基础设施扩张速度将直接影响剩余履约义务转化为收入的能力 [3] 半导体供应商受益情况 - 英伟达、超微和博通股价上涨2%至10% 因这些芯片制造商构成AI实施基础 [3] - 甲骨文与竞争对手不同 未开发自研AI芯片 而是依赖英伟达和超微的GPU [3] 英伟达合作细节 - 作为AI计算标准制定者 为甲骨文云基础设施提供大部分GPU [4] - 提供"裸金属"实例 使客户能直接使用A10、A100、H100、H200及Blackwell等高端物理芯片 [4] - 采用液冷数据中心部署GPU 专注于能源效率和吞吐量优化 [4] 超微半导体合作进展 - 六月宣布在OCI部署AMD Instinct MI355X GPU 性价比达上一代两倍以上 [6] - 计划部署多达131,072个MI355X GPU 支持企业构建和训练大规模AI模型 [6] - 采用台积电3nm工艺和CDNA 4架构 代表超微在AI加速器领域最大技术进步 [6] 博通业务机遇 - AI推理工作量预计将显著超过训练需求 形成经常性需求流 [7] - 定制ASIC芯片在规模推理中提供更佳成本和能效 可能成为重要受益方 [7] - 周三股价上涨近10% 涨幅超过英伟达和超微 因投资者预期其定制芯片将获得甲骨文部分工作量 [7] 供应链战略调整 - 与超微合作拓宽硬件选择范围 减少对单一供应商依赖 [6] - 多元化策略预计将增强与英伟达的GPU谈判筹码 有助于控制总体支出 [6]
COMPAL Optimizes AI Workloads with AMD Instinct MI355X at AMD Advancing AI 2025 and International Supercomputing Conference 2025
Prnewswire· 2025-06-12 18:30
产品发布 - 公司发布SG720-2A/OG720-2A高性能服务器平台,采用AMD Instinct™ MI355X GPU架构,支持单相和两相液体冷却配置 [1] - 新产品针对下一代生成式AI和大型语言模型(LLM)训练设计,提供卓越的灵活性和可扩展性 [1] - 产品在AMD Advancing AI 2025和国际超级计算大会(ISC) 2025上同步亮相 [1][7] 技术特点 - 支持最多8个AMD Instinct MI350系列GPU(包括MI350X/MI355X),实现高密度训练 [7] - 采用双冷却架构(空气和液体冷却),优化高热密度工作负载 [7] - 两相液体冷却解决方案与ZutaCore®合作开发,提供稳定热性能 [7] - 基于CDNA 4架构,配备288GB HBM3E内存和8TB/s带宽,支持FP6和FP4数据格式 [7] - 配备PCIe Gen5和AMD Infinity Fabric™,实现多GPU编排和高吞吐量通信 [7] - 全面支持主流开源AI堆栈(ROCm™、PyTorch、TensorFlow等) [7] - 兼容EIA 19"和ORv3 21"机架标准,采用模块化设计 [7] 行业趋势 - 生成式AI和LLM推动计算需求增长,企业更重视兼具性能和适应性的基础设施 [3] - AI和HPC的未来不仅关注速度,更注重智能集成和可持续部署 [6] 公司战略 - 公司与AMD保持长期战略合作,共同开发服务器平台解决方案 [5] - 通过双平台展示,公司扩大在AI和HPC领域的全球影响力和合作伙伴网络 [7] - 公司近年来积极发展云服务器、汽车电子和智能医疗等新兴业务 [9] 公司背景 - 公司成立于1984年,是笔记本和智能设备行业的领先制造商 [9] - 2024年被《天下杂志》评为台湾前6大制造商之一 [9] - 持续入选《福布斯》全球2000强和《财富》全球500强企业 [9]