Workflow
Instinct MI455 GPU
icon
搜索文档
苏妈和李飞飞炸场CES,AMD AI全栈野心显露:从云端到个人PC,AI芯片性能四年要飙1000倍
36氪· 2026-01-07 02:55
今年的 CES 真可谓是八仙过海,黄仁勋、苏姿丰、陈力武等"经典面孔"齐亮相; 不过台上谈的已不只限于显卡、算力和制程,还在于 AI 接下来要被带 去哪里。 在 AMD 的专场演讲中,苏妈甩出一个大胆判断: "未来五年内,将有 50 亿人每天使用 AI,超过世界人口的一半。" ——什么概念?就是这个增长速度将远超互联网早期阶段,自 ChatGPT 在 2022 年底发布以来,AI 活跃用户已从 100 万暴涨至 10 亿 +。 值得一提的是,这场演讲还请来了"AI 教母"李飞飞。 李飞飞并不是来站台新品的,她和苏妈主要探讨空间智能和世界模型,这也是她已耕深 20 余年的领域。 对于云端,基于下一代 MI455 GPU 的 Helios 机架级平台成为全场焦点:单机架集成 72 块 AI GPU,算力高达 2.9 ExaFLOPS,可通过成千上万个机架拼接 成超大训练集群,直指千亿参数大模型的核心战场。 谈到云端算力的未来,苏姿丰毫不掩饰 AMD 的野心: "全球人工智能运行在云端,而云端运行在 AMD 平台上。" 另外,她还指出,下一代 Instinct 数据中心 AI 加速器平台 MI500 系列,将在 2 ...
苏妈和李飞飞炸场CES!AMD AI全栈野心显露:从云端到个人PC,AI芯片性能四年要飙1000倍
AI前线· 2026-01-06 12:10
行业宏观趋势与愿景 - AMD首席执行官苏姿丰预测,未来五年内将有50亿人每天使用AI,超过世界人口的一半[3] - 自ChatGPT在2022年底发布以来,AI活跃用户已从100万暴涨至10亿以上,增长速度远超互联网早期阶段[3] - OpenAI联合创始人Greg Brockman指出,计算能力是AI走向通用智能的最大瓶颈,世界需要的GPU数量远超现有规模[7] - AI正从语言智能迈向具备空间理解与行动能力的生成式AI新阶段[37] AMD的AI战略与版图 - 公司旨在补齐AI普及所需的算力基础设施,让AI无处不在,算力人人可及[7] - 战略涵盖云端数据中心与本地终端(如AIPC)两大核心战场[9] - 公司提出“全球人工智能运行在云端,而云端运行在AMD平台上”的愿景[8] 数据中心与云端算力解决方案 - 推出下一代机架级平台Helios,单机架集成72块MI455 AI GPU,算力高达2.9 ExaFLOPS,并搭载31TB HBM4内存[7][14] - Helios采用开放OCP机架标准,强调模块化与可扩展性,可与Meta合作开发,数千个机架可互联成超大训练集群[13][15] - 核心芯片Instinct MI455 GPU采用2nm与3nm混合工艺及3D小芯片封装,晶体管数量超过3000亿个,相比MI300系列提升约70%[16][17][18] - MI455与EPYC服务器CPU、Pensando网络芯片深度集成,旨在解决大模型训练中的“内存墙”瓶颈[17][19] - 下一代MI500系列AI加速器计划于2027年推出,全面转向2nm工艺,目标在四年内(MI300到MI500)使AI计算性能提升1000倍[8][21][23] 终端与AIPC战略 - 推出Ryzen AI Max 400系列处理器(代号Strix Halo),面向AI开发者和高端创作者[25] - 该处理器最高配备12核CPU,集成专用AI引擎,最高算力达60 TOPS,并采用统一内存架构,CPU与GPU可共享最高128GB内存[27] - 演示显示,搭载Ryzen AI的设备可在完全离线情况下流畅运行700亿参数的医疗大模型[27] - 在高端笔记本形态下,其AI与内容创作应用表现快于最新一代MacBook Pro;在小型工作站场景中,成本明显低于英伟达DGX Spark[28] - 发布Ryzen AI Halo参考平台,称为“世界上最小的AI开发系统”,可在离线条件下运行多达2000亿参数模型[31] 空间智能与世界模型 - 与“AI教母”李飞飞同台探讨空间智能,认为这是连接“感知→推理→行动”的关键能力[5][36] - 李飞飞创立的World Labs已实现仅凭几张甚至单张图片,即可生成几何一致性、可导航的3D世界,将过去需数月的3D场景建模缩短至几分钟[37][38][39] - 世界模型需要实时响应与编辑,对算力提出极高要求,需极高的内存、大规模并行计算和快速推理速度[40] - World Labs的世界模型已运行在AMD MI325X GPU与ROCm软件栈上,并在几周内实现了超过4倍的推理性能提升[40] - 随着MI450等后续平台推出,更大规模世界模型的训练与实时运行将成为可能[41] 其他新品发布 - 发布消费级显卡Radeon RX 9070和RX 9070 XT,搭载RDNA 4架构及FSR 4等AI图像技术[43] - RX 9070 XT在30多款游戏中平均比RX 7900 GRE快42%;RX 9070在30多款游戏中平均比RX 7900 GRE快21%[45][47] - 发布下一代服务器CPU EPYC Venice,采用2nm工艺,最多集成256个Zen 6核心,内存与GPU带宽相比上一代实现翻倍,专为高效服务AI集群设计[49][50][51]