NVIDIA Vera Rubin NVL144 CPX平台

搜索文档
刚刚,英伟达祭出下一代GPU!狂飙百万token巨兽,投1亿爆赚50亿
猿大侠· 2025-09-11 04:11
产品发布与性能突破 - NVIDIA推出专为大规模上下文推理设计的全新GPU Rubin CPX 开创全新处理器类别[1][7][11] - Rubin CPX性能达Vera Rubin NVL144平台的2倍多 是Blackwell Ultra的GB300 NVL72机架系统的7.5倍[3] - 单机架提供8 EFLOPS NVFP4计算力 配备100TB高速内存与1.7 PB/s内存带宽[3][31] - 相比GB300 NVL72系统 注意力机制处理能力提升3倍[4][34] - 配备128GB高性价比GDDR7显存 单个GPU提供30 petaflops NVFP4计算能力[3][33] 技术架构与创新 - 基于Rubin架构构建 是首款专为海量上下文AI打造的CUDA GPU 支持百万Token级推理[8][9][10] - 采用解耦式推理创新 使上下文阶段(计算受限)与生成阶段(内存带宽受限)独立处理[15][16] - 依托Vera Rubin NVL144 CPX平台 与Vera CPU及Rubin GPU协同工作[10][23] - 支持多步推理、持久化记忆与长时程上下文 适用于软件开发、视频生成及深度研究领域[10] - 通过NVIDIA Dynamo平台实现低时延KV缓存传输、路由及内存管理的精确协调[18][19] 商业价值与投资回报 - 每投入1亿美元资本性支出最高可带来50亿美元Token收入[6][26] - 在规模化场景下可提供30-50倍投资回报率(ROI)[14][25] - 重写推理经济 提升吞吐量并降低时延 增强整体资源利用率[14][16][24] 平台配置与扩展性 - Vera Rubin NVL144 CPX平台单机架集成144块Rubin CPX GPU、144块Rubin GPU及36颗Vera CPU[31] - 支持多种形态配置 包括与InfiniBand网络或Spectrum-X以太网平台结合实现大规模部署[35] - 基于MGX架构实现机架级部署 具备极高算力与能效比[30] 生态系统支持 - 获得完整NVIDIA AI全栈支持 包括AI Enterprise软件平台与NIM微服务[37][38] - 可运行Nemotron多模态模型家族 支持CUDA-X库及近6000个CUDA应用[38] - 预计2026年底上市 目前已有Cursor、Runway等AI企业探索应用加速可能性[12][37]
英伟达下一代GPU登场,Rubin CPX一次推理数百万Token,网友:这是头野兽
机器之心· 2025-09-10 08:14
机器之心报道 机器之心编辑部 在周二的 AI 基础设施峰会上,英伟达宣布推出一款名为 Rubin CPX(Rubin Context GPUs) 的新 GPU,专为超过 100 万 token 的长上下文推理而设计。 对用户而言,这意味着他们在软件开发、视频生成等长上下文任务中能够获得更好的性能。 例如,在软件开发中,AI 系统必须能够对整个代码库进行推理、理解仓库级代码结构,才能更好的帮助开发者。同样地,长视频和研究类应用也要求在数百万 token 范围内保持持续的连贯性和记忆。 现在,随着 Rubin CPX 发布,这些问题都能迎刃而解。 这款新型 GPU(Rubin CPX) 将与 NVIDIA Vera CPU 和 Rubin GPU 搭配使用,共同组成全新的 NVIDIA Vera Rubin NVL144 CPX 平台。这一集成式 NVIDIA MGX 系统在单机架内可提供 8 exaflops AI 算力,其 AI 性能是 NVIDIA GB300 NVL72 系统的 7.5 倍,并配备 100TB 高速内存和 1.7 PB/s(petabytes)内存带宽。 同时,NVIDIA 还将为已有 V ...