英伟达仍是王者,GB200贵一倍却暴省15倍,AMD输得彻底
36氪·2026-01-04 11:13

AI推理游戏规则,正悄然改变。一份最新报告揭示了关键转折:如今决定胜负的,不再是单纯的芯片性能或GPU数量,而是 「每一美元能输出多少智 能」。 AI推理,现已不只看算力硬指标了! Signal65一份最新报告中,英伟达GB200 NVL72是AMD MI350X吞吐量28倍。 而且,在高交互场景在,DeepSeek R1每Token成本还能低到15倍。 GB200每小时单价大概是贵一倍左右,但这根本不重要。因为机柜级NVLink互联+软件调度能力,彻底改变了成本结构。 顶级投资人Ben Pouladian称,「目前的关键不再是算力或GPU数量,而是每一美元能买到多少智能输出」。 最关键的是,这还没有集成200亿刀买入Groq的推理能力。 这里,再mark下老黄至理名言——The more you buy, the more you save! AI推理重心:一美元输出多少智能? 这篇万字报告,探索了从稠密模型(Dense)到混合专家模型(MoE)推理背后的一些本质现象。 如今,英伟达仍是王者。其他竞争对手根本做不到这种交互水平,这就是护城河。 传统的「稠密模型」架构要求:在生成每个Token时都激活模型里的 ...