马斯克新模型背后算法来自英伟达???
Jay 发自 凹非寺 量子位 | 公众号 QbitAI Grok-4-fast最近在降本增效上的表现堪称一骑绝尘,连有「路由器」傍身的GPT5都给干趴下了。 面对如此惊艳的推理效率,很多人第一反应就是:堆卡式的算力scaling又一次大显神威了。 实际上,Grok的背后确实有英伟达的影子。 为此,英伟达研究团队推出了一种全新「混合结构」模型——Jet-Nemotron。 经过一系列全面的基准测试,发现Jet-Nemotron-2B的表现与Qwen3、Qwen2.5、Gemma3和Llama3.2等顶尖开源模型不相上下,还能实现约53倍的速度 提升。 例如在MMLU-Pro上,Jet-Nemotron-2B不仅准确率比Qwen3-1.7B-Base更高,就连生成速度也要快上47倍。 此外,Jet-Nemotron-2B即便遇上参数更大的模型也丝毫不虚,它在MMLU和MMLU-Pro上的准确率甚至可以超过DeepSeek-V3-Small和Moonlight(总参数 量15B,激活参数量2.2B)。 但这次立功的,或许不是老黄的显卡,而是算法。 没错,Grok-4-fast的秘密武器,被和一篇英伟达的算法论文关联 ...