英伟达发布Nemotron 3开源模型系列

产品发布与核心特性 - 英伟达发布最新开源人工智能模型系列Nemotron 3，旨在为各行业提供透明、高效、可定制的智能体AI开发能力 [1][3] - Nemotron 3系列包含Nano、Super和Ultra三个版本，分别拥有300亿、1000亿和约5000亿参数，适用于不同复杂度的任务场景 [9] - 模型引入突破性的混合潜在专家混合架构，显著提升推理效率并降低运行成本 [1][3] - 模型具备100万token的上下文长度，能在大型代码库、长文档等场景中持续推理，提升事实一致性并减少上下文碎片化 [10] 性能与效率提升 - 在Artificial Analysis Intelligence Index v3.0基准测试中，Nemotron 3 Nano在同规模模型中以52分排名领先 [4][19] - 与上一代Nemotron 2 Nano相比，新设计最多可实现4倍的token吞吐量提升，并将推理token生成量最多减少60%，显著降低推理成本 [12] - 采用的混合Mamba-Transformer专家混合架构，在处理长文本时能保持内部状态并降低计算成本，避免为每个token生成庞大的注意力映射和键值缓存，从而运行更快、内存占用更低 [11][13] - 为Super和Ultra模型引入的“潜在MoE”技术，在相同推理成本下可调用多达4倍数量的专家，实现更高水平的专门化 [13] - 模型还采用了多token预测技术，可一次预测多个未来token，提升长推理序列和结构化输出的吞吐效率 [16] - Super和Ultra模型采用4位NVFP4训练格式，使其能在现有基础设施上完成训练而不牺牲准确性 [18] 市场定位与行业影响 - 英伟达创始人兼CEO黄仁勋表示，开放式创新是AI进步的基础，Nemotron旨在将先进AI转变为开放平台 [6] - 公司目标是为开发者提供一个“可以信赖的模型”，并将其作为“库”来对待，在软件工程层面作出长期承诺 [25][26] - 随着Meta可能转向闭源路线，英伟达或将成为美国最主要的开源模型提供商之一 [24] - 开源的Nemotron 3使初创公司能更快构建和迭代AI智能体，加速从原型到企业级部署的创新过程，多家风投旗下的被投公司正探索使用该模型 [26] - 开发者可在同一工作流中将任务在前沿闭源模型与Nemotron模型之间路由分配，以在最大化智能水平的同时优化token成本 [26] 早期采用者与配套工具 - Nemotron 3的早期采用者包括埃森哲、CrowdStrike、德勤、安永、甲骨文云基础设施、Palantir、Perplexity、ServiceNow、西门子以及Zoom等知名企业 [10] - 作为发布的一部分，英伟达将开放更多研究资源，包括研究论文、示例提示词和开放数据集 [21] - 公司推出了全新的强化学习实验环境NeMoGym，让客户可以在模拟环境中测试模型和智能体在后训练阶段的表现 [21][22] - 英伟达计划发布的后训练数据样本在规模上比任何现有数据集都大得多，且使用限制宽松、开放程度很高 [22] 市场反应 - 受此消息推动，英伟达股价周一开盘上涨近1.7%，报177.97美元 [1][6]