工具使用强化学习

搜索文档
马斯克新模型性价比拉满:1折价格实现Gemini 2.5性能,支持2M上下文
量子位· 2025-09-21 13:29
产品发布与核心特性 - xAI推出新一代多模态推理模型Grok 4 Fast 支持2M上下文窗口并与X平台无缝集成[1][3] - 模型具备智能搜索能力 可实时浏览网页和X平台 处理图像、视频等多种媒体内容并快速整合分析结果[21][22] - 采用端到端工具使用强化学习训练 擅长判断调用代码执行或网页浏览等工具时机[20] - 通过统一架构设计 同一组模型参数可处理长链思维推理和快速响应非推理任务 显著降低延迟与Token成本[24][25] 性能表现与基准测试 - 在推理基准测试中全面超越Grok 3 Mini 平均思考Token数量较Grok 4减少40%[11][12] - 在Artificial Analysis"人工分析智能指数"榜单中呈现业界领先的"价格-智能"比[14] - 文本竞技场排名第8 性能与grok-4-0709相当 同体量模型中表现最优(其他同类模型排名均在第18位及以下)[17] - 搜索竞技场以1163分强势登顶 较第二名o3-search领先17分[18] - 在BrowseComp测试中达44.9%(Grok 4为43.0%) BrowseComp中文测试达51.2%(Grok 4为45.0%)[23] 定价策略与市场定位 - 实现1折价格追平Gemini 2.5 树立性价比新标杆[10] - 输入Token定价为每百万Token 0.20美元(<128k tokens)或0.40美元(≥128k tokens) 输出Token定价为每百万Token 0.50美元或1.00美元[27] - 缓存输入Token定价为每百万Token 0.05美元[27] - 已面向所有用户开放 Auto模式下复杂查询将自动调用该模型[26] 技术团队与人才储备 - 从谷歌挖角关键人才Dustin Tran 其曾助力谷歌Gemini获得IMO、ICPC金牌[28] - Dustin Tran为谷歌DeepMind工作8年的高级研究科学家 深度参与Gemini系列研发 推动模型在LMSYS排行榜首次登顶[30] - 学术论文被引用超过24281次 h-index达47 i10-index达60[31][34]