工具使用强化学习 - 财报，业绩电话会，研报，新闻

工具使用强化学习

搜索文档

量子位· 2025-09-21 13:29

产品发布与核心特性 - xAI推出新一代多模态推理模型Grok 4 Fast 支持2M上下文窗口并与X平台无缝集成[1][3] - 模型具备智能搜索能力可实时浏览网页和X平台处理图像、视频等多种媒体内容并快速整合分析结果[21][22] - 采用端到端工具使用强化学习训练擅长判断调用代码执行或网页浏览等工具时机[20] - 通过统一架构设计同一组模型参数可处理长链思维推理和快速响应非推理任务显著降低延迟与Token成本[24][25] 性能表现与基准测试 - 在推理基准测试中全面超越Grok 3 Mini 平均思考Token数量较Grok 4减少40%[11][12] - 在Artificial Analysis"人工分析智能指数"榜单中呈现业界领先的"价格-智能"比[14] - 文本竞技场排名第8 性能与grok-4-0709相当同体量模型中表现最优（其他同类模型排名均在第18位及以下）[17] - 搜索竞技场以1163分强势登顶较第二名o3-search领先17分[18] - 在BrowseComp测试中达44.9%（Grok 4为43.0%） BrowseComp中文测试达51.2%（Grok 4为45.0%）[23] 定价策略与市场定位 - 实现1折价格追平Gemini 2.5 树立性价比新标杆[10] - 输入Token定价为每百万Token 0.20美元（＜128k tokens）或0.40美元（≥128k tokens）输出Token定价为每百万Token 0.50美元或1.00美元[27] - 缓存输入Token定价为每百万Token 0.05美元[27] - 已面向所有用户开放 Auto模式下复杂查询将自动调用该模型[26] 技术团队与人才储备 - 从谷歌挖角关键人才Dustin Tran 其曾助力谷歌Gemini获得IMO、ICPC金牌[28] - Dustin Tran为谷歌DeepMind工作8年的高级研究科学家深度参与Gemini系列研发推动模型在LMSYS排行榜首次登顶[30] - 学术论文被引用超过24281次 h-index达47 i10-index达60[31][34]

人工智能

工具使用强化学习

Artificial Intelligence

Artificial Intelligence

Grok 4 Fast

Gemini 2.5

Grok 3 Mini