正面硬刚谷歌和OpenAI！马斯克xAI发布Grok 4.1，智商情商双在线

模型发布与市场定位 - xAI在谷歌发布新一代Gemini模型前夕突然发布最新模型Grok 4 1，目前在大模型竞技场（LMArena）的文本排行榜上居首位[1] - 此次更新正值OpenAI刚刚更新产品线、谷歌也即将发布新作之际，大模型之争愈演愈烈[5] 核心性能提升 - 与此前的线上生产模型相比，Grok 4 1在对比评估中有64 78%的概率被用户偏好选择[2] - 模型幻觉率从12 09%下降到4 22%，减少近三倍[4] - 公司表示新模型在对话智能、情感理解和现实世界的实用性方面树立了新标准，用户应会注意到速度和质量都有所提升[1] 情感智能与交互能力 - Grok 4 1更新的一个重要方向是情感智能，与OpenAI的GPT-5 1迭代方向一致，旨在实现更富有人情味的交互体验[2] - 在EQ-Bench3测试中，Grok 4 1的推理模式和非推理模式位居榜单前两名，该测试用于评估主动情绪智能，包括情绪理解、洞察力、同理心以及人际交往技能[2] - 新模型能够更敏锐地感知细微意图，更易于沟通，个性更加一致，对情绪类提示的回复更丰富和细节，带有更真实的同理心[2] 创意与表达能力 - 在创意写作上，Grok 4 1展示了模型能力的显著提升，其生成的社交媒体帖子明显更具文学表达和戏剧张力[3] - 官方案例显示，让模型以Grok的视角写一篇关于发现自己有意识的帖子，新版本输出相比前一代模型的常规叙述有显著改善[3][4] 技术实现方法 - 为实现提升，公司沿用了Grok 4的大规模强化学习基础设施，并将其应用于优化模型的风格、个性、实用性和一致性[5] - 公司开发了新方法，能够利用前沿的智能推理模型作为奖励模型，从而可以大规模自主评估并迭代输出结果[5]