正面硬刚谷歌和OpenAI!马斯克xAI发布Grok 4.1,智商情商双在线
第一财经·2025-11-18 05:35

模型发布与市场定位 - xAI在谷歌发布新一代Gemini模型前夕突然发布最新模型Grok 4 1,目前在大模型竞技场(LMArena)的文本排行榜上居首位[1] - 此次更新正值OpenAI刚刚更新产品线、谷歌也即将发布新作之际,大模型之争愈演愈烈[5] 核心性能提升 - 与此前的线上生产模型相比,Grok 4 1在对比评估中有64 78%的概率被用户偏好选择[2] - 模型幻觉率从12 09%下降到4 22%,减少近三倍[4] - 公司表示新模型在对话智能、情感理解和现实世界的实用性方面树立了新标准,用户应会注意到速度和质量都有所提升[1] 情感智能与交互能力 - Grok 4 1更新的一个重要方向是情感智能,与OpenAI的GPT-5 1迭代方向一致,旨在实现更富有人情味的交互体验[2] - 在EQ-Bench3测试中,Grok 4 1的推理模式和非推理模式位居榜单前两名,该测试用于评估主动情绪智能,包括情绪理解、洞察力、同理心以及人际交往技能[2] - 新模型能够更敏锐地感知细微意图,更易于沟通,个性更加一致,对情绪类提示的回复更丰富和细节,带有更真实的同理心[2] 创意与表达能力 - 在创意写作上,Grok 4 1展示了模型能力的显著提升,其生成的社交媒体帖子明显更具文学表达和戏剧张力[3] - 官方案例显示,让模型以Grok的视角写一篇关于发现自己有意识的帖子,新版本输出相比前一代模型的常规叙述有显著改善[3][4] 技术实现方法 - 为实现提升,公司沿用了Grok 4的大规模强化学习基础设施,并将其应用于优化模型的风格、个性、实用性和一致性[5] - 公司开发了新方法,能够利用前沿的智能推理模型作为奖励模型,从而可以大规模自主评估并迭代输出结果[5]