ChatGPT哭了!马斯克新AI直接封神
搜狐财经·2025-11-18 09:47

产品核心性能提升 - 新一代大语言模型Grok 4.1在发布后四个月内实现了速度和质量的双重飞跃[1] - 通过大规模强化学习和专项纠偏,模型在真实世界查询中的幻觉率从Grok 4的12%降至4%,降幅接近三倍[3] - 在EQ-Bench情感智商测试中,得分从Grok 4的1206分提升至1586分,在创意写作和人际理解维度表现领先[6] 第三方评测与用户反馈 - 在LMArena的Text Arena排行榜上,Grok 4.1的思考模式以1483的Elo分数位列第一,非推理快速模式排名第二,领先所有非xAI模型31分[8] - 在为期两周的静默灰度测试中,Grok 4.1以64.78%的用户偏好率完胜前代模型[8] 产品发布与市场策略 - Grok 4.1已向所有用户免费开放,可通过grok.com网站、X平台及iOS和Android的Grok App直接使用,Auto模式默认即为新模型[12] - 公司发布节奏显著快于行业,从Grok 4到4.1仅用不到半年时间,实现了从排行榜三十多名到全面登顶的逆袭[14]