实测 GPT-5.2 :价格暴涨能力微涨,凭什么反击 Gemini
36氪·2025-12-12 10:03

模型发布与市场定位 - OpenAI正式向所有用户推出GPT-5.2,旨在与谷歌的Gemini竞争 [1] - 本次更新包含三个模型:GPT-5.2 Instant、Thinking以及Pro模型 [4] - 在LMArena的大模型竞技场中,GPT-5.2-High在WebDev(网页开发)项目中排名第二,GPT-5.2排名第六,作为对比,Gemini 3.0 Pro排名第三,第一是Claude [9] 性能与能力升级 - 推理能力显著增强,GPT-5.2 Pro非常适合执行需要长时间完成的专业推理任务,但生成结果的等待时间变长 [4] - 知识截止日期更新至2025年8月,优于GPT-5.1的2024年9月和Gemini 3.0的2025年1月 [7] - 视觉能力提升,官方称GPT-5.2 Thinking是其最强大的视觉模型,在图表推理和软件界面理解方面的错误率降低了大约一半 [22] - 在多模态理解和编程开发上表现突出,能够完成复杂的3D建模工作,例如构建交互式3D雪天冰块王国模型和哥特城市建筑 [9][10] - 在专门的网页设计能力榜单上,GPT-5.2从十名开外跃升至第三名,但得分最高的仍是Gemini 3.0 Pro [34] - 长文本创作能力有所突破,能够尝试构建长篇小说的结构和生成PDF文件,尽管内容质量尚不完善 [38] 用户体验与实测反馈 - 用户普遍反馈GPT-5.2 Pro在处理复杂任务时思考速度变慢,例如有用户报告生成一张HLE测试成绩图表花费了24分钟 [4] - 在编程能力测试中,例如编写模拟交通灯的Python代码,GPT-5.2 Extended Thinking的表现被认为不及Claude Opus 4.5 [20] - 在图像标注等特定任务上,虽然GPT-5.2比前代标注了更多信息,但其准确性被认为不及Nano Banana Pro [24] - 在网页设计审美上,GPT-5.2生成的设计被指频繁使用方框网格和渐变紫色调,风格突破有限 [33][36][39] - 在复刻网页等任务中,GPT-5.2能够更好地理解上传视频的配色方案,但其生成的网页尚不能像Gemini那样直接集成AI功能 [19] 定价与市场竞争 - GPT-5.2的价格相比GPT-5.1整体上涨约40% [21] - GPT-5.2 Pro的定价为输入每百万Token 21美元,输出每百万Token 168美元 [21] - 竞争对手谷歌Gemini持续施加压力,其新发布的深度研究Agent在HLE考试中以46.4%的准确率击败了GPT-5.2 Thinking的45.5% [43]