实测 GPT-5.2 ：价格暴涨能力微涨，凭什么反击 Gemini

模型发布与市场定位 - OpenAI正式向所有用户推出GPT-5.2，旨在与谷歌的Gemini竞争 [1] - 本次更新包含三个模型：GPT-5.2 Instant、Thinking以及Pro模型 [4] - 在LMArena的大模型竞技场中，GPT-5.2-High在WebDev（网页开发）项目中排名第二，GPT-5.2排名第六，作为对比，Gemini 3.0 Pro排名第三，第一是Claude [9] 性能与能力升级 - 推理能力显著增强，GPT-5.2 Pro非常适合执行需要长时间完成的专业推理任务，但生成结果的等待时间变长 [4] - 知识截止日期更新至2025年8月，优于GPT-5.1的2024年9月和Gemini 3.0的2025年1月 [7] - 视觉能力提升，官方称GPT-5.2 Thinking是其最强大的视觉模型，在图表推理和软件界面理解方面的错误率降低了大约一半 [22] - 在多模态理解和编程开发上表现突出，能够完成复杂的3D建模工作，例如构建交互式3D雪天冰块王国模型和哥特城市建筑 [9][10] - 在专门的网页设计能力榜单上，GPT-5.2从十名开外跃升至第三名，但得分最高的仍是Gemini 3.0 Pro [34] - 长文本创作能力有所突破，能够尝试构建长篇小说的结构和生成PDF文件，尽管内容质量尚不完善 [38] 用户体验与实测反馈 - 用户普遍反馈GPT-5.2 Pro在处理复杂任务时思考速度变慢，例如有用户报告生成一张HLE测试成绩图表花费了24分钟 [4] - 在编程能力测试中，例如编写模拟交通灯的Python代码，GPT-5.2 Extended Thinking的表现被认为不及Claude Opus 4.5 [20] - 在图像标注等特定任务上，虽然GPT-5.2比前代标注了更多信息，但其准确性被认为不及Nano Banana Pro [24] - 在网页设计审美上，GPT-5.2生成的设计被指频繁使用方框网格和渐变紫色调，风格突破有限 [33][36][39] - 在复刻网页等任务中，GPT-5.2能够更好地理解上传视频的配色方案，但其生成的网页尚不能像Gemini那样直接集成AI功能 [19] 定价与市场竞争 - GPT-5.2的价格相比GPT-5.1整体上涨约40% [21] - GPT-5.2 Pro的定价为输入每百万Token 21美元，输出每百万Token 168美元 [21] - 竞争对手谷歌Gemini持续施加压力，其新发布的深度研究Agent在HLE考试中以46.4%的准确率击败了GPT-5.2 Thinking的45.5% [43]