实测GPT-5：界面更简洁回答更高效，但“不够惊艳”

GPT-5发布与核心能力 - GPT-5正式发布，OpenAI首席执行官通过77分钟视频展示其多模态、深度思考、联网搜索等集成化能力，但复杂问题回复仍有错误，与市面其他模型未拉开显著差距 [1] - 对话界面更简洁，可依据问题切换回答方式提升用户体验，但"惊艳程度"不及GPT-4和o1模型 [1][3] - 在创意写作、编程、数学、长文本等测评中夺榜首，但行业迭代速度快，领先优势不明显 [3][18] 创意写作实测表现 - 采用集成模型，无需手动切换，自动决定深度思考时机，免费用户也可使用 [3] - 中文写作中规中矩，生成内容包含具体人物、时间线及历史背景细节（如明末四川农民故事），并主动提示补充史料 [3][4] - 与DeepSeek、Kimi对比差距不大，但引导用户提问能力更强，可主动建议生成多模态内容（如兵乱形势图） [7] - 生成图片质量粗陋且与说明矛盾，多模态能力仍有局限 [8][10] 编程能力与商业化 - 编程能力为发布会重点，占一半时间，演示案例包括SVG动图解释伯努利效应、二战主题华容道游戏等 [10][11][14] - 生成速度显著提升（如10秒完成英语学习web应用），但复杂程序存在BUG（如单词报错、隆美尔方块无法移动） [11][16] - SWE-bench测试得分74.9%，略超Claude Opus4.1（74.5%），显著优于GPT-4o（30.8%）和o3（69.1%） [18] - API定价每百万token输入1.25美元/输出10美元，低于GPT-4o和Gemini 2.5 Pro，仅为Claude Opus 4.1的1/15 [20] 产品策略与限制 - 免费开放但限制使用次数（实测9轮对话触及上限），需付费解锁完整功能 [19] - 价格下探反映头部厂商抢占市场份额意图，或加速应用端落地 [20]