GPT-5发布与核心能力 - GPT-5正式发布,OpenAI首席执行官通过77分钟视频展示其多模态、深度思考、联网搜索等集成化能力,但复杂问题回复仍有错误,与市面其他模型未拉开显著差距 [1] - 对话界面更简洁,可依据问题切换回答方式提升用户体验,但"惊艳程度"不及GPT-4和o1模型 [1][3] - 在创意写作、编程、数学、长文本等测评中夺榜首,但行业迭代速度快,领先优势不明显 [3][18] 创意写作实测表现 - 采用集成模型,无需手动切换,自动决定深度思考时机,免费用户也可使用 [3] - 中文写作中规中矩,生成内容包含具体人物、时间线及历史背景细节(如明末四川农民故事),并主动提示补充史料 [3][4] - 与DeepSeek、Kimi对比差距不大,但引导用户提问能力更强,可主动建议生成多模态内容(如兵乱形势图) [7] - 生成图片质量粗陋且与说明矛盾,多模态能力仍有局限 [8][10] 编程能力与商业化 - 编程能力为发布会重点,占一半时间,演示案例包括SVG动图解释伯努利效应、二战主题华容道游戏等 [10][11][14] - 生成速度显著提升(如10秒完成英语学习web应用),但复杂程序存在BUG(如单词报错、隆美尔方块无法移动) [11][16] - SWE-bench测试得分74.9%,略超Claude Opus4.1(74.5%),显著优于GPT-4o(30.8%)和o3(69.1%) [18] - API定价每百万token输入1.25美元/输出10美元,低于GPT-4o和Gemini 2.5 Pro,仅为Claude Opus 4.1的1/15 [20] 产品策略与限制 - 免费开放但限制使用次数(实测9轮对话触及上限),需付费解锁完整功能 [19] - 价格下探反映头部厂商抢占市场份额意图,或加速应用端落地 [20]
实测GPT-5:界面更简洁回答更高效,但“不够惊艳”
贝壳财经·2025-08-09 01:50