GPT-5发布核心观点 - OpenAI正式发布新一代AI模型GPT-5 作为GPT-4o和OpenAI o3的继承者 采用双模型架构(gpt-5-main快速模型和gpt-5-thinking深度推理模型)并配备实时路由系统 [9][11][12][16] - 新模型在事实准确性方面取得显著进步 gpt-5-main比GPT-4o减少44%重大事实错误 gpt-5-thinking比OpenAI o3减少78%错误 [19][20] - 模型在专业基准测试(LongFact/FActScore)中表现优异 gpt-5-thinking的factual errors比前代少五倍以上 [22] - 系统新增四种预设性格模式(愤世嫉俗者/机器人/倾听者/书呆子) 减少69-75%的谄媚行为 [27] - 在编程和写作能力上有明显提升 但部分用户反馈在文风细腻度和情商表现上不及GPT-4.5 [53][59][66][68] 技术架构升级 - 采用模块化设计 包含主模型/迷你版/nano版/Pro版等多个变体 其中Pro版支持并行计算 [14][15] - 通过动态路由系统自动分配任务 用户可通过提示词(如"认真思考这个")主动触发深度模型 [12][13] - 能效显著提升 在视觉推理等任务中输出token减少50-80% [47][48] - 上下文处理精度增强 在生产级代码修改任务中表现优于Gemini 2.5 Pro和Claude 4 Opus [90][92][99] 性能表现 - 全面领跑大模型竞技场榜单 在编程/数学/创意写作等8个维度均排名第一 [44][45] - 数学竞赛AIME 0225中 GPT-5 Pro+Python组合获得满分 [30] - 多模态能力和人类知识测试成绩创历史新高 [31][33] - 但发布会展示存在数据标注错误(如52.8>69.1=30.8等明显失误) [37][38][40] 商业化进展 - 开发者定价为输入每百万token 1.25美元(含90%缓存折扣) 输出每百万token 10美元 [54] - 引发市场预期波动 Polymarket预测平台上OpenAI与Google的"最佳AI模型"押注率出现交叉跳水 [52] - 强制替换旧版本引发用户不满 特别是GPT-4.5用户反馈新模型在文风细腻度方面存在倒退 [57][59][71][74] 行业影响 - 标志着AI技术从"可容忍缺陷"阶段进入"需要严肃对待"阶段 [113][114] - 开发者反馈显示其可能改变人机协作模式 降低生产级编程任务的人工干预需求 [102] - 用户普遍怀念GPT-4发布时的技术震撼感 认为当前创新更侧重优化而非突破 [105][106][110][111]
实测GPT-5:写作坠入谷底,编程一骑绝尘。
数字生命卡兹克·2025-08-07 21:12