实测GPT-5：写作坠入谷底，编程一骑绝尘。

GPT-5发布核心观点 - OpenAI正式发布新一代AI模型GPT-5 作为GPT-4o和OpenAI o3的继承者采用双模型架构（gpt-5-main快速模型和gpt-5-thinking深度推理模型）并配备实时路由系统 [9][11][12][16] - 新模型在事实准确性方面取得显著进步 gpt-5-main比GPT-4o减少44%重大事实错误 gpt-5-thinking比OpenAI o3减少78%错误 [19][20] - 模型在专业基准测试（LongFact/FActScore）中表现优异 gpt-5-thinking的factual errors比前代少五倍以上 [22] - 系统新增四种预设性格模式（愤世嫉俗者/机器人/倾听者/书呆子）减少69-75%的谄媚行为 [27] - 在编程和写作能力上有明显提升但部分用户反馈在文风细腻度和情商表现上不及GPT-4.5 [53][59][66][68] 技术架构升级 - 采用模块化设计包含主模型/迷你版/nano版/Pro版等多个变体其中Pro版支持并行计算 [14][15] - 通过动态路由系统自动分配任务用户可通过提示词（如"认真思考这个"）主动触发深度模型 [12][13] - 能效显著提升在视觉推理等任务中输出token减少50-80% [47][48] - 上下文处理精度增强在生产级代码修改任务中表现优于Gemini 2.5 Pro和Claude 4 Opus [90][92][99] 性能表现 - 全面领跑大模型竞技场榜单在编程/数学/创意写作等8个维度均排名第一 [44][45] - 数学竞赛AIME 0225中 GPT-5 Pro+Python组合获得满分 [30] - 多模态能力和人类知识测试成绩创历史新高 [31][33] - 但发布会展示存在数据标注错误（如52.8>69.1=30.8等明显失误） [37][38][40] 商业化进展 - 开发者定价为输入每百万token 1.25美元（含90%缓存折扣）输出每百万token 10美元 [54] - 引发市场预期波动 Polymarket预测平台上OpenAI与Google的"最佳AI模型"押注率出现交叉跳水 [52] - 强制替换旧版本引发用户不满特别是GPT-4.5用户反馈新模型在文风细腻度方面存在倒退 [57][59][71][74] 行业影响 - 标志着AI技术从"可容忍缺陷"阶段进入"需要严肃对待"阶段 [113][114] - 开发者反馈显示其可能改变人机协作模式降低生产级编程任务的人工干预需求 [102] - 用户普遍怀念GPT-4发布时的技术震撼感认为当前创新更侧重优化而非突破 [105][106][110][111]