Workflow
GPT-5问题太多,奥特曼带团回应一切,图表弄错是因「太累了」
机器之心·2025-08-09 06:02

GPT-5发布与用户反馈 - GPT-5发布后用户普遍失望,尤其在解决小学水平数学题时表现不佳,引发对"博士水平智力"宣传的质疑[1][3] - 社交媒体涌现大量GPT-5在逻辑、编码任务中的失误案例,包括发布会展示的基准分数与条形图不匹配的"图表犯罪"[5][8][9] - 用户强烈要求恢复GPT-4o访问权限,公司最终妥协并部分撤回平台更改[7][15][17] 技术改进与功能调整 - 公司承认发布过程存在问题,承诺提升GPT-5智能水平并改进决策边界透明度[13] - API流量24小时内几乎翻倍,计划将Plus用户速率限制提高一倍[13][14] - 新语音模型改进指令遵循能力,编程功能被称作"迄今最佳编程模型"[24][56] 模型性能对比 - GPT-5在推理能力、创造性写作、指令遵循和用户意图对齐方面显著优于GPT-4[47] - 误导性回复从GPT-4o的4.8%降至GPT-5的2.1%,思考模式幻觉减少效果显著[28][53] - 公司原计划实现百万级上下文长度,但因计算成本限制未能实现[57] 安全与内容过滤机制 - 安全改进包括降低拒绝率、增强越狱防护和构建自动化测试器[26] - 生物安全过滤存在过度修正问题,公司正在测试减少误报的方法[29][30] - 历史内容过滤机制引发学术使用争议,公司承诺优化警报触发逻辑[32][34][35] 产品路线与用户体验 - 计划推出统一模型体验,未来版本将继续功能融合[37] - 界面改进包括手动触发思考功能、更顺畅的模型切换体验[13][41] - 考虑按token计量使用量,探索订阅与API使用的结合方案[19]