没人味的 GPT-5 更新了，但变尬了

GPT-5.1产品更新评估 - 新产品GPT-5.1在指令遵循方面表现不佳，未能正确回答六字游戏问题，即使使用英文提示词也答错[4][5] - 在文本生成任务中，当要求写200字薯条颂且不能出现"的"字时，GPT-5.1输出繁体字，去除限制后回复正常，测试五次结果一致[5] - 与竞争对手Gemini 2.5 pro相比，GPT-5.1在相同测试任务中出现错误，而Gemini轻松给出正确答案[6] 情感交互能力对比 - GPT-5.1号称在GPT-5基础上变得更温暖、更有对话性，但实际效果一般，仅恢复GPT-4o原有能力[8] - 在处理失恋等情感问题时，GPT-5和GPT-5.1像旁观者分析情感，而GPT-4o能实现共情鼓励，用户体验更佳[12] - 在情感回应测试中，新版GPT-5.1甚至不如老版，连基本情感表达都减弱[14] 自适应思考优化 - GPT-5.1引入自适应耗时优化，能根据问题难度自动分配思考时间，简单问题思考速度明显快于GPT-5[17] - 在复杂编程难题上，GPT-5快速给出错误结果，而GPT-5.1经过更长时间思考后给出正确答案[19] - 该优化对API用户更具价值，可在简单问题上节省成本，难题上避免浪费支出[21] 个性化功能升级 - ChatGPT新增七种回答风格设置，包括吐槽达人、技术宅、天马行空等不同人设[21] - 不同人设风格差异显著，吐槽达人模式具有思辨能力，能识别PUA话术，但表达方式较尴尬[23] - 个性化模式摆脱了默认模式的讨好感，展现出比默认模式更大的发展潜力[23] 市场竞争态势 - GPT系列产品市场份额持续萎缩，根据10月报告已走了一年下坡路[25] - 竞品市占率增长迅速，用户开始频繁使用其他AI产品[28] - 公司面临产品核心质量平庸与市场竞争加剧的双重压力[28][29]