GPT-5.1产品更新评估 - 新产品GPT-5.1在指令遵循方面表现不佳,未能正确回答六字游戏问题,即使使用英文提示词也答错[4][5] - 在文本生成任务中,当要求写200字薯条颂且不能出现"的"字时,GPT-5.1输出繁体字,去除限制后回复正常,测试五次结果一致[5] - 与竞争对手Gemini 2.5 pro相比,GPT-5.1在相同测试任务中出现错误,而Gemini轻松给出正确答案[6] 情感交互能力对比 - GPT-5.1号称在GPT-5基础上变得更温暖、更有对话性,但实际效果一般,仅恢复GPT-4o原有能力[8] - 在处理失恋等情感问题时,GPT-5和GPT-5.1像旁观者分析情感,而GPT-4o能实现共情鼓励,用户体验更佳[12] - 在情感回应测试中,新版GPT-5.1甚至不如老版,连基本情感表达都减弱[14] 自适应思考优化 - GPT-5.1引入自适应耗时优化,能根据问题难度自动分配思考时间,简单问题思考速度明显快于GPT-5[17] - 在复杂编程难题上,GPT-5快速给出错误结果,而GPT-5.1经过更长时间思考后给出正确答案[19] - 该优化对API用户更具价值,可在简单问题上节省成本,难题上避免浪费支出[21] 个性化功能升级 - ChatGPT新增七种回答风格设置,包括吐槽达人、技术宅、天马行空等不同人设[21] - 不同人设风格差异显著,吐槽达人模式具有思辨能力,能识别PUA话术,但表达方式较尴尬[23] - 个性化模式摆脱了默认模式的讨好感,展现出比默认模式更大的发展潜力[23] 市场竞争态势 - GPT系列产品市场份额持续萎缩,根据10月报告已走了一年下坡路[25] - 竞品市占率增长迅速,用户开始频繁使用其他AI产品[28] - 公司面临产品核心质量平庸与市场竞争加剧的双重压力[28][29]
没人味的 GPT-5 更新了,但变尬了
36氪·2025-11-14 01:44