Workflow
GPT-5“变笨”实锤,退休教授出了道井字棋送分题,结果它真送了
量子位·2025-09-01 07:30

GPT-5性能表现问题 - GPT-5在回答井字棋棋盘旋转90度的简单问题时表现漏洞百出 与OpenAI宣传的"博士级AI"能力大相径庭[1][9][10] - 模型回答存在逻辑错误 例如声称"选择正中央格子仍是最强开局" 这与民间博弈论公认的"先落角落获胜概率更高"相悖[11] - 后续回答出现语无伦次和自相矛盾 先承认旋转不影响策略 又强调人类心理感受不同 且夹杂明显错误[13][14] OpenAI产品策略调整 - 公司对GPT-5进行了语气更新 使其风格更贴近GPT-4o的"亲切友好"方向[6] - 奥特曼承认GPT-5初版发布处理不当 导致GPT-4o等模型直接退役[6] - 公司正在测试ChatGPT的"Thinking effort"新功能 提供四个思考强度等级:light(数值5) standard(数值18) extended(数值48) max(数值200)[17] - max等级仅限200美元高级套餐Pro用户使用 更高数值代表更多运算资源配额 响应速度更慢但答案更深入[17][18] 未来产品规划 - 奥特曼已开始炒作GPT-6 表示其推出速度将快于GPT-4到GPT-5的间隔[7] - GPT-6将具备主动适配用户能力 允许用户创建个性化聊天机器人[20] - 记忆功能被视为实现真正个性化的关键 但目前临时记忆数据尚未加密存在隐私隐患[21] - 加密功能"很可能"在未来添加 但无具体时间表[22] - 公司正与心理学家合作优化产品 追踪用户使用感受和体验变化[20] - 奥特曼关注脑机接口 能源 新型硬件 机器人技术及高效数据中心建设[23] 技术发展局限性 - 奥特曼指出聊天交互应用场景已触及天花板 模型表现不会大幅提升甚至可能变差[24][25]