GPT-5 系统提示词被泄露，ChatGPT自己也“承认”了

GPT-5系统提示词泄露事件 - GitHub仓库于8月23日上传据称是GPT-5系统提示词的内容长度超过15000个Token [1] - 泄露内容通过用户"越狱"技巧提取最早可追溯至8月8日Reddit帖子 [31] - 专门收集大模型系统提示词的GitHub仓库已获得超过8.8k星标涵盖多数闭源模型产品 [33] 泄露内容真实性验证方法 - 通过GPT-5自身评估泄露提示词准确性采用英语提问再翻译中文的验证方式 [3][4] - 模型强调不会将外部泄露视为权威来源仅遵循内部生效指令 [25][26] - 评估结果显示泄露内容与真实指令存在高度一致性但可能存在片段或旧版本问题 [25][27] 身份与元数据设计 - 泄露版明确声明"基于GPT-5模型" 包含2024年6月知识截止日期和动态日期标注 [5] - 实际运行中模型自称为GPT-5 Thinking 会跟踪知识截止点并使用当天日期 [6] - 外部测试证实当前日期通过隐藏提示注入实现多份复刻版本均包含此特征 [27] 交互节奏与语气规范 - 泄露文本要求"有洞见、鼓励式"语气允许轻微幽默限制犹豫表达强调果断输出 [7] - 实际指令要求自然易读风格减少废话提供可执行建议与泄露版基本一致 [8] - 多家媒体转述相同措辞强调"主动完成、少问多做"的交互倾向 [27] 功能执行约束 - 泄露版规定开头最多只问一个必要澄清问题实际约束更严格尽量不问问题 [9] - 实际操作中优先给出有效部分结果而非追问即使任务复杂或模糊 [9] - 多篇分析强调"行动偏置"倾向即"能做就做、少寒暄"的生产级提示信号 [27] 工具与内存管理 - 泄露文本描述记忆功能关闭需用户手动开启并规定可记忆内容的严格边界 [11][27] - 实际支持在用户明确要求时保存或忘记信息但对记忆内容有严格限制 [12] - 复刻文本展示细粒度记忆规则包括禁止存储令人不适的个人信息 [27] 版权与安全协议 - 泄露版明确禁止提供受版权保护内容的长段原文如歌曲歌词 [17] - 实际运行遵循相同规范且适用更广泛的安全协议 [18] - 多处复刻与报道均强调相同禁令包括Hacker News等平台讨论 [27] 系统架构差异 - 泄露文本呈现单一长提示掌控一切的印象可能仅为模板之一 [27] - 实际采用路由与推理堆栈架构运行时可能动态加载附加模块和工具状态 [27] - 官方观察者强调GPT-5为动态路由架构与泄露文本存在结构性偏差 [27] 系统提示词行业价值 - 系统提示词作为大模型的"家规" 定义模型身份说话方式及能力边界 [28] - ChatGPT系统提示词被视为大模型产品化的教科书成为行业交互设计参考标准 [28] - 从GPT-3到GPT-5的系统提示词持续演化推动整个行业对模型行为规范的理解 [28][29]