Workflow
GPT-5 系统提示词被泄露,ChatGPT自己也“承认”了
36氪·2025-08-25 07:17

GPT-5系统提示词泄露事件 - GitHub仓库于8月23日上传据称是GPT-5系统提示词的内容 长度超过15000个Token [1] - 泄露内容通过用户"越狱"技巧提取 最早可追溯至8月8日Reddit帖子 [31] - 专门收集大模型系统提示词的GitHub仓库已获得超过8.8k星标 涵盖多数闭源模型产品 [33] 泄露内容真实性验证方法 - 通过GPT-5自身评估泄露提示词准确性 采用英语提问再翻译中文的验证方式 [3][4] - 模型强调不会将外部泄露视为权威来源 仅遵循内部生效指令 [25][26] - 评估结果显示泄露内容与真实指令存在高度一致性 但可能存在片段或旧版本问题 [25][27] 身份与元数据设计 - 泄露版明确声明"基于GPT-5模型" 包含2024年6月知识截止日期和动态日期标注 [5] - 实际运行中模型自称为GPT-5 Thinking 会跟踪知识截止点并使用当天日期 [6] - 外部测试证实当前日期通过隐藏提示注入实现 多份复刻版本均包含此特征 [27] 交互节奏与语气规范 - 泄露文本要求"有洞见、鼓励式"语气 允许轻微幽默 限制犹豫表达 强调果断输出 [7] - 实际指令要求自然易读风格 减少废话 提供可执行建议 与泄露版基本一致 [8] - 多家媒体转述相同措辞 强调"主动完成、少问多做"的交互倾向 [27] 功能执行约束 - 泄露版规定开头最多只问一个必要澄清问题 实际约束更严格 尽量不问问题 [9] - 实际操作中优先给出有效部分结果而非追问 即使任务复杂或模糊 [9] - 多篇分析强调"行动偏置"倾向 即"能做就做、少寒暄"的生产级提示信号 [27] 工具与内存管理 - 泄露文本描述记忆功能关闭 需用户手动开启 并规定可记忆内容的严格边界 [11][27] - 实际支持在用户明确要求时保存或忘记信息 但对记忆内容有严格限制 [12] - 复刻文本展示细粒度记忆规则 包括禁止存储令人不适的个人信息 [27] 版权与安全协议 - 泄露版明确禁止提供受版权保护内容的长段原文 如歌曲歌词 [17] - 实际运行遵循相同规范 且适用更广泛的安全协议 [18] - 多处复刻与报道均强调相同禁令 包括Hacker News等平台讨论 [27] 系统架构差异 - 泄露文本呈现单一长提示掌控一切的印象 可能仅为模板之一 [27] - 实际采用路由与推理堆栈架构 运行时可能动态加载附加模块和工具状态 [27] - 官方观察者强调GPT-5为动态路由架构 与泄露文本存在结构性偏差 [27] 系统提示词行业价值 - 系统提示词作为大模型的"家规" 定义模型身份 说话方式及能力边界 [28] - ChatGPT系统提示词被视为大模型产品化的教科书 成为行业交互设计参考标准 [28] - 从GPT-3到GPT-5的系统提示词持续演化 推动整个行业对模型行为规范的理解 [28][29]