DeepSeek“极你太美”bug,官方回应了
量子位·2025-08-27 02:24
核心观点 - DeepSeek V3 1模型在代码生成输出中随机出现"极"字 导致编译失败等问题 引发开发者社区广泛讨论[1][2][5] - 问题根源被推测为数据清洗不彻底 模型将"极"字作为终止符或语言切换标记学习[19][21][22] - 官方已确认将在近期版本修复该问题[12] 事件表现 - 多个平台包括火山引擎 chutes 腾讯CodeBuddy和DeepSeek官方均出现输出异常[5] - 异常表现为随机输出"extreme" "极" "極"等字符[7][8] - 问题对需要高精度 结构化输出的代码开发场景造成严重影响[11] 临时解决方案 - 通过提示词工程缓解问题 禁止特定符号序列模式[空格][token][占位符]的出现[15][18] - 该方法主要适用于调用API的第三方平台 DeepSeek官方平台暂不需要[18] 技术分析 - 类似问题曾在早期R1模型中出现 表现为枚举素数时输出"极长"作为终止符[21] - 模型在陷入thinking循环时有千分之一概率输出"极"字后终止思考[21] - 问题可能与SFT数据合成和预训练数据清洗不彻底有关[22] - 模型可能通过RAG技术学习到"极"字作为特殊标记[22]