Workflow
MIRAGE
icon
搜索文档
如何让AI“识破”AI?这项研究给出答案
科技日报· 2025-08-25 01:32
核心观点 - 南开大学计算机学院媒体计算实验室开发了直接差异学习(DDL)优化策略 显著提升AI生成内容检测的泛化能力和鲁棒性 相关成果论文已被ACM MM 2025接收 [1][2][3] 行业问题现状 - AI生成内容存在虚假信息生成、学术诚信冲击及人类识别困难等问题 论文AI率检测系统不完善导致误判频发 [1] - 现有AI检测方法主要分基于训练的检测和零样本检测两种路线 但在复杂现实场景中面临困境 [1] - 现有检测工具需收集所有大模型数据训练才可实现通用检测 这在大模型快速迭代背景下几乎不可能实现 [2] 技术方案 - DDL方法通过直接优化模型预测文本条件概率差异与目标值的差距 帮助模型学习AI文本检测内在知识 [2] - 该方法精准捕捉人机文本间深层语义差异 使检测器仅学习DeepSeek-R1文本即可识别GPT-5等最新模型生成内容 [2] - 团队构建MIRAGE基准数据集 包含13种商用大模型和4种开源大模型生成的近10万条人类-AI文本对 [2][3] 性能表现 - 在MIRAGE测试中现有检测器准确率从简单数据集的90%骤降至60% 而DDL训练检测器保持85%以上准确率 [3] - 相比斯坦福大学DetectGPT工具 DDL检测器性能提升71.62% [3] - 相比马里兰大学和卡内基梅隆大学Binoculars方法 DDL检测器性能提升68.03% [3] 发展计划 - 研究团队将持续迭代升级评估基准和技术 致力于实现更快、更准、更低成本的AI生成文本检测 [3]