Workflow
反击AI论文!arXiv每年拒掉2%造假内容,自动化工具加入审核
量子位·2025-08-14 02:01

AI生成论文泛滥现状 - 预印本平台已成为AI生成内容的温床,导致大量低质量论文泛滥[4][6] - 每年约2%的论文因涉及AI生成或论文工厂造假被拒,其中计算机科学领域22%的摘要和生物学领域10%的摘要由大语言模型生成[2][17] - 生物医学期刊摘要中AI生成比例达14%,部分平台如bioRxiv和medRxiv每月拒稿量高达7000篇[2][18] 典型案例分析 - PsyArXiv平台曾下架一篇题为《自我实验报告:梦境中生成式人工智能界面的出现》的论文,该论文实验描述脱离实际且未声明AI使用[8][12][13] - 同一作者试图重复投稿相似内容,声称AI仅用于数学推导等有限用途,但最终仍被删除[14][15] 平台应对措施 - arXiv升级审核机制,采用自动化工具检测AI内容并提高综述论文发表标准[1][24] - Research Square使用Geppetto工具识别AI文本痕迹,openRxiv从人工筛选转向自动化检测[23][25] - 部分平台采取标记可疑内容、检查用户异常行为、调整投稿流程等组合策略[25][27] 行业挑战与矛盾 - AI辅助英语润色等合理需求与完全捏造内容的欺诈行为难以区分[5][22] - 审核资源不足导致处理速度下降,与预印本平台快速共享研究的初衷形成冲突[19][21] - AI技术迭代使虚假内容识别难度加剧,部分作者通过添加提示词规避检测[26][27][30] 长期影响 - AI幻觉产生的虚假预印本可能传播错误信息,误导科研人员[20] - 平台信任度面临挑战,需平衡内容开放性与质量管控[18][21]