反击AI论文！arXiv每年拒掉2%造假内容，自动化工具加入审核

AI生成论文泛滥现状 - 预印本平台已成为AI生成内容的温床，导致大量低质量论文泛滥[4][6] - 每年约2%的论文因涉及AI生成或论文工厂造假被拒，其中计算机科学领域22%的摘要和生物学领域10%的摘要由大语言模型生成[2][17] - 生物医学期刊摘要中AI生成比例达14%，部分平台如bioRxiv和medRxiv每月拒稿量高达7000篇[2][18] 典型案例分析 - PsyArXiv平台曾下架一篇题为《自我实验报告：梦境中生成式人工智能界面的出现》的论文，该论文实验描述脱离实际且未声明AI使用[8][12][13] - 同一作者试图重复投稿相似内容，声称AI仅用于数学推导等有限用途，但最终仍被删除[14][15] 平台应对措施 - arXiv升级审核机制，采用自动化工具检测AI内容并提高综述论文发表标准[1][24] - Research Square使用Geppetto工具识别AI文本痕迹，openRxiv从人工筛选转向自动化检测[23][25] - 部分平台采取标记可疑内容、检查用户异常行为、调整投稿流程等组合策略[25][27] 行业挑战与矛盾 - AI辅助英语润色等合理需求与完全捏造内容的欺诈行为难以区分[5][22] - 审核资源不足导致处理速度下降，与预印本平台快速共享研究的初衷形成冲突[19][21] - AI技术迭代使虚假内容识别难度加剧，部分作者通过添加提示词规避检测[26][27][30] 长期影响 - AI幻觉产生的虚假预印本可能传播错误信息，误导科研人员[20] - 平台信任度面临挑战，需平衡内容开放性与质量管控[18][21]