Workflow
让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA
量子位·2025-09-27 07:00

DRAG团队 发自 凹非寺 量子位 | 公众号 QbitAI RAG准确率提升10.6% ,多项基准拿下新SOTA! ACL 2025最新研究提出 Lexical Dive rsity-a ware RAG (DRAG) 框架,首次系统性地 将词汇多样性引入RAG的检索与生成过程 ,提供 了一个轻量、通用且易扩展的解决方案。 在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。 在大语言模型的浪潮下,Retrieval-Augmented Generation ( RAG ) 已经成为提升模型事实性和时效性的重要手段。然而,现有方法普 遍忽视了一个看似细微却极为关键的问题——词汇多样性 (lexical diversity) 。 同一个问题,不同的表达方式,往往让检索模型"晕头转向",最终导致错误答案。 由此,来自北航、北大、中关村实验室的研究团队提出了这项最新工作,他们首次将"词汇多样性"引入检索增强生成的相关性评估过程,并通 过新颖的风险稀疏校准机制解决了生成阶段被无关信息干扰的问题。 团队认为,该方法对信息检索、问答系统、专业领域大模型应用都具有重要价值。未来,他们计 ...