句子级溯源+生成式归因,C²-Cite重塑大模型可信度
机器之心·2025-12-03 00:06

核心技术突破 - 首创上下文感知的归因生成技术,使大模型在生成内容时自动标注精准信息来源,并确保生成内容与引用的外部知识高度语义对齐[2] - 通过引入上下文感知机制,将引用标记从被动的占位符转变为带有上下文语义的特殊令牌,显著提升引用质量和模型回答准确性[2][5] - 核心包含三大关键组件:上下文感知嵌入机制、上下文引用对齐机制和上下文注意力增强机制,通过距离衰减系数和注意力约束维持引用与内容的语义连贯性[7][8] 技术优势 - 解决了现有归因模型的三大关键缺陷:技术路径固有局限、引用标记沦为通用占位符、引用质量与回答准确性失衡[5] - 模型最终损失函数为默认损失、引用对齐损失、路由器损失与注意力增强损失的加权和,确保引用质量与回答准确性的协同优化[8] - 注意力热力图可视化显示,C²-Cite中后续句子对前文的注意力显著增强,形成跨引用的语义桥梁,这是生成高质量溯源内容的关键[15] 性能表现 - 在ALCE基准测试的三个数据集(ASQA、ELI5、QAMPARI)上全面评估,C²-Cite++在引用F1分数上平均提升5.8%,在回答正确性指标上平均提升17.4%[10][12] - 相比需要多轮迭代的方法,C²-Cite++实现了最高的处理速度,在实际应用中具有明显优势[13] - 在不同质量的训练数据上均表现稳定,即使使用普通训练数据也能超越依赖高质量数据的传统微调模型[12] 行业影响 - 该工作已被国际顶级会议WSDM 2026收录,为构建更加可靠、透明的AI溯源系统提供了重要的技术路径[2][17] - 通过"上下文感知"的设计思想,在内容生成过程依赖可靠的引用知识库,解决了大模型生成内容的可信度问题[2][17]