一个 RAG 项目,在真实训练中是怎么被“做出来”的?
36氪·2025-12-19 00:11

RAG技术的本质与定位 - RAG技术远非简单的数据注入模块,而是重塑AI理解与决策的核心框架[1] - RAG项目不是简单的“加模块”技术问题,而是一整套数据与判断体系[1] - 决定RAG效果的关键并非“有没有资料”,而是“资料怎么被用”[2] - RAG项目是许多大模型走向“可用”的关键一环[11] - 在真实业务中,RAG往往不是过渡方案,而是长期存在的基础设施,是连接“稳定模型”与“变化世界”的桥梁[12][17] RAG项目的核心构成与挑战 - RAG项目由问题、参考材料、回答三部分构成,且没有一块是“天然可靠”的[3] - 用户问题本身可能存在问题,例如语义不清、上下文矛盾、逻辑跳跃或包含不合理意图,并非每个问题都值得被认真回答[4][7] - 参考材料并非权威答案,仅是候选证据,常存在与问题不相关、信息不完整、多条材料互相冲突或包含常识性错误等问题[5][8] - 最终交付物是用户能直接使用的回答,需满足理解用户真实意图、不违背材料事实、信息完整、表达自然等要求[9][14] - RAG项目中90%的难点在于“判断”而非“生成”,大量工作仍需依赖人类判断[1][9] RAG项目所需的核心能力 - RAG项目训练的是模型的三种底层能力:信息取舍能力、上下文对齐能力、结果导向能力[16] - 信息取舍能力指判断什么该用、什么不该用、什么只能作为背景[16] - 上下文对齐能力指确保回答是嵌在一段对话中的,而非独立存在[16] - 结果导向能力指目标不是“材料写了什么”,而是“用户看完能不能用”[16] - 项目中的许多关键判断,如材料不全是否要补、材料有错是否纠正、材料冲突信哪一条、历史对话有问题是否跳过,本质上是人类在替模型建立判断边界[10][15] RAG在对话式AI中的工作场景 - 在对话式AI助手场景中,RAG面对的是非标准问答的复杂结构[3] - 模型需要完成理解对话语境、判断材料有用性、整合信息、最终给出对用户有帮助的回答这一系列任务[3] - 从训练视角看,这本质上是材料阅读理解、问题理解、信息整合与表达控制的结合[3] - 系统输入通常包含一段历史对话、用户最新问题以及系统检索到的1–3条参考材料[6]