Workflow
RAG技术
icon
搜索文档
一个 RAG 项目,在真实训练中是怎么被“做出来”的?
36氪· 2025-12-19 00:11
RAG技术远非简单的数据注入,而是重塑AI理解与决策的核心框架。本文深度拆解RAG项 目中的真实困境——从语料筛选、矛盾处理到结果交付,揭示为何90%的工作仍依赖人类判 断。 在之前的文章里,我花了很多篇幅讲 RAG 为什么重要。但真正走到项目现场,你会很快意识到一件 事:RAG 不是一个"加模块"的技术问题,而是一整套数据与判断体系。 很多刚接触的人会以为,RAG 项目无非就是: 给模型多喂点资料,让它照着说。 但真实情况是——真正决定 RAG 效果的,从来不是"有没有资料",而是"资料怎么被用"。 先从一个最真实的工作场景说起 在对话式 AI 助手场景中,RAG 项目面对的,通常不是"标准问答",而是这样一种结构: 模型要做的,不是简单复述材料,而是: 理解对话语境 → 判断哪些材料有用 → 整合信息 → 给出一个"对用户有帮助"的回答 从训练视角看,这本质是在做一件事:材料阅读理解 + 问题理解 + 信息整合 + 表达控制 RAG 项目里的"三件套":问题、材料、回答 如果把一个 RAG 项目拆开来看,它其实由三块内容构成,但这三块,没有一块是"天然可靠"的。 问题,本身就可能有问题 你在项目中会频繁遇 ...
AI帮你做用户研究?这两大场景超实用!
搜狐财经· 2025-12-04 08:43
文章核心观点 - AI大语言模型正在变革用户研究行业,通过处理海量文本数据提升效率,使研究人员能专注于关键决策 [1] - AI在用户研究中的应用主要聚焦于短文本反馈分类和长文本分析洞察两大核心场景 [1] - AI是强大的辅助工具而非替代者,研究人员需在利用技术的同时守住专业底线 [11] 短文本反馈分类 - 针对短文本分类,存在通用模型分类和SFT微调模型分类两种主流AI解决方案 [2] - 通用模型分类适用于偶发、数据量不大或处于探索分类标准阶段的任务,操作灵活便捷,无需复杂训练数据 [3] - 通用模型分类使用门槛低,可利用常见对话式AI工具或API接口实现高效处理,但在处理高复杂度或深奥行业术语时可能出现偏差 [3] - SFT微调模型分类通过监督微调将通用模型培养为特定领域的专家,适合拥有大量历史数据、业务稳定、需长期监测且对准确率要求高的场景 [4][6] - SFT方案前期需投入精力准备高质量标注数据并进行训练,但成功后准确度与效率出众,缺点是分类标准发生根本变化时需要重新训练 [6] - 提升SFT模型效果的关键在于提供高质量的标注数据,需明确角色、说清任务、讲透规则、提供示例并引导模型进行思维链思考 [7] - 标注数据需确保准确并经交叉检查,同时覆盖各种场景以保持类别均衡,并随业务变化及时更新 [8][12] 长文本分析洞察 - 对于长文本分析,AI可化身“超级管家”,运用RAG等技术处理访谈记录等资料 [9] - 具体运作流程包括:整理切分文本构建知识库,搭建智能体并下达指令,AI根据问题检索相关原始语料并生成洞察报告 [9] - RAG技术极大提升了信息处理效率与完整性,能在几分钟内完成原本需数小时的工作,并基于数据关联分析发现深层洞察 [10] - 优化长文本分析效果需合理拆分文本保证语意完整,采用关键词加语义理解双重优化检索方式,控制上下文参考资料量,并通过指令明确工作规则防止AI“瞎编” [13]
零代码落地!DeepSeek+ChatWiki,打造企业专属智能客服
搜狐财经· 2025-11-27 02:51
产品解决方案核心价值 - 解决企业普遍存在的客服困境,如大促期间咨询爆单导致消息遗漏、新客服培训期长且回答质量差、夜间咨询无人响应导致订单流失 [2] - 通过DeepSeek大模型与ChatWiki的RAG知识库结合,为零代码快速搭建精准高效的AI客服系统提供可能 [2] - 全流程零代码操作,1天内即可完成部署,极大降低企业技术门槛与时间成本 [2] - 某教育平台接入后,夜间咨询响应率从0提升至100%,转化率直接翻倍 [8] 技术实现与功能特点 - 兼容全球20多种主流AI模型,企业只需申请DeepSeek API Key并在ChatWiki后台一键配置,技术小白也能轻松上手 [3] - 支持上传ODF、PDF、Word、Excel、网页链接等多种格式文档,自动完成文本清洗、向量化转换与QA分割以构建知识库 [4] - DeepSeek负责精准捕捉客户意图并从知识库提取信息,以自然流畅语言组织回复,避免大模型胡编乱造和传统知识库答案机械罗列的弊端 [6] - AI机器人可无缝接入H5链接、企业官网、微信公众号、小程序,以及飞书、钉钉等办公平台,实现全渠道覆盖 [8] 企业级管理与协作 - 提供精细化权限管理,管理员可按需为成员分配角色,精准管控知识库编辑和机器人配置权限 [10] - 实现数据隔离与安全管控,保障核心业务数据安全,同时提升团队协作效率,适配复杂组织架构需求 [10]
西部机场集团AI战略下的银川实践 “数智大脑”激活空港新动能
中国民航网· 2025-10-16 01:19
智慧机场建设方略 - 公司以4A架构为核心的智慧机场建设方略持续扎实推进,伴随“AI + 专项行动”全面深化 [1] - 企业级AI助理“小西”实现规模化应用,银川机场航站楼管理部弱电中心自主搭建“AI智能体+本地RAG知识库”融合平台 [1] - 该平台作为集团AI技术落地的重要标杆,首批覆盖安全、生产、培训等核心场景,将分散数据转化为决策能力 [1] 技术架构与核心优势 - 技术路径为“RAG + 本地大模型”,通过检索增强生成技术破解大模型“幻觉”难题,用本地部署保障数据安全 [1] - 采用RagFlow搭建本地知识库,集成DeepSeek大模型与自定义智能体,通过向量数据库实现“检索-推理-生成”全流程本地化运行 [2] - 该架构契合集团“数据专有、价值专享”的私域大模型建设原则,核心优势凸显 [2] - 平台通过Prometheus+Grafana监控体系实现检索延迟低于500ms、模型调用成功率超95%的生产级运行标准 [2] 运营效率提升 - 平台解决了知识分散、检索低效的瓶颈,值班人员检索“三大规程”从耗时十几分钟以上提升至秒级 [1][2] - 新员工独立处理工单的熟练度提升60%,相当于为每个班组配备了全天候“AI老师傅” [2] - 撰写事件调查报告无需在千余份历史文档中人工筛选,输入巡检记录后智能体自动匹配设备型号与历史故障案例 [1][2] 安全与风险管理 - 安全态势实现秒级研判,上传工单与巡检数据后,AI助理内生成含风险等级、趋势预判、处置建议的可视化报告 [2] - 该功能实现“一页总览”的全局管控,已助力受限航班保障及时率提升 [2] - 智能体输出“风险点+整改清单”,隐患锁定时间压缩至“分钟级” [2] 试点成果与推广 - 依托集团“1+N”数字化协同模式,弱电中心将试点成果向全部门辐射 [3] - 安全质量室上线“法规制度指引助理”,实现千余项民航规章的“秒级检索”,替代传统“翻册核对” [3] - 引入隐患风险库的“方案智慧助理”,在施工方案审查中自动识别合规缺口,推动管理从“事后整改”向“事前预防”升级 [3] 未来发展规划 - 平台与集团“小西”AI助理形成能力互补,其多模态扩展方案未来将实现安检图像分析、语音交互等功能 [3] - 按照建设路线图,平台将逐步接入航班动态、旅客服务、能源消耗等鲜活数据,推动AI能力向“预测决策”跨越 [3] - 该实践验证了RAG技术在航空领域的独特价值,正逐步推动该架构在西北机场集群的规模化部署 [3]
最新Agent框架,读这一篇就够了
自动驾驶之心· 2025-08-18 23:32
主流AI AGENT框架 - 当前主流AI Agent框架种类繁多,各有侧重,适用于不同应用场景 [1] - 主要框架包括LangGraph、AutoGen、CrewAI、Smolagents和RAGFlow [2] - 各框架特点鲜明,LangGraph基于状态驱动,AutoGen强调多Agent对话,CrewAI专注协作,Smolagents轻量级,RAGFlow专注RAG流程 [2] CrewAI框架 - 开源多智能体协调框架,基于Python,通过角色扮演AI智能体协作完成任务 [3] - 核心特点包括独立架构、高性能设计、深度可定制化和全场景适用 [4] - 支持两种模式:Crews模式(智能协作团队)和Flows模式(事件工作流) [7] - 拥有超过10万认证开发者社区,生态活跃 [8] - 通过平衡易用性、灵活性与性能,帮助构建智能自动化系统 [9] CrewAI使用流程 - 创建项目结构清晰,遵循Python最佳实践,降低操作门槛 [11][12] - 配置文件与实现代码分离,便于调整行为 [13] - 可定义具有特定角色、目标和背景的AI agent [14] - 支持为agent分配具体工作并设置协作流程 [15][16][17][18] - 通过简单代码即可实现agent协同工作 [19][20] - 提供环境变量配置和依赖安装的便捷方式 [21][22][23] - 运行后可实时观察代理思考和输出,最终报告自动保存 [25][26] LangChain框架 - 由LangChain创建的开源AI代理框架,基于图的架构管理复杂工作流 [26] - 状态功能记录并追踪AI系统处理的所有信息 [30] - 支持创建反应式agent,配置LLM参数和自定义提示 [32][33][34][35] - 提供静态和动态两种提示类型 [36][37][38] - 支持记忆功能实现多轮对话 [39][40] - 可配置结构化输出,通过Pydantic模型定义响应格式 [41][42] - 推出LangGraph Studio可视化界面,降低使用门槛 [43] AutoGen框架 - 微软开源框架,支持多Agent对话协作完成任务 [44] - 统一接口设计,支持自动回复和动态对话 [44] - 提供易用灵活的开发框架,加速智能体AI研发 [46] - 核心特性包括多智能体对话、LLM与工具调用、自主工作流等 [46][49][50] - 提供开箱即用案例系统,覆盖多领域 [51] - 支持无代码执行和代码执行器配置 [53][54][55] - 代码执行器可在沙盒环境安全运行代码 [57][58][59][60][61][62][63][64] Smolagents框架 - HuggingFace推出的轻量级Agent开发库 [66] - 设计理念为"低门槛,高天花板,可拓展" [67] - 主要特点包括简洁实现、一流代码代理支持、通用工具调用等 [68][69] - 支持Hub集成,模型无关,可处理多模态输入 [70][71] - 提供丰富工具支持,包括MCP服务器、LangChain工具等 [72] - 安装简单,示例代码简洁明了 [74][75] RAGFlow框架 - 端到端RAG解决方案,专注深度文档理解 [75] - 核心能力包括高质量文本切片和异构数据源支持 [77][78] - 可智能识别文档结构,处理复杂格式非结构化数据 [77] - 支持多种文件类型,包括Word、PPT、Excel、图片等 [78] - 提供可控文本切片,多种模板选择 [77] - 适用于文档解析、知识问答和多模态数据处理 [79][86] 框架对比与选择 - CrewAI适合多智能体协作场景,如内容团队和市场分析 [80] - LangGraph适合复杂状态机和多步骤任务编排 [81] - AutoGen适合研究型任务和交互式应用 [82][86] - Smolagents适合快速开发和私有化部署 [82][86] - RAGFlow是处理多模态文档的首选方案 [82][86] - 选择依据包括协作需求、流程复杂度和开发轻量级要求 [86]
大模型专题:2025年大模型智能体开发平台技术能力测试研究报告
搜狐财经· 2025-08-14 15:48
测试概述 - 测试背景聚焦大模型驱动的智能体在产业智能化转型中的多场景渗透态势,评估其知识增强、流程编排和智能决策能力 [7] - 测试选取阿里云百炼、腾讯云智能体开发平台、扣子及百度智能云千帆四个平台,围绕RAG能力、工作流能力和Agent能力展开 [7] - 测试方法构建标准化框架,涵盖场景构建、数据集设计、智能体配置及问题集设计,确保与实际业务高度贴合 [11][12] RAG能力测试 - 文本问答表现优异,单文档及多文档问答准确率超80%,但拒答与澄清处理差异显著,腾讯云对知识库外问题实现100%拒答 [20][21] - 结构化数据问答中百度智能云千帆表现稳定,多表关联查询准确率较高,阿里云百炼和扣子存在信息遗漏与聚合误差 [23][27] - 图文问答中阿里云百炼、腾讯云及扣子图片识别能力较强(83.3%-91.7%),但配图输出率分化,百度智能云千帆因流程bug识别率低 [30][33] 工作流能力测试 - 订单修改场景端到端准确率61.5%-69.2%,腾讯云意图识别准确率达93.3%,参数提取是主要差异点 [36] - 各平台在意图识别环节准确率达100%,但阿里云百炼和腾讯云参数提取准确率(75%)高于扣子和百度智能云千帆(61.5%) [37] - 工作流配置呈现差异化设计,腾讯云采用全局Agent机制,阿里云百炼和扣子分离对话与任务执行引擎 [40] Agent能力测试 - 单工具调用完成率83%-92%,多工具协同及提示词调用有提升空间,腾讯云因工具生态完整表现均衡 [48][50] - 任务分解能力标准化,如行程规划场景均能识别路径规划+天气查询+联网搜索工具组合需求 [48] - 平台工具生态依赖自身资源,百度整合文库/百科,腾讯打通文档/地图,扣子支持轻量化插件开发 [49] 总结与展望 - 平台基础能力趋同但路径分化,需在场景深度适配、技术链厚度构建、生态广度拓展上持续发力 [1] - 当前技术需优化自然语言到结构化查询的精准映射,增强字段格式兼容性校验 [28] - 工作流系统仍依赖人工干预,需结合业务经验与技术特性进行动态校准 [43]
VLA:何时大规模落地
中国汽车报网· 2025-08-13 01:33
VLA技术发展现状 - 理想i8成为首款搭载VLA司机大模型的车型,主打"像家人一样懂你"的辅助驾驶体验 [2] - 博世认为VLA短期难以落地,坚持投入一段式端到端技术,因多模态对齐和数据训练困难 [2] - 行业对VLA落地时间存在分歧,乐观预测2025年为元年,保守估计需3-5年技术成熟 [2][12][13] 技术路线对比 - 模块化端到端保留部分人工设计接口,存在感知与决策衔接难题 [2] - 一段式端到端采用全局优化模型,特斯拉FSD V12代码量从30万行缩减至2000行 [4] - VLA通过思维链实现可解释性决策,在潮汐车道等复杂场景表现优于传统端到端 [4][5] - VLA单日可完成30万公里仿真测试,显著降低实车数据依赖 [5] 技术演进路径 - 行业主流从端到端+VLM双系统转向VLA原生融合架构 [6] - 端到端+VLM需同步处理TB级视频流与百亿参数模型,车载算力紧张 [6] - VLA通过对比学习实现多模态特征对齐,仿真复现率达99.9% [7] - 理想汽车通过端到端+VLM升级至VLA架构,实现空间理解等四大能力 [5] 算力与芯片挑战 - 当前智驾芯片算力不足,英伟达Orin(254TOPS)不支持语言模型直接运行 [9] - 英伟达Thor芯片实际算力缩水,基础版仅300TOPS [9] - VLA低速自动驾驶需10赫兹运行频率,高速需20赫兹 [9] - 车企加速自研芯片:理想马赫100计划2026量产,特斯拉AI 5算力或达2500TOPS [11] 落地时间表 - 短期(2025-2026):特定场景如高速路/封闭园区应用 [14] - 中期(2027-2029):算力达2000TOPS时覆盖城市全场景,接管率或低于0.01次/公里 [14] - 长期(2030年后):光计算架构+脑机接口实现类人直觉决策 [14] - 需突破多模态对齐、训练效率、芯片能效比等关键技术 [14]
一文了解 AI Agent:创业者必看,要把AI当回事
混沌学园· 2025-07-16 09:04
AI Agent 的核心重构 - 智能系统的进化本质是对"认知-行动"闭环的迭代 [1] - 大语言模型(LLM)突破在于破解人类语言符号编码逻辑,赋予机器近似人类的语义推理能力 [2] - 当前LLM如同未开化的原始大脑:拥有海量知识但缺乏主动调用能力,能解析逻辑但无法规划连续行动 [3] 记忆系统 - 将静态"知识存储"转化为动态"认知流程"是智能体的第一重突破 [4] - 短期记忆类似工作内存,负责实时处理任务上下文(如多轮对话记忆) [10][11] - 长期记忆作为"认知基因",通过向量数据库储存用户偏好和业务规则(如电商场景的购物偏好记忆) [12] - 双重记忆机制使智能体具备学习能力,能总结经验优化未来决策(如客户投诉处理方案优化) [14][15] 工具调用能力 - 工具调用是智能体突破认知边界的关键 [17] - 相比RAG技术仅提供数据访问,智能体可将外部信息转化为可处理的符号流(如金融数据API调用) [18][19][20] - 工具多样性决定认知边界广度(数学计算器/图片识别插件等场景应用) [26][27] - 在企业办公场景可整合数据分析工具和文档编辑工具完成复杂任务 [24] 规划模块 - 规划模块破解复杂任务的"认知熵增"(如餐厅预订任务的思辨链拆解) [28] - 在项目管理中可拆解子任务、监控进度并动态调整规划 [30][31][32] - 具备自我反思优化能力,通过复盘提升复杂任务处理效率 [34][35] 商业应用前景 - 正在重塑企业软件底层逻辑,重新定义人机协作边界 [36][37] - 完成从"能思考"(LLM)到"知边界"(RAG)再到"会行动"的完整闭环 [38] - 未来可能在医疗(病历分析)、教育(个性化学习)等领域带来变革 [45] - 混沌AI创新院开发了可落地的AI Agent解决方案,已在3000+实战案例中应用 [51][52]
没有RAG打底,一切都是PPT,RAG作者Douwe Kiela的10个关键教训
虎嗅· 2025-07-01 04:09
文章核心观点 - AI在理解上下文和隐性知识方面存在挑战,导致聊天生硬且准确率不足[1][6][11] - RAG技术应用面临工程难度大、专业化要求高、数据护城河构建等核心问题[15][20][26] - 企业AI项目需关注可观测性而非绝对准确率,建立闭环迭代机制[45][46][52] AI技术瓶颈 - 当前AI能覆盖80%场景但业务要求95%准确率[1] - 大模型擅长有限集任务(如围棋)但难以处理语料残缺的隐性知识[8][9][10] - 专家系统需解决医生诊断中的微表情解读、伦理判断等非结构化问题[11] RAG技术实践 - 工程复杂度远超模型:50个SOP需25-50万字提示词,数据工程占80%工作量[15][17][19] - 垂直领域专业化优于通用AI,如法律Harvey、医疗Open Evidence等案例[20][22] - 数据是核心壁垒:企业非结构化数据构建的飞轮系统形成差异化优势[26][28] 生产环境挑战 - 试点项目70分易实现,但生产需处理千万级文档和数万场景[29][30] - 快速迭代比追求完美更重要,初期barely functional即可[33][34][35] - 竞争焦点转向试错速度与资源,但需平衡成本与差异化[36][37][38] 可观测性方法论 - 审计追踪和归因机制比准确率更重要,需记录错误上下文[45][47][48] - 财务审核案例展示4类错误闭环处理:费用标准、发票合规等[51] - 五步方法论:锁定关键字段、显性化规则、双跑道架构等[52] 行业落地建议 - 优先将业务SOP全量导入Workflow,强化基础数据[56] - 建立审计链闭环,积累可观测数据再优化推理[56] - 盘活非结构化资产,通过数据飞轮拉开竞争差距[56][58]
估值72亿美元,红杉加持的这家AI搜索创企什么来头?
证券时报网· 2025-06-14 11:08
融资与估值 - AI初创公司Glean完成1.5亿美元新一轮融资,估值达72亿美元,相比去年9月的46亿美元估值大幅提升 [2] - 本轮融资由威灵顿资产领投,新增投资者包括Khosla Ventures等,老股东红杉资本等也再次参与 [3] - 公司自2019年成立后已完成六轮融资,去年9月E轮融资2.6亿美元 [3] - 资金将用于加速产品开发、发展合作伙伴生态系统及国际扩张 [3] 产品与技术 - Glean从企业内部搜索起步,核心产品为基于RAG技术的企业AI搜索 [4] - 主要产品包括Glean Search(企业内部文件搜索)、Glean Assistant(自然语言查询业务数据)和Glean Agents(创建AI智能体完成任务) [6] - Glean Agents平台每年支持超过1亿个代理,整合100多个软件平台的实时数据 [6][7] - 技术关键在于与企业系统的深入集成、安全权限框架和复杂知识图谱 [9] 市场表现与战略 - 客户包括戴尔等财富500强企业,年度经常性收入从去年9月的5500万美元增长至1亿美元 [7] - 反映企业AI领域从试点项目转向广泛部署自主代理的趋势 [7] - 公司定位为组织智能的上下文系统,致力于AI访问权大众化 [7] - 商业模式强调从用户实际需求出发,先提供关键功能再扩展AI功能 [10] 行业洞察 - 企业搜索比互联网搜索更难,难点在于数据私有性、权限管理和上下文依赖性 [8][9] - 有效AI应用需要强大的数据基础设施支持,否则无法提供真正价值 [9] - 企业AI迭代需从员工实际工作行为中学习,追踪隐性信号形成良性循环 [9] - AI创业者应从解决具体业务问题出发,而非单纯追求AI技术 [9][10]