RAG

搜索文档
对谈 Memories AI 创始人 Shawn: 给 AI 做一套“视觉海马体”|Best Minds
海外独角兽· 2025-08-13 12:03
文章核心观点 - Memoriesai致力于构建基础性视觉记忆层,目标是成为所有AI的"海马体",通过LVMM(大型视觉记忆模型)实现对无限量视频数据的压缩、索引和查询 [2][8][9] - 当前AI的记忆本质是"上下文工程",而真正的类人记忆应是视觉化的,视觉记忆与文本记忆在数据特性(数据量、信噪比)上存在根本差异 [13][14][18] - 构建PB级基础设施能力是打造全球视觉记忆的护城河,公司已建立亿级视频数据库并实现规模化运行 [28][29][30] - 视觉记忆技术将赋能多模态AI助手和人形机器人,成为实现高度个性化服务的关键组件 [21][39][40] Memoriesai的视觉记忆技术与多模态AI应用路径 - 公司定位为B2B基础设施提供商,通过LVMM系统解决视频数据特有的海量存储(单日视频数据超5GB)和低信噪比问题 [8][20][22] - 技术路径区别于text-to-video生成类公司,专注于video-to-text理解领域,解决B2B场景的长链路需求 [12][17] - 视觉记忆系统包含解压层、聚合模块和服务层,采用类脑架构模拟人类记忆的压缩、索引和检索机制 [27][28] LVMM的人类记忆模拟机制 - 系统设计受人类记忆类型(语义/程序性/情景记忆)启发,但尚未实现人类水平的连续学习和记忆重构能力 [25][26] - 关键技术突破包括:基于范式的token聚合、视觉检索模型(VRM)和亿级数据库的实时问答能力 [27][29] - 当前系统在信息重要性判断(retrieval & reranking)环节已接近人脑机制,但抽象能力仍存在差距 [26][27] 大规模视频记忆的基础设施与VRM技术路径 - 采用非端到端架构,通过分布式数据库处理增长性数据,技术路径区别于Gemini等有上下文限制的模型 [28][29] - VRM技术超越RAG(检索增强生成)框架,直接对视觉数据进行token化处理,要求更高的基础设施能力 [29][30] - 团队核心成员来自Meta Ads Team,具备处理亿级数据库的工程经验,实现从演示到规模化运行的跨越 [30] 视觉记忆技术的多行业应用 - 安防领域:实现实时行为检测,应用于商场人流量统计、餐厅翻台率等B2B场景,覆盖零售/楼宇/停车场等 [34][35] - 媒体领域:为短剧提供毫秒级人物信息分析、自动剧本生成和视频再利用解决方案,提升内容生产效率 [35][36] - 视频营销:建立TikTok视频索引库(超100万条),提供创意引擎和网红达人搜索服务,优化内容策略 [35][41] 视觉记忆技术的隐私合规与未来应用方向 - 通过SOC 2 Type 1/2和GDPR合规认证,建立受监管的数据处理体系 [38] - 未来最大应用场景为AI助手和类人机器人,通过视觉记忆实现人机情感连接和个性化服务 [39][40] - 现阶段聚焦B2B基础设施赋能,长期可能通过开源或示范应用推动生态建设 [40][41]
很严重了,大家别轻易离职。。
猿大侠· 2025-08-12 04:11
AI大模型对程序员职业发展的影响 - 当前技术圈普遍存在"AI焦虑",大模型技术频繁被讨论,程序员面临是否掌握AI能力的抉择 [1] - 仅掌握传统CRUD开发技能的程序员市场价值下降,而将大模型融入开发流程(如Prompt设计、RAG、微调)的技术人员更具竞争力 [2] - 企业普遍将AI应用落地作为业务重点,掌握大模型能力的技术人才薪资涨幅超过50%,且获得更多职业机会 [2] AI大模型技术应用趋势 - RAG技术适用于需要持续更新知识的场景,无需重新训练大模型即可实现特定领域应用 [10] - Function Call技术通过集成外部工具增强大模型处理复杂任务的能力,提升交互实用性 [10] - Agent技术是特定场景的AI解决方案,智能客服成为企业最先尝试的Agent项目 [10] - 技术组合应用示例:检索资料需Agent+RAG,整合回复需Agent+Prompt+RAG [12] AI大模型人才培养方案 - 行业推出"AI大模型—就业实战营",通过2天直播课程覆盖技术原理、实战项目复现和职业规划 [2][5] - 课程内容包含5大核心步骤:原理掌握→工具应用→开发实操→信息链接→实战演练 [10] - 实战案例包括金融行业"支小助"、知乎直答等热门产品,逐行解析代码实现全流程复现 [10] - 提供大厂内推资源,简历直达面试官,已有学员通过该体系实现职业跃迁 [18][20] 行业人才需求特征 - 大厂招聘聚焦大模型技术,岗位需求涵盖技术迭代方法、发展空间等维度 [18] - 具备AI能力可帮助技术人员构建壁垒,避免35岁职业危机,延长20年职业生命周期 [14] - 课程名额限制100人,反映市场对AI人才培养的高需求与稀缺性 [5][14]
最近,程序员的招聘市场已经疯掉了。。
菜鸟教程· 2025-08-12 03:30
AI技术对程序员职业的影响 - 当前技术圈普遍存在"AI焦虑","大模型"和"替代程序员"成为高频话题[1] - 传统CRUD程序员价值下降,掌握AI大模型能力的程序员薪资涨幅超过50%且更具职场竞争力[2][3] - 企业已将业务重点转向AI应用落地,具备大模型能力的技术人才更受招聘市场青睐[3] AI大模型技术应用 - RAG技术适用于需要持续更新知识的场景,无需重新训练大模型即可实现特定领域应用[12] - Function Call通过集成外部工具增强大模型处理复杂任务的能力[12] - Agent技术是特定场景的AI解决方案,智能客服成为企业级应用的典型代表[12] AI大模型就业实战营内容 - 课程包含2天直播,覆盖技术原理+企业级实战项目复现+职业规划三大模块[3][6] - 教学案例包括金融行业"支小助"和知乎直答等热门产品的技术架构拆解[12] - 学员可获得大厂内推/面试资料/知识图谱等求职资源[8][18] 课程技术深度 - 解析从GPT到开源模型的底层原理与技术架构[9][10] - 教授5大核心开发步骤:原理掌握→工具应用→产品开发→信息链接→实战演练[12] - 重点演示RAG和Fine-tuning技术在大语言模型中的实际应用[9] 职业发展支持 - 提供大模型招聘行情分析,包括岗位需求/薪资水平/技术迭代方法等[20] - 持续提供企业直聘机会,简历可直达大厂面试官[20] - 课程由AI领域专家研发,包含商业化项目经验分享[18] 课程推广信息 - 限时免费开放100个名额,24小时后关闭报名通道[6][16] - 目标人群包括希望参与前沿项目/构建技术壁垒/规避职业风险的开发者[16] - 强调AI时代先发优势的重要性,建议程序员尽早掌握相关技术[22]
无人谈论的AI堆栈:数据采集作为基础设施
36氪· 2025-08-07 07:23
人工智能数据基础设施的重要性 - 人工智能行业正从追求模型规模转向重视数据质量与新鲜度,数据成为性能提升的关键因素而非单纯增加参数数量[1] - 模型规模翻倍带来的边际收益成本高昂且环境不可持续,电力与水资源消耗难以规模化[1] - 实时、高质量数据可显著提升AI产品准确性,Salesforce以80亿美元收购Informatica以增强Agentforce平台的实时数据处理能力[2][5] 高质量数据的定义与特征 - 领域特定性:数据需精准匹配应用场景,如零售定价AI需竞争对手数据而非无关噪声[4] - 持续更新:数据需反映最新动态,过时信息会导致模型失效[4] - 结构化与去重:干净、一致的数据能减少计算浪费并增强信号强度[5] - 实时可操作性:价格变动、新闻等实时数据需通过合规方式规模化采集[5] 数据基础设施的行业实践 - IBM以23亿美元收购StreamSets,整合混合数据源为Watsonx提供实时信号,实现10倍效能提升[5] - Dataweps采用Bright Data的API生态系统为电商客户收集实时定价数据,支持AI驱动的动态定价系统[6] - Bright Data提供代理优先的数据基础设施,涵盖自动化工具与合规性支持,成为AI系统基础组件[6][16] 数据采集技术的演进 - 现代AI数据栈需支持动态UI、验证码处理及多模态数据(PDF、视频等)采集[14][21] - 采集管道需具备定时更新、增量刷新及TTL感知路由能力,以维持数据新鲜度[14][20] - 事件驱动架构(如Kafka)成为处理时间敏感数据的核心,替代传统静态数据湖[21] 数据驱动的竞争壁垒 - 未来AI系统竞争力取决于上下文管理能力,实时数据与动态记忆比模型规模更重要[23][24] - 将数据采集视为基础设施的团队能以更低成本实现更快迭代,形成长期护城河[25] - 开源模型(如Gemma 3)在特定领域超越GPT-4的案例显示精选数据对检索系统的决定性作用[16]
明显感觉程序员的面试已经变了。。
猿大侠· 2025-07-23 03:25
行业趋势与职业发展 - 传统技术岗位(如Java、C++、前端)从业者面临AI大模型技术冲击,需将现有技术与大模型结合以提升竞争力 [1] - AI应用落地是未来趋势,大模型方向成为职业升级和薪资提升的关键机遇 [1] - 行业出现裁员、降薪现象,但掌握AI能力的工程师更受市场青睐 [1] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖大模型微调、RAG、AI Agent、Transformer架构等核心技术 [9][11] - 五大学习模块:基础→工具→进阶→竞赛→实战,构建完整学习路径 [9] - 案例拆解包括金融行业支小助、知乎直答等商业化应用,提供一手数据资源和项目复现机会 [16] 技术应用与实战 - 聚焦主流大模型(如DeepSeek、Qwen)的微调技术,优化特定场景(制造、医药、金融)的模型性能 [11] - RAG技术应用于垂类场景(法律文档分析、医疗诊断辅助、金融报告生成),提升信息提取精准度 [11] - AI Agent开发涵盖多任务协同与自主决策,如制造业设备故障诊断、金融投资分析等场景 [11] 学员成果与就业支持 - 课程已服务20000+学员,部分学员通过内推获得高薪offer [11][20] - 提供大厂内推+直聘权益,简历直达面试官,加速职业跃迁 [15][20] - 完课赠送《大模型应用案例集》《AI商业落地白皮书》,助力技术迭代与职业发展 [1][20] 课程附加价值 - AI领域大佬授课,揭秘大厂真实案例(如知乎直答底层原理)并分享商业化项目经验 [18] - 剖析大模型招聘行情(岗位、薪资、技术迭代),规划职业发展路径 [20] - 限时免费预约,名额仅限100-200人,强调紧迫性以吸引潜在学员 [13][20]
最近,程序员的招聘市场已经疯掉了。。。
程序员的那些事· 2025-07-22 03:48
行业趋势与职业发展 - 传统Java、C++、前端等技术开发者面临职业转型压力,大模型技术兴起引发行业焦虑 [1] - AI与传统技术结合成为关键趋势,掌握AI能力的Java工程师更具市场竞争力 [1] - 大模型方向是实现职业升级和薪资提升的重要机遇,AI应用落地是未来趋势 [1] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖从0到1的AI应用开发全流程 [1] - 五大模块构建完整学习路径:基础→工具→进阶→竞赛→实战 [8] - 核心技术包括RAG、AI Agent、Transformer架构、Fine-tuning等 [8] - 热门项目拆解涵盖金融行业支小助、知乎直答等商业化案例 [15] 技术应用与实战 - 主流大模型微调技术(如DeepSeek、Qwen)针对制造、医药、金融等领域优化 [10] - RAG技术应用于法律文档分析、医疗诊断辅助、金融报告生成等垂类场景 [10] - AI Agent开发实现多任务协同与自主决策,案例包括制造业故障诊断、金融投资分析 [10] 学员成果与资源 - 课程已开班58期,服务20000+学员,多人获得高薪offer [10] - 提供一手数据资源和项目资料,学员可复现全流程积累实战经验 [15] - 完课赠送《大模型应用案例集》《AI商业落地白皮书》等资料 [19] 职业支持与机会 - 行业大佬深度解析大厂招聘行情、薪资水平及技术迭代方向 [17][19] - 提供企业内推+直聘权益,简历直达大厂面试官 [14][19] - 课程限时免费预约,名额仅限200人,24小时后关闭通道 [12][19]
就业市场跌爆了。。
菜鸟教程· 2025-07-21 03:09
行业趋势与职业发展 - 传统技术岗位(如Java、C++、前端等)从业者因大模型技术兴起(如GPT、DeepSeek)面临职业转型压力,需将现有技术与AI结合以提升竞争力[1][2] - AI应用落地是未来趋势,掌握大模型技术的开发者更易实现职业升级与薪资提升[3] - 行业普遍存在裁员、降薪现象,但大模型方向仍被视为职业发展的关键机遇[3] 课程内容与结构 - 课程采用「代码逐行解构+实战项目操练」双轨模式,覆盖从0到1的AI应用开发流程[4] - 五大模块包括基础、工具、进阶、竞赛、实战,构建完整学习路径[7] - 核心技术涵盖RAG、AI Agent、Transformer架构、Fine-tuning等,并聚焦主流模型(如DeepSeek、Qwen)的微调技术[7][9] - 实战项目涉及垂类场景优化(如金融、医疗、制造业),提升任务准确性与效率[9] 课程附加价值 - 提供大厂真实案例拆解(如知乎直答、金融行业支小助),学员可复现项目并积累实战经验[14] - 赠送《大模型应用案例集》《AI商业落地白皮书》等资源,助力技术商业化应用[4][14] - 包含内推机会与直聘权益,简历直达大厂面试官,已帮助部分学员实现高薪offer[16][18] 市场反馈与招生 - 课程已开班58期,服务20000+学员,口碑良好且部分学员成功获得高薪岗位[11] - 本期招生限200人(后调整为100人),24小时后关闭报名通道,强调紧迫性[13][18] 目标人群与诉求 - 面向希望参与前沿项目、构建技术壁垒、避开裁员风险或延长职业生命周期的开发者[13] - 课程解决技术迭代、职业规划等需求,帮助学员从竞争者中脱颖而出[13][18]
@所有开发者:Agent变现,阿里云百炼联合支付宝首创「AI打赏」!Agent Store全新发布
量子位· 2025-06-27 04:40
行业趋势 - 2025年成为Agent元年,AI Agent正经历从"玩具"到"工具"的关键转折[1] - 行业面临开发周期长、商业价值验证难等挑战,大量项目卡在POC阶段[2] 阿里云百炼核心升级 - 推出业内首个"Agent打赏"功能,用户可直接为开发者打赏,金额直达AI钱包并可提现[3][4][5][23][24][26][27] - 正式上线Agent Store,提供覆盖各行各业的100+个可一键复制的Agent模板[7][8][10][18][19] - 升级企业级RAG能力至千万级文档处理水平,支持多模态文件统一索引并开源V-RAG方案[29][30][33][34][35] - 升级MCP服务支持KMS加密,免费提供50个加密Key,实现统一鉴权和计量计费[36][37][38] - 发布OpenAPI MCP Server,支持大模型与2W+OpenAPI互联互通[39] 技术能力突破 - 多模态交互开发套件支持低延迟(1.5秒)全双工对话、复杂任务自主规划推理等能力[45][46] - 提供可视化配置界面,开发者可像拼乐高一样自由组合功能[48][49] - 支持后付费或买断License等灵活计费方式[50] 商业化进展 - 已有超50个企业级MCP上架,22000+用户开通服务,构建3万+MCP Agent[41] - 落地案例包括听力熊学习机(扩展50+交互技能)、浙一麻醉评估助手、牧原智能兽医问诊系统等[42][28]
提示词工程、RAG之后,LangChain:上下文工程开始火了!
机器之心· 2025-06-25 04:06
上下文工程概述 - 上下文工程是构建动态系统以合适格式提供准确信息和工具,使LLM能合理完成任务[5][9] - 该概念并非全新,近两年已被智能体构建者广泛关注[2] - 传统提示工程侧重设计提示语,但应用复杂度提升后单纯依赖提示已无法满足需求[3] 上下文工程核心特征 - 系统性:需整合开发者、用户、交互记录等多来源数据[10] - 动态性:多数上下文动态生成,提示逻辑需随动调整[11] - 准确性:缺乏正确上下文是智能体表现不佳的主因[12] - 工具适配:需提供查找信息或执行行动的工具[12] - 格式规范:工具输入参数的结构化程度影响沟通效率[13] 重要性分析 - LLM出错主因从模型能力不足转向上下文传递不当[15] - 现代AI系统需完整结构化上下文而非巧妙措辞[17] - 正成为AI工程师最关键的发展技能[7] 与提示工程差异 - 提示工程是上下文工程的子集[17] - 前者处理静态模板,后者处理动态数据集[17] - 核心指令设计仍是两者的共同重点[18] 实施要素 - 工具使用:外部信息需格式化为LLM易理解形式[20] - 记忆系统:需建立短期对话摘要和长期用户偏好记忆[20] - 检索机制:动态获取信息并插入提示[20] - 格式优化:数据传递方式直接影响模型响应质量[19]
OpenAI o3-pro发布,也许当前的RAG过时了
虎嗅· 2025-06-16 06:33
OpenAI o3-pro 发布与定价调整 - OpenAI 发布 o3-pro 模型,号称推理能力最强 [1] - 同时宣布 o3 价格下调 80%,降至与 GPT-4o 相当水平 [1] - 输入 token 从每百万 10 美元降至约 2 美元 [1] - 输出 token 从每百万 40 美元降至约 8 美元 [1] - 10000 字提示词成本从 0.72 元降至 0.144 元 [2] o3-pro 技术规格与影响 - 上下文窗口大小达 200k,最大输出 token 数 100k [3] - 可输入约 15 万字提示词,相当于一篇短篇小说长度 [3] - 更便宜资费和更强上下文利好 Agent 架构记忆问题 [3] - 为 RAG 技术提供更长提示词上下文支持 [3] RAG 技术演进 基础 RAG - 工程层面包含三个关键步骤:向量检索→上下文拼接→一次性生成 [8] - 优势在于快、易落地 [7] - 短板包括检索策略死板、推理链条单薄 [7] - 典型问题包括检索覆盖不足、回答缺少链条、可观测性差 [9] 高级 RAG - 在基础 RAG 上增加工程控制策略 [10] - 采用多通道找资料+智能排序+过程可追踪的方案 [12] - 可同时跑向量、关键词、结构化数据等多路召回 [13] - 系统自动记录召回率、覆盖率等指标 [14] - 在医疗问答场景使召回率从 62%提升至 93% [12] - 在券商数据分析场景使报告生成时间从 80 秒缩短至 18 秒 [12] GraphRAG - 将所有书的知识点串成关系网,实现网状路径跳跃推理 [17] - 把"检索增强"升级到"关系增强" [18] - 检索颗粒度从文本块升级到实体+关系+路径 [18] - 典型能力提升包括多跳推理、事实连贯性、减少幻觉 [18] 推理型 RAG - 融合思维链推理与检索动态调度 [22] - 面向复杂思考+自主决策场景 [22] - 包含思维链增强、自反思机制、多步骤分解推理等能力 [24] - 在医疗诊断案例中实现可追踪的自纠错闭环 [30] 行业发展趋势 - 模型基础能力持续增强 [33] - 上下文窗口从 4k-8k 发展到 128k、200k 甚至更大 [34][37] - 新一代 RAG 可能演进方向: - 窗口够大时整篇输入,不够再按结构化单元分 [40] - 检索层统一处理多模态数据 [40] - 检索-推理-验证全程留痕 [40] - 未来重点将转向丰富多模态数据的无缝衔接,而非切割细节优化 [41]