Workflow
MIRIX
icon
搜索文档
那天,AI大模型想起了,被「失忆」所束缚的枷锁
机器之心· 2025-08-31 05:33
大模型记忆技术发展现状 - 谷歌Gemini具备跨越多次对话的长期记忆能力,可从用户交流中提炼关键细节和偏好并主动调用[1] - OpenAI的ChatGPT早在2024年2月就已上线记忆功能,使用频率越多记忆力越好,GPT-6的核心改进也将聚焦记忆能力[3] - Anthropic的Claude能记住之前对话,允许用户无缝继续项目并参考之前讨论[3] - xAI的Grok在4月份实现多轮对话记忆,且记忆内容对用户透明可见并可选择遗忘[6] - 字节跳动联合浙大和上交发布多模态智能体M3-Agent,将记忆能力扩展到视频、音频等多模态数据[10] 记忆技术实现方式分类 - 上下文内记忆:将信息放入模型上下文窗口的短期记忆方式,受Transformer有限上下文窗口长度限制[17][18][19] - 外部记忆:通过检索增强生成(RAG)技术将信息存储在外部数据库的长期记忆方式,支持海量信息存储且无需重新训练模型[22][23] - 参数化记忆:将信息直接编码进大模型自身参数的深层"内化记忆"方式,检索速度极快但更新成本高昂[24][29][30] - 类人的分层式记忆:受认知科学启发设计的类似人脑记忆架构,分为记录具体事件的情景记忆和存储一般事实的语义记忆[31][35] 主要公司的记忆技术实现 - ChatGPT记忆功能:将用户记忆以结构化片段保存于服务器端,通过提示工程方式在生成回复时自动注入模型参考语境[42][44] - Claude记忆机制:只在用户要求时检索和引用过去聊天记录,不建立用户档案[44] - Gemini记忆功能:支持用户直接录入想要记住的内容[45] - MemGPT系统:使用专门记忆LLM智能体管理工作LLM上下文窗口,受传统操作系统分层内存系统启发[49][52] 记忆操作系统创新 - MemOS系统:将记忆看作与算力同等重要的系统资源,通过标准化MemCube记忆单元统一调度明文、激活状态和参数记忆[53][55] - MemoryOS系统:融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块[55] - MIRIX系统:将记忆细分为核心记忆、情景记忆、语义记忆、程序记忆、资源记忆、知识金库六类进行处理[57][59] 记忆结构化与多模态进展 - G-Memory系统:设计三层图式基于模型(洞察图、查询图和交互图),支持定制化记忆视角与跨智能体语义映射[66][67][71] - 多模态记忆突破:Memories.ai提出"大视觉记忆模型"(LVMM),能持续捕获、存储和结构化海量视觉数据[70] - M3-Agent架构:通过强化学习驱动的多轮推理与迭代记忆检索,实现无限信息处理和世界知识构建[70][75][78] 原生记忆能力探索 - Meta记忆层概念:通过键-值对检索机制实现关联存储与调用,记忆容量可达1280亿参数级别[77][80][81] - Branch-Train-MiX方法:通过创建多个专家模型在不同数据子集上训练,然后合并为MoE模块实现参数化记忆[83][92] - Yan 2.0 Preview模型:基于非Transformer架构,通过可微分"神经网络记忆单元"实现记忆的存储、检索和遗忘[85][87] 技术发展趋势 - 从功能模拟到结构仿生:向多模态与综合记忆系统演进,整合不同类型记忆模块形成多层次自适应综合记忆中枢[97][98][106] - 从孤立个体到记忆互联:智能体间实现共享记忆与协作,催生集体智能但面临信息不对称和集体隐私保护挑战[100][101] - 终极目标自动演化:实现记忆的自动演化,智能体能够根据环境互动自主学习管理和优化记忆,实现无需人工干预的终身学习[101][103]
全球首次,「AI记忆」开源落地,MIRIX同步上线APP
36氪· 2025-07-30 03:32
产品发布 - 加利福尼亚大学圣迭戈分校与纽约大学研究人员联合推出全球首个多模态、多智能体AI记忆系统MIRIX 并开源[1][2] - 团队同步上线Mac桌面端应用程序 支持用户下载构建专属AI个人助理[1][4] 技术架构 - 突破传统长短期记忆划分 首创六模块记忆系统:核心记忆(容量超90%自动重写)、情景记忆(按时间戳排序)、语义记忆(存储抽象概念)、程序记忆(任务流程指南)、资源记忆(文档截图等资源)、知识金库(加密存储敏感信息)[14][16][17] - 采用多智能体工作流:1个元记忆管理者与6个子记忆管理器协同 实现记忆更新与检索双流程[18][19][22][23] 性能表现 - 在ScreenshotVQA多模态理解基准测试中:准确率较传统RAG方法提升35% 存储开销降低99.9%;较长文本方法性能提升410% 存储降低93.3%[4][26] - 具体数据对比:MIRIX整体准确率59.5% 存储仅15.89MB;RAG方法准确率44.1% 存储达15.07GB;长文本方法准确率11.66% 存储236.7MB[27] - 在LOCOMO长对话任务中以85.4%准确率创SOTA记录 显著超越Mem0(66.88%)、Zep(79.09%)等基线模型[4][28][30] 应用功能 - 自动记录用户电子生活点滴 通过可视化树状结构管理多模态记忆[8][9] - 支持智能对话:可回答历史活动相关问题 辅助完成如工作申请等需历史信息的任务[11][12] - 本地SQLite存储保障用户隐私 无需云端数据传输[31] 行业意义 - 标志大模型从1.0时代即问即答、2.0时代RAG补丁 进入3.0时代长期记忆驱动的新阶段[7] - 实现从"即时对话生成"到"长期记忆驱动智能心智"的技术跃迁[31]
腾讯研究院AI速递 20250730
腾讯研究院· 2025-07-29 16:01
Claude新增周流量限制条款 - Anthropic宣布8月底对Claude Pro和Max用户推出每周使用限制,影响将少于5%的订阅用户 [1] - 部分用户24小时不间断运行Claude Code,极端案例中一位用户200美元套餐实际消耗数万美元 [1] - 用户普遍反映缺乏使用量透明度,无法查看已消耗token和剩余配额,许多人开始寻找替代产品 [1] 微软AI Edge浏览器 - Edge浏览器推出"Copilot模式",核心功能是跨标签页情境感知,可同时读取分析所有打开的页面 [2] - 全新界面使用简洁统一输入框,自动理解用户意图,支持语音控制和主题式旅程功能 [2] - 该功能现已在所有Copilot市场限时免费开放,未来可能与Copilot订阅服务捆绑销售,浏览器或不再是免费软件 [2] 无问芯穹发布全规模AI效能跃升方案 - 无问芯穹发布三大核心产品:无穹AI云、无界智算平台与无垠终端智能 [3] - 目前已覆盖26个省市53个核心数据中心,整合超15种主流芯片架构,总算力规模超25000P [3] - 端侧创新包括全球首款端侧本征模型"无穹天权",实现云级21B参数智能水平的同时内存占用控制在7B规模 [3] 阶跃AI推出研究小助手 - 阶跃深研能在十分钟内自主完成复杂研究任务,生成深度专业报告,在xbench-DeepSearch评测中取得70%超高通过率 [4] - 基于强化学习和多智能体架构研发,具备自主思考、推理、动态工具调用能力 [5] - 提供高级搜索功能,包括聚焦搜索、自选信源和知识库,支持导出多种格式 [5] 京东升级大模型品牌为JoyAI - 京东推出JoyAgent智能体平台、JoyInside附身智能和数字人等多场景解决方案 [6] - JoyAgent是首个100%开源的企业级智能体,收获超2000颗GitHub星标 [6] - JoyAI针对不同场景的产品均已实现落地应用,数字人服务超2万品牌,交互型AI潮玩Fuzozo芙崽首发预售售罄 [6] 多模态、多智能体AI记忆系统MIRIX - 加州大学圣迭戈分校和纽约大学研究者推出并开源MIRIX,全球首个多模态、多智能体AI记忆系统 [7] - 系统将记忆分为六个模块:核心、情景、语义、程序、资源和知识金库 [7] - MIRIX在ScreenshotVQA测试中准确率比传统RAG高35%,存储减少99.9%,在LOCOMO长对话任务中达85.4%创新纪录 [7] 空间天气链式AI预报模型 - 国家卫星气象中心与南昌大学、华为联合发布"风宇"模型,全球首个全链式空间天气人工智能预报模型 [8] - 模型首创链式训练结构,包括太阳风"煦风"、地球磁场"天磁"和地球电离层"电穹"三大区域模型 [8] - "风宇"对全球电子密度总含量预测误差控制在10%左右,已申请11项国家发明专利 [8] 上海AI lab开源科学多模态大模型 - 上海人工智能实验室发布并开源"书生"科学多模态大模型Intern-S1,多模态能力全球开源第一 [9] - 模型首创"跨模态科学解析引擎",可精准解读化学分子式、蛋白质结构、地震波信号等复杂科学数据 [9] - 研发团队提出通专融合的科学数据合成方法,创造性地降低了强化学习训练成本 [9] a16z合伙人观点 - AI大模型竞争格局将如云计算大战一样走向寡头垄断,将形成品牌效应新格局 [10] - 应用层已无技术护城河,理性商业决策是"牺牲利润换取分销",价值将在模型基础设施和垂直领域深耕中形成 [10] - AI并非将普通开发者变成超级工程师,而是"让10倍工程师变成2倍",使编程回归本质创造 [10] 腾讯具身智能开放平台 - 腾讯发布具身智能开放平台Tairos"钛螺丝",旨在为机器人本体开发商与应用开发商补齐软件能力 [11] - 平台基于SLAP³技术体系,提供规划大模型、多模态感知大模型和感知-行动联合大模型三大核心能力 [11] - 具身智能未来发展五大趋势(IDEAS):虚实集成世界、技术门槛降低、智能演进、智能体化和感知多模态化 [11]
腾讯研究院AI速递 20250716
腾讯研究院· 2025-07-15 15:09
英伟达恢复对华销售H20 AI芯片 - 美国政府授予英伟达许可恢复向中国销售H20 AI芯片[1] - 政策转变源于黄仁勋与特朗普会面强调公司对美国就业和AI领先地位的支持[1] - 2025财年Q1收入达26044亿美元同比增262% 数据中心业务226亿美元为核心增长点[1] Meta超算集群建设规划 - 2026年投运1GW「Prometheus」AI集群 算力相当于核电站或百万人口城市用电量[2] - 2027年「Hyperion」计划扩容至5GW 占地面积对标曼哈顿 配套自建天然气电厂[2] - 算力规模远超OpenAI星际之门(300-500MW)和马斯克Colossus项目(250MW)[2] 马斯克Grok 4智能伴侣功能 - 推出动漫角色Ani(含NSFW模式)和卡通熊猫Rudy 具备3D动画与语音交互能力[3] - 中文发音仍显机械 交互动作待优化 功能处于早期阶段[3] - 新增提示词生成HTML5游戏功能 可自主整合3D模型与纹理[3] 亚马逊Kiro IDE工具发布 - 提供氛围编码与规划双模式 通过规约(Specs)和挂钩(Hooks)实现规格驱动开发[4] - 自动转化需求为技术设计图 文档代码同步 挂钩自动化检查流程[5] - Anthropic同步更新Claude Code支持Windows 可替换为Kimi K2模型[5] 谷歌Gemini嵌入模型突破 - MTEB评测68.37分超越OpenAI(5893分) 价格仅015美元/百万token[6] - 32层Transformer架构 采用MRL技术支持多维嵌入输出[6] - 两阶段训练(预微调+精调) 在检索/分类/聚类任务表现优异[6] 秘塔AI深度研究功能 - 可视化问题链展示搜索/思考/决策过程 支持互动网页与图表生成[7] - 用户可管理来源偏好(屏蔽/优先网站) 免费版每日100搜索额度(单次消耗20-30)[7] - 年费会员每日500次 研究质量对标OpenAI DeepResearch[7] UCSD&NYU多模态记忆系统 - MIRIX在ScreenshotVQA基准准确率比RAG高35% 内存占用减少999%[8] - 设计6类人记忆系统(核心/情景/语义等) 通过多智能体协作构建认知基础[8] - 已开源并发布Mac应用 支持文本/截图/对话日志多模态输入 SQLite本地存储[8] 微软Orbformer量子化学模型 - 解决多参考体系精度与效率矛盾 计算成本降低两个数量级[10] - 三模块架构: 原子核MPNN/动态轨道生成器/电子Transformer[10] - 键解离等测试达化学精度(1 kcal/mol) 实现分子间计算共享[10] OpenAI工程师谈编程趋势 - 未来程序员价值80-90%来自结构化沟通 代码仅占10-20%[12] - 规约(Specification)比代码更重要 可完整捕捉意图与价值观[12] - 模型规约实践案例: Markdown文档版本化管理 解决GPT-4o谄媚问题[12]