Memory

搜索文档
Why memory is key element to the AI revolution
Yahoo Finance· 2025-09-26 15:07
Nat King Cole had a memorable year in 1954. That was when the legendary singer's "Unforgettable" album went platinum, meaning it sold one million copies. The title song was later inducted into the Grammy Hall of Fame in 2000 for its cultural impact. 💵💰Don't miss the move: Subscribe to TheStreet's free daily newsletter 💰💵 Today, artificial intelligence is having a monstrous cultural impact on the world and it promises to play a much bigger role. And memory — particularly the long-term kind — is a key el ...
对谈 Macaron 创始人陈锴杰:RL + Memory 让 Agent 成为用户专属的“哆啦 A 梦”|Best Minds
海外独角兽· 2025-09-11 12:02
AI Agent发展趋势 - ChatGPT加入memory功能后用户粘性显著增强 AI Agent开发进入更成熟阶段 从依赖prompting构建基础Agent转向通过RL和memory开发Agentic能力更强的Agent [2] - AI角色正从写代码、做PPT的生产力助手向真正懂用户的个性化生活伙伴转变 [2] - Multi-agent系统可将Memory Agent和Coding Agent分开训练 实现情商和智商的平衡 [3] - 不同的生活场景叠加会给Agent带来更大的商业价值 [3] Macaron产品定位 - Macaron定位为Personal Agent 专注于个人生活场景而非生产力方向 [13] - 产品核心特点是Memory强和有用性 能帮助用户定制饮食记录、健身日志、心情日记等Sub Agent小工具 [14] - 产品最佳类比是多啦A梦 既是用户朋友又是生活助手 而非单纯工具 [23] - 采用multi-agent架构:高情商的Memory Agent作为用户朋友 高智商的Coding Agent专注工具开发 [24] - 上线一周多已有7000多用户创建10000多个小应用 主要集中生活记录与规划类需求 [51] Memory技术突破 - Memory不是目的而是方法 目标是更好服务用户而非单纯记忆 [15] - 将Memory当作智能能力进行训练 采用Memory强化学习技术 [16] - 在671B大模型级别进行Memory强化学习训练 国内能做的团队不到5个 [33] - 训练中机器Memory与人的Memory需要拟合对齐 用户强调的信息会被着重记录 [17] - 开发all-sync RL技术 将训练时间从按周压缩到按天 约30小时完成一次有意义的RL [39] 训练技术优势 - RL是智能提升下半场的核心 在特定场景可推到智能最上限 [34] - 在700B大模型上进行RL训练才能迈过AGI门槛 200B是分水岭 [34] - all-sync RL通过通信与模型压缩实现训练与推理同步 效率提升数倍 原需512张卡现仅需48张卡 [42] - RL在场景优化中价值显著 从85分往95分提升时RL效果最强烈 [47] 商业化路径 - 生活场景相比工作场景具有更大商业价值 场景叠加能产生更大效果 [60] - 当前采用订阅制商业模式 未来考虑社区分享回报和第三方接入等创新模式 [61] - 不是传统App Store模式 而是生活方式分享平台 创作者无需创作能力只需分享独特生活方式 [27] - Personal Agent赛道类似社交软件格局 不同性格的Agent可并存 [63] 市场竞争格局 - ChatGPT已占据4亿DAU 处于Facebook式的统治地位但定位更偏向工作场景 [64] - Macaron定位生活陪伴场景 与ChatGPT可并存甚至抗衡 [65] - 时间点正好 作为第一批Personal Agent上市团队 有三到六个月窗口期建立用户心智 [65] - 专业场景Agent仍有巨大机会 但单纯工作流式小Agent会被大Agent覆盖 [66] 用户案例 - 用户创建多样化生活应用:高尔夫动作分析、搬家规划、家庭菜谱管理等个性化需求 [55][56][57] - 这些应用太个性化难以在传统应用商店找到解决方案 但完美符合个人需求 [57] - 代码生成成本大幅降低 像自来水一样流动 普通用户也能造出合心意工具 [59] 技术架构 - 摒弃传统数据库系统 设计让所有Sub Agent共享同一份个人数据的架构 [32] - 记忆传递机制复杂 需实现Sub Agent间相互理解与信息反馈 [31] - 训练目标分离:Memory Agent优化更懂用户和聊天服务 Coding Agent优化200个真实案例工具开发 [25]
竞购Chrome的Perplexity,为什么要做AI浏览器?
虎嗅· 2025-08-16 01:06
AI浏览器市场格局 - Perplexity向Alphabet提出345亿美元收购Chrome的邀约 这一出价超过其自身200亿美元估值[1] - OpenAI宣布未来几周发布AI浏览器 将重新思考用户浏览方式并与Operator集成[12] - The Browser Company于6月向Arc用户开放Dia浏览器Beta测试[30] Comet产品特性 - 采用多模型架构 集成OpenAI、Anthropic及自研DeepSeek模型[6] - 侧边栏AI助手可基于当前页面context执行任务 包括跨应用操作和复杂工作流[3][41] - 支持语音指令和个性化设置 等待名单超50万人 目前仅限Perplexity Max订阅用户使用[5][37] 技术实现路径 - 基于真实用户数据构建PPLX Bench基准测试集 避免模型过拟合学术基准[8] - 采用监督微调(SFT)和强化学习(RLHF)优化模型 使用DeepSeek设计的GRPO算法[10] - 动态构建训练数据 结合表现不佳的prompt与通用能力prompt[9] 商业模式创新 - 设计分层收费:免费版提供基础AI功能 付费版支持高价值场景如私有数据处理[16] - 用户愿为省时服务付费 案例显示Comet用5分钟完成原需2-3小时工作并节省200美元[17] - 拒绝广告驱动模式 认为Google将凭借垄断广告网络保持优势[14] 产品定位差异 - Comet侧重任务执行 在搜索摘要、跨应用操作和协作功能上表现突出[38][41][46] - Dia专注于工作流管理 Skill功能支持自定义代码和多标签页协同[46][51] - a16z测评显示Comet在8个维度领先 Dia在2个维度占优 4个维度持平[35] 行业发展趋势 - 浏览器成为AI代理操作系统(Agent OS)的理想平台 可无缝集成现有工作流[23][24] - 记忆(Memory)功能是解锁主动型AI的关键 需在操作系统或浏览器层面实现[57][61] - 预计2025年初将普及能完成简单工作流的代理 复杂研究任务代理将在2-3年内成熟[55][56] 竞争优势构建 - AI浏览器根本优势在于数据本地化处理 服务端无法访问用户数据[27] - Perplexity最关注用户留存率 目标是将Comet设为默认浏览器以提升日请求量[13] - 架构设计实现"按需使用数据但不收集"的平衡 避免数据用于训练或广告[29]
ASM reports second quarter 2025 results
Globenewswire· 2025-07-22 16:00
文章核心观点 - 公司在复杂市场环境下Q2业绩稳健,销售额同比增长,各业务表现有差异,对未来业绩有预期并推进股份回购计划 [1][2] 财务亮点 - 2025年Q2新订单7.02亿欧元,按固定汇率同比降4%,较Q1降10%,主要因先进逻辑/代工订单减少 [1] - 2025年Q2营收8.36亿欧元,按固定汇率同比增23%,较Q1增7%,超指引范围,由代工、存储和逻辑业务驱动 [1] - 2025年Q2毛利润率51.8%,较去年同期改善,较Q1下降但仍健康,得益于产品和客户组合及中国销售贡献 [1] - 2025年Q2调整后运营利润率31.5%,同比增5.7个百分点,环比降0.8个百分点,同比改善因毛利润率提高和去年一次性税务费用 [1] - 报告净收益包含3400万欧元ASM PT股份减值转回,无现金影响 [1] 评论 - 公司CEO称在复杂市场环境下Q2业绩稳健,营收同比和环比均增长,由逻辑/代工业务及备件与服务业务带动 [2] 市场环境 - 二季度市场环境复杂,AI推动先进逻辑/代工和HBM相关DRAM领域产能扩张,其他市场板块仍低迷 [3] 订单情况 - 2025年Q2订单7.02亿欧元,按固定汇率较Q1降10%,主要因先进逻辑/代工订单减少,但该领域潜在趋势健康,预计Q3回升 [4] - 预计2025年Q3先进逻辑/代工订单高于Q2,中国订单降低,整体订单出货比低于1 [8] 全年预期 - 预计2025年下半年营收与上半年相近,Q3营收持平或略降0-5% [7] - 预计2025年按固定汇率营收增长在指引范围10%-20%中点附近,有望跑赢WFE市场 [9] - 2025年关键增长驱动是2nm GAA节点量产,先进逻辑/代工销售预计大增,存储业务贡献预计下降 [10] - 功率/模拟/晶圆板块设备需求低迷,全年无明显销售复苏 [11] - 中国市场上半年表现好于预期,预计2025年中国设备销售达总营收20%多区间高端,下半年低于上半年 [11] 股份回购计划 - 2025年2月宣布的1.5亿欧元股份回购计划于4月30日启动,6月30日完成40%,平均股价486.48欧元 [13] 投资者日 - 公司将于2025年9月23日举办投资者日,CEO、CFO等高管将出席,详情后续公布 [14] 中期财务报告 - 公司发布截至2025年6月30日的六个月中期财务报告,含中期管理董事会报告和简明合并中期财务报表 [15] 季度财报电话会议 - 公司将于2025年7月23日下午3点举办季度财报电话会议和网络直播,需预注册获取接入信息 [19]
重塑记忆架构:LLM正在安装「操作系统」
机器之心· 2025-07-16 04:21
大型语言模型记忆能力与上下文窗口 核心观点 - 现代大型语言模型(LLM)存在内在的「记忆缺陷」,上下文窗口有限导致难以维持长期一致性 [5][6] - 长上下文处理能力与记忆能力密切相关,但上下文窗口不等同于记忆 [11][34] - 新兴记忆管理系统借鉴操作系统架构,实现更持久的LLM记忆 [48][50][54] 上下文窗口演变 - 早期GPT-3仅支持2,048 token,近期模型如Llama 4 Scout可达1,000万token [2][4] - 上下文窗口扩展面临长度泛化、高效注意力、信息保留等挑战 [12][13][14] 记忆分类体系 - **短期记忆**:当前推理可见的历史文本,用于文档问答/多轮对话 [16] - **长期记忆**包含: 1) 事件记忆-记录代理操作历史 [18] 2) 语义记忆-整合外部知识与自我认知 [19] 3) 程序性记忆-系统运行机制与行为边界 [20] 提升记忆能力的技术路径 - **长上下文方法**: 1) RAG实现动态知识检索,减少幻觉 [27][28] 2) 分层摘要处理超长文本但易累积错误 [31] 3) 滑动窗口推理结合次级模型整合 [32] - **记忆系统架构**: 1) 固定记忆池(MemoryLLM)限制容量避免无限增长 [36][37] 2) 非固定记忆池采用键值对/隐藏向量等灵活形式 [41][42] 代表性记忆系统 - MemGPT借鉴操作系统分页机制管理虚拟内存 [50][52] - MemOS采用工业级分层架构融合Memory3技术 [52][54] - MemoryOS实现三级分层存储体系(实时/主题/个性化) [54][56] - MIRIX首创多模态多智能体记忆系统 [58][63] - Larimar受人类情景记忆启发构建分层框架 [60][64]
New Speculative Novel The Version Who Stayed by Krispy Launches on Amazon — A Hauntingly Beautiful Exploration of Identity, Memory, and Emotional Truth
GlobeNewswire News Room· 2025-04-28 15:04
书籍发布 - Krispy发布首部小说《The Version Who Stayed》作为系列《The Mirror Archive》的开篇作品 [1] - 小说主角Auren Solven将在Krispy的多部作品中作为叙事核心出现 [1] - 书籍主题聚焦身份认同、悔恨与情感真相的探讨 [1] 内容概述 - 故事设定在现实与超现实交织的世界中,主角通过神秘镜子进入未做关键选择的平行人生 [2][3] - 小说避免对平行世界机制的技术解释,着重刻画情感后果与自我接纳 [4] - 核心冲突体现为"留下"的代价:在替代人生中,快乐与不安并存,选择成为负担而非指引 [3] 创作理念 - 作者主张"静默时刻塑造人性"的叙事哲学,强调非戏剧化的内心转变 [5] - 作品通过主角持续面对不适感的历程,重新定义"柔软"为一种反抗形式 [8] - 系列将延续对爱、身份认同、韧性等主题的探索,Auren Solven作为贯穿性角色 [8] 市场反响 - 早期读者评价该书为"年度最具情感智慧的小说",引发强烈共鸣 [6] - 评论特别称赞其"灵魂镜像"特质与抒情散文风格,产生持久心理影响 [6] - 非科幻读者认为作品"温和而真实",开创了人性化 speculative fiction 的新路径 [7] 商业动态 - 作品通过亚马逊独家发行,标记为当代文学领域新声音的崛起 [9] - 系列后续作品已规划,官网与作者页面同步开通 [10] - 联系方式显示作者采用单名制品牌策略,强化辨识度 [11]
Deep Research类产品深度测评:下一个大模型产品跃迁点到来了吗?
Founder Park· 2025-04-23 12:37
产品定义与特点 - Deep Research 产品是以大模型能力为基础、集合检索与报告生成的端到端系统,能迭代搜索和分析信息并生成详细报告[4] - 与传统 LLM Search 产品相比,Deep Research 是迈向 Agent 产品雏形的跃迁,可能成为经典产品形态[6] 产品测评情况 - 测评围绕 Tool Use、Instruction Following、报告输出能力对五家 Deep Research 产品评估,Memory 因自动联网检索难以有效评估[10] Tool Use 能力 - 在线检索中 OpenAI 表现出色,在冷门电影和最新书籍检索任务中唯一成功定位正确内容[20][31] - 数据分析任务里五家产品均未成功计算出正确数值,OpenAI 和 Manus 能力成熟度较高但有偏差[35][47] - 编程任务中 Manus 表现最佳,提供完整项目文件且网页功能和美观性达标,五家产品输出分层明显[57] Instruction Following 能力 - 文献分析任务中五家产品均无法完全遵循指令,存在“选择性执行”和“对牛弹琴”情况[72] - 旅游路线设计采用六维评估体系,Google、Manus、OpenAI 得分接近满分但交通可行性有不足[107][118][123][130] 报告输出能力 - 基于商业研报场景评估,各产品能力排序为 OpenAI > Manus > PPLX = xAI >> Google,OpenAI 兼顾深度与广度[136] 总结与展望 - Deep Research 产品打破外部工具调度和需求执行平均线,但消除短板、触及天花板需市场耐心,Agent 产品下一级阶梯或更快降临[162][164]