Workflow
AGI
icon
搜索文档
从黑箱到显微镜:大模型可解释性的现状与未来
腾讯研究院· 2025-06-17 09:14
大模型可解释性的核心观点 - 大模型在编程、科学推理和复杂问题解决等领域展现出"博士级"专业能力,但模型内部机制高度复杂难以解释,被称为"黑箱"[1] - 大模型可解释性是指系统能够以人类可理解的方式阐释其决策过程和输出结果的能力,包括识别关键输入特征、揭示推理路径和解释行为因果关系[3] - 生成式AI的可解释性问题尤其复杂,因为其内部机制属于"涌现"现象,而非直接设计,类似于培育生物的过程[4] - 大模型发展速度远超可解释性研究进展,行业必须加快脚步确保可解释性研究能跟上AI发展步伐[1] 可解释性的关键价值 - 防范AI系统价值偏离与不良行为:可解释性可帮助检测模型是否存在欺骗、权力寻求等异常行为[4][5] - 推动模型调试改进:通过检查模型内部可定位错误行为原因,针对性调整训练数据或模型结构[6] - 防范AI滥用风险:深入观察模型内部可系统性阻止越狱攻击,封堵绕过限制的漏洞[7] - 推动高风险场景落地:金融、司法等领域要求AI决策具备可解释性以满足法律合规和建立用户信任[8] - 探索AI意识边界:可解释性有助于理解模型是否具有意识,为未来AI道德考量提供基础[9] 破解AI黑箱的技术路径 - 自动化解释:利用大模型解释小模型,如GPT-4为GPT-2神经元自动生成自然语言描述[12] - 特征可视化:使用稀疏自编码器技术提取模型内部激活特征,揭示知识组织方式[13][14] - 思维链监控:监测模型推理过程以识别异常行为,如DeepSeek R1公开思维链推理过程[15][16] - 机制可解释性:Anthropic提出"AI显微镜"概念,追踪模型推理过程;DeepMind开源Gemma Scope工具[17][18] 可解释性研究的技术瓶颈 - 神经元多重语义与叠加现象:一个神经元混合表示多个概念,模型内部概念数量可能达数十亿计[19] - 解释规律普适性问题:不同模型架构间的解释规律是否通用仍待验证[19] - 人类理解的认知局限:需要发展人机交互工具将复杂机理信息转化为人类可理解形式[19][20] 行业发展趋势与建议 - OpenAI、DeepMind、Anthropic等领先AI实验室加大对可解释性研究的投入[21] - 研究方向向动态过程追踪、多模态融合等方向演进,如"AI显微镜"和"思维链溯源"[21][22] - 建议采用软法规则鼓励行业自律,如中国人工智能产业发展联盟发布《人工智能安全承诺》[24] - 未来可能实现对模型进行类似"脑部扫描"的全面检查,即"AI核磁共振"[23]
雷军官宣:小米YU7将于6月底发布;极氪第50万台量产车下线丨汽车交通日报
创业邦· 2025-06-16 09:35
1.【小米雷军:小米yu7将于6月底发布】小米雷军发布微博称,大家非常期待的小米yu7,将于6月 底发布。 还有很多重磅新品同场一起发布,比如搭载玄戒O1芯片的第二款平板:小米平板7S Pro。 (证券时报) 3.【雷诺汽车CEO将离职,传接任开云集团CEO一职】 法国雷诺汽车公布,公司首席执行官Luca de Meo将离开公司,迎接汽车业以外的新挑战。De Meo出任雷诺车厂CEO近5年,主导集团与日本 日产汽车联盟的变化及开发电动车的计划。另外,较早时法国报章《Le Figaro》报道称,Luca de Meo将出任Gucci母企开云集团的首席执行官。开云主席兼CEO Francois-Henri Pinault较早时表 示,正寻找接班人,考虑做法包括由另一人先担任CEO。(金融界) 4.【日产汽车CEO称计划减持雷诺股份】日产汽车首席执行官埃斯皮诺萨(Ivan Espinosa)表示, 该公司计划减持其在法国合作伙伴雷诺的股份。日产目前持有雷诺15%的股票。以当前股价计算,出 售雷诺5%的股份将筹集约1000亿日元(6.4亿美元),日产计划将这笔资金用于在充满挑战的商业 环境下开发新车。(新浪财经) 更 ...
四度“闯关”资本市场,云知声或成港股“AGI第一股”
环球老虎财经· 2025-06-16 06:41
上市进展 - 云知声已通过港交所上市聆讯,联席保荐人为中金公司、海通国际,若顺利上市将成为港股AGI第一股 [1] - 这是公司第四次启动IPO,此前曾于2020年11月启动A股上市后撤回,随后在2023年6月、2024年3月和2025年3月三次向港交所递表 [1] - IPO募集资金将主要用于Atlas AI基础设施研发、新兴业务投资、产品应用渗透率提升、国际化扩张及营运资金补充 [1] 公司概况 - 公司成立于2012年,专注于为企业和用户提供智能语音技术和综合解决方案,主要服务生活和医疗两大领域 [1] - 2023年自研消费级AI芯片已通过NPUIP授权实现车用芯片商业化,同年推出自有大语言模型"山海",其通用能力综合水平位列全球第一梯队 [1] - 累计完成超10轮融资,投资方包括中网投、中金资本、启明创投、高通、京东等知名机构,估值达百亿元 [2] 市场地位 - 按2024年收入计算,公司是中国第四大AI解决方案提供商,市场份额0.6% [2] - 在中国生活AI解决方案领域排名第三,在医疗AI服务解决方案领域排名第四 [2] 财务表现 - 2022-2024年总收入分别为6.01亿元、7.27亿元和9.39亿元,复合年增长率25.0% [3] - 同期净亏损分别为3.75亿元、3.76亿元和4.54亿元,经调整净亏损为1.83亿元、1.37亿元、1.68亿元 [3] - 净负债持续增加,从2022年末19.11亿元增至2024年27.53亿元 [3] - 研发开支分别为2.87亿、2.86亿和3.70亿元,占收入比例达47.8%、39.4%和39.4% [3]
复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕
机器之心· 2025-06-15 04:40
AGI发展路径 - 大模型演进分为三幕:第一幕是模型规模化胜利,通过堆叠数据与参数实现通用任务跃升,代表模型包括ChatGPT、MOSS、Qwen [6] - 第二幕是后训练优化探索,通过强化学习、工具调用、思维链等技术提升复杂问题决策能力,代表成果包括GPT o1/o3、DeepSeek-R1、AnyGPT [6] - 第三幕Context Scaling聚焦情境理解,旨在让AI适应复杂多变情境并捕获"暗知识",实现模糊环境中的合理判断 [7][8] Context Scaling核心价值 - Context是多维动态信息结构,包含时空信息、参与者状态、文化规则等未明示的语境暗示 [9] - 关键能力是捕获"暗知识"(如社交暗示、文化差异判断),解决现有技术对模糊任务描述的局限性 [11] - 对AI安全发展至关重要,通过情境理解使AI做出符合人类价值观的自主判断(如规避回形针悖论) [12] 技术实现支柱 - 强交互性:要求AI具备社交智能、文化适应、动态调整能力,需从多模态协作中理解情绪状态和未说出口的期望 [14][15] - 具身性:智能体需具备虚拟或现实环境中的主体性,通过感知-行动闭环实现情境学习 [16] - 拟人化:需深度理解人类情感模式与文化敏感性,在参数固定情况下通过Context积累实现持续能力提升 [17] 技术协同与挑战 - Context Scaling与Test-Time Scaling形成互补,前者提升输入质量后者优化计算效率 [18] - 为强化学习提供新环境定义,将简单状态-动作循环升级为含丰富情境的交互空间 [20] - 面临三大技术挑战:Transformer架构重构、学习范式向交互式持续学习转变、复杂情境数据的生成方法创新 [23] 行业影响 - 将推理增强、多模态融合等技术统一于"情境理解"目标,可能成为通向AGI的关键路径 [22] - 代表企业包括OpenAI(o系列数学推理)、DeepSeek(GRPO强化学习突破)等探索不同扩展路径的机构 [2] - 复旦大学邱锡鹏教授提出该理论框架,指出行业需突破已有路径微调,解决"意识到但未表达"的核心问题 [22]
巨头博弈下,Agent 的机会和价值究竟在哪里?
海外独角兽· 2025-06-14 11:42
核心观点 - 2025年是Agent技术加速发展的关键年份,但真正实现用户价值闭环的产品仍稀缺 [6] - Agent的真正门槛在于基础设施而非模型能力,包括记忆系统、上下文感知、工具调用和可控环境等模块 [6] - Coding被视为衡量AGI最关键的先验指标,可能占据大模型产业阶段性90%的价值 [6][45] - AI Native产品需要构建同时服务于AI和人类的双向机制 [34] - Agent商业模式正从按token/调用次数计费向按结果/工作流计费演进,未来可能出现直接雇佣Agent的模式 [6][39] 01 通用Agent是大模型公司主战场 - 通用Agent领域表现最佳的是"模型即Agent"(Model as Agent)模式,如OpenAI的Deep Research和o3模型 [12] - 通用Agent市场已成为大模型公司的主战场,创业公司难以仅靠通用需求做大 [13] - 垂直领域Agent分为前台(与人交互)和后台(重复性工作)两类,典型案例包括HappyRobot(物流沟通)和AI for Science创业公司 [14][15] 02 Cursor是从Copilot发展到Agent - Cursor通过三个阶段完成从Copilot到Agent的转型:自动补全→代码重构→后台异步执行 [22][23] - 关键策略是先从Copilot切入收集用户数据,逐步过渡到Agent形态,而非一开始就追求完全自动化 [18] - 产品设计注重用户交互心智,通过同步交互收集反馈数据,为后续Agent能力奠定基础 [23] 03 Coding是衡量AGI最关键的先验指标 - Coding数据具有干净、可验证、易闭环的特性,最可能率先实现数据飞轮 [24] - 数字世界是实现AGI的第一环境,Coding能力提升将带动指令遵循等核心能力 [25] - 若AI无法规模化完成端到端应用开发,在其他领域进展会更缓慢 [25] 04 做一个好的Agent需要什么条件 - 需要构建可验证的反馈机制和数据飞轮环境,如代码和数学领域 [26] - 产品需同时考虑人和Agent的需求,实现AI Native设计 [28] - 评估标准包括任务完成率(行业及格线约50%)、成本效率(计算/时间成本)和用户指标(留存/付费率) [30][32][33] 05 Agent定价会从基于成本转向基于价值 - 商业模式演进路径:按成本→按动作→按工作流→按结果→按Agent本身 [39] - 典型案例Hippocratic AI的AI护士成本仅为人类护士的1/4 [39] - 未来可能出现智能合约模式,通过Crypto技术实现Agent经济价值分配 [40] 06 人与Agent该如何交互协作 - 交互模式分为Human in the loop(持续参与)和Human on the loop(关键节点介入) [41] - 未来高重复性任务将实现高度自动化,人类仅需复核摘要 [42] - 新的异步协同方式将出现,需要探索Agent与Agent之间的交互机制 [43] 07 Agent爆发离不开Infra - 环境(虚拟机/浏览器)是Agent开发早期80%问题的根源 [55] - 关键基础设施包括上下文管理(记忆/检索)、工具发现平台和安全机制 [57][58] - 未来机器搜索需求可能达万亿次/天,远超人类搜索规模(200亿次/天) [59] - 大厂分化明显:Anthropic专注Coding,OpenAI布局多方向,Google具备端到端能力 [52][53]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-14 02:32
Agent行业现状与趋势 - 2025年成为Agent技术加速发展关键年,DeepSeek、GPT-4o和Claude 3.5等推动大模型边界扩展,但行业焦点转向具备自我调度能力的智能体[1] - Agent成为继大模型后全球科技圈最快形成共识的风口,巨头战略重构与创业赛道跟进同步进行,但多数产品陷入"用老需求套新技术"的困境[2] - 行业面临核心挑战:底层设施缺位(可控运行环境/记忆系统/上下文感知/工具调用)制约Agent从演示走向实用[2] 技术路径与产品形态 - 通用Agent领域最佳实践是"模型即Agent"(Model as Agent),如GPT-4o整合LLM/上下文/工具使用/环境等组件端到端训练[14] - 垂直领域Agent分为ToB前台(如HappyRobot的物流电话Agent)和后台(AI for Science多智能体系统)两类[15][16] - Coding Agent发展路径:从Cursor的Copilot(Tab键补全90%准确率)逐步演进至后台异步运行的完整Agent形态[19][22] AGI发展关键领域 - 编程(Coding)被视为通往AGI的"价值高地":数据干净闭环可验证,可能占据大模型产业90%价值[24][47] - 数字世界优先实现AGI的逻辑:端到端软件开发能力是基础,未来两年Agent或能完成人类在数字设备上的所有操作[25] - 评估Agent核心指标:任务完成率+成功率(行业及格线50%)、成本效率(计算/时间成本)、用户粘性(DAU/MAU/留存)[30] 商业模式创新 - 收费模式演进:从基于成本定价→按动作收费(如物流电话单次几毛钱)→按工作流收费→按结果付费→未来可能按Agent本身付费[37][42] - 市场渗透策略变化:自下而上(如Cursor)替代传统SaaS销售模式,医疗领域OpenEvidence通过医生群体切入再植入商业广告[35] - 价值捕获方向:Coding可能服务全球3000万程序员后,通过"氛围编程"拓展至5亿平民开发者,激发应用软件大爆发[47][48] 基础设施需求 - 环境(Environment)构成最大挑战:需要虚拟机/沙盒(如E2B)保障安全执行,专用浏览器(如Browserbase)支持信息检索[56][59] - 上下文系统关键组件:信息检索(MemGPT)、工具发现平台、记忆管理系统[62] - 未来基础设施规模:万亿级Agent任务执行将重构云计算,机器搜索需求或达人类搜索量的50倍(日万亿次)[61] 未来技术演进 - 多模态大一统:理解与生成能力一体化将打开产品想象力,模型持续遵循Scaling Law和"思维链"双范式[63] - 自主学习突破:AI通过在线任务体验提升能力,进入"经验的时代",记忆系统完善将显著提升产品粘性[64] - 交互方式革新:从文字输入转向"永远在线"的异步交互,形成人机新型协作关系(Human on/in the loop)[44][45]
汉堡王中国将关闭部分门店;李国庆离婚进展:财产分割达成和解,将进军AI领域;哪吒汽车进入破产重整程序;追觅回应对赌失败丨邦早报
创业邦· 2025-06-14 00:38
公司动态 - 李国庆与俞渝就财产分割达成最终和解 李国庆将轻装上阵 积极布局AI应用 [3] - 哪吒汽车关联公司合众新能源进入破产重整程序 新增管理人机构浙江子城律师事务所 原计划6月底前发布处置方案 因与离职员工矛盾激化或调整 [4] - 汉堡王中国将关闭部分选址及运营不佳门店 2025年门店总数预计下降 同时计划新增40至60家新餐厅 战略布局一、二线城市核心商圈 截至2024年底中国门店1474家 [5] - 追觅科技遭遇有组织网络水军攻击 涉及"断指计划"等虚假信息 公开征集线索 核实有效奖励1万至100万元 [7] - 蚂蚁集团法人代表变更为CEO韩歆毅 核心管理团队保持不变 井贤栋继续担任董事长 [9] - 蔚来规范首任车主权益使用 非个人运营车辆将回收免费换电、质保等权益 换电站突破3300座 服务中心超330家 车主用户突破70万 [13] - 7家主机厂承诺60天内向经销商支付销售奖励及返利 包括宝马、北汽新能源等 广汽丰田返利将转变为月结 80%-90%次月支付 10%-20%2个月内支付 [14] - 特斯拉推出改款Model S和Model X 新增霜蓝色金属色和钻石黑色 全轮驱动版分别涨价5000美元至84990美元和89990美元 [11] - 奇瑞汽车申请注册"墨茵"商标 人形机器人Mornine已在马来西亚汽车4S店投入使用 [10] - 2026款奇瑞瑞虎7 PLUS/瑞虎7高能版6月17日上市 配置升级 瑞虎7 PLUS增加1.5T动力可选 [16] 行业趋势 - 美光确认DDR4将停产 未来2-3季陆续停止出货 DDR4/LPDDR4将严重缺货 未来主要供给车用、工业、网通长期合作客户 [11] - 工信部数据:1-4月全国锂电池总产量超473GWh 同比增长68% 储能型锂电池产量超110GWh 动力型锂电池装车量约184GWh 出口总额1554亿元 同比增长25% [18] - 正极材料、负极材料、隔膜、电解液产量同比均增长超40% 电池级碳酸锂产量27万吨 同比增长60% 氢氧化锂产量9万吨 同比下降14% [18] 资本市场 - 甲骨文创始人埃里森净资产单日增260亿美元至2430亿美元 超过贝佐斯和扎克伯格 成为全球第二大富豪 [8] - Scale AI获Meta投资 估值超290亿美元 创始人汪滔将加入Meta负责AI工作 同时继续担任Scale董事 [16] - 长弢新材料完成2000万元A+轮融资 投资方为湖北交投集团 [16] - 景嘉航生物医药完成数千万元天使轮融资 由杭实资管领投 [16] 产品技术 - 腾势"圆规掉头"设计解决窄路掉头难题 每周使用一次年磨损仅0.05毫米 占轮胎寿命2.5% [5][6] - 谷歌上线Weather Lab气象预测网站 利用DeepMind AI模型预测台风路径 可模拟15天内50种气象发展场景 [18] - 闲鱼出现LABUBU租赁服务 日租金30-80元不等 主要用于拍照、社交展示、婚宴布置等场景 [10] 人事变动 - 三星晶圆代工高管两年内减少15人 技术高管减少 战略、规划和营销等非技术领域高管增加 [11]
张鹏对谈李广密:Agent 的真问题与真机会,究竟藏在哪里?
Founder Park· 2025-06-13 20:27
Agent行业核心观点 - 2025年成为Agent技术加速发展的关键年份,从大模型性能迭代转向自我调度的智能体范式[1] - Agent被视为继大模型后全球科技圈最快形成共识的风口,但多数产品陷入"用老需求套新技术"的困境[2] - 行业面临的核心矛盾是底层设施缺位,包括可控运行环境、记忆系统等基础模块的不足[2] - Coding领域被视作实现AGI的关键试炼场,可能占据大模型产业90%的阶段性价值[24][47] 技术路径与产品演进 - "模型即Agent"成为通用Agent最佳实践,如GPT-4o整合LLM、上下文等组件实现端到端训练[14] - 垂直领域Agent分化为ToB前台/后台两类:后台侧重SOP自动化(如AI for Science多智能体系统),前台聚焦人机交互(如医疗电话回访Agent)[15][16] - 从Copilot到Agent的渐进路径:Cursor通过代码补全(90%准确率)、重构功能分阶段过渡至异步后台Agent[22][23] - 多模态技术、自主学习和记忆系统构成未来技术突破三大方向[64] 商业模式创新 - 定价模式从成本导向转向价值导向,出现按动作/工作流/结果/Agent本身等五级计价体系[37][42] - ToB领域出现自下而上的渗透模式,如Cursor绕过CIO直接获取开发者认可[35] - 智能合约可能成为Agent经济新基础设施,实现任务完成后的自动价值分配[42] 行业竞争格局 - 巨头技术路线分化:Anthropic专注Coding Agent,OpenAI布局ChatGPT+多模态+o系列模型,Google整合TPU+Android全栈能力[54][55] - 创业公司机会存在于垂直领域(如HappyRobot物流Agent)和Infra层(虚拟机/浏览器环境)[16][56] - Agent Infra四大组件:环境(E2B等虚拟机服务)、上下文(MemGPT等记忆工具)、工具平台、安全系统[56][62] 用户交互范式 - "Human on/in the loop"形成协作光谱:高重复性任务趋向自动化,关键决策保留人工干预[44] - 上下文感知成为体验核心,需整合代码库、通讯记录等多维数据提升任务完成率[48][51] - AI Native产品需构建双向服务机制,同时满足人类和AI的需求[31] 市场供需现状 - 供给端能力过剩(Cursor将编码效率提升10-100倍),需求端尚未突破"落地页开发"等初级场景[47] - 杀手级应用缺失类比推荐引擎早期,等待类似"信息流"的产品形态突破[47] - 应用大爆发潜力存在于降低开发门槛后激发的长尾需求,可能催生新创意平台[48]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-13 13:11
模型动态 - OpenAI推出o3-pro实测和4o思考模式两项新模型技术 [2] - Meta发布V-JEPA 2世界模型 聚焦多模态理解能力 [2] - Mistral AI推出Magistral推理模型 强化商业场景应用 [2] - 面壁智能发布MiniCPM 4.0模型 参数规模未披露 [2] - 小红书开源dots.llm1模型 布局社区生态 [2] - 智源研究院推出悟界系列模型 专注认知智能研究 [2] 应用进展 - OpenAI上线高级语音拟人功能和AI数学天才应用 [2] - 字节跳动迭代豆包大模型至1.6版本 同步推出即梦图片3.0工具 [2] - 谷歌发布Veo 3 Fast版视频生成工具 ElevenLabs升级v3语音引擎 [2][3] - 智谱AI推出CoCo企业助手 DreamTech发布影视级3D模型系统 [2] - Figure AI展示机器人进展 Krea AI推出1代创意设计平台 [2] - 夸克开发高考志愿大模型 厦大联合企微推出校园AI万事通 [3] - 苹果更新Xcode 26开发工具 美团发布NoCode低代码平台 [3] 科技突破 - Figure研发劳动力系统 理想汽车布局空间与穿戴机器人 [3] - 英伟达推出量子CUDA-Q平台 苹果发布六大OS系统更新 [3] - 中科院开发启蒙系统 荣耀宣布进军机器人领域 [3] 行业观点 - Altman预测AGI技术发展时间线 Ilya Sutskever提出AI全能化假说 [3] - 苹果质疑当前AI推理能力 OpenAI探讨人类对AI的依赖性 [3] - a16z分析生成式引擎优化趋势 Richard Sutton预言经验主导时代 [3] 资本与事件 - Meta投资Scale AI并重建超级智能研究小组 [3][4] - Midjourney面临版权诉讼 Meta签署大规模核电合作协议 [4]
AGI活动怎么玩爽?当然是上手玩、随意聊,不插电音乐会,以及抽奖啊!
Founder Park· 2025-06-13 13:04
AGI Playground 2025 活动概述 - 活动主题为让参与者"听得爽、聊得嗨、玩得尽兴",强调同频社交与开放体验[1][2] - 设置主题分享、专题研讨、互动展区等多元环节,突破传统会议形式[2] - 推出高科技胸卡支持"碰碰交友"功能,并延续小红书打卡获官方流量支持的惯例[3] RTE Open Day 展区 - 聚焦AI+实时互动技术展示,涵盖AI玩具、客服、陪伴等16个社区成长项目[3][9] - 采用高密度信息呈现方式,参与者可体验demo并与创业者直接交流[6][7] - 展区升级后包含AI教育、语音模型、AR游戏等前沿领域[9] PLAYGROUND 户外交流区 - 创新设置露营式开放空间,配备简易座椅和小礼物促进自由交流[10][11] - 吸引创业者、投资方、云厂商等多方角色形成资源对接节点[13] - 打破身份限制,支持项目对接、团队组建等灵活社交场景[11][13] After Party 特别环节 - 由Founder Park与"十字路口"联合主办草地音乐会,提供无限量餐饮[16][18][19] - 设置Insta360 X5套餐等重磅抽奖,需通过集5人签名破冰参与[21][22] - 包含AI音乐现场演出等娱乐内容,强化社群联结[22] 小白卡社交系统 - 采用Bonjour数字名片技术实现手机碰触交换信息,自动加入大会社群[24][25] - 设置实体"碰碰墙"供张贴数字名片,完成互动可获纪念款卡片[26][28] - 支持线上社群持续交流,提升社交效率[27] 小红书UGC传播 - 平台合作提供流量补贴,带官方tag发布真实内容即可获得推荐[31][33] - 鼓励随拍展区、装置、社交瞬间,内容形式不限但需突出真实性[32][33] - 多发笔记增加曝光,重点展示个人视角的参会体验[33]