腾讯研究院

搜索文档
腾讯研究院AI速递 20250805
腾讯研究院· 2025-08-04 16:01
GPT-5技术进展 - 奥特曼亲自展示GPT-5实测,暗示即将进入"SaaS快时尚时代"[1] - GPT-5采用超级对齐团队遗留的"通用验证器"技术,训练方法为"证明者-验证者游戏"[1] - 研发面临高质量训练数据不足和大规模预训练收益下降的挑战[1] 苹果AI战略布局 - 组建AKI团队研发类ChatGPT搜索引擎,由前Siri负责人领导[2] - 扎克伯格提出"个人超级智能"概念,称AI眼镜将挑战iPhone地位[2] - 库克强调iPhone仍是生态中心,透露苹果有"令人兴奋的AI计划"[2] 腾讯开源模型 - 开源四款混元小模型(0.5B/1.8B/4B/7B),手机可运行并在微信读书落地[3] - Hunyuan 7B数学能力超越OpenAI o1-mini和Qwen3-8B,支持256k上下文长度[3] - 增强agent能力,适合低功耗场景和低成本垂直领域微调[3] 快手AI影视创新 - 可灵AI短剧《新世界加载中》全球播放1.97亿次,全网曝光13.7亿+[4] - 赋能Z世代团队实现多风格创作,降低大制作门槛[4] - 通过20次迭代提升水面效果、动态控制等影视细节表现力[4] 高德地图AI升级 - 发布全球首个AI Native应用"高德地图2025",搭载智能体"小高老师"[5] - 智能体具备自主推理、计划、反思能力,提供全旅程AI服务[5] - 整合超视距感知和AR互动体验三大智能体服务[5] 小米音频模型 - 开源MiDashengLM-7B声音理解模型,刷新22个评测集记录[6][7] - 首Token延迟为业界1/4,数据吞吐效率达同类20倍[7] - 实现语音/环境声/音乐统一理解,已在30+智能家居场景落地[7] AI视频现象 - "兔子蹦床"AI视频播放超5亿次,多数观众未识别为AI生成[8] - 成功要素包括夜视画质掩盖缺陷、@Ring标记增强可信度[8] - 反映用户"选择相信"的新型社交媒体互动逻辑[8] 具身智能突破 - 中科硅纪发布四款灵巧手和三款机器人整机产品[9] - 产品覆盖工业、高风险环境和服务场景[9] - 通过软硬协同打通具身智能产业化"最后一厘米"[9] AI行业观点交锋 - 马斯克称"只有工程师没有科学家",LeCun反驳会扼杀创新[10] - LeCun强调研究者追求新原理,工程师聚焦系统构建[10] 强化学习前沿 - Ai2科学家提出RLVR技术,目标打造开源推理模型[11][12] - 区分RLHF与RLVR,强调智能体需发展四层能力[12] - 呼吁开源AI从论文转向创造实际"产物"[12]
人形机器人的进化之路|2.5万字圆桌实录
腾讯研究院· 2025-08-04 09:23
具身智能技术突破 - 端到端大模型实现从L2到L4级跃迁 Physical Intelligence公司Π系列模型展示少样本学习能力[7][8] - 数据采集技术突破 主从臂式遥操/VR遥操/光学动捕等技术提升效率 AGL Bot World项目采集百万级真机数据[9] - 仿真技术显著提升 生成式模型使仿真效果从"非常假"到"视觉逼真" 物理交互仿真仍需加强[9] 技术瓶颈与挑战 - 开放环境任务执行能力弱 复杂技能/高精度场景下故障率高 存在安全风险[6] - 硬件成本与运维问题 单台机器人成本达数十万人民币 供电持久性不足[6] - 泛化能力存在局限 Physical Intelligence Π0模型在OOD场景成功率低于产业预期[10] 主流技术范式 - VLA(视觉-语言-动作)成为共识框架 但底层架构仍处探索期 存在自回归与Diffusion两条技术路线[32][33] - 系统1(直觉响应)与系统2(规划决策)协同方案 短程任务端到端解决 长程任务需规则介入[18][19] - 触觉模态(T)增强形成VTLA框架 触觉信号使响应延迟从2-3秒提升至毫秒级[15][16] 数据生态现状 - 真实数据与仿真数据存在鸿沟 刚体仿真准确度达80%-90% 柔性体/流体仿真仍困难[36][39] - 数据规模严重不足 具身数据量仅为语言模型的1/5000 需百亿级VLA token训练量[9][57] - 互联网视频数据利用受限 缺乏动作标签与多视角信息 需清洗与伪标签生成技术[42][43] 产业化路径 - 专业场景优先落地 工厂SOP场景成熟度高于开放家庭环境 规则系统现阶段更可靠[14][51] - 消费级产品渐进发展 扫地机器人+简易操作臂组合或成突破口 价格增幅需控在数百元内[50] - 中间件接口标准化需求迫切 需建立动作抽象层兼容不同机器人本体[26][27] 技术演进方向 - 世界模型与强化学习结合 数据驱动的物理规律模拟替代传统物理引擎[35][37] - 穿戴设备数据反哺 未来消费级设备可能意外积累海量具身数据[41] - 多模态持续扩展 红外/温度等非人类模态将增强环境感知能力[29][32]
论坛预告丨科技创新与良法善治的智识交汇!
腾讯研究院· 2025-08-04 09:23
论坛概述 - 香港中文大学法律学院与腾讯研究院联合主办"网络法论坛",聚焦科技创新与法律治理的交叉领域 [1] - 论坛旨在为科技创新与良法善治的价值交互贡献大湾区智慧 [1] - 讨论主题包括全球数字经济、互联网公共政策、人工智能治理等前沿议题 [1] 演讲嘉宾 - 蒙美玲教授:香港中文大学系统工程与工程管理学系讲席教授,演讲主题为"AI for an Empowered Future: Educating the Next Generation with Intelligence, Agency, and Integrity" [2][8] - 苏文藻教授:香港中文大学研究院院长,演讲主题为"Ethical Dilemmas in AI" [4][9] - 王雅媛女士:个人资料私隐专员公署助理专员,演讲主题为"从《个人资料(私隐)条例》探索网络行为的法律责任与合规要求" [6][9] - 张平教授:北京大学人工智能研究院AI安全与治理中心主任,演讲主题为"中国人工智能立法的思路与展望" [8][9] 论坛议程 - 8月5日11:30-12:15:蒙美玲教授主题演讲 [8] - 8月5日12:15-13:00:苏文藻教授主题演讲 [9] - 8月6日10:15-11:15:王雅媛女士主题演讲 [9] - 8月6日11:30-12:30:张平教授主题演讲 [9] 推荐阅读 - 腾讯研究院发布《拥抱概率真相——AI时代谣言套路拆解与防御指南》 [10] - 腾讯研究院发布《共生伙伴:2025人工智能十大趋势|2025 WAIC报告重磅发布》 [10]
腾讯研究院AI速递 20250804
腾讯研究院· 2025-08-03 16:01
Anthropic与OpenAI竞争升级 - Anthropic切断OpenAI对Claude API的访问权限,指控其利用Claude工具开发GPT-5违反服务条款[1] - OpenAI回应称API评估竞品能力是行业惯例,对Anthropic决定表示失望[1] - 事件标志AI巨头竞争进入"数据与接口封锁"阶段,API成为战略资源[1] Grok推出短视频生成功能 - Grok Imagine功能向Grok Heavy用户开放,支持一键生成动画/写实风格短视频[2] - 生成速度极快,在X平台引发刷屏效应,被科技公司CEO评价"超出想象"[2] - 马斯克定位为AI版Vine,直接对标谷歌Veo 3产品[2] 谷歌发布IMO金牌模型 - Gemini 2.5 Deep Think模型达到IMO铜牌水平,Ultra订阅价249.99美元/月[3] - 性能超越OpenAI o3和Grok 4,通过扩展并行"思考时间"优化代码/科学/推理能力[3] - 原版模型曾获IMO金牌,新版本速度更快实用性更强[3] Manus推出多Agent并行功能 - Wide Research功能支持100个Agent同时工作,Pro版定价199美元/月[4] - 每个子Agent为完整Manus实例,可自主完成复杂调研并汇总结果[4] - 基于虚拟化基础设施和MapReduce范式,但用户反馈积分消耗过高[4] 开源图像模型技术突破 - FLUX.1-Krea模型专注解决"AI感"问题,通过两阶段训练提升自然细节[5] - 分析指出"AI风格"源于指标过度优化和美学评估偏见[5] - 采用监督微调+人类反馈强化学习针对性改善蜡质皮肤/过曝高光等问题[5] AI育种与数学研究进展 - 华中农大团队在Nature发表AI育种研究,整合组学技术和基因编辑实现精准改良[7] - OpenAI三人团队开发实验性模型,4.5小时完成IMO六题达金牌标准[7] - 模型采用通用强化学习技术,展现自我识别难题能力[7] AI建模与职业影响研究 - 哈萨比斯提出AI可建模所有进化系统,预测2030年AGI概率达50%[8] - 微软研究分析20万对话显示翻译/销售/程序员等职业受AI影响超80%[9] - AI适用性与薪资/学历弱相关,更取决于信息处理领域匹配度[9] 未来社会与AI关系展望 - 凯文·凯利主张将AI视为"异类智能",预测2049年"镜像世界"成为主流社交平台[10][11] - 强调人类价值将因稀缺上升,核心技能是"学会如何为自己学习"[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-08-02 02:33
芯片与算力 - AI推理芯片由云天励飞推出 [3] - 无问芯穹关注AI效能提升 [3] 模型发展 - OpenAI推出「龙虾」盲测模型 [3] - 阶跃星辰发布Step 3模型 [3] - RockAI推出Yan 2.0模型 [3] - 智谱发布GLM-4.5模型 [3] - 昆仑万维推出Skywork UniPic模型 [3] - 群核科技发布InteriorGS数据集 [3] - DeepSeek开发NSA技术 [3] - OpenAI正在部署GPT-5 [3] 应用场景 - 腾讯发布AI应用全景图 [3] - 阿里巴巴推出AI眼镜 [3] - Lovart发布ChatCanvas应用 [3] - 钛动科技推出Navos应用 [3] - Coze开发零代码平台 [3] - 可灵AI推出灵动画布 [3] - 腾讯与Lovart合作3D生成API [3] - 阿里发布Wan2.2应用 [3] - 商汤推出悟能具身平台 [4] - Anthropic设置周流量限制 [4] - 微软发布AI Edge应用 [4] - 阶跃星辰推出阶跃深研 [4] - 京东发布JoyAI [4] - 加州大学等开发MIRIX [4] - 国家卫星气象中心推出空间天气预报模型 [4] - OpenAI推出学习模式 [4] - xAI发布Imagine视频功能 [4] - 拓竹科技推出混元3D模型 [4] - WPS发布灵犀Office智能体 [4] - 火山引擎推出SeedEdit 3.0 [4] - Google发布Video Overviews [4] - 理想汽车推出VLA司机大模型 [4] - Google发布AlphaEarth [4] - Moonvalley推出Sketch-to-Video [4] - Ollama发布对话界面 [4] - 阿里推出1688 AI版 [4] 科技创新 - 宇树科技推出Unitree R1 [4] - 上智院等发布星河启智平台 [4] - 上海AI lab推出书生Intern-S1 [4] - 逐际动力发布LimX Oli [4] 行业观点 - 辛顿提出大模型永生观点 [4] - 辛顿与周伯文讨论AI变聪明与善良 [4] - Shopify推动全员AI转型 [4] - OpenAI提出AI市场泡沫观点 [4] - a16z讨论AI时代护城河 [4] - 张正友提出具身智能趋势 [4] - 谷歌前CEO讨论开放权重价值 [5] - Meta探讨超级智能与开源变化 [5] - a16z提出投资判断标准 [5]
AI迁徙一代:跨越技术断层的中坚力量
腾讯研究院· 2025-08-01 08:33
核心观点 - AI技术革命正在重塑人类社会结构与个体经验,AI不仅是工具,更是新的生存逻辑,改变了知识生成方式、人与世界关系及自我理解[2] - AI迁徙一代(AI Migrants)是在数字原生与智能原生之间的过渡群体,他们成长于AI普及关键节点,既保留前数字时代记忆又必须适应AI主导的未来[4][5] - 技术迁徙带来社会分层加剧,世界银行2022年报告显示AI普及率在北美、欧洲、东亚城市青年中远高于全球平均水平,而非洲、南亚、拉美农村处于边缘地带[5] - AI正在重塑教育和工作本质,世界经济论坛2023年报告指出AI将重塑全球44%工作岗位,技能更新周期从十年缩短至三年[17][18] 技术革命与社会变迁 - 工业革命带来第一次大规模社会迁徙,农民变工人、乡村变城市,传统宗族关系被工厂规训取代[10] - 信息革命制造数字断层,皮尤研究中心2019年报告显示60后、70后成为被迫适应数字世界的"数字移民"[10] - AI革命超越以往技术变革,牛津大学未来人类研究所2018年报告指出AI将重塑人类社会方方面面[11] - 社会学家鲍曼提出"流动的现代性"概念,AI迁徙一代身份在断裂与连接张力中生成[12] 教育体系转型 - 联合国教科文组织2021年报告显示20世纪末教育以标准化、同质化为核心,强调记忆力与规范性[6] - AI驱动教育向个性化学习转变,哈佛大学加德纳提出多元智能时代学习是多维探索与协作[7] - 联合国教科文组织2021年指南指出AI自适应学习系统能动态调整内容与难度,实现教师与AI共创知识[16] - 牛津大学2020年报告显示80后、90后呈现混合型社交特征,既珍视现实连接也拓展虚拟关系[7] 工作模式变革 - 世界经济论坛2023年报告强调AI催生新职业同时淘汰传统岗位,重塑全球44%工作岗位[4][17] - 麦肯锡2023年报告指出80后、90后需快速适应AI主导未来,成为人机协作原型[12][16] - 牛津大学马丁学院2021年报告显示数字经济下技能更新周期缩短至三年[18] - 普华永道2023年报告发现AI迁徙一代在企业创新项目中担任关键桥梁角色[20] 伦理与社会责任 - 剑桥大学2023年报告指出AI迁徙一代对算法偏见、数据隐私等议题高度关注[21] - 牛津大学2022年调查显示超70%年轻科技从业者认为开发者应对AI社会后果负责[21] - 联合国教科文组织2021年建议书强调技术发展必须以人类尊严、公正、包容为前提[21] - 联合国人权理事会2023年报告主张AI系统设计需尊重个体权利[22] 文化多样性保护 - 剑桥大学2022年研究指出技术团队多样性直接影响AI系统公平性与包容性[23] - AI迁徙一代积极推动算法透明、包容性设计,反对数据单一化导致的歧视[23] - 在数字身份、情感计算等领域保持警惕,守护人类情感深度与精神自由[23]
腾讯研究院AI速递 20250801
腾讯研究院· 2025-07-31 16:01
GPT-5泄露与功能曝光 - 大量用户在ChatGPT、MacOS应用、Cursor、微软Copilot及OpenAI API平台发现GPT-5痕迹,预计最快下周发布 [1] - GPT-5将整合GPT系列和o系列,实现多模态和推理能力大一统,包括主模型(代号"nectarine"或"o3-alpha")、mini版(代号"lobster")和nano版(代号"starfish") [1] - GPT-5将支持100万tokens上下文窗口、MCP协议与并行工具调用,其中mini版本Lobster特别强化编程能力 [1] DeepSeek R2核心技术突破 - DeepSeek与北京大学联合完成的《Native Sparse Attention》论文获ACL最佳论文奖,实现模型处理长文本速度提升11倍 [2] - 首创"原生稀疏注意力"机制,将模型从"割裂拼接"推向"有机融合",在不牺牲性能的情况下大幅提升效率 [2] - NSA技术已完成27B、MoE架构上的完整预训练验证,通过三种阅读策略(压缩块、选择性精读、滑动窗口)和门控机制 [2] 谷歌AlphaEarth基础模型 - Google DeepMind推出AlphaEarth Foundations,将多源地球观测数据整合为统一数字表征,实现10米级精度地球观测 [3] - 系统整合卫星图像、雷达扫描、3D激光测绘等多种数据,以10×10米网格分析全球陆地及近海,所需存储空间仅为同类AI系统的1/16 [3] - 多项技术创新包括自适应解码架构、空间密集型时序瓶颈和地理文本精准对齐 [3] Moonvalley视频生成技术 - AI视频生成公司Moonvalley宣布旗舰模型Marey正式支持Sketch-to-Video功能,用户可通过手绘草图一键生成电影级视频 [4] - 该功能支持人物动作或摄像机运动路径定义,自动生成连贯视频 [5] - 目前支持1080p@24fps输出,订阅价格14.99美元/月起 [5] Ollama可视化界面升级 - Ollama 0.10.1版本正式上线可视化图形界面,同步支持Mac和Windows [6] - 新版本提供全新对话界面,支持下载模型、与PDF和文档对话、多模态交互和文档编写功能 [6] - 内置新的多模态引擎,支持发送图片给大语言模型 [6] 1688 AI版转型 - 1688推出全新AI版App,上线免费企业查询工具"88查"和全新商家数字人Agent [7] - 1688 AI版聚焦创业与拿货场景,集成AI搜索、选品、创款、图搜、查企等功能 [7] - 商家数字人已有40万商家使用,带动平台GMV和询盘增长18% [7] 逐际动力人形机器人 - 逐际动力推出LimX Oli全尺寸人形机器人,身高165cm、拥有31个主动自由度 [8] - 该机器人软硬件设计贯彻"模块化"与"全开放"理念,提供完整SDK系统 [8] - 推出Lite、EDU及Super三个版本,起售价15.8万元 [8] Meta超级智能愿景 - Meta CEO扎克伯格发布公开信,表示已开始看到AI系统自我改进迹象 [9] - Meta正改变AI模型发布策略,暗示Llama系列不再全部开源 [9] - Meta在第二季度财报中宣布将于2025年斥资高达720亿美元用于AI基础设施建设 [9] a16z AI投资新标准 - a16z合伙人Martin Casado认为AI投资不再看模型性能,而是平台是否能持续交付业务结果 [10] - 平台竞争分化的三要素为组织模式、资源配置与产品策略 [10] - AI估值逻辑回归具体场景,基于悲观、中性、乐观三种场景进行拆解模拟 [10]
AI时代如何把想象力变成一种竞争优势?|2万字圆桌实录
腾讯研究院· 2025-07-31 09:13
AI时代想象力的竞争优势 - AI时代人类的竞争优势在于想象力,当AI具备行动力后,人类需要将想象力转化为差异化优势 [2][3] - AI将重塑内容创作方式,未来可能出现10亿级用户的AI娱乐超级平台和个人创作者独角兽 [9][13][73] - 多模态AI技术将打破传统内容形态界限,实现更丰富的交互式娱乐体验 [14][22] AI内容产业未来3-5年趋势 - AI短剧平台将同时变革创作工具和发行渠道,推动娱乐形式升级 [3][14] - 虚拟角色共创社区月产30-40万原创角色,用户通过AI实现幻想世界的可视化 [8][11] - AI硬件如LOOI ROBOT结合手机算力与机器人交互,创造新型人机互动场景 [6][19] AI对企业服务的重塑 - 企业服务工具将从效率工具进化为结果交付型智能体,改变传统工作流 [15][17] - 中国工具付费市场将因AI智能体的结果交付能力而扩大,1-3年内完成转型 [15] - 传统工具叠加AI效果有限,需要重构问题解决方式而非简单功能升级 [16] 人机协作模式演进 - AI将从工具演变为创作协作者、评判者甚至主导者,改变传统创作流程 [24][25] - 人类需保持创作主体性,通过Prompting等新交互方式维持独特性 [23][35] - 娱乐行业可能出现AI自主运转的创作生态,超越人类消费需求 [46][74] 教育与人才培养变革 - 高校教育将转向博雅型人才培养,减少专业细分,强化综合素质 [53][54] - 想象力培养需要多模态输入和实践环境,而非单纯知识灌输 [61][62] - 技术黑盒化趋势下,广泛知识面比专业技术深度更重要 [64][65] 行业创新方向 - AI+硬件机会存在于输入输出执行三环节的语言结构化改造 [70][71] - 智能体协议基础设施将形成比ToC互联网更大的新市场 [74] - AI娱乐平台将突破现有内容形态,创造全新交互范式 [73][22]
腾讯研究院AI速递 20250731
腾讯研究院· 2025-07-30 16:03
ChatGPT学习模式 - OpenAI推出"学习模式"新功能,采用苏格拉底式引导方式帮助用户理解复杂概念 [1] - 所有版本用户均可免费使用,功能包括交互式提示、分步解答和个性化支持 [1] - 系统会根据用户教育背景和知识基础自动调整教学策略 [1] Grok视频功能 - xAI即将为Grok iOS应用推出"Imagine"视频生成功能,支持带音频的视频生成 [2] - 可一次性生成4段视频,效果逼真细节丰富,支持多种风格生成 [2] - 提供近乎实时的图像生成,支持Spicy、Fun和Normal等预设模式 [2] 昆仑万维开源模型 - 开源多模态统一模型Skywork UniPic仅需1.5B参数即可实现与百亿参数专用模型相当效果 [3] - 在单一模型中实现图像理解、文生图和图像编辑三大能力深度融合 [3] - 在GenEval和DPG-Bench等多个基准测试中达到行业SOTA水平 [3] 群核科技3D数据集 - 发布全球首个大规模3D语义数据集InteriorGS,包含1000个精细3D高斯语义场景 [4] - 覆盖超过80种室内环境,将3D高斯技术与自研空间大模型SpatialLM深度融合 [4][5] - 已与谷歌、斯坦福、英特尔等机构合作,为智元机器人等企业提供仿真数据训练 [5] 拓竹科技3D打印 - 3D模型平台MakerWorld全面接入腾讯混元3D,预计月调用量突破10万次 [6] - 混元3D实现0.1毫米级高精度建模,几何分辨率达1024级 [6] - 支持文字图片输入快速生成,具备物理级材质建模能力 [6] WPS办公智能体 - 实现AI与办公软件深度融合,一站式完成文案写作、PPT制作等办公任务 [7] - 采用原子化操作技术智能识别修改边界,精准锁定内容范围 [7] - 提供AI搜索、知识库和AI聊文档等功能,支持随身语音助手 [7] 豆包图像编辑 - 发布SeedEdit 3.0模型,支持通过自然语言指令进行多种图像编辑操作 [8] - 在文字修改、背景替换等场景表现对标GPT-4o和Gemini 2.5 Pro [8] - 采用多阶段训练策略实现8倍推理加速,运行时长从64秒降至8秒 [8] NotebookLM视频功能 - 推出"视频总览"功能,可将笔记、PDF、图片自动生成结构清晰的视频 [10] - 用户可定制视频内容,增强个性化学习体验 [10] - 已向所有英文用户开放,Studio面板同步升级 [10] 理想汽车VLA模型 - 推出业内首个量产VLA司机大模型,8月OTA推送至AD Max车型 [11] - 能理解自然语言指令、根据记忆设定路段速度、复杂路况下判断风险 [11] - 开发依靠12亿公里有效数据和13 EFLOPS训练平台 [11] 中国AI发展 - 中国AI技术在两年内取得巨大进步,多个大模型达到全球领先水平 [12] - "开放权重"策略被认为是推动中国AI快速发展的关键因素 [12] - 提倡加强中美AI合作,共同应对技术滥用风险 [12]
AI Agent的终极未来|3万字圆桌实录
腾讯研究院· 2025-07-30 09:04
智能体定义与核心特征 - 智能体被定义为具备记忆、规划、执行和总结能力的系统,模拟人类完成任务[5][6] - 核心能力包括感知环境、规划步骤、执行动作(通过API或RPA)及调用工具形成闭环[6] - 技术演进推动定义扩展:从强自主性智能体到涵盖弱自主性的"智能系统谱系"[10] 产品形态与技术路径 - 内嵌式智能体(如ChatGPT Deep Research)与独立Agent(如Cursor)并存,前者通过端到端训练降低工程复杂度,后者依赖提示词+工程逻辑结合[18][19] - 通用型与垂直型Agent将长期共存:通用型覆盖广泛需求(如信息检索),垂直型深耕专业领域(如编程IDE)[22][23] - 技术分层:基模型内化Agent能力(高成本)、半模型微调+工程化支持、纯提示词驱动的轻量级Agent[39][40] 商业化路径与行业影响 - To B场景优先替代标准化工作(60%重复性岗位),如财务审核、文档处理,提效显著[29][30] - To C入口价值凸显:超级Agent可能整合多服务,重构"人找信息"为"服务找人"模式[72][73] - 国际市场更成熟:欧美付费意愿强+SaaS基础好,日本人力成本驱动Agent替代需求[68][78] 关键挑战与突破方向 - 记忆管理与长程上下文处理是核心瓶颈,需优化注意力机制与运行时权重更新技术[34][35] - 基模型进化可能挤压垂类Agent空间,但专业数据锚点(如医疗、法律)形成护城河[36][37] - 物理世界交互需补全多模态感知(视觉/触觉),具身智能或是AGI关键路径[49][51] 生态协议与评估体系 - MCP协议在C端价值明确(工具发现/调用),但B端因封闭环境更倾向直接API调用[56][57] - 评估需分层:通用测试集(如GAIA)设门槛,企业级定制化标准关注实际任务完成度[52][53] - Agent间社会化协同催生新业态,需建立任务验收、支付机制等基础设施[55][80]