AI技术演进历程 - 英伟达GTC2025大会回顾AI领域十余年演进:从2012年AlexNet开启深度学习时代,到近年大模型推动生成式AI浪潮,再到当前Agentic AI范式,最终指向Physical AI愿景 [2] - 技术演进速率呈指数级提升:深度学习十年突破远超传统机器学习三十年积累,ChatGPT问世后两年半内AI进展超越整个深度学习时代,加速效应被形容为"人间一日,AI一年" [2] - 技术史视角下传统机器学习如同"远古文明",专家系统似"史前技术" [2] Agentic AI发展阶段 - 第一阶段(2024年秋季):OpenAI的o1与DeepSeek-R1推理模型技术成熟化 [5] - 第二阶段(2025年初):o3模型上线及Deep Research、Operator、Manus等智能体应用涌现 [5] - 核心定义:具备自主理解、规划、记忆和工具调用能力,能自动化完成复杂任务的系统,升级为Auto-Pilot模式 [10] 能力范式对比 - 传统AI阶段:依赖专业界面与指令,解决限定领域任务,本质为人类操作工具 [6] - 大模型阶段:获得通用任务解决能力与自然语言交互界面,升级为人机协作副驾驶(Co-Pilot),但仍需人类分步指挥 [6] - Agentic AI阶段:新增任务规划与工具调用能力,可理解并执行高层目标导向需求(如设计并发布海报) [10] 技术突破路径 - 任务规划能力:关键挑战为实现类人类"系统二"慢思考(多步逻辑推理) [11] - 解决方案演进: - 提示词工程(CoT/ToT)通过示例激发模型上下文学习 [14] - 监督学习提供标准解法路径(类比"通识教育"),强化学习自主探索最优路径(类比"研究生教育") [15] - 工具调用机制:支持API/数据库/知识库/外部模型/GUI封装,调用方式包括预设流程(确定性高)与提示词触发(适应动态环境) [17][19] 应用生态与架构 - 实现架构: - 操作型Agent(Operator)负责环境交互与自动化("眼和手") [28] - 信息型Agent(Deep Research)专注知识整合与分析("大脑") [28] - 协同模式:GUI Agent适配人类数字界面,API Agent构建AI原生环境,多Agent协同案例包括荣耀YoYo调用中移动灵犀 [29] - 垂直领域落地:成功案例覆盖广告(ICON)、网络安全(XBOW)、开发(Traversal),核心趋势包括交互界面简化为目标对话框、Action/Information Agent深度融合 [30] 底层驱动逻辑 - 算力转化智能三阶段定律: - 预训练阶段通过算法优化消化算力(Transformer收敛架构) [30] - 后训练阶段利用强化学习生成高质量合成数据 [30] - 推断阶段消耗算力提升实时智能,形成行为数据反哺预训练模型的正向循环 [30]
新学习了下AI Agent,分享给大家~
自动驾驶之心·2025-07-10 10:05