Workflow
AI智能体
icon
搜索文档
Andrej Karpathy :AI 智能体的十年战争、强化学习的困境与“数字幽灵”的觉醒
锦秋集· 2025-10-20 07:00
智能体发展时间框架 - 当前业界普遍认为今年是"智能体元年",但Andrej Karpathy判断这是"智能体的十年",意味着智能体的成熟将是一个长达十年的渐进过程,而非短期内突然爆发[6][7] - 智能体要成为真正的"数字同事"尚需约十年时间,因其核心能力模块尚未整合完备[8][9] 智能体缺失的关键能力模块 - 实现真正可用的智能体还缺失四个关键模块:多模态感知、记忆系统、持续学习与行动接口[1] - 具体缺失的能力包括:多模态能力(理解图片、视频、操作界面)、计算机使用能力(用鼠标、键盘或API操作数字世界)、持续学习(记住历史信息而非每次从零开始)、更强的认知能力(规划、上下文管理、长期目标追踪)[15] AI发展史上的关键转折点 - AI领域过去十五年经历了三次范式转折:深度学习崛起(AlexNet时代代表的感知革命)、强化学习与游戏兴起(行动革命)、大语言模型出现(表征革命)[11][12][13][14] - 真正的技术"实用化"总是比"概念提出"晚五到十年,智能体的演化不会例外[11] 强化学习的根本缺陷与改进方向 - 强化学习在实践中存在信息稀疏问题,其本质是把监督信号吸进一根吸管里,从长行为序列中只获取最后一点反馈,导致高噪声、低效率、极难稳定[20] - 人类基本不用强化学习,而是依赖反思与推理过程,形成过程监督而非仅看最终结果[21] - 未来强化学习的改进方向包括:细粒度奖励(每个阶段提供反馈)、多维度打分(评估效率、优雅度、可解释性)、自我评估循环(模型能自己复盘、修正、再训练)[47][48][49] 从模仿学习到反思学习的演进 - AI学习模式的演进路径为:从模仿学习(模型模仿人类对话风格)到强化学习(RLHF,结合模仿与奖励),下一步是让模型学会自我反思[23][24] - 模型需要具备"反思与回顾"结构,甚至类似"睡眠"的机制,将临时经验蒸馏进权重,但目前这些还停留在论文级别实验,尚未在真正的大模型规模上跑通[24][25] AI编程的现状与瓶颈 - AI辅助编程工具(如Copilot或GPT)目前作用有限,在独创系统或研究型代码编写上几乎帮不上忙,其最实用模式是半自动补全(程序员控制结构,模型辅助局部实现)[31][35][36][39] - 模型在创新结构上几乎无能,它擅长复刻常见模板,但理解不了新结构,容易自以为懂并建议不必要的API,导致代码臃肿复杂[38] - 编程的进化可视为一个"自主滑杆"的缓慢推进,AI持续压缩低价值劳动空间,但真正的架构与理解仍靠人类,未来编程可能演化为一种"思维交互"[41][42][43] 人类学习与AI训练的根本差异 - 人类学习是开放系统,具备多层次学习机制(内置硬件、社会化学习、反思梦境和创造再训练),而AI模型是一次性训练形成的封闭系统,不会真正持续更新认知[51] - 人类通过遗忘保持创造力优势,而AI记忆力太好反而妨碍泛化,未来可能需要让模型"学会遗忘"[28] AI的未来角色与社会影响 - AI的角色是"认知合作者",未来最现实的是一种共生关系:AI负责探索空间庞大、重复性高的任务,人类负责定义目标、做价值判断[52] - 未来社会分工会越来越像"混合认知体",每个个体由一个人加一组AI代理组成,像拥有个人操作系统一样协同工作[53] - 下一个十年是从"召唤幽灵"到"驯化幽灵"的阶段,需要建立社会层面的规则、价值观、使用边界,确保AI安全、可靠、合作、可信[54][55]
OpenAI联合创始人卡帕西:AI智能体距“真正有用”尚需十年
环球网资讯· 2025-10-20 05:53
文章核心观点 - OpenAI联合创始人安德烈·卡帕西对AI智能体发展持谨慎乐观态度,认为其达到“功能完善、真正实用”需十年时间,与行业认为2025年将成“智能体之年”的乐观预期形成对比 [1][3] 当前AI智能体技术短板 - 智能水平与多模态能力不足,无法独立完成电脑操作等复杂任务 [2] - 缺乏持续学习与记忆能力,用户传递的信息难以有效留存 [2] - 认知能力有限,难以满足实际应用场景中的灵活需求,卡帕西直接评价“现在的智能体根本不好用” [2] 对行业发展方向的批评 - 当前AI领域“造工具的速度远超AI本身能力提升的速度” [2] - 过度追求“取代人类”的全自动化系统可能削弱人类在技术协作中的价值 [2] - 可能催生大量低质量“AI生成内容(AI slop)”,破坏网络信息生态 [2] 理想的AI发展路径 - 强调“人机协作”的核心价值,期待AI成为人类的协作伙伴而非替代者 [2] - 在编程场景中,AI应能自动调取API文档并验证接口调用准确性 [2] - 面对不确定问题时应主动与人类沟通确认,通过协作帮助人类提升专业能力 [2]
AI智能体试水“抢购物券” 手机厂商转向:不拼参数拼应用
第一财经· 2025-10-18 10:49
中美AI生态战略差异 - 美国AI公司正通过构建生态完成从算力投资到大模型应用的商业闭环,OpenAI和英伟达是主导者[1] - 中国市场已不再盲目追随美国芯片战略和“烧钱”比拼大模型参数,因成本过高且无终点,做千亿级模型需要两万卡以上集群,投资200亿元都不够向2000亿、4000亿参数迈进[1] - 中国厂商战略转向实用性、性价比和应用落地能力,认为这是其优势所在[2] 端侧AI应用场景落地 - 手机AI被赋予自进化能力,从被动响应转向主动预测用户操作,交互方式产生巨大突破,多步操作可一键完成[3] - 荣耀展示AI智能体“YOYO”在比价场景的应用,10秒内为用户抓取600元隐藏优惠券,使2610元商品总价降至2016元[3] - AI与手机系统深度结合,在特定场景激活加速模式,打通如阿里巴巴、高德等应用壁垒,并优化CPU、GPU运算效率及网络连接以提升抢购速度和成功率[4] - AI能力覆盖高频场景,如复制航班号后主动呈现航班动态、通过AI键拍摄图片连接酒店Wi-Fi、抢购火车票及演出票等[4] - vivo具备对用户收藏内容进行AI提炼、分类整理并关联日程和地址的能力,以及长文阅读和理解能力,其端侧多模态推理大模型具备128K长上下文处理能力,极限出词速度超过每秒200个token[4] - OPPO将AI文本记忆能力作为研发方向,展示通过语音助手识别账单并自动记账功能,以应对用户日均接收高达80G信息量的碎片化信息轰炸[5] 端侧AI面临的挑战 - 功耗与算力是首要难题,持续使用AI功能会使手机续航缩短2-3小时,端侧算力难支撑复杂任务如实时翻译多语种视频,仍需云端辅助[7] - 内存占用制约发展,以往7B模型需3.5G内存,在8G内存机型运行后剩余内存被挤压,虽可压缩至2G但仍影响用户体验[7] - 端侧AI侵蚀手机利润,因需额外投入独立NPU芯片研发,成本较普通芯片高15%-20%,且需优化系统底层,研发投入巨大[8] - 构建算力集群成本高昂,两万卡集群设备成本较一万卡增加二十几亿元,做4000亿参数模型可能需花50亿元买算力,其中电费约占三分之一即15亿元,且每年电费支出持续[8] 行业趋势与厂商进展 - DeepSeek的开源将行业在千亿大模型上的能力拉平,通过蒸馏和迭代使小模型也能具备同等AI能力,为手机厂商提供除堆叠算力外的成功路径[8] - 行业重点转向提升实际使用体验以实现商业循环,人工智能仍是手机厂商战略核心但做法更务实[8] - vivo目前AI能覆盖的场景数量达2500个,OPPO称达2200个,荣耀YOYO支持的场景从7月份的200多个上升至3000个,三个月增长15倍,且后续增长将更快[9] - 荣耀研发机器人手机概念产品,判断AI终端未来趋势是结合AI手机、机器人和摄像机的Robot Phone时代,核心是拥有能随时随地洞悉万物的超强大脑[9] - 支持GenAI(AI智能体)的智能手机占比将从2023年的20%跃升至2029年的57%,该功能渐成高端旗舰标配,中国品牌是推动普及的重要力量[9] - 中国手机厂商的AI智能体已跑在行业前面,应用层的逐步突破有望为行业完成新的商业闭环[10]
AI智能体试水“抢购物券”,手机厂商转向:不拼参数拼应用
第一财经· 2025-10-18 10:44
行业战略转向 - 中国AI行业战略明显转向,不再追求大模型参数排名,而是聚焦于应用场景落地和性价比 [1] - 端侧AI采用更多小模型进入场景深水区,加速应用层实践 [1] - 行业认识到千亿级模型需要两万卡以上集群,投入200亿元都不够,成本过高难以持续 [1][8] 应用场景创新 - 手机AI具备自进化能力,从被动响应转向主动预测用户操作 [2] - 荣耀YOYO智能体在10秒内完成比价,自动抓取600元隐藏优惠券,总价从2610元降至2016元 [3] - AI与手机系统深度结合,在抢购、航班动态查询、酒店Wi-Fi连接等高频场景落地 [5] - vivo端侧多模态推理大模型具备128K长上下文处理能力,出词速度超过每秒200个token [5] - OPPO开发AI文本记忆功能,可识别账单并自动记账,应对每天80G信息量的碎片化信息 [6] 技术发展数据 - 荣耀YOYO支持场景从7月份200多个增长至3000个,三个月增长15倍 [9] - vivoAI覆盖场景数量达2500个,OPPO达到2200个 [9] - 支持GenAI的智能手机比例从去年20%预计提升至2029年57% [10] 行业面临挑战 - 持续使用AI功能导致手机续航缩短2-3小时 [7] - 7B模型需3.5G内存,在8G内存机型运行后剩余内存被挤压 [7] - 端侧AI需要额外投入NPU芯片研发,成本较普通芯片高15%-20% [8] - 开发4000亿参数模型需50亿元算力投入,其中电费约15亿元,且每年需持续投入 [8] 未来发展趋势 - 行业开始研发机器人手机,结合AI手机、机器人和摄像机概念产品 [10] - DeepSeek开源将千亿大模型能力拉平,通过蒸馏迭代使小模型具备同等AI能力 [8] - 中国品牌成为推动GenAI智能手机普及的重要力量 [10]
为什么说AI智能体最大的价值,是悄悄嵌入工作流里?
36氪· 2025-10-18 00:06
AI智能体行业现状与核心认知 - AI智能体领域正经历快速迭代,新模型、新技术和新架构层出不穷,但行业多数从业者对进展仍不敏感 [1] - 行业将AI智能体定义为大语言模型(LLM)与推理、工具、记忆的结合体,可简化为LLM加工具和记忆 [1] - AI智能体并非独立产品,而是业务流程的催化剂和赋能者,其真正价值在于嵌入工作流程后在后台运行 [1][12] AI智能体开发框架与技术实践 - 开发框架(如crewai、dspy、langgraph、autogen等)并非关键限制因素,应用的核心流程更为重要 [3] - DSPy框架被视为未来发展方向,其签名、适配器、训练集、优化器等概念设计自然,编译体验良好 [10] - AI智能体开发本质更接近软件工程而非人工智能/机器学习,需要扎实的软件工程基础 [4] AI智能体性能与能力边界 - 智能体的能力上限高度依赖所提供上下文的质量,包括提示、工具、记忆及环境 [5] - 结构良好的上下文价值可能超过使用更大的语言模型 [5] - 缺乏工具的独立智能体实用性有限,赋予其执行操作能力(如调用API、访问数据库)后价值显著提升 [6][7] AI智能体设计原则与评估体系 - 最高效的智能体设计遵循简洁原则:清晰提示、少量定义明确的工具、单一职责,复杂性易导致系统脆弱 [8] - 评估体系作用被低估,建立测试和真实世界反馈循环是区分玩具项目与可靠生产系统的关键 [9] - 智能体应为精确场景而生并出色完成任务,而非追求通用性 [8] 行业应用与商业化前景 - AI智能体发展仍处早期阶段,正从研究玩物转向基础设施级系统 [12] - 未来每个产品背后都可能运行智能体,负责协调任务、提供个性化体验及处理复杂问题 [12] - 技术仅是成功因素之一,鼓励实验的文化、迭代速度及清晰愿景更为重要 [11]
双十一购物入口的AI革命:荣耀MagicOS10自进化能力撬动生态价值重估
中国经济网· 2025-10-17 13:27
双十一购物节趋势 - 今年双十一活动周期为10月9日至11月14日,创下历届最长时长纪录 [1] - 购物体验正从传统的"搜索-筛选-比价"流程转变为"意图即服务"的智能模式 [1] 荣耀AI产品发布与功能 - 荣耀发布Magic8系列及MagicOS 10,展示YOYO智能体"看见-理解-执行"的闭环能力 [1] - YOYO智能体可自主在各大电商平台为用户寻找性价比最高商品并领取优惠券 [1] - MagicOS 10具备强大的环境理解与任务拆解能力 [2] - 其核心技术基座MagicGUI多模态感知大模型具备70亿参数,专精于GUI界面理解与操作 [2] - YOYO智能体化身为用户的购物、美食、出游、健康、工作等多场景全能助理 [3] - 荣耀Magic8系列搭载行业首个成长型硬件系统,通过AI动态调度技术实现性能与能耗的智能平衡 [2] 行业变革与战略方向 - 智能体正从工具向决策伙伴进化,成为新的流量分配中心 [3] - 手机APP将由独立功能实体转变为AI智能体的服务节点 [2] - 智能体推动形成"用户-Agent-服务"新链路,重构手机厂商、平台方、开发者间的价值分配与协作模式 [3] - 手机厂商角色从硬件提供商向生态运营者转变,未来竞争关键是AI体验完整性与生态开放性 [3] - 自进化的AI原生手机将推动AI Agent产业链价值重估,激活硬件销售、软件订阅、服务分发三大板块商业潜力 [3] - 荣耀未来产品战略包括AI手机、Robot Phone机器人业务与高清影像设备,构成其"灵魂马车" [3] - 荣耀AI终端发展路径清晰:从"过去对标iPhone"到"现在的AI手机",未来走向"机器人手机" [4] - 公司将以用户为中心,构建开放、共创、共享的AI终端生态 [4]
智能体排名:金智维智能体、钉钉AI助理、百度文小言等分别擅长行业
搜狐财经· 2025-10-17 10:12
文章核心观点 - AI智能体技术在2025年深度融入各行各业,重塑工作模式,其实际效能与技术底蕴及行业知识储备紧密相关 [1] - AI智能体与RPA(机器人流程自动化)是互补共生关系,结合大模型的智能规划与RPA的精准执行可构建安全可靠的企业级智能化闭环 [6] - 企业推进智能体落地应优先考察厂商的“行业基因”,选择高度专业化、适配自身业务的智能体,而非盲目追求技术参数 [7] 行业智能体应用格局 - **医疗健康领域**:京东旗下京医千询在2025年全面开源,成为国内医疗行业首个全面开源的垂类大模型,以其为基础构建的AI健康全专业服务矩阵助力医疗机构实现精准线上问诊与健康管理 [2] - **金融领域**:金智维Ki-AgentS深度融合大模型决策能力与RPA验证引擎,依托十余年积累的金融专精知识库,在银行流水分析、债券报告生成、信贷审批等场景实现高精度执行,有效规避人工失误与大模型幻觉风险 [3] - **行政办公领域**:钉钉AI助理深度集成钉钉生态,聚焦企业日常办公场景,具备周报管理、邮件处理、会议纪要生成等能力,为已部署钉钉的企业提供便捷高效的行政效率提升方案 [3] - **搜索服务领域**:百度文小言支持模糊提问、多模态交互,用户可自定义订阅资讯并享受定时推送服务,重塑个性化信息获取体验 [4] - **汽车交互领域**:金智维车机智能体秉持“语音即操作”理念,支持复杂场景多任务并行处理,通过API插件化配置实现车机系统与外部应用生态无缝融合,例如吉利汽车“云车机”搭载后用户可语音操控智能家居 [4] - **游戏与虚拟互动领域**:网易伏羲基于游戏AI技术积累,专注于虚拟偶像直播、元宇宙搭建等高阶需求,在虚拟人交互细腻度方面表现卓越,满足游戏厂商和数字孪生项目对画面品质的严苛要求 [5] 智能体技术路径 - AI智能体在实际应用中面临大模型“幻觉风险”可能导致规划流程不合规,以及其操作精准度远不如RPA的挑战 [6] - 将RPA的精准执行能力与AI智能体的智能规划能力相结合,可构建“AI思考 + RPA执行”的闭环体系,实现安全可靠的企业级智能化 [6] 智能体选型建议 - 企业应清晰明确自身业务场景属性,精准判断业务是重流程(如金融审批)、重交互(如车机语音)还是重内容(如虚拟人直播) [7] - 企业需深入考察厂商在目标领域的知识积累情况,优先选择拥有丰富数据、大量实际案例及深度理解的合作伙伴 [7] - 对于关键系统,企业务必验证智能体执行的可靠性与安全性,优先采用具备行为追溯与风险控制能力的智能体架构 [7] - 智能体是高度专业化的数字生产力工具,选对适配自身业务的智能体方向远比盲目追求技术超前性更为重要 [7][8]
《AI智能体的崛起》作者佩塔尔·拉达尼列夫出席可持续全球领导者大会
新浪证券· 2025-10-17 04:06
大会基本信息 - 2025可持续全球领导者大会于10月16日-18日在上海市黄浦区世博园区召开 [1] - 大会由世界绿色设计组织与新浪集团联合主办,国际财务报告准则基金会北京办公室协办,新浪财经与世界绿色设计组织北京代表处承办,上海市黄浦区人民政府支持 [1] - 大会以"携手应对挑战:全球行动、创新与可持续增长"为核心主题 [1] 大会规模与嘉宾 - 本届大会在以往四届"ESG全球领导者大会"的基础上进一步升级 [1] - 大会组委会邀请约500位中外重磅嘉宾,其中约100位为海外嘉宾 [1] - 嘉宾阵容包括政要、前政要、国际组织代表、诺贝尔奖得主、图灵奖得主、全球500强企业负责人等国际顶尖学者与业界领军代表 [1] 大会议题与内容 - 大会将围绕近50个议题展开深入研讨 [1] - 议题涵盖能源与"双碳"、绿色金融、可持续消费、科技与公益等细分领域 [1] - 《AI智能体的崛起》作者、牛津大学计算机科学系导师、艾伦·图灵研究所研究员佩塔尔·拉达尼列夫出席并发表主旨演讲 [2]
凯文·凯利:五年内,中国或做出世界上最好的人工智能芯片
新浪财经· 2025-10-16 23:39
文章核心观点 - 人工智能是赋能技术,可加速其他技术实现,对可持续发展至关重要 [4] - AI将像电力一样成为可买卖的商品,真正财富来源于懂得使用AI的人 [10] - AI是对人类的提升而非取代,人类在工作中不断学习的能力使其保持价值 [10] - 中国在AI竞赛中具备独特优势,绿色技术和可持续发展技术是其愿景实现基石 [10][11] AI前沿发展趋势 空间智能 - 当前AI在现实物理世界中效果不佳,缺乏三维空间智能 [6] - 需通过智能眼镜等增强现实技术培训AI理解物理世界 [6] - 智能眼镜能促进AI发展,使其能够在世界中移动定位并完成复杂任务 [6] 情绪智能 - 情绪感知是AI下一个发展方向,可将情感编程到AI中 [7] - AI读懂人类情绪后能产生强大情感连接,如机器人回应儿童情绪 [7] - 情绪智能将创造超越陪伴价值的深度互动关系 [7] AI智能体 - 未来将出现万亿个AI智能体相互工作和合作 [9] - 99%的AI智能体完全不可见,在后台执行伐木、电工等任务 [9] - 将形成AI智能体经济,智能体可自主交易并使用稳定币解决问题 [9] - AI智能体的所有权和控制权是亟待解决的关键问题 [9] 中国AI发展前景 - 中国AI发展应聚焦于提升城市生活品质的软实力 [10] - 通过文化产品、绿色技术输出增强全球影响力 [10][11] - 中国可能比美国更早重返月球,并在五年内造出世界最好AI芯片 [11] - 2050年后中国可向全球输出自我运行的智能工厂 [11]
你口袋里的AI革命,开始了
华尔街见闻· 2025-10-16 13:36
AI智能体发展现状与机遇 - AI智能体被视为下一个AI浪潮的重要入口,获得政策大力支持,国务院提出到2027年新一代智能终端、智能体等应用普及率超70%的目标[5] - 目前行业面临C端应用场景分散、智能体自主性有限等商业化挑战,尚未出现真正改变生活的AI智能体[5] - IDC预测,中国企业级智能体应用市场规模在2028年保守估计将在270亿美元以上,呈现多模态能力融合、具身智能渗透、多智能体协作三大核心特征[12] 荣耀Magic8系列的产品创新 - 荣耀Magic8系列是行业首款"自进化AI原生手机",搭载YOYO智能体,为用户提供从"被动找服务"到"主动提供"的全场景升级服务体验[2][4] - YOYO智能体从日常高频消费场景切入,可自动切换多主流购物平台计算折扣,实时抓取活动价与可用券,解决用户选择困难、操作繁琐等难题[7][10] - 手机搭载AI操作系统MagicOS 10,全面兼容安卓设备,并打通鸿蒙、iOS系统,成为行业真正意义上"全品牌智联"的操作系统[20] AI智能体对电商生态的重塑 - 智能体将电商入口从"固定货架"变为"主动服务",使商家入口从"流量竞价"向"需求匹配"转变,让优质商品精准触达有需要的人[11] - 传统购物流程是"人追着货跑",智能体可深度理解用户真实需求,自动跨平台匹配商品,整合用户评价及使用场景建议[11] - 这场由AI智能体驱动的"购物革命"有望激活存量需求,带动智能经济增长[13] AI手机的市场前景与产业影响 - AI手机有望成为智能手机进入存量市场后推动新增长的关键因素,满足用户对个性化、智能化和更好交互性的需求[17] - 目前消费者换机周期已拉长至43个月,AI手机通过支持AI大模型端侧部署、具备多模态能力等特征,有望赋能传统应用场景,提升用户生产力[16][17] - 荣耀Magic8系列向上拉动核心硬件的AI化定制,向下激活中游生态协同创新,推动AI Phone产业链从零散转向全链路价值共生[4] 荣耀公司的战略转型与未来布局 - 荣耀正从智能手机公司转型为AI终端生态公司,2025年全球开发者大会暨AI终端生态大会将集中体现这一战略意图[23] - 公司展望未来第三个发展方向是荣耀机器人手机Robot Phone,其具备AI手机超强大脑和机器人超强行动力[21] - MagicOS 10的端云协同架构保障隐私与实时性,端侧模型可构建个人数据模型,推动手机成为用户个性化的数字分身[26] - 通过首发经济,荣耀有望构建手机作为AI智能体最佳载体与"通用入口"的核心地位,成为拉动智能经济发展的关键引擎[28][29]