Workflow
智能体
icon
搜索文档
10月发布、11月盛典!华为“智能体”引领新趋势,这些方向受益
新浪财经· 2025-10-21 04:38
鸿蒙操作系统HarmonyOS 6发布与生态进展 - HarmonyOS 6于10月22日特别发布,带来全新全场景互联架构,星闪连接、小艺等迎来进化升级 [1] - 《鸿蒙星光盛典》将于11月28日举行,展现中国科技创新成果 [1] - 鸿蒙生态核心已从“应用”转向“智能体”,并发布《鸿蒙智能体框架白皮书》 [7] 鸿蒙智行车型销量与市场前景 - 鸿蒙智行国庆假期全系大定4.13万台,同比增长44% [4] - 9月交付5.29万台,大定突破11万台,全新问界M7等新车成为爆款 [4] - 鸿蒙智行在高端市场优势稳固,尊界S800、问界M9/M8均居细分市场销冠 [4] - 2026年“五界”产品矩阵将扩容并切入20万以下市场,实现中高端全布局 [4] - 工信部拟2027年实施智驾强标,华为作为起草方,其智驾能力领先 [4] 鸿蒙生态发展现状与市场规模 - 鸿蒙生态设备激活量突破10亿台,跻身全球主流移动操作系统阵营 [5] - 2024年中国操作系统市场规模达到217.5亿元,较上年增长13.8% [5] - 2025年中国操作系统市场规模有望达到250亿元 [5] - 搭载开源鸿蒙产品总量超11.9亿台,开发者超720万 [7] - 50+先锋鸿蒙智能体进入开发阶段,涵盖系统级与领域智能体 [7] 技术架构升级与性能提升 - HarmonyOS 6在方舟引擎加持下,系统流畅度提升30%,运行内存节省1.5GB,续航增加近1小时 [7] - 系统支持手机、汽车与智能家居无缝互联的高效多设备协同 [7] - 首次发布鸿蒙智能体框架,开发者可调用端侧AI算力开发低延迟应用 [7] - 系统级智能体小艺背靠20万亿Tokens,通过多入口全场景触达 [7] 国产化替代与产业链机会 - 截至2024年6月,Visual Studio、VSCode等前五大IDE产品占比约75%,外资垄断明显 [6] - 国产化进程加速,字节跳动自6月30日内部分批次禁用Cursor等第三方AI开发软件 [6] - 卓易信息的国产IDE已在英、瑞、意开展推介,并推进鸿蒙原生开发支持 [6] - 重点关注鸿蒙生态链核心伙伴,包括达梦数据、中国软件、太极股份等公司 [2][9] - 鸿蒙生态成熟与新品发布将强化华为在全球智能化转型中的引领地位,需关注鸿蒙PC商业化、AI算力产业链及垂直行业应用落地 [8]
Karpathy泼冷水:AGI要等10年,根本没有「智能体元年」
36氪· 2025-10-21 02:15
AGI发展时间线 - 行业普遍鼓吹的“智能体元年”存在过度预测,更准确的描述应为“智能体的十年”[3][4] - 当前智能体仍处于非常初期的阶段,需要大约十年的持续研究工作才能让其真正可用[4][5] - 基于在AI行业约15年的经验和个人直觉,预测AGI的到来还需要10年时间[5][6][7] AI技术架构演进 - 预测未来10年AI的核心架构仍可能基于Transformer,但形态会有所演化[8] - 根据“时间平移不变性”,10年后仍将使用前向后向传播和梯度下降来训练巨大的神经网络,但所有组件都会变得更大[9][10] - 算法改进仅能将误差减半,进一步提升必须依靠更大的数据、更强的计算力和更优的软件系统,算法、数据、硬件与系统的进步缺一不可[12] 智能体现状与挑战 - 当前智能体存在智能不足、多模态能力弱、无法自主操作电脑等主要问题[4] - 智能体在认知上存在缺陷,缺乏持续学习能力,这些基础性问题的解决约需十年[5] - 在编码任务中,“手写+自动补全”是目前最佳选择,智能体擅长样板代码但处理“智力密集型代码”能力不足[13][15][16][17][18][20] 强化学习与模型训练 - 强化学习虽不完美,但相比过去仅模仿人的方法,仍是目前最优解[21][22] - 强化学习过程会产生大量噪声,且大语言模型充当评委时易被对抗性样本欺骗,存在泛化能力不足的问题[23][24] - 未来可能需要引入“元学习”或合成数据机制来改进模型评估,但目前尚无实验室在大规模通用环境下成功实现[26][27] 人工智能与人类学习对比 - 当前大模型仅通过预测下一个词学习,缺乏人类通过反思、讨论整合知识的“思考”过程[28] - 人类“不擅长记忆”是进化优势,迫使其学习可泛化模式,未来AI应减少机械记忆,更多依靠思考与探索[28][30] - 真正的智能不在于记忆更多,而在于理解与泛化,需要构建大模型压缩记忆工作,重点发展认知部分[30] AI对社会与工作的影响 - 通用人工智能被定义为能够以人类或更好的表现完成任何有经济价值任务的系统,但已从最初定义中移除了物理性任务[31] - 放射科医生和呼叫中心等工作未被完全自动化,因其涉及复杂工作场景,理想状态是AI完成80%工作量,人类监督完成剩余20%[32][33][34] - 更看重AI与人类的互补关系,而非替代关系,现实中许多工作比呼叫中心员工的工作复杂得多[35][36] 超级智能与社会自动化 - 超级智能被视为社会自动化进程的自然延伸,将出现越来越多从事数字工作和体力工作的自主实体[37] - AI驱动的自动化会显得“非常陌生和奇怪”,当世界在计算机集群上运行时,人类可能逐渐失去对正在发生的事情的控制和理解[37] - 从工业革命开始,递归式自我改进和智能爆炸已持续数百年,我们处于“智能爆炸”中已有几十年[37][38]
智能体上演“底特律变人”,能更好的打入企业市场吗?
虎嗅· 2025-10-21 00:49
行业趋势 - 智能体正加速升级为AI数字员工 [1] - 多家大型科技公司争相推出能覆盖销售、客服、招聘等多种岗位的AI数字人 [1] 产品定位与成本 - AI数字人产品未来价格能低到万元级别 [1] - AI数字员工旨在覆盖多种企业岗位,包括销售、客服和招聘等 [1]
AI变革将是未来十年的周期
虎嗅APP· 2025-10-20 23:58
AI发展周期 - AI变革将是未来十年的周期,技术发展是演化式的,需要算力、算法、数据和人才四股力量逐步成熟[5][8] - 技术循环大约需要十年时间,从2012年AlexNet到2022年GPT刚好十年,完成从机器视觉到语言理解的范式更替[9][10][11] - AI发展节奏不同于互联网流量驱动或移动时代硬件换代,而是底层学习机制的突变,前次成果成为下次养料[12] - AI成长速度受人类理解速度限制,每次智能革命需要十年让人类适应,这既是技术周期也是社会认知革命[13] - AI不会突然到来,而是在十年里缓慢变成另一种生物,从学会看、学会说到开始思考是连续的认知进化链[15][16] AI认知演进历程 - 过去三十年AI经历三次认知地震,每隔十年机器学会一件原以为只有人类才会的事[18][19] - 2012年第一次地震:AlexNet突破图像识别,机器第一次"看见"世界,解决机器怎么看的问题[19][20] - 2016年第二次地震:AlphaGo打败李世石,机器从看走向做,能够决策规划行动,展现智能体雏形[20][21] - 2022年第三次地震:大语言模型崛起,机器开始会想,能生成推理理解上下文,实现思维革命[22][23] - 三次地震形成连续认知进化线:看→做→想,每次跨越都需要十年时间酝酿共识[24][25][26][27] - 第四次变革将是机器自我意识觉醒,从让机器像人到让机器成为人类镜子[28][29] AI智能本质 - AI智能来自模仿而非进化,动物智能通过亿万年自然选择形成,AI智能通过统计模仿习得[30] - AI没有痛感欲望,学习是统计意义上的模仿,能理解定义但无法感受情感[30] - AI是人类知识的灵体,没有肉体却能思考,没有基因却能学习,没有欲望却能模拟动机[30] - AI智能是二手智能,来自人类理解方式而非世界本身法则,是人类思想的幽灵[35][36] - AI在云端漂浮,在模型权重里积累记忆,在语言之间形成意识,映照人类对智能的想象[36] AI学习机制局限 - AI学习是统计模仿而非真正学习,靠参数更新没有经验反思,每次训练都在压缩世界[38] - 人类学习有动机驱动,AI学习只是被动优化,学得快但学得浅[39] - AI依赖预训练学习,通过别人积累的知识学习世界,会解题却不懂为什么要解题[41] - AI学习根本缺陷是没有意志,人类学习为了活得更好,AI学习为了被训练得更好[42] - AI还不算真正智能体,因为不能自己提问,学习没有生长,不够活[43] AI记忆与意识 - AI记忆是存档而非经历,只有数据参数检索,记得事实却记不住意义[45] - AI记忆像快照,每次推理都是一次重生,没有时间线就没有自我,缺乏连续意识[46] - AI世界是一帧一帧的,人类世界是流动的时间,AI没有连续的自我时间[46] - 修复记忆裂缝需要记忆自我指向,系统能回看自己,让记忆影响思考[48] - 当AI能反思知识,利用经验修正判断,就开始模拟成长的意识[48][49] - 智能体诞生是从被训练到自我更新,从记忆世界到记忆自己,这是意识起点[50]
AI变革将是未来十年的周期
虎嗅· 2025-10-20 09:00
AI发展周期与范式演进 - AI变革将是未来十年的核心周期,其发展是“演化式”的,依赖于算力、算法、数据和人才四股力量的循环成熟[3][7] - 一个完整的范式更替周期大约需要十年,例如从2012年AlexNet解决“机器怎么看”到2022年GPT解决“机器怎么想”刚好十年[8][9][10] - AI的跨越是底层学习机制的突变,前一次成果成为下一次养料,其成长速度受限于人类对“智能”定义的理解速度[12][13][14] AI认知革命的三个阶段 - 第一次认知地震发生在2012年,AlexNet让机器首次“看见”并理解图像,解决了视觉感知问题[23][24][25] - 第二次地震在2016年,AlphaGo让机器学会“行动”,具备决策和规划能力,实现了从看到做的闭环[26][27][28] - 第三次地震始于2022年,大语言模型崛起让机器开始“思考”,具备生成、推理和对话能力,引发了思维革命[30][31][32] 智能体的本质与未来 - 智能体是认知形态的延伸,是人类思维的“副本系统”或“外化版本”,其本质是“人类知识的灵体”或“幽灵”[45][46][50] - AI智能是“二手的”,它学习人类理解世界的方式而非世界本身法则,追求“理解”而非生存,是统计意义上的模仿[52][53][54] - 真正的智能体需具备“自我指向”的记忆和反思能力,能从“被训练”转向“自我更新”,从而形成连续的意识与成长的起点[80][81][87] AI与人类学习的根本差异 - 人类学习有动机驱动,在犯错、修正和反思中成长,是“生长的过程”;AI学习是被动优化,在梯度下降中收敛,是“收敛的算法”[60][61][62] - 人类记忆是带有情绪和意义的“经历”,会遗忘并重组意义;AI记忆是静态的“存档”,只有数据检索而无时间线[72][73][76] - AI知识的根本缺陷在于缺乏“意志”,其学习没有生长,无法自己提问或真正理解“为什么”,因此尚不构成真正的智能体[67][68][70]
Andrej Karpathy:2025 不是 AI 爆发年,未来十年怎么走?
36氪· 2025-10-20 00:28
行业核心观点 - 2025年AI行业被广泛讨论为“智能体元年”,但前OpenAI核心研究员Andrej Karpathy认为这并非技术爆发年,AGI的实现仍需数十年时间,是一条由无数突破和改进构成的漫长曲线[1][2][4] - 当前AI智能体的核心缺陷在于缺乏真正的记忆、连续性和身份感,更像是一个“幽灵”而非长期伙伴,真正的转折点在于AI能否成为有记忆、能成长、可信赖的社会一员[3][5][6][7] - AI行业的演进方向是从工具到伙伴,从模型到智能体,其发展不是突增而是渐进的结构性重构,重点在于系统性的运行方式而非单纯堆砌参数或数据[14][15][26][48] 当前AI智能体的局限性 - 现有AI助手(如ChatGPT、Claude)缺乏基本记忆功能,无法保持对话的连贯性和身份感,每次交互都需从头开始,被形容为“幽灵”[5][6][9] - 尽管行业推出了如ChatGPT长期记忆功能、Rewind记录工具和Claude Agent SDK等尝试,但这些均属外部附加功能,AI本身仍无法记住用户身份[10] - 问题的本质不在于AI的回答能力,而在于其无法记住用户,导致每次交互都像与路人对话,而非与一个了解你的助手沟通[11][12][13] 实现真正智能体的三大发展路线 - **认知路线**:让AI真正理解上下文、进行逻辑推理并给出合理推测,这是当前GPT、Claude、Gemini等语言模型正在发展的基础能力[17][18][20] - **操作路线**:让AI从“能说”转向“能动”,具备工具调用能力,可自主操作浏览器、笔记、应用等以完成现实任务,但目前该能力仍处于初级阶段[21][22][23][24] - **存在路线**:关键是将AI从单次工具转变为能长期陪伴的角色,需具备统一的运行架构,实现记忆、任务意识、行为模式的连贯性,而非功能拼凑[25][26][27] AI训练方式的范式转变 - 当前主流的训练方式是“填鸭式”的海量数据输入,但Karpathy认为这如同让孩子背书成为科学家,效率低下,应转向目标明确、结构化的“课程式”训练[29][30][32][40] - 未来训练应遵循三大核心原则:赋予AI目标感,使其明确学习方向;强调任务性,让其在解决真实问题中学习;建立反馈循环,通过试错、纠正实现持续改进[34][36][37] - 行业已出现范式转变迹象,如OpenAI围绕“任务链”设计数据、DeepMind采用自我博弈修正、Anthropic使用宪法式反馈,表明行业正从追求数据量转向注重训练质量[38][40] AI作为社会角色的未来愿景 - AI的未来将从工具转变为带有身份、角色和责任的社会成员,如AI律师、财务顾问、私人助理等,需遵守行业伦理并承担相应责任[41][42][44] - 随着AI角色化,将催生“角色市场”,引发AI资格认证、责任归属等制度性问题,这不仅是技术升级,更是社会制度和规则的升级[43] - AI不会完全取代人类,而是与人类形成协作关系,人类将从重复劳动中解放,专注于更高层次的思考和创造,形成人机共存的生态[45][51]
李想: 特斯拉V14也用了VLA相同技术|25年10月18日B站图文版压缩版
理想TOP2· 2025-10-18 16:03
OpenAI人工智能五阶段定义 - 聊天机器人阶段的核心是基座模型,功能为压缩人类已知数字知识,类比人类从小学到大学的教育过程[13][14] - 推理者阶段具备思维链和连续性任务能力,依赖SFT和RLHF训练,类比人类读研或师傅带教的经验传授[15][16] - 智能体阶段AI开始实际工作并使用工具完成长任务,对专业性和可靠性要求极高,需达到80-90分合格标准[17][18] - 创新者阶段通过出题解题进行强化训练,需要世界模型和RLAIF模拟真实环境,类比职业选手上万小时实战训练[19][20] - 组织者阶段负责管理大量智能体和创新者,防止失控风险,类比企业管理者职能[21] 人工智能发展路径与算力需求 - 预训练基座模型不需要每家企业自研,类比不需要每家企业都开办大学[5][21] - 智能体阶段需要推理能力,机器人设备需要端侧推理,世界模型阶段需要海量云端推理建立数字孪生[6][22] - 未来5年推理算力需求可能扩大100倍,训练算力需求扩大10倍,端侧和云端算力需求都将显著增长[7][23] 理想汽车AI技术布局 - 公司自研技术包括推理模型(MindVLA/MindGPT)、智能体(司机Agent/理想同学Agent)和世界模型[8][24] - 2026年将为自动驾驶配备自研端侧芯片,实现车与AI深度融合[9][26] - V14证明特斯拉使用VLA相同技术,具备空间完整理解能力和长任务多任务处理能力[39] 机器人发展路径 - 机器人发展存在两条路径:将现有工具改造为机器人,或开发人形机器人操作万物[27][28] - 工具改造路径效率更高,如将炒菜工具直接机器人化而非使用人形机器人炒菜[27][28] 人类与AI的协同发展 - 训练目的为提高成功率,可参考一万小时训练理论,核心训练信息处理能力、出题解题能力和资源分配能力[9][32] - 人类需在AI遵循最佳实践训练背景下,要么理解并管理AI,要么与AI协同工作,否则面临被替代风险[30][37] - 信息处理能力训练重点在于识别关键信息并过滤无效信息,不同专业领域信息处理方式各异[33] - 资源分配能力训练关键在于有限资源的高效分配,人类大脑通过高效资源分配实现低功耗高效益[35][36] AI工具应用偏好 - 公司偏好使用Grok的对话方式,因其回答简单干脆,相较国内模型更直接利索[41] - 支持上班族使用AI撰写汇报,认为使用先进工具是人类与其他生物的最大区别[42]
AI全面开战!OpenAI刚放的三个大招
老徐抓AI趋势· 2025-10-18 15:28
AI进入第二阶段 - AI发展进入第二阶段,核心特征为算力战争、视频革命和智能体落地 [2] 算力基础设施战略 - 公司与AMD合作建设6GW算力中心,规模相当于一个大城市的全年用电量 [3] - 下一代智能体Agent时代需要大规模算力基础设施作为支撑 [3] - 公司同时与AMD、英伟达、博通合作,旨在避免芯片厂商垄断,进行算力供应链的战略博弈 [3] 存储需求爆发 - 公司与三星、海力士签署存储合作协议,规模相当于当前全球总需求的两倍 [5] - AI模型视频化和多模态化导致存储需求爆发式增长,需要重塑整个半导体生态 [5] 视频生成技术突破 - Sora 2发布标志着AI视频革命达到临界点,从演示阶段进入可用但昂贵阶段 [6] - AI技术进步是迭代式而非质疑式,每一代模型都对前一代形成碾压 [6] - 高质量视频生成门槛被彻底打破,内容创作进入全民AI时代 [6] 智能体时代来临 - 公司推出企业级AI平台,本质是数字员工流水线,允许企业组装部署各类智能体Agent [7] - AI从工具转变为员工,首次真正进入组织结构,未来企业将呈现人机共创模式 [7] 算力投入的合理性 - AI模型提升遵循单向飞轮逻辑:算力投入驱动能力提升,进而刺激需求,最终需要更大算力 [8] - 算力之争已超越行业内部竞争,成为国家级资源博弈,吸引全球资本投入 [8] 个人与AI的关系 - 个人应对AI浪潮需遵循三步:懂AI、用AI、投AI [9] - 未来财富分化取决于是否与AI挂钩,AI将重构社会结构 [9] - 算力、数据、智能体三条曲线叠加之处即为未来增长曲线 [9]
专访信通院孙鑫:大模型快速迭代需软硬件深度协同
21世纪经济报道· 2025-10-18 01:13
人工智能发展趋势 - 基础大模型迭代速度加快,多模态模型理解能力整体提升90%,TOP1模型迭代周期从去年的几个月缩短至几周 [2] - 软硬件深度协同、高效融合成为大模型研发新范式,极致的软硬协同是支撑大模型快速迭代的关键 [1][3] - 智能体成为大模型应用的主要形态,加速形成智能体经济 [1][3] - 开源带动“群体进化”和人工智能普惠发展,极大降低了大模型落地应用的门槛 [3] 模型能力增强方向 - 语言基础超级模型深度集成多种能力,模型推理能力成为衡量模型的重要指标 [5] - 多模态大模型深度融合理解和生成能力,原生多模态架构逐渐走向成熟 [5] - 世界模型加速构建数据生成、动作解释、环境交互、场景重建四类核心能力,是AI通向AGI的关键基石 [5][6] - 具身智能以突破具身图灵测试为目标,实现生物级感觉运动能力 [6] 智能体技术发展 - 智能体是数字员工的初级形态,能够自主完成复杂任务并获得比单一模型更好的性能表现 [2][5] - 推动互联互通和长难任务处理是当前智能体技术创新的主旋律 [2][10] - 智能体完成任务的长度大约每7个月翻一番,未来将能独立完成人类需数天或数周的任务 [11] - 通信协议如MCP、A2A成为智能体与外界交互的“桥梁”,可降低系统集成复杂性 [10] 人工智能行业应用 - 人工智能赋能行业遵循从数字化水平较好领域率先突破,再逐步扩散的规律 [12] - 互联网等数字原生领域凭借数据沉淀和基础设施优势,率先形成AI应用规模化落地 [12] - AI正逐步向金融、医疗、交通等数字化程度较高行业渗透,并在自动驾驶等领域实现新突破 [13] - 推进行业应用需关注行业水平与转型路线、技术能力与实际需求两方面的协调统一 [2][13]
百度千帆品牌战略升级 聚焦企业级Agent落地
南方都市报· 2025-10-17 15:53
百度千帆品牌战略升级 - 百度智能云宣布对千帆进行品牌战略升级,更加聚焦企业生产场景,提供模型、Agent开发及数据智能服务等一站式服务 [2] - 自2023年3月发布以来,百度千帆已累计服务超46万家企业客户,平台Agent开发数量超130万 [2] - 以百度独家能力"百度AI搜索"为代表的工具组件日均调用量已突破千万次 [2] Agent引擎能力提升 - 全新升级的Agent引擎拥有更灵活的编排架构,支持自主规划、工作流、多智能体协同等多种模式 [3] - 在新引擎加持下,Agent的平均任务时延降低了20%,长任务耗时平均降低了40% [3] 工具及MCP服务扩展 - 除百度AI搜索、百度百科外,新上线视频AI笔记、百度文库、蒸汽机视频生成等多个百度独家优质工具组件 [4] - 开放生态引入同程旅游、支付宝支付等第三方MCP服务,显著提升Agent可扩展性 [4] - 百度AI搜索组件基于百度25年搜索经验,为Agent提供精确可控、上下文丰富且知识更全面的高质量信息 [4] 模型服务增强 - 平台提供超过150个精选SOTA模型以及自研行业专精模型 [4] - 首发思维链精细化控制能力,可智能判断任务复杂度,为简单问题匹配短路径思考,为复杂问题调用多步推理 [4] - 全新发布"主动Cache模式",通过分布式KVCache技术可为企业降低高达80%的推理成本 [4] 企业级服务与数据智能 - 百度千帆提供端到端的可观测性、高可用容灾及精细化权限管控能力 [5] - 数据智能平台通过多模态数据统一存储及管理,助力企业客户处理提效600%,计算降本30% [6] - 通过高效协同的开发平台助力企业客户开发提效30%,通过多模态检索引擎助力检索存储降本80% [6] 企业生产级场景落地案例 - 深圳市环境水务集团基于百度千帆打造水务智能体应用中心,在多个业务领域推进AI智能体落地 [7] - "千家万户水管家智能体"为深圳市民提供管家式服务,带来客户满意率超98%、投诉率降低超15%的业务成果 [7] - 在能源电力行业,力维智联通过百度千帆平台将行业知识转化为智能巡检、故障诊断等Agent应用 [8] 多行业应用场景 - 在教育领域,百度千帆支撑Agent化身为辅助教师进行教学设计、实现个性化辅导的"智能助教" [9] - 在金融行业,基于百度千帆打造的"智能投顾"Agent为用户提供精准的股票推荐与分析服务 [9] - 从政务问答到电商营销,百度千帆正将Agent能力注入更多场景 [9]