AI Agent
搜索文档
当AI手机开始“越权”:豆包的颠覆体验,动了谁的奶酪?
36氪· 2025-12-11 09:38
文章核心观点 - AI手机正通过系统级智能体重构用户体验,其核心在于从“信息获取”转向“需求直接满足”,并具备跨应用操作和长期记忆等能力,这正在重塑移动互联网的价值链和流量入口格局 [1][2][18] - 中国手机厂商在AI驱动体验重构的竞赛中并未落后,豆包AI手机等产品展示了系统级AI的突破性进展,设定了行业新起跑线 [1][2][18] - AI手机的发展面临来自现有互联网平台逻辑的挑战,其跨应用操作能力因触及平台对流量入口和商业模式的掌控而引发冲突 [10][11][12] AI手机的功能与体验革新 - **交互模式简化**:豆包AI手机将交互简化为一次唤醒提问,例如在相册中直接呼出处理图片,无需打开独立AI程序 [3][5] - **跨应用操作能力**:豆包AI手机能执行跨应用复杂任务,例如自动打开购物App比价、或结合车票信息、地图和日历为用户设定个性化闹钟,过程由AI后台接管,主屏幕仍可正常使用 [6] - **端侧长期记忆**:豆包AI手机引入高度个性化的端侧记忆功能,用户可通过三指上滑或截屏快速保存信息,并能基于个人对话记录、短信等调取具体信息(如咖啡馆名称、取件码) [7][8] - **记忆与执行的深度结合**:豆包AI助手的Pro模式能将记忆库作为决策依据,进行深度规划并执行系列操作,例如自动准备客户会议(检索纪要、邮件、安排日程、生成草案) [9] 行业竞争格局与趋势 - **中国厂商的竞争路径**:中国手机厂商在过去十几年围绕用户体验(如性价比、影像、快充)展开竞争,最终使中国品牌占据全球手机销量的三分之一(每卖出三部手机,就有一部来自中国品牌) [1] - **当前厂商的AI策略分化**:荣耀、OPPO、vivo选择将AI能力注入具体场景(如影像、办公),OPPO的一键闪记可自动将微信支付记录转为账单,荣耀Magic可自动化执行超过3000个生活场景;华为、小米则押注生态协同,将手机作为跨设备智能中枢 [14] - **行业渗透率加速**:据Canalys数据,2025年全球AI手机的渗透率预计将达到32% [15] - **换机驱动因素转变**:2024年智能手机年平均换机率为23.7%(对应换机周期约51个月),参数内卷对大众消费者已失去意义,新体验成为推动换新的关键动力 [13] AI手机发展面临的挑战 - **与互联网平台的逻辑冲突**:AI手机的跨软件操作逻辑(由用户意图驱动)与BTA等平台的逻辑(服务必须在自身应用内完成以掌控路径、入口与收益)形成对立 [11] - **遭遇软件封禁**:豆包AI手机已被阿里系、腾讯系几乎所有应用以及部分银行App(如农行、建行)因状态异常或判定风险环境而封禁,导致登录、支付流程受阻 [2][10] - **平台方的安全与商业考量**:从安全层面,AI助手的模拟点击行为在数据特征上与黑灰产脚本难以区分;从商业利益层面,AI手机绕过App前端页面(广告、推荐流、促销入口),直达最终交易按钮,将App从流量入口降级为纯粹服务接口,冲击其核心商业模式 [11][12][13]
万咖壹联获Apple Ads官方认证:从Android 巨头到iOS生态关键玩家的历史性一跃
智通财经· 2025-12-11 07:57
核心观点 - 万咖壹联旗下玩咖欢聚获得Apple Ads官方合作伙伴认证,标志着公司技术能力获得苹果最高认可,并成功打通安卓与iOS生态,其独特的市场地位有望推动资本市场价值重估 [1][3] 认证的含金量与技术能力 - Apple Ads官方合作伙伴认证筛选标准严苛,要求AI算法能力、跨文化运营经验和数据安全合规达到顶尖水平 [4] - 公司凭借自研平台Ad Maven的三大核心技术突破获得认证:智能预算分配引擎基于280亿条历史数据构建,可将广告投放ROI提升30%以上,并帮助某头部SLG游戏在东南亚市场预约转化率提升2.4倍 [4] - 实时SOV战场感知系统每15分钟刷新展示份额数据,帮助某金融App客户在核心关键词上获客成本降低40%的同时新增用户规模翻倍 [4] - 全生命周期自动化闭环由AI替代80%重复性人工操作,运营人效提升至行业平均水平的5倍 [4] - 认证赋予公司调用苹果官方核心数据接口的权限,使其在iOS投放精准度上与普通代理拉开代际差距 [5] 战略影响与业绩验证 - 2025年上半年,公司海外收入达4190万元,同比激增439.1%,增长源于新加坡本土团队直接服务东南亚广告主 [6] - 管理层预计2025年下半年海外市场增长幅度将比上半年更大,全年海外收入有望突破2亿元,下半年收入有望达1.58亿元,是上半年收入的3.77倍 [7] - 认证在市场准入、客户结构、跨生态协同多个维度助推出海战略:业务落地周期缩短60%;客户结构从服务中国App出海转向直接获取海外本土客户,已服务Grab、Garena等企业,单客户月均投放额超50万美元;实现跨生态“一键式全球投放”,帮助某电商客户在印尼市场实现iOS与安卓双端用户增长成本同步下降35% [6] 生态壁垒与市场地位 - 公司成为全球唯一同时获得苹果官方认可、且深度绑定华为HarmonyOS及四大Android厂商的技术中台 [7] - 在Android侧,公司作为OPPO/vivo/小米游戏行业核心代理及荣耀的游戏行业独家代理,覆盖中国Android应用商店95%以上游戏分发流量 [7] - 在iOS侧,公司成为苹果全球范围的游戏与社交、金融、工具等八大行业的首选技术伙伴 [7] - 在HarmonyOS侧,公司为快应用生态发起方之一,深度参与HarmonyOS NEXT系统广告技术标准制定,是华为“鲸鸿动能”铂金代理商 [8] - “三位一体”的生态壁垒带来数据飞轮效应,横跨三大生态每日可新增7200万条数据,并能获得跨生态用户行为差异等独特洞察 [8] - 生态稀缺性使公司成为唯一能提供全渠道一站式解决方案的平台,2025年上半年实现客户留存率95%、客单价提升20% [9] 未来展望与商业模式演进 - 公司卡位AI手机时代,行业商业价值将经历三级变革:从1.0阶段的广告差价模式(参考小米生态单机ARPU约29元),到2.0阶段成为AI数据采集与标注服务商并按服务调用量收费,再到3.0阶段AI Agent成为主流,商业模式升级为交易佣金 [10][11] - 在3.0阶段,单机单用户年ARPU值可达200-300元,接近苹果当前“广告+佣金”470元的水平,是当前1.0阶段单机ARPU的近10倍 [11] - 公司为AI手机时代做好三层储备:在数据层可合法合规采集端侧语音指令数据;在标准层与各大厂商共同制定AI手机时代的快应用调用协议;在执行层于香港、新加坡、苏州设立子公司用于收购或孵化垂类Agent应用,正与某网约车平台洽谈排他性合作 [11] - 公司商业化路径有望完成从“广告变现-数据服务-佣金分成”的三级式跃迁 [12] 业绩指引与估值潜力 - 管理层给出明确增长指引:2025年海外收入将实现10倍增长,AI营销业务收入同比增长50%以上 [13];2026年HarmonyOS生态广告商业化加速,“鲸鸿动能”业务翻倍增长,ADM平台接入Google/Meta/TikTok成为全球化跨平台AI营销中台 [14];2027年首个AI Agent应用实现百万级日活,服务佣金收入占比提升至15% [15] - 公司当前市值约15亿港元,对应2025年预期收入不到0.4倍P/S,显著低于AI营销赛道平均25倍PE [15] - 若参考AppLovin 15倍P/S的估值模型,仅2025年预期40亿元收入的AI营销业务,对标估值即达600亿港元 [15] - 若2027年AI Agent业务落地,按5亿元佣金收入、20倍P/E测算,可额外贡献100亿港元估值 [15]
万咖壹联(01762)获Apple Ads官方认证:从Android 巨头到iOS生态关键玩家的历史性一跃
智通财经网· 2025-12-11 07:55
公司核心战略认证与行业地位 - 公司旗下智能营销平台玩咖欢聚正式通过Apple官方审核,成为大中华区为数不多获得Apple Ads官方合作伙伴认证的技术型服务商 [1] - 该认证标志着苹果生态对公司AI投放技术能力、数据合规体系及全球服务网络的最高认可,使公司成功打通从安卓到iOS的生态位,其价值有望在资本市场迎来全面重估 [3] - 认证赋予公司调用苹果官方核心数据接口的权限,包括搜索词趋势洞察、用户行为断点分析等,这将使公司在iOS投放精准度上与普通代理拉开代际差距,进一步夯实护城河 [6] 认证的技术含金量与核心能力 - Apple Ads官方合作伙伴筛选标准严苛,要求候选者在AI算法能力、跨文化运营经验、数据安全合规三个维度达到顶尖水平 [3] - 公司自研平台Ad Maven(ADM)凭借三大核心技术突破胜出:基于280亿条历史投放数据构建的智能预算分配引擎,可将广告投放ROI提升30%以上 [3] - 实时SOV战场感知系统每15分钟刷新一次展示份额数据,结合竞品出价智能诊断,帮助某金融App客户在核心关键词上获客成本降低40%的同时新增用户规模翻倍 [3] - 全生命周期自动化闭环由AI替代80%重复性人工操作,运营人效提升至行业平均水平的5倍 [4] 海外业务增长与战略质变 - 2025年上半年,公司海外收入达4190万元,同比激增439.1% [7] - 海外增长主要源于新加坡本土团队直接服务东南亚广告主,而非依赖国内客户出海 [7] - 公司管理层在路演中透露,2025年下半年海外市场增长幅度将比上半年更大,全年海外市场收入有望突破2亿元,即下半年收入有望达1.58亿元,是上半年收入的3.77倍 [8] - 认证在市场准入、客户结构、跨生态协同等多个维度对出海战略发挥关键作用:新加坡分部接入苹果亚太区官方支持体系,业务落地周期缩短60% [7] - 客户结构实现升级,从服务中国App出海转向直接获取海外本土客户预算,ADM平台已服务Grab、Garena等东南亚头部企业,单客户月均投放额超过50万美元 [7] - 跨生态协同允许同一客户在苹果、小米、OPPO等渠道实现“一键式全球投放”,数据策略互通,例如某电商客户在印尼市场实现iOS与安卓双端用户增长成本同步下降35% [7] 构建“三位一体”的生态壁垒 - 公司成为全球市场中唯一同时获得苹果官方认可、且深度绑定华为HarmonyOS及四大Android厂商的技术中台 [8] - 在Android侧,公司作为OPPO/vivo/小米游戏行业核心代理及荣耀的游戏行业独家代理,覆盖了中国Android应用商店95%以上游戏分发流量 [9] - 在iOS侧,公司获Apple Ads官方认证,成为苹果全球范围的游戏与社交、金融、工具等八大行业的首选技术伙伴 [10] - 在HarmonyOS侧,公司为快应用生态发起方之一,深度参与HarmonyOS NEXT系统广告技术标准制定,并晋级为华为「鲸鸿动能」铂金代理商 [10] - “三位一体”生态壁垒带来数据飞轮效应,公司横跨三大生态每日可新增7200万条数据,使AI模型能识别出跨生态用户行为差异等单一生态无法获知的洞察 [10] - 生态稀缺性使公司成为唯一无需通过多家代理、直接提供一站式全渠道投放解决方案的平台,2025年上半年实现了客户留存率95%、客单价提升20%的优异指标 [11] AI手机时代的商业模式演进与公司布局 - 随着苹果iPhone 17将深度集成Apple Intelligence,手机交互将从“点触式”向“语音指令式”革命性跃迁,重构移动生态底层逻辑 [12] - 行业商业价值将经历三级变革:从1.0阶段赚取CPI/CPM差价,到2.0阶段转变为AI数据采集与高端标注服务提供商,再到3.0阶段AI Agent成为主流交互方式,商业模式从广告收入升级为交易佣金 [12][13] - 在3.0阶段,单机单用户年ARPU值可达200-300元,逼近苹果当前“广告+佣金”470元的水平,这将会是当前1.0阶段单机ARPU的近10倍 [13] - 公司已前瞻性做好三层储备:在数据层,可在授权范围内小范围合法合规采集端侧语音指令数据,用于训练AI Agent意图理解模型 [13] - 在标准层,公司与华为、小米、OPPO、vivo、荣耀、苹果等共同制定AI手机时代的快应用调用协议 [14] - 在执行层,公司在香港、新加坡、苏州设立子公司,专门用于收购或孵化垂类Agent应用,目前正洽谈与某网约车平台签订排他性合作意向 [14] 未来业绩指引与估值重估潜力 - 公司管理层就Apple Ads认证带来的红利给出明确增长指引:2025年海外收入将实现10倍增长,AI营销业务收入同比增长50%以上 [15] - 2026年,HarmonyOS生态广告商业化加速,「鲸鸿动能」业务翻倍增长;ADM平台接入Google/Meta/TikTok,成为全球化的跨平台AI营销中台 [15] - 2027年,首个AI Agent应用实现百万级日活,服务佣金收入占比提升至15%,公司整体估值体系从“广告代理”切换至“AI科技平台” [16] - 当前公司市值约15亿港元,对应2025年预期收入不到0.4倍P/S,显著低于AI营销赛道平均25倍PE [16] - 若参考AppLovin 15倍P/S的估值模型,仅2025年公司预期40亿元收入的AI营销业务,对标估值即达600亿港元 [16] - 若2027年AI Agent业务落地,按5亿元佣金收入、20倍P/E测算,可额外贡献100亿港元估值 [16]
AMD大中华区纪朝晖:AI Agent推动AI从对话工具向生产力跃迁
证券时报网· 2025-12-11 04:45
事件概述 - 12月10日,迷你计算机品牌MINISFORUM铭凡与半导体公司AMD联合举办了以“智算前沿·焕芯未来”为主题的迷你AI工作站&AINAS产品体验会 [1] 产品发布与合作 - 体验会演示了两款全新的旗舰级AI计算产品:AI迷你工作站MS-S1MAX与AINAS N5 Pro [1] - 此次产品演示是MINISFORUM铭凡与AMD深度合作的一项重要举措 [1] - MINISFORUM铭凡通过与AMD合作,整合了世界级AI处理器技术,旨在将“高性能与小型化”的AIPC创新产品理念推向新高度 [1] 行业观点与展望 - AMD大中华区市场营销副总裁表示,2025年开启了AIAgent的“元十年”,认为AIAgent是将AI从对话机器人转变为生产力的关键,是“AI+千行万业”进入快车道的转折点 [1] - AMD期待以其技术实力为下一代智能计算提供核心动力,并与MINISFORUM铭凡共同推动行业发展 [1] - MINISFORUM铭凡董事长表示,全球AI技术的快速发展趋势激励着公司不断创新,以持续为企业与个人应用带来真正的价值 [1] 产品性能与优势 - 迷你AI工作站MS-S1MAX是一款紧凑且具性能优势的旗舰级产品,单机可在本地运行Llama 10 9B、DeepSeek-R1 70B等大模型 [1] - MS-S1MAX支持四机集联,可处理满血版Deepseek 67 10亿参数Q4模型 [1] - 该产品适用场景涵盖快速AI推理、边缘计算、科学研究、内容创作等前沿科研和工业领域 [1] - 相比传统用于大模型推理的5U RTX 5090服务器,在运行Deepseek 67 10亿参数Q4模型时,MS-S1MAX四机集群在体积上减少约65% [1] - 相比传统服务器,MS-S1MAX四机集群功耗降低80% [1] - 相比传统服务器,MS-S1MAX四机集群整体成本节省可达77% [1]
智谱重磅开源,AI手机有新进展
21世纪经济报道· 2025-12-11 02:12
文章核心观点 - 智谱华章开源全球首个具备手机操作能力的AI Agent模型AutoGLM,旨在将智能化能力变为行业公共底座,并强调数据与隐私留在本地[1][5] - AI手机与Agent的普及趋势势不可挡,端侧模型因响应快、数据安全而成为发展重点,但跨应用自动化操作面临合规标准缺失与生态利益博弈等挑战[1][6][9] - 行业各方(硬件厂商、APP开发商、大模型提供商)需共同合作,建立标准与开放生态,以推动AI手机的真正落地与发展[10][11][12] AI Agent技术开源与行业影响 - 智谱华章于12月9日宣布开源AutoGLM,这是全球首个具备“Phone Use”能力的AI Agent模型[1][5] - 该模型支持在微信、淘宝、抖音等超过50个高频应用中实现自动化操作,如发红包、点外卖、更新软件等[6] - 开源目的是将手机操作能力转化为行业可共同打磨的公共基础,并确保用户数据与隐私永远留在本地设备侧[1][6] - 开源模式改变了隐私博弈关系,代码透明可验证,数据无需上云,从根源上降低了泄露风险[6][7] AI手机发展趋势与市场预测 - 端侧AI模型因反应更快、数据更安全,成为手机厂商积极推进的重点,利于终端厂商对生态的控制[6] - 端云结合将成为主流服务模式,厂商更多调用外部云侧大模型,同时聚焦于端侧模型的轻量化与深度推理能力建设[7] - 根据IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,同比增长31.6%,占据整体手机市场的53%[7] - 国内开源大模型(如DeepSeek)能力的快速演进,以及模型小型化趋势的进展,为手机端侧部署提供了算力支撑[6] 行业面临的挑战与博弈 - 跨应用自动化操作(如多平台比价)面临“标准真空地带”,现有合规标准仅支持“一个应用一个界面一个操作确权”,缺乏场景授权的明确依据[9] - 涉及支付、聊天记录等敏感数据时,权限边界模糊,导致厂商在推进功能时面临法务与合规挑战[9] - 当前AI生态处于硬件厂商、APP开发商、大模型提供商三方争夺未来分发权和流量的阶段,各方互不相通,建立壁垒[10] - 大型APP开发商与大模型提供方往往归属相同集团,集团之间更不会互通数据合作,加剧了生态割裂[10] 厂商动态与合作探索 - 豆包手机助手此前推出的类似功能遭遇使用阻力,凸显了行业在落地时面临的普遍问题[1][9] - 中兴终端与豆包就手机助手功能调整进行回应,中兴表示以开放姿态促成创新,正与合作伙伴积极沟通解决问题[10][11] - 软件厂商正跨入硬件领域进行探索,如夸克和百度入局AI眼镜,类似微软做PC、谷歌做手机,旨在向硬件厂商展示如何更好发挥软件能力[11] - 行业共识是需要手机厂商、互联网厂商等多方共同达成共识,逐步探索并建立行业标准[10][12]
甲子光年创始人&CEO张一甲:不唯大模型论,企业级 AI Agent 落地的关键到底是什么?
搜狐财经· 2025-12-11 01:51
峰会核心观点 - 峰会聚焦AI Agent在企业级场景中的价值落地与产业演进路径,探讨智能体如何成为企业数字化转型的新引擎 [1] - AI Agent的本质是“大模型的超级大脑+自动化的敏捷双手”,核心能力在于工具调用、任务规划与自主执行 [1] - 2025年AI Agent的崛起是大模型成熟、算力供给、开源生态与真实产业需求同步共振的结果 [1] AI Agent在企业中的角色演进 - 企业对AI的期待已从“展示性样板间”转向“可投产的工厂”,AI正从“对话伙伴”升级为“共事同事” [3] - AI Agent需要完成端到端的工作流,例如从识别发票到自动走完报销、审批、付款全流程 [3] - 企业级部署对AI Agent的稳定性、集成性与安全性提出了严苛要求 [3] 企业级AI落地的关键:场景与Know-How - 大模型只是“发动机”,企业智能化落地需要结合业务场景、数据、流程和算法,场景是关键乘数因子 [4] - 真正的落地公式为:场景×(数据+流程+算法),缺乏对行业痛点和业务流程的深刻理解,再强的模型也难以发挥价值 [4] - 企业级AI Agent的起点不是模型选型,而是场景定义,需要将大模型“做垂、做实”,嵌入行业知识体系 [4] - 以交通基建领域为例,通用大模型无法准确引用专业条款,需打造垂类智能体解决高门槛、高风险任务 [4] AI Agent的实施路径:“四象限数字员工”模型 - 根据行业知识深度与业务流程复杂度两个维度,将AI Agent落地形态分为四类 [5] - “通用助手”处理高频、低复杂度任务,如会议纪要生成或IT工单分派,适用于快速验证价值 [6] - “执行助理”面向销售、采购等长链条流程,需打通多个系统实现自动化闭环 [6] - “专家顾问”聚焦高知识密度场景,如金融风控或法律咨询,依赖专业规则库与推理能力 [6] - “总工程师”级Agent需同时掌握设备机理模型与实时控制逻辑,如工业预测性维护系统 [6] 企业实践案例与成效 - 宁夏交建部署了四位数字员工,分别覆盖工程技术文档撰写、核算报表生成、无代码数据分析和投标全流程自动化 [6] - 实践结果是:投标文件生成时间降低70%,知识查找效率提升50% [6] - 这些Agent基于上万份行业规范、历史标书和内部制度训练而成,内化了企业Know-How,而非基于通用模型微调 [6] 企业部署AI Agent的信任基石与核心要求 - AI Agent进入大型企业核心业务需通过六项“硬性大考”:稳定性、可扩展性、易用性、系统集成能力、安全合规与行为可控 [7] - Agent必须7×24小时可用,能与ERP、CRM等系统打通,避免成为信息孤岛,并确保所有操作可审计、权限可管控 [7] AI Agent的深层价值:数据飞轮与资产进化 - AI Agent的部署会形成“AI数据飞轮”,其与业务系统交互产生的数据经处理后,可反哺模型迭代,使Agent更懂业务 [7] - AI Agent是企业中“越用越值钱”的唯一资产,历经任务锤炼的版本将不断进化,与初始版本差异显著 [7] - 这种共生式成长可能重塑组织管理逻辑,管理将从应对“人的不确定性”转向工程化优化“群体智能” [7] AI Agent的宏观影响与未来展望 - AI Agent标志着企业智能化从“辅助人类”进入“与人类协作”乃至“自主执行”的新阶段 [8] - 其价值不仅在于降本增效,更在于重构连接、优化流程、激活数据,并最终提升组织管理的科学性与系统性 [8] - 技术落地仍需克服场景适配、系统集成、安全合规与成本控制等多重挑战 [8] - “连接”是AI Agent智能进化的起点,“越连接,越智能”,密集的连接能激发智能体潜力并揭示数据与协作的根本价值 [8] - AI Agent不仅是一项技术变革,更是一场关于组织形态、工作方式与管理哲学的整体演进 [8]
智谱开源、豆包遇阻 AI手机竞赛白热化
21世纪经济报道· 2025-12-10 14:34
核心观点 - 智谱华章开源具备手机操作能力的AI Agent模型AutoGLM,旨在将其打造为行业公共基础,并强调数据与隐私留存于用户本地设备 [1][4] - AI手机及Agent化趋势势不可挡,但当前面临跨应用操作合规标准缺失、生态利益博弈以及数据权限边界模糊等多重挑战,需要产业链各方共同推进解决 [1][7][10] 行业趋势与市场前景 - IDC预计,2026年中国新一代AI手机出货量将达到1.47亿台,同比增长31.6%,占据整体市场的53% [6] - 端云结合将成为主流服务模式,厂商将更多调用外部云侧大模型,同时将资源集中于端侧多模态模型的轻量化与深度推理能力建设 [6] - 国内开源大模型能力快速演进,如DeepSeek拉齐了千亿规模大模型的能力,推动了手机厂商补足端侧推理能力,同时模型小型化趋势取得显著进展 [5] - 软件厂商正跨入硬件领域,如字节跳动(豆包)、夸克、百度入局AI硬件,类似微软做PC、谷歌做手机,旨在展示软件能力或探索合作模式 [9] 技术发展与合作动态 - 智谱华章宣布开源AutoGLM,被称为全球首个具备“Phone Use”能力的AI Agent,已支持微信、淘宝、抖音等超过50个高频应用 [1][4] - 开源旨在将Phone Use能力转化为行业共同打磨的公共基础,并让数据与隐私永远留在使用方一侧 [1][4] - 中兴终端与豆包(字节跳动)就豆包手机助手进行合作,双方均强调以开放姿态推动AI手机发展,旨在为用户提供更好体验 [8][9] - 端侧模型部署因反应更快、数据更安全而受手机厂商积极推进,有利于终端厂商控制 [6] 面临的挑战与障碍 - 跨应用自动化操作(如发红包、点外卖、多平台比价)面临法务与合规挑战,核心争议在于是否损害互联网厂商利益以及授权模式是否符合要求 [7] - 现有合规标准存在“标准真空地带”,仅支持“一个应用一个界面一个操作确权”,缺乏对身份授权、场景授权的明确依据,难以适配AI时代一键完成跨应用任务的需求 [7] - 涉及支付、聊天记录等敏感数据时,权限边界模糊,导致厂商不敢贸然推进,也难以找到合规落地路径 [8] - 当前AI生态体系处于硬件厂商、APP开发商、大模型提供商三方争夺未来分发权和流量的阶段,各方互不相通、建立壁垒,且大型APP开发商与大模型提供商常属同一集团,加剧了数据合作障碍 [8] - 手机UI操作能力需要持续迭代,厂商应聚焦降低门槛、解决实际问题的场景,而非盲目追求全场景自动化 [10]
不唯大模型论 企业级 AI Agent 落地的关键到底是什么?
经济观察报· 2025-12-10 13:13
文章核心观点 - AI Agent的本质是“大模型的超级大脑+自动化的敏捷双手”,其核心能力在于工具调用、任务规划与自主执行,其崛起是大模型成熟、算力供给、开源生态与真实产业需求同步共振的结果 [1] - 企业级AI Agent的落地关键并非单纯依赖大模型,而是需要深刻理解业务场景,将大模型与行业知识、数据、流程深度融合,其起点是场景定义而非模型选型 [3] - AI Agent正从“对话伙伴”升级为“共事同事”,其价值在于完成端到端的工作流,标志着企业智能化进入“与人类协作”乃至“自主执行”的新阶段,最终目标是重构连接、优化流程、激活数据并提升组织管理的科学性与系统性 [2][6] AI Agent的行业定位与价值 - 企业对AI的期待已从“展示性样板间”转向“可投产的工厂”,AI Agent需完成从识别发票到自动走完报销、审批、付款的全流程 [2] - AI Agent的兴起标志着企业智能化从“辅助人类”进入“与人类协作”乃至“自主执行”的新阶段 [6] - AI Agent的价值不仅在于降本增效,更在于重构连接、优化流程、激活数据,并最终提升组织管理的科学性与系统性 [6] 企业级落地的关键路径 - 不唯大模型论,大模型只是“发动机”,真正的落地公式为:场景×(数据+流程+算法),其中场景是关键的乘数因子 [3] - 企业级AI Agent的起点不是模型选型,而是场景定义,需要深刻理解行业痛点、客户逻辑和业务流程 [3] - 必须将大模型“做垂、做实”,嵌入行业知识体系,才能解决高门槛、高风险任务,例如宁夏交建的案例中,通过上万份行业规范、历史标书和内部制度训练垂类智能体,实现了投标文件生成时间降低70%,知识查找效率提升50% [3][4] AI Agent的落地形态与分层策略 - 根据行业知识深度与业务流程复杂度两个维度,可将AI Agent分为四类:“通用助手”、“执行助理”、“专家顾问”和“总工程师” [4] - “通用助手”处理高频、低复杂度任务,如会议纪要生成或IT工单分派 [4] - “执行助理”面向销售、采购等长链条流程,需打通多个系统实现自动化闭环 [4] - “专家顾问”聚焦高知识密度场景,如金融风控或法律咨询,依赖专业规则库与推理能力 [4] - “总工程师”级Agent必须同时掌握设备机理模型与实时控制逻辑,如工业预测性维护系统 [4] 企业部署的信任基石与核心要求 - AI Agent要进入大型企业核心业务,需通过六项“硬性大考”:稳定性、可扩展性、易用性、系统集成能力、安全合规与行为可控 [5] - Agent必须像水电一样7×24小时可用,能与ERP、CRM等系统打通,避免成为新的信息孤岛,并确保所有操作可审计、权限可管控 [6] AI Agent的进化逻辑与长期价值 - AI Agent的深层价值在于形成“AI数据飞轮”,每一次连接产生的交互数据经处理后反哺模型迭代,使Agent更懂业务、更精准执行 [6][7] - AI Agent将会是企业中“越用越值钱”的唯一资产,随使用不断进化,今日部署的Agent与一年后历经千次任务锤炼的版本将是两个物种 [6] - 这种共生式成长可能重塑组织管理逻辑,管理将从应对“人的不确定性”转向工程化优化“群体智能”,从而打开企业效率与价值的新天花板 [6] - “连接”是Agent智能进化的起点,“越连接,越智能”,越是深入、广泛、密集的连接,越能激发智能体的潜力 [7]
20个企业级案例揭示Agent落地真相:闭源模型吃掉85%,手搓代码替代LangChain
36氪· 2025-12-10 12:12
核心观点 - 加州大学伯克利分校发布AI Agent领域迄今最大规模实证研究,基于306名从业者调研及20个企业级案例,覆盖26个行业,揭示了生产级AI Agent的部署现状、技术选择与核心挑战 [1] 部署动机与首要场景 - 73%的从业者部署Agent的首要目的是提高生产力 [2] - 其他主要动机包括:63.6%为减少人工工时,50%为自动化常规劳动 [4] - 相比之下,质性收益如风险规避(12.1%)和加速故障响应(18.2%)排名靠后 [4] - 部署优先考虑能带来直接、可量化回报的场景 [6] - 金融与银行业是Agent应用第一大战场,占比39.1%,其次是科技(24.6%)和企业服务(23.2%) [9] 应用角色与用户 - Agent的角色类似人类的“超级实习生”,深入严肃的商业流程,已走出写代码或聊天机器人范畴 [8][9] - 92.5%的Agent直接服务于人类用户,其中52.2%服务于企业内部员工 [11] - 仅7.5%的Agent服务于其他软件系统,Agent间全自动交互尚不成熟 [11] - 66%的生产系统允许分钟级或更长的响应时间,因相比人类工时仍是巨大效率提升,开发重心在质量与可靠性而非极限低延迟 [11] 技术选型与构建哲学 - 生产级AI Agent构建哲学是“大道至简”,优先选择简单、可控、可维护的技术路径 [12] - 模型选择上闭源是绝对主流:在20个深度案例中,85%(17个)使用了闭源模型,首选Anthropic的Claude系列和OpenAI的GPT系列 [13] - 选择闭源的核心逻辑是效率,对于辅助专家的场景,推理成本相比人力成本可忽略不计 [13] - 开源模型被视为特定场景补充,主要用于大规模高推理场景下的成本效益考量或受法规限制的数据隐私场景 [13] - 70%的案例直接使用现成模型,完全不进行权重微调,学术界热衷的微调和强化学习极少使用 [13] - 从业者精力集中于构建Prompt:78%的系统采用全手动或手动+AI辅助方式构建生产环境Prompt,12%的Prompt超过10,000个Token [16] 系统设计与自主性约束 - 为降低不可控性,Agent自主性被严格限制:68%的系统在需要人工干预前执行步骤不超过10步,47%的系统少于5步 [17] - 限制步数的主要原因包括保证可靠性、控制API调用成本以及控制延迟 [19] - 80%的案例采用预定义的静态工作流,Agent在固定流程内做决定,不能发明新步骤 [19] - 尽管60%的问卷调查者表示愿意用第三方框架,但在实际案例中,85%的团队选择完全自研,直接调模型API,以获得完全控制权并减少依赖臃肿 [19][20] 评估方法与基准测试 - 基准测试参考价值低:75%的团队完全不使用公开学术榜单,因企业业务高度特殊 [21] - 剩余25%的团队从零开始构建自定义基准 [21] - 人工循环验证是主导评估方法,被74.2%的从业者采用 [21] - 在开发阶段,领域专家直接审查输出正确性、安全性和可靠性;在运行阶段,人类作为最终决策者和安全护栏 [23] - 自动化评估也有应用:51.6%的团队使用LLM作为裁判,但所有团队都结合了人工验证,典型做法是LLM评分后高分自动通过、低分转人工,同时人工定期抽查高分样本 [25] 核心挑战与应对策略 - 可靠性是头号挑战:37.9%的人将“核心技术问题”(可靠性、鲁棒性)列为头号挑战,远超合规性(17.2%)和治理问题(3.4%) [26] - 可靠性挑战源于基准难建、测试难做(传统单元测试失效)以及反馈延迟 [27] - 安全与合规性问题通常通过“约束设计”解决,常见方法包括:限制Agent为只读操作、使用沙盒环境、构建API封装层限制抽象层、尝试实施权限控制 [27] - 系统能上线的答案是“约束性部署”,具体模式包括环境约束(如沙盒)和自主性约束(如限制步骤与预定义流程) [28] - 仅利用现有前沿大模型和相对简单的提示工程技术,就足以在超过26个不同行业中创造可观、可量化的商业价值 [29]
拐点来临!亚马逊云科技开启Agent时代,数十亿Agents重构产业生产范式
第一财经· 2025-12-10 11:11
亚马逊云科技re:Invent 2025核心战略与行业趋势 - 公司认为Agentic AI技术正处于从“技术奇迹”转变为提供实际业务价值实用工具的关键转折点,预计未来将有数十亿Agents在各行各业运行,帮助企业实现10倍效率提升 [1] - 行业竞争焦点已从“谁训练出最强大模型”转向“谁能让AI真正进入企业的生产流程”,AI Agent正成为云计算下半场竞争的新战场 [3] - 公司战略目标不再是仅提供算力资源,而是致力于成为支撑社会经济整体智能转型的“价值实现平台”,竞争维度已升至“全栈工程化能力”的构建 [8] 全栈AI基础设施创新 - 公司系统性地披露了覆盖从基础设施、大模型到Agent工具链的全栈式创新图谱,自研芯片核心锚定“能效比”指标以控制AI训练与推理的成本瓶颈 [4] - Amazon Trainium3 UltraServers是首款搭载3纳米工艺AI芯片的服务器,计算能力比Trainium2提升4.4倍,内存带宽提升3.9倍,每兆瓦算力处理的AI token数量提升5倍,在运行GPT-OSS-120B模型时,每兆瓦输出token数是上一代的5倍以上 [4] - 公司首次披露Trainium4芯片,承诺将较上一代实现6倍的FP4计算性能、4倍内存带宽和2倍高内存容量 [5] - 公司同时与英伟达深度合作,确保在最复杂工作负载上顶尖算力的可用性与稳定性 [5] 开放的模型与Agent生态 - Amazon Bedrock平台新增Gemma、Mistral、Kimi、MiniMax等开源模型,一年间模型数量近乎翻倍 [7] - 自研Amazon Nova 2系列基础模型家族覆盖高性价比、复杂任务处理等细分场景,其中Nova 2 Omni是业界首个支持文本、图像、视频和语音输入,同时生成文本和图像输出的多模态推理模型 [7] - 公司强调前沿Agent必须具备自主决策、横向扩展、长时运行三大特征,并发布了一系列旨在降低Agent构建门槛、确保安全可控的前沿工具 [7] AI Agent驱动的效率革命与商业实践 - AI Agent的价值首先体现在对复杂、重复工作的自动化,例如技术债务每年在美国造成约2.4万亿美元成本,70%的IT预算用于维护历史系统 [9] - Amazon Transform custom帮助客户从VMware、大型机等历史平台迁移,全栈Windows现代化速度提升5倍,消除70%的维护成本,已分析十多亿行大型机代码 [9] - 索尼基于亚马逊云科技构建的Data Ocean每天处理来自500多个数据源的760TB数据,其使用Amazon Bedrock构建的企业大语言模型拥有57000名用户,每天处理超过15万个推理请求,目标是将合规审查与评估流程效率提升100倍 [11] - 金融信息巨头S&P Global的内部Agentic工作流平台Astra将新应用部署时间从“几周”压缩至“几分钟” [12] - 数据安全公司Druva通过AI Agent,使客户在数据备份失败时能从手动排查日志数小时变为获得即时分析和数据恢复 [12] 行业价值回归与生态角色重塑 - 行业逐渐认识到,真正的AI价值产生于技术与复杂业务流程的安全、可靠、深度集成,并最终表现为成本降低、效率提升或收入增长 [14] - 云厂商在AI时代的角色正被重新定义为价值实现的“赋能平台”,公司致力于回应企业对数据安全、模型定制化和行为合规性的关切,成为帮助企业治理、控制和规模化AI能力的战略伙伴 [17] - AI竞争的下半场正从技术标杆竞赛,转向生态系统与落地能力的较量,焦点在于提供最完整的工具链、最丰富的模型选择和最安全的部署环境 [17] - 以Adobe为例,其90%以上创作者已积极使用生成式AI工具,公司的全栈云基础设施和AI工具集使Adobe能专注于释放用户创造力的核心优势 [16] 公司运营规模与市场地位 - Amazon S3存储超过500万亿个对象,每秒处理超过2亿次请求 [1] - 超过一半的CPU容量来自Amazon Graviton处理器 [1] - 托管生成式AI服务Amazon Bedrock有超过50个客户已处理超1万亿个token [1]