AI Agent
搜索文档
保守的谷歌,激进的豆包
36氪· 2025-12-05 10:23
文章核心观点 - 技术创新必须在尊重用户权益和遵守监管要求的前提下进行,过于激进、试图绕过现有安全体系和合作模式的方案难以推进 [1][5][15] - 豆包手机助手近期对其AI操作手机能力进行规范化调整,特别是限制金融类应用的使用,姿态从强硬转向愿意与相关厂商沟通合作 [4] - 全球AI Agent(特别是GUI Agent技术路线)发展迅速,但主流厂商(如谷歌、苹果、百度、华为)普遍采取通过API与开发者合作的审慎路径,豆包的激进方案引发了关于安全、合规与责任的争议 [6][7][10] 豆包手机助手事件与方案调整 - 豆包手机助手发布说明,计划对AI操作手机能力进行规范化调整,包括进一步限制银行、互联网支付等金融类应用的使用,并暂时下线操作这类APP的能力 [4] - 调整原因是金融场景直接关联用户资金安全,虽然操作需用户授权,但为审慎起见做出此决定 [4] - 公司表示愿意与相关厂商沟通,共同制定清晰、安全的AI操作行为准则,姿态较此前更为柔软 [4] - 此次调整意味着豆包降低了其方案的激进程度,此前的方案突破了传统的用户安全体系、监管体系及厂商合作模式的边界 [5] GUI Agent技术路线与行业实践 - 豆包的方案属于GUI Agent技术路线,该技术基于多模态视觉模型驱动,能自动推理并执行图形用户界面交互以完成任务 [6] - 全球范围内,主流智能助手(如苹果Siri、谷歌Google Assistant)严格遵循API调用方式,避免直接触碰应用程序核心功能,以保证用户隐私、数据安全并避免与开发者或监管机构的冲突 [7] - 国内厂商如百度、华为在推出智能助手时,也选择与应用程序开发者合作,通过API接口实现功能对接 [7] - 大模型独角兽阶跃星辰在豆包手机助手发布两天前,开源了同类型的GUI Agent技术套组GELab-Zero [7] - 豆包手机助手选择了更为激进的路径,试图通过用户授权直接操作微信、支付宝等主流App的界面,绕过了其安全体系 [7] 豆包激进方案面临的核心挑战与风险 - 该方案挑战了互联网合作关系,并忽视了成熟的互联网账号安全体系,如登录验证、双重验证、权限控制及反欺诈检测系统 [8] - 绕过这些安全机制存在风险,可能导致用户账号被窃取、隐私信息泄露、数据被篡改,并使异常行为难以被检测 [8] - 方案核心争议在于忽略了行业在账号安全和监管方面的“防护栏”,微信、支付宝等App已建立严格机制防止第三方程序绕过官方授权 [9] - 在金融支付领域,监管对数据安全和用户隐私要求尤为严格,豆包的方案可能违反相关法律法规 [9] - 方案涉及关键责任问题:作为第三方平台,豆包是否能接过所有App的平台责任并满足监管需求,尤其是在涉及用户财产安全的金融支付领域 [10] - 从全球范围看,任何试图绕过应用开发者和监管机构的方案都难以获得广泛支持,可能引发监管审查和处罚 [10] 行业稳健发展的合作路径与参考案例 - 谷歌助手(或Gemini)在调用第三方应用时,会清晰列出需要访问的用户数据和权限,用户必须主动登录Google账号并点击授权才能继续 [11] - 在涉及用户隐私的应用如邮箱时,谷歌表现克制,Gemini只有在用户请求时才会调用相关数据,且不会进行发布邮件等敏感行为 [12] - 国内OPPO和支付宝的合作提供了参考,支付宝发布了AHA智能体互联协同解决方案,通过安全可控的方式实现智能助手与应用程序之间的高效协作 [14] - AHA方案构建了一个智能体互联枢纽,连接手机操作系统、AI大模型及第三方应用服务,并遵循严格的安全标准和透明的用户授权机制 [14] - 该方案具备开放性和兼容性,能够接入不同厂商的AI助手和各类应用,为行业提供标准化互联互通平台 [15] - 工信部、信通院等机构正在积极推进国家多智能体互联的标准,工信部牵头的《人工智能 智能体互联》系列标准已发布,蚂蚁集团作为核心参编方,AHA方案是重要业界实践参考 [15]
但斌发声:AI Agent的实现,很可能让全世界被几家公司控制,谷歌英伟达未来市值未来可能达10万亿,国内对标谷歌的公司只有两家
华尔街见闻· 2025-12-05 09:39
核心观点 - 当前正处于人工智能革命的开端,这是一个堪比蒸汽机、互联网和移动互联网的伟大时代,投资者不应错失这一历史性机遇 [4][16][40] - 投资应选择代表技术进步和时代浪潮的赛道与市场,选择比努力更重要,例如过去35年投资纳斯达克指数回报远超日经指数 [5][25][26] - 人工智能行业竞争将异常激烈,可能导致高度垄断的商业模式,少数头部公司市值有望达到前所未有的规模 [10][13][47][48] 战略抉择与时代机遇 - 东方港湾在2022年做出了明确的战略抉择,将投资重心转向以英伟达为代表的美国人工智能公司,类比2004年成立时若全力投资腾讯可获六七百倍回报的移动互联网机遇 [3][20][21] - 当前人工智能时代与过去的电子硬件、互联网、移动互联网时代类似,尽管初期存在市场噪音,但技术进步是推动社会财富增长的根本动力 [16][17][18] - 对于资深投资者而言,这可能是职业生涯中最后一次参与伟大时代的机会,因此需要全力以赴 [13][51][52] 市场选择与历史对比 - 选择正确的市场至关重要,过去35年纳斯达克指数上涨51倍,而日经指数仅上涨30%,若考虑日元兑美元汇率从80贬值至150,投资日股实际为亏损 [5][25][26] - 投资应“去大海里打鲸鱼”,而非“在烂泥塘里挖泥鳅”,日本市场过去35年的表现即为反面案例 [5][27] - 历史表明,即使在技术浪潮的中后期介入,仍可能获得巨大回报,例如腾讯在互联网时代中后期上市仍带来约六七百倍回报,巴菲特在2016年投资苹果也获得约十倍回报 [7][8][32] 对人工智能行业的判断 - 当前市场关于人工智能存在泡沫的讨论为时过早,行业实际上才刚刚起步 [6][33] - 人工智能竞争白热化,全球科技巨头均全力以赴投入,例如亚马逊年研发投入约1250亿美元,谷歌约900亿美元,微软与OpenAI联合宣布投入约1000亿美元 [10][45] - 人工智能Agent的实现可能深刻改变现有交互模式与商业模式,甚至对腾讯、微信等强大商业模式构成挑战 [11][43][44] - 人工智能竞争可能导致商业模式更加集中,最终可能让全世界被少数几家公司控制 [13][47] 重点公司与投资布局 - 英伟达和谷歌被视为人工智能时代的核心代表,未来市值均有可能达到10万亿美元 [13][48] - 多家知名投资机构与投资人,包括伯克希尔·哈撒韦、巴菲特、索罗斯、段永平等,近期都不约而同地加仓了谷歌,这被视为对人工智能时代的重要认同信号 [9][39][40] - 从TPU/GPU、大模型(Gemini)及数据能力看,中国国内能对标谷歌的公司可能只有阿里巴巴和字节跳动,腾讯甚至略显落后 [12][46] - 基于上述判断,许多国内市场投资人在当季度将阿里巴巴加入了投资组合 [12][46]
抢夺入口?周鸿祎:大厂对豆包手机会展开技术攻防战
观察者网· 2025-12-05 07:48
产品发布与市场反响 - 中兴通讯与字节跳动旗下AI大模型豆包合作推出“豆包手机”(nubia M153 豆包手机助手技术预览版),其核心卖点是通过搭载的“豆包手机助手技术预览版”实现对日常App的自动化操作,包括点外卖、订机票、比价购物、打游戏、银行转账等 [1] - 定价3499元的豆包手机一经发售便迅速售罄,在二手平台上价格被炒至6000元至1.29万元不等,显示出强烈的市场关注度 [1] - 该产品被定位为面向行业和AI技术爱好者的探索产品,是一个“技术预览版” [7] 技术特点与行业方向 - 豆包手机助手向消费者展现了AI助手操作手机的全新愿景,其能力被认为比苹果的Siri走得更远,真正实现了“AI助手”的概念 [6] - 豆包手机助手的核心依赖于UI Agent技术,该技术方向与荣耀等厂商的AI发展方向一致 [8] - 该产品验证了AI Agent确实能操作手机的方向,此前荣耀、vivo、华为等主流厂商已在“手机自动驾驶”或AI智能体操作手机方面有所探索 [7] 潜在影响与行业观点 - 360创始人周鸿祎认为,此类能直接接管手机操作的AI助手将彻底改变用户使用手机的逻辑,甚至对传统的互联网商业模式构成颠覆性挑战 [1] - 周鸿祎指出,豆包相当于搭建了跨平台通道,直接打破APP之间的隔阂,让服务直达用户,这可能冲垮互联网大厂依靠用户停留时长和广告投放的盈利模式,直接冲击传统流量逻辑 [3] - 荣耀首席影像工程师罗巍认为,入口是关键护城河和收费站,AIOS让大厂看到了替代Android或收取“AI税”的可能性,试图模仿苹果iOS的模式 [4] - 罗巍对豆包手机的未来并不看好,认为字节跳动缺乏硬件研发能力,预计其难以成功 [4] - 荣耀产品线总裁方飞对豆包手机入局表示兴奋,认为更多厂商入局能让AI手机生态更繁荣,最终受益的是消费者 [7] 面临的挑战与博弈 - 让手机助手实现跨应用自动操作,要求第三方应用开发商将“核心命脉”拱手让人,面临巨大阻力 [6] - 第三方APP对外部应用抓取数据通常有明确禁止规定,例如美团和淘宝的平台协议禁止未经授权的数据抓取 [6] - 周鸿祎预测,各大APP可能会通过调整页面结构、设置动态验证码、隐藏关键信息等方式增加AI读取难度,巨头甚至可能抱团推出“联合防御协议”限制AI跨APP调用 [3] - 手机厂商同样不会轻易让出控制权,小米MIUI、华为HarmonyOS等系统可通过限制运行、降低调用速度等方式制约第三方AI助手,同时推出自家AI助手抗衡 [3] - 豆包手机助手在操作微信时已出现异常退出甚至无法登录的情况,其运营方已发布声明,未来将对AI操作手机的能力在刷分刷激励、竞技类游戏及金融类操作方面进行规范化调整 [6] - 有分析认为,这一动向是豆包手机助手的“主动避嫌”,既有监管考量,也是向应用厂商示好,避免触动其核心利益 [7]
2025年金融科技发展报告重磅发布,金融科技ETF华夏(516100)涨3.88%
每日经济新闻· 2025-12-05 06:58
市场行情表现 - 12月5日A股三大指数午后走强,深证成指和创业板指涨幅扩大至1%以上 [1] - 金融科技和证券板块午后快速冲高后小幅回落 [1] - 截至14:22,金融科技ETF华夏(516100)涨幅收窄至3.88% [1] - 持仓股赢时胜打开涨停,星环科技、安硕信息、指南针、银之杰等股涨幅小幅回落 [1] - 券商ETF基金(515010)上涨2.69% [1] 行业发展趋势 - 中关村互联网金融研究院与中关村金融科技产业发展联盟联合发布《中国金融科技与数字金融发展报告(2025)》 [1] - 报告指出金融科技行业未来五大核心趋势:AI渗透核心业务、AI智能体演进、量子计算实用化、差异化投入策略、信创与数据安全 [1] 机构研究观点 - 华泰证券认为金融科技核心已从工具性辅助演进为驱动业务生态重构的核心引擎 [2] - 在AI Agent应用落地浪潮中,生成式AI将遵循“2B领先2C、应用领先终端”的发展路径 [2] - 数据中心AI芯片市场规模已远超手机与PC,AI服务器有望取代智能手机成为最大科技硬件品类 [2] - 中国凭借完整产业链在物理AI领域具有比较优势,但在算法创新与算力自主可控方面仍需持续突破 [2]
AI Agent重塑智慧城市:谁执下一代升级牛耳?
格隆汇· 2025-12-05 04:36
AI Agent+智慧城市市场概况与增长前景 - 2024年全球AI Agent市场规模已达54亿美元,预计2025至2030年复合增长率将达45.8%,到2030年将膨胀为近400亿美元的大赛道 [1] - Gartner将Agentic AI列为2025年十大技术趋势之首,预测到2028年,15%的日常决策将由AI自主完成 [1] - AI Agent已从实验室走出,渗透到城市治理的毛细血管,技术落地生根的关键在于将算法、数据与城市肌理深度融合的实践者 [1] 核心玩家阵营与竞争格局 - 赛道已形成三大核心玩家阵营:垂直行业深耕者、全栈技术赋能者、通用大模型巨头 [3] - **垂直行业深耕者**:以数字政通、卓尔软件为代表,核心优势是二十余年积淀的场景理解力与业务数据资产 [3] - 数字政通发布的人和大模型2.0精准卡位城市运管服、行政执法、城市生命线、政务热线、低空经济五大高价值场景,在北京、深圳等地实现建筑垃圾黑工地精准监管、政务热线全流程智能化等实战效果 [3] - 数字政通与华为昇腾、海康威视等企业联合推出解决方案,解决国产化算力适配问题并整合空天地一体化感知设备资源 [3] - 卓尔软件的智慧云瞳能识别200多种城市问题,使治理效率提升3倍以上 [3] - **全栈技术赋能者**:以华为、联想为代表,核心竞争力在于算力+算法+硬件的全链路布局 [4] - 华为与武汉合作的超大型城市运行管理智能体,依托盘古中控大模型和四大AI中心,实现了96%以上的多源信息解析准确率 [4] - 联想在宜昌落地全球首批城市超级智能体,整合交通、能源等全域数据,打造了长江经济带的智慧治理标杆 [4] - **通用大模型巨头**:以谷歌、阿里为代表,凭借强大的通用推理能力和多模态处理能力为城市智能体提供基础AI支撑 [4] - 通用大模型在垂直领域存在约15%的幻觉生成概率、专业领域知识滞后等问题,使其在高精度场景中难以直接应用 [4] 垂直行业深耕者的领跑潜力 - 垂直行业深耕者目前更具领跑潜力,智慧城市的核心诉求是解决实际治理问题,其“场景定义技术”的模式比“技术适配场景”更高效 [5] - 核心竞争力源于三点:城市治理的“场景密度”构筑技术护城河、实现从辅助工具到决策主体的跨越、以及对多Agent协同所需的政府组织架构有深刻理解 [10] - 发展路径清晰:先在单一垂直场景做到绝对领先,再横向复制到城市治理全链条,例如数字政通先拿下城管、执法等复杂场景,建立行业数据飞轮,再渗透到关联领域 [10] 科技巨头的市场定位与机会 - 科技巨头的机会在于提供Agent操作系统,定义通用标准、开发工具链、运营算力平台,将具体场景落地交给生态伙伴 [11] - 但利润最丰厚的市场,仍将属于既懂AI又懂业务的垂直王者 [11] 未来智慧城市架构与核心特征 - 基于当前技术演进,2030年的智慧城市将呈现三层智能体架构:底层感知执行层、中层认知决策层、上层服务体验层 [7] - 底层感知执行层:由IoT设备、无人机、机器人等构成,实现与物理世界的实时交互,例如数字政通布局的低空经济场景 [7] - 中层认知决策层:由行业大模型+专业Agent构成联邦制“城市大脑”,各专业Agent通过语义化通信协议协同,例如雄安新区的边云超智计算体系已连接60余万个感知终端 [7] - 上层服务体验层:市民通过各类终端与Web Agent交互,实现全流程闭环服务 [7] - 未来智慧城市将实现三大变革 [7][8] - 全域协同的智能中枢打破信息孤岛,城市要素的专属智能体通过分布式协同形成集体智能 [7] - 治理模式从被动处置迈向主动预防,AI Agent的自主学习和预测能力让城市运行从事后救火变为事前预警,例如武汉的城市运行智能体及数字政通的人和大模型2.0的预警能力 [8] - 人机协同实现温情治理,智能体作为数字员工处理常规任务,人类则专注创新决策,例如卓尔软件的智慧云瞳处理占道经营问题,数字政通的政务数字人提供24小时咨询服务 [8] - 最关键的变化在于城市将从“人找服务”变为“服务找人”,AI Agent会主动发现并响应市民需求,实现无感服务 [8]
豆包抢入口,捅了马蜂窝
华尔街见闻· 2025-12-05 04:02
豆包AI助手事件与行业影响 - 字节跳动旗下豆包团队于12月5日发布公告,宣布对AI操作手机能力进行“规范化调整”,核心举措是暂时下线操作银行、互联网支付等金融类APP的能力,理由是“审慎起见”[1] - 此次调整发生在豆包手机助手技术预览版发布仅几天后,该预览版于12月1日推出,并率先落地于中兴通讯旗下努比亚M153手机,原价3499元的手机一度被黄牛炒至近7000元[2] - 豆包AI助手能够根据用户指令在不同应用间自主切换和操作,功能覆盖机票预订、批量文件下载、物流追踪、智能修图、外卖比价等,实现了从“问答对话”到“跨应用任务执行”的突破[3] 主要应用平台的抵制与原因 - 微信、淘宝、中国农业银行、中国建设银行等应用陆续出现豆包AI助手无法正常操作的情况,用户操作微信时甚至导致账号异常退出或被强制下线[2][3] - 微信方面回应称“可能是中了本来就有的安全风控措施”,其服务协议明确禁止通过非腾讯授权的第三方软件进行自动化操作[4] - 技术分析指出,豆包实现跨App操作的核心是获取了名为INJECT_EVENTS的系统级高危权限,该权限允许AI模拟用户的点击、滑动、输入等一切行为,在微信等超级App看来,此行为模式与“外挂”或“灰黑产”工具高度相似[4] - 对于淘宝、银行等涉及资金安全的App而言,对任何“模拟用户”的行为保持最高警惕是其安全体系的本能反应[4] 高盛对行业竞争格局的分析 - 高盛指出,豆包的遭遇凸显了第三方AI代理挑战现有手机生态时面临的三大核心障碍:系统级操作权限由手机厂商(OEM)牢牢掌握;系统级记忆能力所需的关键用户数据天然由厂商掌控;超级App为构建闭环生态会限制外部AI代理的调用[5] - 高盛认为,这场风波反而验证了如小米等公司长期竞争力的稳固性,在中国市场前六大厂商占据超过90%份额的背景下,新玩家颠覆市场的空间微乎其微[6] - 报告指出,小米的自有AI代理“超级小爱同学”已深度整合进其“人 x 车 x 家”全生态战略,在小米手机用户中渗透率高达71%,能操作抖音、淘宝、美团等绝大多数主流App(微信除外),并能在本地记忆用户的敏感数据与使用习惯[6] - 结论是,小米凭借“操作系统+硬件+庞大AIoT生态+深度整合的AI代理”构建的系统性优势,形成了强大的竞争壁垒[6] AI时代超级入口的争夺与挑战 - 豆包事件揭示了对AI时代超级入口的争夺,当语音交互成为主要入口时,传统App的运营逻辑将面临挑战,用户倾向于使用“打车去学校”而非“用滴滴打车去学校”这类直接指令,系统默认入口变得至关重要[7] - 在AI时代,能够调度一切的“系统级AI Agent”将成为下一代设备的灵魂和新的“权力中心”,掌握最大的App推荐权和用户心智[7] - 字节跳动选择与中兴合作,绕开自研手机、直接从操作系统层面切入,正是为了争夺这一入口,但道路充满荆棘[8] - 目前存在两条技术路线:一是“意图框架路线”,需要得到第三方App授权,但面临利益冲突和数据安全壁垒;二是“纯视觉方案”(读屏+模拟点击),无需授权但面临与超级App的正面冲突及法律合规挑战[9] - AI Agent元年已开启,技术创新与现有商业生态、安全规范之间的平衡点仍在探索,参与者包括腾讯、阿里、字节等互联网大厂,华为、小米、OPPO等终端厂商,以及众多AI创业公司[10]
让 Agent 真正进入企业核心业务系统,到底还缺什么?
钛媒体APP· 2025-12-05 01:48
AI Agent平台发展趋势 - 产业焦点正从大模型竞争转向能自主思考执行并解决实际问题的AI Agent平台竞争[1] - Agent被视为将进入企业核心生产系统的下一代通用能力[1] - 行业正从单个任务自动化迈向推动整个行业加速发展的协作模式[6] AWS Agentic AI平台核心组件 - Strands Agent SDK采用模型驱动方法让LLM自主处理任何场景省去预设工作流程和复杂协调代码[1] - Strands Agent SDK已开源新增支持TypeScript和边缘设备五个月下载量超500万次[2] - Amazon Bedrock AgentCore解决Agent在生产环境稳定安全大规模部署问题具备从0到数千并发能力[2] - AgentCore Identity通过几行代码实现AWS应用与SlackZoom等第三方应用无缝身份访问管理[2] AI Agent技术架构 - 每个Agent由三个关键组件构成模型负责推理规划执行代码定义身份和能力工具让Agent活起来[3] - AgentCore Memory推出情景记忆功能使AI Agent能记住并从过去经历中学习越丰富越智能[5] - 工具范畴包括后端API知识库与数据库访问权限代码解释器网页浏览器等实际操作支持[3] 模型训练与优化技术 - Bedrock RFT自动化所有复杂RL流程让开发者无需理解奖励建模策略优化就能使用RLAIF[5] - SageMaker AI推出无服务器模型定制功能不再需要繁琐的基础设施准备[5] - Nova Forge开放训练模型计划提供中间检查点访问允许混合专有与基础训练数据[5][6] - SageMaker HyperPod Checkpointless Training故障恢复从数小时缩短到数分钟节省高达40%训练成本[6]
豆包算是踢到钢板了
虎嗅APP· 2025-12-05 00:23
豆包AI助手与微信的冲突事件 - 2024年12月2日晚起,使用豆包AI助手自动操作微信导致用户微信账号异常退出,随后淘宝、中国农业银行、中国建设银行等APP也陆续出台风控措施,出现豆包AI助手无法登录、无法完成支付等情况[5] - 12月3日晚9点,豆包官方发布公告,宣布下线AI助手操作微信的功能,并表示合作机型nubia M153上被限制登录的微信账号将陆续解封[7] - 腾讯方面表示,微信并未针对性采取特别动作,仅当豆包AI助手执行相关指令时,会触发常规登录限制机制[9] 豆包AI助手的技术实现与争议 - 豆包AI助手于12月1日发布预览版,可根据用户指令在多款应用间自动跳转,完成效率型及生活服务类操作,其开创意义在于从操作系统层面推动AI从被动问答升级为主动完成跨应用任务[11] - 该产品与中兴合作,在合作机型nubia M153上,基于系统私钥签名,将豆包手机助手设置为操作系统的一部分,而非普通第三方软件,实现了丝滑的智能调度[11][12] - 技术实现依赖Android系统的`INJECT_EVENTS`权限(允许应用向系统模拟用户输入事件的权限),该权限属于操作系统高危权限[11][12] - 豆包AI助手的进程注入行为,与中国信通院牵头发布的《端云协同 智能体交互双重授权安全指引》条款存在明显冲突,该指引规定不得通过模拟用户行为等方式绕过第三方应用的核验措施[12] 豆包官方的回应与解释 - 针对“未经授权获取系统权限”的质疑,豆包方面表示,`INJECT_EVENTS`权限的调用需用户主动授权,且已在权限清单中明确披露[12] - 强调当操作涉及敏感授权环节时,AI助手会自动暂停任务,由用户接管完成,不会替代用户进行任何敏感授权或操作[13] - 针对“侵犯用户隐私”的质疑,豆包方面回应称,读取屏幕内容时不会在云端存储任何相关数据,且所有屏幕信息均不会用于模型训练,执行长时任务时屏幕会有明确提示,用户可随时中断[15] - 抖音高管李亮明确,跨应用任务执行均以用户授权为前提,所有权限使用规则已在官网《隐私安全白皮书》中披露[17] 行业背景与AI Agent发展趋势 - 主流手机厂商如荣耀、华为、小米、vivo、魅族均拥有自研AI助手,这是豆包选择与中兴合作的核心原因之一[15] - 自2024年起,“手机自动驾驶”风潮盛行,AI代点咖啡、代发红包等功能成为大模型厂商发布会“秀肌肉”标配[23] - 国外有先例,如三星宣布Galaxy A系列支持通过侧边按钮激活谷歌AI助手Gemini[23] - 2024年4月,微信安全中心发布公告,提醒用户勿安装或使用任何可访问本地聊天记录的第三方工具,随后华为、小米等主流手机厂商的AI智能体均无法再直接调用微信功能[23] - 2024年8月,微信再次封禁一批AI代理产品的相关权限,释放了严禁通过模拟点击等方式操作微信的明确信号[23] - 过去6个月,AI产业迭代速度显著加快,行业处于技术周期的关键拐点,模态融合成为核心趋势[24] - 去年AI领域以单模态为主,大语言模型占据绝对主流;今年多模态调用量持续攀升,生图、生视频等能力增长迅猛,下半年以来模型的“Function Call”请求量爆发式增长,标志着Agent能力已成为市场核心需求[24][25] - 微信与抖音凭借庞大的用户基数、高频刚需的应用场景,稳居国内AI Agent技术落地的T0梯队核心载体[25] 各方的立场与观点 - 安全专家曲子龙分析,豆包AI助手调用`INJECT_EVENTS`权限模拟用户输入,会被微信识别为高风险操作,进而触发常规风控逻辑[9][10] - 网络信息安全专家彭根指出,结构化解析技术让AI能够精准识别屏幕上的元素,为AI代理的自主操作提供了核心技术支撑,实现了从“人主导操作”到“授权AI全自动操作”的本质转变[20][21] - 北京大学武汉人工智能研究院副院长吕鹏认为,以Agents为代表的技术革新是必然发展趋势,在用户自主选择的前提下,任何限制、隔离不同APP或智能体的行为,都是对用户权益的漠视[21] - 中国社会科学院大学互联网法治研究中心主任刘晓春认为,在获得用户明确授权、确保合规的前提下,AI助手代替用户访问第三方应用是用户意志的合法延伸,应得到尊重,对创新技术需秉持包容审慎的态度[25][26] - 腾讯总裁刘炽平在2025年第三季度财报电话会上表态,微信最终将推出自研AI智能体,让用户在微信生态内即可利用AI完成多项任务[24] - 《腾讯微信软件许可及服务协议》明确规定,用户不得通过非腾讯授权第三方工具登录或使用微信,不得进行自动化操作[24] AI Agent发展伴随的核心风险 - 权限的无边界扩张:如无障碍权限属于系统级全局权限,一旦完全放开,将让AI获得设备的全面操控权,突破传统权限的单一性与限定性[27] - 行为主体的模糊化:AI逐渐变成实际操作主体后,用户可能逐渐丧失主观能动性,部分敏感信息可能在用户未查看前就被AI捕获并处理[28] - 监管挑战:在AI Agent爆发初期,监管体系的完善往往滞后于技术创新,需要兼顾技术创新与产业利益的平衡[28]
速递|Simular 的 AI 助手想替你运行你的 Mac 和 Windows PC
Z Potentials· 2025-12-05 00:04
公司融资与产品发布 - 初创公司Simular完成由Felicis领投的2150万美元A轮融资,NVentures、South Park Commons等跟投,累计融资额约2700万美元[2][8] - 公司宣布发布其Mac OS 1.0版本AI智能体产品,并正在与微软合作开发Windows版本[3] - 公司是入选微软“Windows 365智能体计划”的五家公司之一,其他四家为Manus AI、Fellou、Genspark和TinyFish[3] 核心技术特点与差异化 - 公司AI智能体的核心差异在于直接控制电脑操作系统本身(如移动鼠标、点击),而非仅控制浏览器,旨在高效执行和重复数字世界中的任何人类活动[2] - 公司采用“神经符号计算机使用代理”技术,并非完全基于LLM,其解决幻觉问题的关键方法是让LLM编写确定性代码,使成功的工作流可重复执行[6] - 公司将非确定性的LLM探索与确定性的代码执行相结合:智能体先自由迭代执行任务,用户可中途修正,成功后可将工作流锁定为确定且可重复的代码[4][5] - 生成的确定性代码由终端用户掌握和审计,增强了可信度与控制权[7] 市场应用与早期进展 - 早期测试客户包括自动化VIN码查询的汽车经销商,以及从PDF提取合同信息的业主协会[7] - 公司的开源项目已衍生出从内容创作到销售营销等多种自动化方案,目前仅支持Mac系统[7] 创始团队与行业背景 - 联合创始人兼CEO李昂为持续学习科学家,曾在谷歌DeepMind工作,并结识了强化学习专家杨嘉晨[3] - 团队虽发表多篇学术论文,但工作旨在改进包括Waymo在内的谷歌产品,并非纯粹学术性质[3]
速递|微软下调Agent产品销售增长目标:是短期挫折,还是行业“祛魅”的开始?
Z Potentials· 2025-12-05 00:04
微软AI产品销售预期调整 - 微软已下调销售人员针对特定人工智能产品的销售增长指标 多个事业部在截至6月的财年中未能达成既定增长目标 公司鲜少针对特定产品降低此类销售配额 [2] - 例如 美国一个Azure销售部门上个财年要求将客户对Foundry产品的支出提高50% 但不到五分之一的销售人员达到目标 本财年增长目标已降至约25% [8] - 在美国另一个Azure部门 大多数销售人员未能达到将Foundry销售额翻倍的目标 本财年配额已降至增长50% [8] 企业客户对AI付费的抵制与挑战 - 企业客户不愿为AI支付更高费用 难以量化使用该技术节省的成本 在自动化财务和网络安全等容错率低的场景中让AI完美运作也存在困难 [3] - 例如私募基金凯雷集团在使用微软Copilot Studio数月后 反映难以让人工智能稳定接入来自Salesforce等其他程序的数据 今年秋季已削减了相关工具的开支 [4] - 从AI Agent提升收入的挑战对于Salesforce等企业软件公司尤其严峻 这些公司不具备大规模云服务器业务带来的优势 一直在为尝试新型客服Agent产品的客户提供大幅折扣 [6] AI对微软业务的积极贡献 - AI对微软业务带来显著利好 主要得益于OpenAI等AI公司的新增支出 OpenAI预计今年将从微软租用价值约150亿美元的云服务器 [3] - 由于会计准则规定 微软实际只能确认OpenAI约70亿美元的云服务收入 [3] - 微软自身AI软件的销售业绩 包括365 Copilot办公套件和GitHub Copilot编程助手 也带来贡献 大型科技公司通过内部使用AI工具实现了生产力提升 [3] 行业普遍调整AI收入预期 - 微软并非唯一一家调整对自动化复杂任务的AI Agent收入预期的公司 OpenAI近期将其AI Agent收入预期下调了未来五年260亿美元 [5] - 这并非大型云计算和软件供应商首次调整对企业人工智能支出的预期 去年谷歌和亚马逊也因企业未以预期速度为新AI工具付费而降低了对企业AI销售的预期 [6] - 其他公司如Amazon Web Services和Anthropic则投入大量资源帮助客户部署AI应用程序以确保其正常运行 类似咨询公司提供服务的方式 [6] AI Agent技术的发展现状与未来 - 微软高管曾预言2025年将成为人工智能具备多步骤任务自动化能力的关键年份 但随着岁末临近 微软已降低了对客户为“智能Agent”新产品付费速度的预期 [2] - 网络安全公司Cohesity正在测试Copilot Studio和Foundry中的AI Agent功能 这些功能可以根据内部及公开数据为销售人员撰写客户报告 [9] - 尽管智能体至今尚未兑现其承诺 但Cohesity正在编写代码以更好地将它们与其他应用程序的数据源连接起来 希望在未来几个月内让它们发挥作用 [10] 微软的AI产品改进与新模型 - 微软计划全面改进AI助手功能 这些功能可自动执行客户桌面电脑上的操作 并将面向Windows PC软件购买者销售 [7] - 此前名为“Recall”的早期版本因隐私问题广受诟病 公司已于去年撤回该功能 [7] - 微软开发了名为Fara-7B的新开源模型 以比前代版本更注重隐私的方式处理此类任务 该模型体积小巧可完全在本地计算机上运行 [7]