Workflow
端侧智能体经济
icon
搜索文档
掀桌!豆包被“围攻”后,智谱把手机Agent开源,让人人皆可打造AI手机
华尔街见闻· 2025-12-09 03:42
核心观点 - 智谱AI开源其核心AI Agent模型AutoGLM 此举被业界视为技术上的“掀桌”行为 将原本被视为“大厂核武器”的跨应用操作能力 变成了整个行业可共同拥有的公共技术底座 有望推动AI手机产业进入类似新能源汽车的爆发式增长阶段 并可能重构现有的互联网流量和商业模式 [4][9][20] 事件背景:豆包手机引发的行业震荡 - 12月1日 字节跳动联合中兴通讯旗下努比亚推出搭载“豆包手机助手”的nubia M153 售价3499元 该手机凭借系统级权限 能够模拟人类操作 跨越APP孤岛执行点外卖、发微信、比价购物等复杂任务 [8] - 豆包手机迅速引爆市场 首批备货瞬间售罄 在闲鱼平台上 该手机的未拆封报价甚至一度被炒至7999~9999元 [8] - 微信、淘宝及多家银行APP随即启动了防御机制 当豆包助手尝试接管应用时 会出现异常退出、风险提示甚至封号的情况 行业普遍认为 这本质上是互联网巨头对流量入口和数据控制权的保卫战 [8] 智谱AI的应对:开源AutoGLM - 12月9日 智谱AI正式宣布开源其核心AI Agent模型——AutoGLM 这是一个历经32个月研发、具备“Phone Use”(手机操作)能力的智能体框架 [1] - 智谱AI明确表示开源初衷是“把这一层能力变成整个行业可以共同拥有、共同打磨的公共底座” [9] - 开源内容包含训练好的核心模型、Phone Use能力框架与工具链 以及覆盖超过50个高频中文应用的可跑通Demo [4][9] 技术路径与优势 - **研发历程与能力**:AutoGLM研发始于2023年4月 经过32个月打磨 建立了一整套Phone Use能力框架 将点击、滑动、输入、界面理解抽象化 2024年11月 AutoGLM发出了人类历史上第一个由AI完成的手机红包 [12] - **底层技术“降维打击”**:AutoGLM在底层调用ADB(Android Debug Bridge)指令 并结合视觉大模型(AutoGLM-Phone-9B) 其运行逻辑是“看屏幕截图 -> 大模型分析 -> 模拟手指点击” 这种基于视觉的“类人操作”让APP厂商通过简单代码检测进行防御变得极其困难 [15] - **隐私与部署方案**:AutoGLM支持私有化部署和本地部署模式 通过MobileRL等强化学习算法在云端虚拟手机中训练 实际运行时 模型运行和数据处理可在用户设备端完成 数据不出手机 此举旨在瓦解互联网大厂以“隐私泄露”为由进行围剿的合法性基础 [18] 行业影响与未来展望 - **硬件厂商的新机遇**:中信证券指出 AI Agent之于手机 正如自动驾驶之于汽车 AutoGLM的开源为荣耀、小米、OPPO等手机厂商 甚至中小硬件开发者提供了现成的技术底座 未来“大模型厂商+手机厂商”的深度绑定将成为常态 AI手机有望迎来类似新能源汽车的爆发式增长 [4][20] - **互联网生态面临挑战**:当用户可以通过AI Agent绕过APP的首页推荐、广告位 直接触达核心服务(如直接订票、比价购物)时 超级APP的流量分发逻辑将失效 互联网巨头面临选择:继续修筑高墙或开放API与AI Agent共建新生态 [23] - **赋能个体开发者**:AutoGLM的开源标志着手机Agent进入了“可编程”时代 未来可能诞生出专门服务于视障人士的公益Agent、专注于特定工作流的效率Agent 甚至是完全个性化的私人助理 [24] - **开启新赛道**:智能终端的交互逻辑正在发生根本性逆转 一个新的万亿级赛道——端侧智能体经济 已经开启 [28]