智谱AutoGLM与豆包手机的分歧,是AI时代的安卓苹果之战?
钛媒体APP·2025-12-10 05:04

核心观点 - 智谱AI开源其核心AI Agent模型AutoGLM 此举旨在对抗技术垄断 推动行业共建 降低开发门槛 并定义未来AI Agent生态规则[2][3][4] 产品功能与定位 - AutoGLM是具备“Phone Use”能力的跨端通用智能体 能通过自然语言指令模拟真人点击、滑动、输入等动作 自主完成手机、电脑等设备的复杂操作[2] - 其核心功能围绕“自主执行”展开 稳定处理外卖点单、机票预订等数十步流程 覆盖50多个高频中文应用的核心场景 支持手机与电脑的跨端协同[2] - 2025年8月开放的AutoGLM 2.0强调“执行型助手”定位 在办公和生活场景中执行从检索资料到生成视频、PPT及跨应用预订服务的全流程[2] - 产品采用“云端智能体”范式 任务在云端虚拟设备中执行 不占用本地设备资源[5] 开源动因与内容 - 开源主要基于三方面原因:避免AI手机能力被少数厂商垄断 保护用户隐私与数据控制权 共享32个月的技术积累以降低Agent开发门槛[3] - 开源内容包含训练好的核心模型、Phone Use能力框架、50多个高频App的Demo及文档 均以MIT和Apache-2.0许可证开放[3] - 开源的首要意义是将“AI使用手机”这一核心能力基础设施化和民主化 使其成为行业可共同拥有的公共底座[3] 行业影响与战略意义 - 开源使开发者能像使用“积木”一样集成或改造AutoGLM 催生多样化AI原生应用与解决方案 加速Agent生态繁荣[4] - 此举被行业人士视为一次战略性的生态卡位和规则定义 目标是成为未来AI Agent(尤其是终端通用Agent)的基础设施 类似Android之于移动应用生态[4] - 开源意味着智能手机终端的通用Agent竞争走上不同道路 智谱AutoGLM选择成为AI时代的基础设施和公共底座 类似于安卓的软件开发环境[4][5] 竞争格局与路线对比 - 智谱AutoGLM的开放模式与豆包手机助手形成路线分歧 前者提供云端智能体并开源技术 后者采用终端具身智能并直接集成于专属硬件[5] - AutoGLM将操作执行能力封装为API供开发者融入各类硬件 豆包则与手机厂商合作推出专属硬件 其“模拟点击、调度一切”的模式直接挑战了微信、淘宝等超级应用的生态壁垒[5] - 两条路径类似历史上的安卓与苹果之争 智谱AutoGLM的开源被视为通用AI Agent话语权之争大幕拉开的重要信号[5][6]