核心观点 - 智谱开源其核心AI Agent模型AutoGLM,该模型被视为全球首个具备“Phone Use”(手机操作)能力的AI Agent,能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程 [2] - 此次开源旨在降低AI手机技术门槛,推动AI手机生态从封闭走向开放共创,并支持本地与云端部署以保障数据与隐私控制权 [2] - 智谱认为Agent的爆发需要广泛参与,并基于对AGI早期形态的理解,提出了迈向AGI所需的3A原则 [4] 开源内容与能力 - 开源内容为一整套“拿来就用”的能力,包括训练好的核心模型、Phone Use能力框架与工具链、可直接跑通的Demo、针对Android的适配层与示例工程以及相关文档和指南 [3] - AutoGLM已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景,其自动化操作能力与此前引发热议的“豆包手机”演示相似 [2] - 开源意味着硬件厂商、手机厂商和开发者均可基于AutoGLM,在自己的设备或系统中复现一个能“看懂”屏幕、并模拟真人进行点击、输入、滑动的AI助手 [2] 行业影响与生态愿景 - AutoGLM的开源将大幅降低AI手机的技术门槛,推动AI手机生态从封闭走向开放共创 [2] - 智谱乐见各方基于AutoGLM进行创新,例如有团队做出真正意义上的AI原生手机,研究者将模块发展为新算法,或个人开发者将其应用于小众场景 [4] - 公司对AGI早期形态的理解是AutoGLM产品形态的根源,并认为从Agent到AGI需要满足3A原则:全时(24小时运行)、自主零干扰(独立运行不占用用户资源)、全域连接(跨越多种设备操作物理世界) [4] - AutoGLM团队将继续推动Agent开源和研究,以期实现“贾维斯”式的个人助手愿景 [4]
智谱开源全球首个「会操作手机的AI」AutoGLM,让每台手机都可以成为豆包手机
IPO早知道·2025-12-09 03:29