全模态智能
搜索文档
从豆包手机谈起:端侧智能的愿景与路线图
AI前线· 2025-12-22 05:01
近日,字节跳动发布的豆包手机助手在业内激起了广泛讨论。这不仅是一款新智能硬件的亮相,更标志着大模型应用范式的一次重要跃迁——从"Chat (对话)"真正迈向"Action(行动)"。作为长期深耕大模型领域的研究者,我们将豆包手机助手定义为行业首款系统级 GUI Agent。它不再是一个孤立 的智能应用,而是深度耦合于操作系统底层、具备跨应用感知与操作能力的"超级中枢"。 如何看待豆包手机助手的当下与未来?藉此机会,我们希望与大家分享我们眼中的手机助手,以及端侧智能的演进愿景与路线图。 豆包手机助手关键技术解析与研判 GUI Agent 无疑是豆包手机助手的核心技术。为透视豆包手机助手的技术本质,我们有必要先回顾 GUI Agent 技术从实验室走向产业界的演进脉络。 2023 年至 2025 年间,GUI Agent 技术经历了从"外挂式框架"到"模型原生智能体"的根本性范式转变: 作者 | OpenBMB 团队 而在模型侧 ,综合现有使用体验与技术特征判断,豆包手机助手采用端云协同的模型架构: 豆包手机助手的出现,标志着 GUI Agent 终于走出实验室的"玩具"阶段,开始具备实用价值。它揭示了一个事实: ...