豆包助手在争议中出圈,业内人士称有系统级权限不等于高风险
南方都市报·2025-12-15 10:23

豆包助手产品发布与市场反应 - 字节跳动与中兴合作推出的豆包手机(努比亚M153)于12月1日小批量发售,内置的豆包助手能通过理解指令、读取屏幕信息并自动点击来执行任务 [1] - 手机发售迅速拉动了中兴通讯等相关A股概念股走强 [1] - 发售次日(12月2日起),微信、淘宝、支付宝、美团等多个国民级APP相继将豆包助手“拉黑”,限制其操作能力 [1] - 12月5日,豆包助手官方回应称,已限制助手刷激励、调用金融类应用等能力,并正积极与各应用厂商沟通 [1] - 12月10日,豆包助手在用户群发布消息,称阿里系部分应用已陆续解除对设备登录的限制,同时豆包助手也关闭了对阿里系相关APP的操作能力 [1] 豆包助手的技术原理与核心优势 - 豆包助手能执行50步以上的复杂任务,用户感觉其成功率约80% [4] - 与依赖“无障碍权限”的前台运行AI助手不同,豆包助手通过与手机厂商合作,获得系统级权限,可在后台运行 [5] - 其核心技术是调用操作系统级的INJECT_EVENTS(事件注入)权限来实现操作点击,该权限已存在十多年,并被多家手机厂商的AI助手使用 [6][12] - 豆包助手通过系统框架创建“虚拟屏”或“影子系统”来执行任务,比通过无障碍权限读屏和模拟点击更流畅 [5] - 与“剧本式”的传统手机助手不同,豆包助手依靠模型对屏幕的视觉理解、元素定位和推理规划能力来执行任务,具备更强的泛化能力和更长的任务链执行能力 [13] - 未选择API接口方案,因提供接口的APP有限且开放能力有限,难以满足泛化和长尾需求 [14] 关于安全与隐私的讨论 - 豆包助手调用INJECT_EVENTS等系统级高危敏感权限,引发了公众对安全风险和隐私泄露的担忧 [1][15] - 业内人士认为,将高危敏感权限直接等同于高风险是误区,风险取决于使用该权限的应用主体,正规商业公司通常不会用于恶意行为 [2][15] - 针对黑客劫持助手的担忧,业内人士指出支付等关键操作仍需用户手动确认,且恶意任务会被安全机制拒绝 [16][17] - 针对“全天候监控”的担忧,业内人士指出持续监控会导致手机电量消耗巨大且运营成本显著增加 [17] - 根据《隐私安全白皮书》,用户偏好等“全局记忆”信息存储在设备端侧 [18] - 任务执行中,屏幕视觉信息需上传云端进行推理,但官方声明所有屏幕内容和操作过程不会在服务器端存储或用于模型训练 [20] - 云端存储的是用户与豆包的聊天记录(输入输出),而非屏幕原始图像,因此识别出的结果(如银行卡余额)可在不同设备同步,但原始图像未被保存 [21] - 操作过程对用户可见、可控,用户可随时切换到前台监督或人工接管,以建立信任 [22] 行业合作与生态博弈 - 业内人士将此次“工程样机”发售视为一次“打样”,旨在收集用户反馈并推动行业合作,是与手机厂商进一步合作的“敲门砖” [1] - APP厂商的强烈风控反应出乎意料,可能是将搭载豆包助手的手机设备整体纳入了风控范围 [24] - 尽管多个头部APP限制调用,但AI助手价值在于覆盖长尾、泛化的需求,应用商店有百万数量级的APP可供操作 [25] - 目前豆包手机发售量非常有限,对行业流量格局尚不构成任何实质影响,现阶段谈AI入口为时尚早 [2][25] - 业内对“双重授权”(即AI助手除用户授权外是否需第三方APP授权)存在争议,目前尚无具有强制法律效力的监管规则禁止此类操作 [26] - 部分APP平台协议中禁止自动化程序,主要是针对传统爬虫和黑灰产,而AI助手被视为对用户意愿的自动化执行 [27] - 未来可能出现应用厂商对AI助手态度分化的局面,更开放的APP可能获得更多被使用的机会 [25]