豆包手机遭「五大派」围剿,实测23款主流App,哪些「使不动」?
新浪科技·2025-12-10 07:25

文章核心观点 - 豆包手机助手作为一款创新的AI手机助手,在发布后引发了巨大关注和争议,其核心功能在经历主流App的“风控墙”限制后,部分功能仍得以保留,展现了强大的实用性和技术潜力,但其发展也面临着来自隐私安全、商业利益冲突和生态重塑的严峻挑战 [3][6][26] 产品功能与用户体验实测 - 在记者实测的23款主流App中,有15款App(如滴滴、QQ、京东)可正常登录并通过AI操作,3款App(微信、高德地图、大麦网)可手动登录但无法通过AI操作,5款App(淘宝、美团、支付宝、拼多多、猫眼)直接无法登录,总计8款App功能受限 [4] - 受限的8款App主要隶属于腾讯、阿里巴巴、美团、拼多多及光线传媒五家大厂,此外,官方出于金融安全和游戏公平考虑,主动限制了银行类及游戏类应用 [4] - AI助手能够精准识别并关闭各类App弹窗和广告,成功率极高,极大提升了操作效率 [8] - 在执行任务时展现出高度灵活性,例如在导航任务中,当高德地图受限后会自动尝试打开百度地图;在P图任务中,尝试了4条不同路径直至完成任务 [13] - 具备一定的记忆和主观判断能力,能根据用户历史记录(如便签中的“想吃猪脚饭”)来理解模糊指令(如“订一份晚饭”),并在外卖凑单时自主选择推荐商品 [16] - 存在局限性:处理海量信息任务(如查询大量高铁票)时可能自动停止;在判断“传唱度最高歌曲”等复杂任务时可能出错;更新后无法执行涉及用户账户激励体系的操作(如看广告领VIP) [19] 核心技术支撑 - 豆包手机助手实现“丝滑”体验的关键在于其拥有系统底层的INJECT_EVENTS权限,允许其在后台执行任务而不占用前台屏幕,这与仅能通过“无障碍权限”在前台模拟操作的第三方方案有本质区别 [21] - 其图形界面操作能力基于字节自研的UI-TARS模型(闭源版本),该模型针对移动端(Mobile Use)进行了大量优化,提供了“阅读理解手机屏幕”的关键技术支撑 [22] - 技术专家指出,豆包手机助手采用了端云协同架构,本地处理个性化任务,云端负责专业化任务,这是未来端侧智能的发展方向 [25] 面临的挑战与行业影响 - 豆包手机助手因其高系统权限和自动化操作能力,触及了众多App的风控机制,被部分应用识别为异常或机器代理操作(类似“猫池”),从而导致登录和功能限制 [24] - 其更深层的挑战在于可能颠覆现有移动互联网商业模式:AI助手在后台自动化完成任务,使用户跳过开屏广告、弹窗等环节,这将严重削弱依赖广告和流量变现的App的商业价值,使其有沦为“通道”的风险 [26] - 第三方App可以通过获取设备信息或检测INJECT_EVENTS权限等运行环境来识别并阻断豆包手机助手的操作 [27] - 行业专家认为,要解决利益冲突,需要构建一个紧密协调的联盟来重塑生态,但这非常困难;更现实的路径可能是从特定场景(如工作场景)开始切入 [27][28] - 法律专家指出,在获得用户明确授权且合规的前提下,AI代理用户访问第三方应用是用户意志的合法体现,行业处于初期,需以包容审慎态度对待创新 [28]