Workflow
Mobile Agent
icon
搜索文档
仅仅四小时!他做出了豆包手机平替产品“肉包”
中国经营报· 2025-12-19 20:29
文章核心观点 - AI手机助手的技术实现门槛相对较低,但面临数据标注、系统权限、商业模式及平台生态壁垒等核心挑战,其发展受制于大厂封禁、安全隐私与责任界定等深层次问题 [2][6][7] 行业动态与市场反应 - 字节跳动与中兴通讯联合推出的“豆包AI手机”(努比亚M153工程样机)在12月开售后迅速售罄,二手平台成交价一度接近发售价的两倍 [1] - “豆包手机助手”因触发风控机制,被微信、淘宝、美团及多家银行类App限制登录或禁止AI操作 [1] - 在豆包手机引发关注后,个人开发者李云龙在四小时内开发出类似开源项目“肉包”,该项目在GitHub上星标数持续攀升,受到大量开发者关注 [1] - 荣耀在Magic8和Magic7发布会上已演示过AI操控手机的能力,例如“一句话点咖啡” [4] - 在豆包手机被主流App封禁后,智谱开源了“会操作手机的AI”AutoGLM,阿里也发布了同类开源项目Mobile Agent [4] 技术实现与方案对比 - “肉包”初版开发仅耗时四小时,其中99%的代码由AI生成,开发者仅写了约十行代码 [3] - “肉包”调用包括Claude、ChatGPT在内的六款AI助手协同完成UI设计、前后端开发与测试部署 [3] - 核心原理是通过高权限工具截取屏幕画面,利用多模态大模型识别界面元素,再结合模拟点击等操作实现对应用的自动化控制 [3] - “肉包”采用多智能体架构,包含管理者、执行者、反思者和记录者角色,使AI具备从错误中学习的能力 [3] - 阿里Mobile Agent和智谱AutoGLM(开源版)需连接电脑作为中转,而“肉包”完全运行于手机本地,降低了使用门槛 [4] - “肉包”底层依赖阿里通义千问VL通用大模型,需上传整屏截图至云端分析,导致响应迟缓,演示中完成B站搜索点赞任务耗时2分54秒,而豆包手机仅需十几秒 [6] - 豆包手机通过获得系统级权限、使用针对手机操作场景微调的小模型,并对主流App进行人工标注,实现了更精准高效的控制 [6] 核心挑战与行业壁垒 - 数据标注是提升AI手机助手效率的关键,若将“肉包”训练至豆包手机助手水平,至少需要300万元投入和三到四个月时间 [7] - 标注需专业团队对每个应用界面进行详细标记,例如需分别标注折叠屏与直面屏的显示差异 [7] - 大厂封禁AI助手主要因其行为模式被识别为非人类操作,且AI会冲击平台依赖“用户打开App—浏览页面—点击广告”构建的传统流量变现模型 [8] - 大厂自身纷纷推出内置AI服务,如腾讯“元宝”、美团“小美”、字节“豆包”、阿里“夸克”和“通义千问”,旨在将用户锁定在自家生态内 [9] - 手机厂商对开放系统底层权限持谨慎态度,因一旦开放给AI,也可能被“黑灰产”和诈骗者利用 [10] - AI手机助手面临责任归属难题,目前在支付等关键环节均强制用户二次确认,将最终决策权留给人类以规避责任纠纷 [11] 商业模式与生态博弈 - AI助手能直接完成订餐、购物等操作,使用户无须浏览首页和观看广告即可直达目标,直接冲击了淘宝、美团等平台依赖用户停留时长和广告投放的传统盈利模式 [8] - 理想的商业路径被认为是由手机厂商作为整合者,与头部App达成授权合作,在系统底层预留安全可控的AI代理接口,以保障用户体验并让各平台保留数据主权 [10]