AI手机技术路线分野 - AI手机技术路线已形成鲜明分野,以字节跳动“豆包手机”为代表的阵营采用GUI技术路线,而苹果、谷歌主导的阵营则坚持API标准化路线[1] GUI技术路线阵营 - 字节跳动联合中兴努比亚推出“豆包手机”nubia M153,其AI助手通过获得系统级权限,利用GUI技术模拟人类点击、滑动,实现跨应用操作,如订外卖、发微信、比价购物[4][6] - 字节跳动正与vivo、联想、传音等厂商推进AI手机合作[1] - 智谱AI宣布开源自主任务模型AutoGLM,同样基于GUI范式,通过视觉大模型实现手机自动化操作[6] - GUI路线的优势在于通用性强,不依赖App开发者配合,理论上能操作所有App;缺点包括隐私保护压力大、效率较低且易出错[8] API技术路线阵营 - 以苹果Apple Intelligence和谷歌Gemini为代表的API路线,通过构建底层框架与标准化接口,让AI通过规范“调用能力”完成任务[8][9] - API路线的优点是稳定、保障隐私且效率高;缺点是需要App开发者主动配合,生态构建周期更长[9] - 苹果Apple Intelligence集成OpenAI的ChatGPT,并计划采用谷歌Gemini模型为Siri升级提供技术支撑[13] - 谷歌推出AppFunctions API,旨在解决生态内碎片化问题,实现系统对应用能力的统一发现与索引[13] - 苹果和谷歌均倾向于推动应用开发者主动接入标准化接口,尚未在手机上推出GUI多模态操作功能,仍处于技术储备阶段[13] 技术路线博弈与行业影响 - GUI路线引发主流App“自卫反击”,如微信提示环境异常、淘宝频繁弹出人机验证、银行App拒绝在录屏状态下运行[6] - 超级App的焦虑在于,AI助手直接介入交易可能影响其商业模式,且GUI Agent将用户操作截留在系统层面,可能使App的广告投放失去核心价值[14][15] - 手机厂商对开放系统级权限给AI公司存在顾虑,包括用户隐私担忧以及不希望沦为AI公司的技术通道,这解释了为何字节跳动的首个合作伙伴是中兴努比亚而非头部厂商[7] 未来生态格局展望 - 未来AI手机生态可能呈现“分层治理”格局:超级App可能通过自研AI Agent形成A2A协作模式;而中长尾App因缺乏自研能力,可能“被系统级AI直接控制”,接受新的流量分发规则[16] - 市场机构Canalys报告显示,全球AI手机出货占比预计将从2024年的16%升至2028年的54%,2023年至2028年的年复合增长率预计达63%[13] - 行业变革将推动生态从“流量争夺”走向“价值共创”,最终形成手机厂商主导,超级App、长尾应用和大模型厂商各司其职的新格局[16]
AI手机路线大分野:当豆包试图“接管屏幕” 苹果和谷歌为何选择“慢半拍”?