Workflow
nubia M153
icon
搜索文档
中兴努比亚倪飞谈豆包手机助手:行业太久没给用户带来颠覆式创新,AI手机发展势不可逆【附智能手机行业市场分析】
前瞻网· 2025-12-10 02:27
产品发布与市场反响 - 字节跳动旗下AI模型豆包于12月1日正式发布“豆包手机助手”技术预览版,并与中兴通讯合作推出首款深度集成该系统的工程样机nubia M153,售价3499元 [2] - nubia M153在开售一天后即宣告售罄,在二手平台闲鱼引发溢价狂潮,部分卖家报价高达7999-9999元,最高溢价超过6500元 [2] 技术路径与核心能力 - 豆包手机助手的技术颠覆性在于其路径突破,它直接嵌入操作系统底层,而非困于应用层 [2] - 基于豆包大模型能力,该助手首次实现跨App自动化任务执行,用户只需一句自然语言指令即可完成复杂流程 [2] - 具体应用示例:用户指令对比京东、美团、淘宝上肯德基香辣鸡腿堡价格并选最低价下单后微信发给朋友,助手能自动完成打开应用、搜索、比价、领券、下单、截图、发送的全流程 [2] - 这种Agent能力将美团、淘宝等平台降级为可调用的底层服务,打破了App孤岛模式,标志着AI从辅助工具向主动代理的范式跃迁 [2] 公司战略与合作理念 - 中兴通讯终端事业部总裁倪飞表示,手机行业缺乏颠覆式创新,AI手机发展势不可逆,公司的答案是开放 [3][5] - 公司认为以开放姿态可实现1+1>2的效果,类似iPhone+ChatGPT、三星+Gemini的组合,核心是为用户提供更好的产品体验,因此选择与豆包手机助手强强联合 [3][5] - 中兴努比亚早在2017年就开始布局AI,并坚持“AI for All”理念,认为AI应成为每个人都能轻松享有的基础能力,而非实验室炫技或少数人专属 [5][7] - 从2017年首款AI手机Z17到2025年多模型协同理念,再到与豆包合作的M153,公司近十年间持续从技术创新到全场景布局进行实践 [5] 行业发展趋势 - 中国智能手机市场呈现新趋势,价格超过600美元(国内以4000元人民币为标准)的高端手机市场份额不断提升,2023年占比超过27%,较2022年增长3.7个百分点 [7] - 消费者对高端手机的需求日益旺盛,对手机性能、功能和创新体验要求更高 [7] - 在全球经济回暖与折叠屏、AI手机兴起的双重驱动下,中国智能手机市场正迎来新一轮换机潮 [8] - 前瞻产业研究院预计,到2029年中国智能手机市场规模将达到15367亿元,年均复合增长率约为9.2% [8] - 行业观点认为,AI技术应是具备自主学习与持续进化能力的“生命体”,AI手机能通过端侧学习在日常互动中不断适应用户习惯,实现自我迭代,而非出厂即功能固化 [11]
智谱开源“会使用手机的模型”,智能体能否保障个人隐私安全?
中国证券报· 2025-12-09 04:39
公司动态:智谱AI开源AutoGLM模型 - 智谱于12月9日通过微信公众号宣布,开源其核心AI Agent模型AutoGLM [1] - AutoGLM的目标是让AI真正学会“使用手机”,实现从说到做,可在外卖App完成下单、在云手机批量处理通知、在销售客服等场景自动完成重复操作 [1] - AutoGLM于2024年10月25日发布,被业界视为首个具备“Phone Use”(手机操作)能力的AI Agent [1] - 2025年,公司推出AutoGLM 2.0,验证了强化学习的规模扩展定律,并提出MobileRL、ComputerRL和AgentRL算法,通过让模型在上千个虚拟设备环境中同时强化学习,扩展了Agent的准确性和泛化能力 [1] - AutoGLM Phone Agent支持微信、微博、淘宝、京东、美团、抖音、小红书等超50款主流中文应用,可完成启动应用、输入文本、长按、双击等操作,面对登录、输入验证码等敏感操作时会发起人工接管请求 [1] - 智谱为国内头部AI大模型公司,由清华大学团队孵化,致力于打造新一代认知智能大模型 [2] - 公司此前已推出对话模型ChatGLM、开源单卡版模型ChatGLM-6B,并打造了包括智谱清言、CodeGeeX、CogVLM和CogView在内的AIGC产品矩阵 [2] 行业趋势:AI Agent技术发展与应用 - 近期,人工智能技术正向更具实用价值的智能体Agent方向发展,行业希望AI能“长出手脚”,不仅提供建议,还能将建议转为行动 [2] - 豆包于12月1日宣布发布技术预览版豆包手机助手,并与中兴通讯联合推出工程样机nubia M153少量发售,演示中AI助手实现了手机跨App调用,消息引起市场广泛关注,中兴通讯股价当日涨停 [2] - 豆包手机助手在nubia M153上操作手机功能时,被用户发现在部分App出现异常退出甚至无法登录的情况,业内人士认为可能与需要系统级权限相关 [3] - 豆包在后续声明中确认,需要用户主动授权INJECT_EVENTS系统级权限(或类似无障碍权限)才能提供服务,并承诺虽然需要读取屏幕以完成指令,但不会在云端存储用户屏幕内容,且相关内容不会进入模型训练 [3] - 行业人士认为,目前Agent技术仍在探索中,如何平衡使用体验和隐私安全等,需要行业共同努力,开源等方式或有助于加速行业对技术的共同研发 [3] 技术路径与隐私考量 - 由于隐私保护争议和当前手机难以支撑AI Agent模型算力需求,智谱AutoGLM选择不完全部署于手机端,而是在云端运行端侧模型 [3] - 智谱表示,云端运行方案让AI Agent的每一个动作都可以回放、审计、干预,从而将敏感数据隔离 [3] - 在实践中,用户个人隐私保护和网络安全隐忧仍在,以手机智能体为例,将App操作托管给AI需要用户授权屏幕读取权限,引发对个人信息泄露和Agent被灰黑产利用的担忧 [2]
掀桌!豆包被“围攻”后,智谱把手机Agent开源,让人人皆可打造AI手机
华尔街见闻· 2025-12-09 03:42
核心观点 - 智谱AI开源其核心AI Agent模型AutoGLM 此举被业界视为技术上的“掀桌”行为 将原本被视为“大厂核武器”的跨应用操作能力 变成了整个行业可共同拥有的公共技术底座 有望推动AI手机产业进入类似新能源汽车的爆发式增长阶段 并可能重构现有的互联网流量和商业模式 [4][9][20] 事件背景:豆包手机引发的行业震荡 - 12月1日 字节跳动联合中兴通讯旗下努比亚推出搭载“豆包手机助手”的nubia M153 售价3499元 该手机凭借系统级权限 能够模拟人类操作 跨越APP孤岛执行点外卖、发微信、比价购物等复杂任务 [8] - 豆包手机迅速引爆市场 首批备货瞬间售罄 在闲鱼平台上 该手机的未拆封报价甚至一度被炒至7999~9999元 [8] - 微信、淘宝及多家银行APP随即启动了防御机制 当豆包助手尝试接管应用时 会出现异常退出、风险提示甚至封号的情况 行业普遍认为 这本质上是互联网巨头对流量入口和数据控制权的保卫战 [8] 智谱AI的应对:开源AutoGLM - 12月9日 智谱AI正式宣布开源其核心AI Agent模型——AutoGLM 这是一个历经32个月研发、具备“Phone Use”(手机操作)能力的智能体框架 [1] - 智谱AI明确表示开源初衷是“把这一层能力变成整个行业可以共同拥有、共同打磨的公共底座” [9] - 开源内容包含训练好的核心模型、Phone Use能力框架与工具链 以及覆盖超过50个高频中文应用的可跑通Demo [4][9] 技术路径与优势 - **研发历程与能力**:AutoGLM研发始于2023年4月 经过32个月打磨 建立了一整套Phone Use能力框架 将点击、滑动、输入、界面理解抽象化 2024年11月 AutoGLM发出了人类历史上第一个由AI完成的手机红包 [12] - **底层技术“降维打击”**:AutoGLM在底层调用ADB(Android Debug Bridge)指令 并结合视觉大模型(AutoGLM-Phone-9B) 其运行逻辑是“看屏幕截图 -> 大模型分析 -> 模拟手指点击” 这种基于视觉的“类人操作”让APP厂商通过简单代码检测进行防御变得极其困难 [15] - **隐私与部署方案**:AutoGLM支持私有化部署和本地部署模式 通过MobileRL等强化学习算法在云端虚拟手机中训练 实际运行时 模型运行和数据处理可在用户设备端完成 数据不出手机 此举旨在瓦解互联网大厂以“隐私泄露”为由进行围剿的合法性基础 [18] 行业影响与未来展望 - **硬件厂商的新机遇**:中信证券指出 AI Agent之于手机 正如自动驾驶之于汽车 AutoGLM的开源为荣耀、小米、OPPO等手机厂商 甚至中小硬件开发者提供了现成的技术底座 未来“大模型厂商+手机厂商”的深度绑定将成为常态 AI手机有望迎来类似新能源汽车的爆发式增长 [4][20] - **互联网生态面临挑战**:当用户可以通过AI Agent绕过APP的首页推荐、广告位 直接触达核心服务(如直接订票、比价购物)时 超级APP的流量分发逻辑将失效 互联网巨头面临选择:继续修筑高墙或开放API与AI Agent共建新生态 [23] - **赋能个体开发者**:AutoGLM的开源标志着手机Agent进入了“可编程”时代 未来可能诞生出专门服务于视障人士的公益Agent、专注于特定工作流的效率Agent 甚至是完全个性化的私人助理 [24] - **开启新赛道**:智能终端的交互逻辑正在发生根本性逆转 一个新的万亿级赛道——端侧智能体经济 已经开启 [28]
AI端侧多重利好催化!消费电子ETF(159732)上涨1.12%,东山精密涨5.12%
搜狐财经· 2025-12-08 02:34
市场行情 - 12月8日上午A股三大指数集体上涨 上证指数盘中上涨0.50% [1] - 通信设备、券商、航天军工等板块涨幅靠前 煤炭、能源设备跌幅居前 [1] - 消费电子板块走强 截至10:23消费电子ETF(159732)上涨1.12% [1] 消费电子个股表现 - 消费电子ETF成分股佰维存储上涨6.91% 东山精密上涨5.12% 胜宏科技上涨4.85% 信维通信上涨3.81% 兆易创新上涨2.97% [1] AI硬件与行业动态 - AI眼镜密集出新 阿里自研AI眼镜夸克S1首发售罄 [3] - 理想发布主打“人-车-家”生态的AI眼镜Livis [3] - 谷歌联合XREAL预告将深度集成Gemini与XR的新品 [3] - Meta调整策略 业务重心由元宇宙业务转向AI与眼镜硬件 [3] - 字节旗下豆包推出具备系统级AI交互能力的功能样机nubia M153 迈出软硬一体协同的重要一步 引发市场强烈关注 [3] 机构观点与投资方向 - 银河证券表示AI应用将是接下来及明年的科技板块投资重要关注点 [3] - 银河证券指出端侧AI仍在探索阶段 建议持续关注产业相关进展 [3] - 银河证券建议继续关注苹果链和新型消费电子品类投资机会 [3] 消费电子ETF产品信息 - 消费电子ETF(159732)跟踪国证消费电子指数 [3] - 该ETF主要投资于业务涉及消费电子产业的50家A股上市公司 [3] - 其成分股行业主要分布于电子制造、半导体、光学光电子等市场关注度较高的主流板块 [3] - 该ETF场外联接基金为A类:018300;C类:018301 [3]
AI端侧产品密集出新,国产算力初创公司资本化加速 | 投研报告
中国能源网· 2025-12-08 02:11
市场回顾与指数表现 - 本周(2025.12.1-2025.12.5)电子行业指数上涨1.17% [1][2] - 子板块中,光学光电领涨,涨幅达4.28%,消费电子上涨1.32%,半导体上涨1.02% [1][2] - 海外市场方面,费城半导体指数上涨3.84%,特斯拉上涨5.77%,Meta上涨3.93%,英伟达上涨3.06% [1][2] AI终端产品动态 - AI眼镜新品密集发布:阿里自研AI眼镜夸克S1首发售罄,理想发布主打“人-车-家”生态的AI眼镜Livis,谷歌联合XREAL预告将深度集成Gemini与XR的新品 [2] - Meta调整业务策略,重心由元宇宙转向AI与眼镜硬件 [2] - 字节旗下豆包推出具备系统级AI交互能力的功能样机nubia M153,引发市场关注 [2] - 美国商务部长近期密集会见机器人行业高层,预示相关行政命令或在2026年发布 [2] 算力领域进展 - 摩尔线程于12月5日成功登陆科创板,发行价114.3元,开盘报650元,涨幅高达468.8%,收盘市值突破2800亿元 [3] - 沐曦股份开启申购,发行价104.7元,预计募集资金净额约38.99亿元,网上发行申购中签率不足0.04% [3] - DeepSeek-V3.2模型于12月1日发布,其推理能力对标顶尖闭源模型,Agent能力显著强化 [3] 存储(存力)市场格局 - 三星已完成HBM4的量产准备认证(PRA),与英伟达价格协商进入收尾,力求与海力士同价供货 [3] - 美光退出零售存储业务,聚焦AI存储芯片,并计划在日本广岛投资96亿美元建厂,目标2028年实现HBM出货 [3] - SK海力士宣布进军DRAM晶圆代工,计划最早2027年生产定制化DRAM [3] - TrendForce预计2025年第四季度NAND价格将再上涨20~25% [3] - 力积电指出其12英寸产能已满载且报价走扬,订单能见度可达2026年第二季底 [3] 投资建议与受益标的 - 建议持续关注由AI端侧(如AI眼镜、AI手机)及自主可控(如算力芯片资本化)催化的投资机会 [4] - 报告列举的受益标的包括:中芯国际、华虹半导体、北方华创、中微公司、通富微电、佰维存储、传音控股、歌尔股份、龙旗科技、立讯精密、领益智造、蓝思科技、恒玄科技、珠海冠宇 [4]
豆包出“王炸”!AI手机能否成为新的主线?
每日经济新闻· 2025-12-06 02:27
豆包手机助手发布与战略定位 - 字节跳动正式切入端侧AI赛道,通过发布豆包手机助手技术预览版,渗透操作系统底层以重塑人机交互方式 [1] - 豆包手机助手并非独立手机产品,而是与手机厂商在操作系统层面合作的AI助手,首发搭载于中兴工程样机nubia M153,售价3499元,主要面向开发者与科技爱好者少量发售 [1] - 公司明确表示没有自研手机计划,正以“生态合作”形式与多家厂商推进合作,将豆包手机助手整合进不同品牌机型 [1] 豆包手机助手核心功能与技术特点 - 直接嵌入操作系统底层,支持通过专属物理按键、语音等方式全局唤醒,并能以悬浮窗形式交互,不中断当前应用 [2] - 突破应用孤岛,可自动执行跨平台任务链,例如同时打开美团、京东、淘宝进行比价并下单,或整理小红书攻略生成出行方案 [2] - 融合视觉理解与语音交互,能“读懂”屏幕内容,例如在相册中通过语音指令修图,或在微信聊天界面根据上下文生成回复建议 [2] - 具备操作手机系统的权限,可执行播放音频、订票、发短信等任务,并支持本地化记忆,将对话转为文本并生成待办提醒 [2] - 该产品被认为可能颠覆应用生态,使各类应用降级为被调用的服务模块,冲击现有互联网流量分配格局,同时对消费者而言非常实用且具有“科幻感” [2] 市场整体表现与关键指数 - A股三大指数集体上涨,上证指数上涨0.65%,收复3900点整数关口,深证成指、创业板指数分别上涨1.25%、1.31% [3] - 沪深两市成交额达到18739亿元,较上一交易日放量2881亿元 [3] - 整个市场有3398只个股上涨,1872只个股下跌,个股涨跌幅的中位数为上涨0.46% [4] - 反弹行情未结束,后续需重点关注上证指数对11月21日缺口及11月20日平台高点3967点附近两大压力位的测试情况,并观察市场内在动力是否强劲,尤其是能否放量站上2万亿元大关 [5][11] 消费电子与AI硬件板块表现及驱动因素 - 消费电子方向领涨,AI手机、AI PC、AI眼镜、无线耳机、智能穿戴、星闪概念等分支板块涨幅居前,主要受豆包手机助手技术预览版发布的催化 [5] - 中兴通讯是豆包手机方向的核心股 [5] - AI手机的行情后续可能会扩散至AI眼镜、AI音箱、AI玩具等端侧以及算力、端侧芯片等环节 [5] - 东吴证券表示,手机端侧AI发展驱动硬件升级,有望成为新一轮换机潮核心推力,AI正从辅助交互工具向“具身智能体”转变,应用场景延展至高价值任务 [6] - 银河证券表示,消费电子板块估值修复后PE-TTM约37倍,低于电子行业均值,具备配置性价比 [7] - AI硬件方向,核心股中际旭创大幅上涨,带动光模块、PCB方向继续反弹,其股价表现被视为AI硬件及趋势方向的锚 [8] 算力产业链与相关板块动态 - 谷歌产业链方面,高辨识度个股赛微电子再创历史新高 [9] - 摩根士丹利将谷歌TPU在2027年的产量预测从约300万块上调至约500万块,增幅约67%,2028年预测也相应上调 [9] - 国金证券表示,AI需求持续强劲,英伟达AI服务器四季度出货量提速,ASIC迎来爆发式增长,产业链积极拉货,继续看好AI-PCB及核心算力硬件、苹果链及自主可控受益产业链 [9] - 中信证券表示,“超节点”架构变革驱动交换芯片、光模块及高速线模组需求从线性增长转变为指数级爆发,该架构是国产算力建设实现后发赶超的必经之路,建议重点关注互联密度提升带来的价值重估机遇 [10] 其他板块表现及驱动因素 - 有色板块走强,受国际金银价格上涨、LME铜创历史新高以及美联储12月降息概率达80%影响 [10] - 大消费方面,旅游、酒店餐饮两大板块走强,受峨眉山A回馈股东活动及中国中免大涨影响,影视院线股受《疯狂动物城2》票房高涨影响,中国电影“一字”涨停 [10] - 商业航天板块指数跳空上涨,但板块内部出现明显分化,主要因朱雀三号首飞情况仍不确定,但基于产业趋势,中期值得关注 [10]
豆包手机助手回应争议:不会代替用户进行相关授权和敏感操作
凤凰网· 2025-12-05 05:30
事件概述 - 豆包手机助手运营团队于2025年12月3日发布公告,就用户反馈的微信登录异常及关于权限的谣言进行说明 [1][2] 微信登录异常事件 - 12月2日晚,多位用户反馈在nubia M153手机上使用豆包手机助手操作微信时,会出现微信异常退出甚至无法登录的情况 [1][5] - 公司后续下线了手机助手操作微信的能力 [1] - 目前,nubia M153上被禁止登录的微信账号正陆续解封,用户需等待并尝试重新登录 [1][5] 关于系统权限的澄清 - 针对部分媒体关于“豆包手机助手存在侵犯用户隐私”、“未经授权获取系统权限”的报道,公司进行了辟谣 [6][7] - 公司明确表示豆包手机助手不存在任何黑客行为 [1][7] - 产品使用的INJECT_EVENTS权限是Android系统级权限,技术实现依赖于此,并有更严格的使用限制 [1][7] - 拥有该权限许可,相关产品才能跨屏、跨应用模拟点击事件,以完成用户操作手机的任务需求 [1] - 该权限需要用户主动授权后才可调用,公司已在权限清单中进行了明确披露 [1] - 据公司了解,目前行业的AI助手均需要使用该权限(或与其类似的无障碍权限)才能提供操作手机的服务 [1] 产品权限管理与用户控制 - 豆包手机助手不会代替用户进行相关授权和敏感操作 [1] - 在使用该权限时,公司建立了透明的管理体系 [1] - 豆包手机助手在执行长任务时会在屏幕有明确提示,且用户可以随时中断,全程可控 [1]
大厂抢占硬件入口?继手机之后,字节AI眼镜或将跟上
凤凰网· 2025-12-05 02:00
中国AI硬件入口争夺战态势 - 2025年末,中国AI竞争焦点已从大模型转向大厂间的流量入口争夺,核心在于抢占触达用户的“物理入口”[1] - 字节与中兴联合发布“豆包AI助手”手机nubia M153,阿里发布千问APP及夸克AI眼镜,百度也以AI眼镜入局,大厂正竞相补齐AI软硬件生态[1] - AI眼镜被视为手机后的下一代关键终端,吸引创业公司及互联网大厂投入,但短期内因技术限制仍需手机辅助,形成“手机+AI眼镜”的智能体硬件闭环是字节等公司的目标[2] 入口的战略价值与商业模式 - 入口被视为关键的护城河与收费站,掌握分发权意味着更大话语权,因此互联网公司想做硬件,硬件公司想做爆款APP[2] - AI操作系统被视为替代安卓的潜在可能,并可能在此基础上收取“AI费”,这吸引了AI能力强的公司[2] - 未来趋势可能是手机仅负责显示与发声,AI负责生成内容并精准推送服务,实现“服务直达”,手机将成为AI能力的聚合体,根据意图实时生成界面[6] 智能体应用场景与行业探索 - 搭载豆包助手的手机可实现挂机打游戏、通过第三方应用打开智能车门等功能,展示了智能体调用终端应用的潜力[2] - 苹果计划让新版Siri通过语音控制单个应用内的所有功能,荣耀YOYO、小米小爱等也演示过“一句话点外卖”等功能,阿里夸克AI眼镜则通过语音完成各种操作[5][6] - 字节与中兴在手机上的合作模式被类比为“华为智选车”模式,即AI能力强的企业提供核心技术并深度介入产品定义,与硬件方紧密绑定[6] 应用生态冲突与监管挑战 - 豆包手机助手因操作微信导致用户账号出现风控措施,微信异常退出甚至无法登录,字节随后下线了该助手操作微信的能力[7] - 第三方APP(如美团、淘宝)协议明确禁止未经授权的技术手段抓取数据或干扰平台运行,微信协议尤其严格,禁止使用未经授权的工具进行自动化操作[10] - 主流手机厂商的AI助手(如荣耀YOYO、OPPO的“AI一键闪记”)此前推出的微信相关调用功能,后续均因微信应用限制而被取消或终止支持[10][11] 行业博弈与未来展望 - AI时代智能体分发涉及手机厂商与应用厂商间的利益博弈,类似于移动互联网时代应用市场的分发权争夺,部分应用厂商出于商业考虑不允许手机厂商调用其APP[12] - 微信等超级APP对AI手机争夺流量入口的行为持抵制态度,因这触及了其核心利益[12] - 豆包此次试水被视为一次“压力测试”,有助于理清用户接受度边界与商业规则模糊地带,推动智能体在终端侧的后续落地[12] 互联网大厂布局硬件的挑战与优势 - 缺乏硬件基因的互联网企业试水智能终端面临较大研发难度,且当高研发投入短期难以回报时,可能难以坚持迭代超过三代产品[13][14] - 谷歌收购HTC部分业务后推出的Pixel手机销量持续疲弱,字节收购锤子团队后推出的坚果手机项目也已停止研发,互联网公司做硬件面临长期主义考验[14] - 互联网公司亦具备独特优势:字节拥有自有平台的用户流量,可为硬件企业赋能;阿里在B端有稳定客户,可通过AI眼镜整合供应链并向平台商家供货;百度则凭借搜索能力,在信息与AI整合方面具备优势[14][15]
大厂抢占硬件入口!继手机之后 字节AI眼镜或将跟上
新浪财经· 2025-12-05 01:21
文章核心观点 - 中国AI竞争焦点已从大模型转向硬件入口争夺 互联网巨头与硬件厂商正通过手机、AI眼镜等终端 抢占触达用户的“物理入口”并构建软硬件生态 但面临应用生态封闭、硬件研发能力等挑战 [1][2] 从手机到眼镜:AI硬件入口争夺战 - 行业竞争从大模型参数转向AI软硬件应用落地 通过智能终端争夺下一代硬件入口 入口被视为关键护城河与收费站 掌握分发权意味着更大话语权 [2] - AI眼镜被视为手机后的下一代关键终端 引发创业公司“百镜大战”并获互联网大厂青睐 但目前技术限制使其短期内无法脱离手机独立使用 需与手机形成智能体落地硬件的闭环 [2] - 字节与中兴联合发布“豆包AI助手”手机nubia M153 实测中可帮用户挂机打游戏、通过调用第三方应用打开智能汽车车门等 阿里发布首款搭载千问助手的夸克AI眼镜 百度也以AI眼镜杀入战场 [1][2][6] - 行业探索智能体调用终端应用 苹果计划让新版本Siri通过语音控制单独应用内所有功能 荣耀YOYO、小米小爱等演示过“一句话点外卖”等功能 [5][6] - 业内专家认为后手机时代 手机可能只负责显示和发声 AI负责产生内容并精准适配服务 催生“服务直达”新时代 手机将成为AI能力聚合体 实时生成界面和操作方式 [6] - 字节与中兴在手机上的合作被类比为华为智选车模式 代表一种趋势:AI能力偏弱的企业或沦为基础硬件代工厂 灵魂交给AI能力突出的企业 车、手机等主流终端市场可能如此发展 [6] AI颠覆智能终端面临的挑战:应用生态博弈 - “豆包AI助手”手机nubia M153发售后 用户发现微信、农业银行、建设银行等App出现风控措施 操作微信时会出现异常退出甚至无法登录 字节豆包后续下线了手机助手操作微信的能力 [7] - 第三方App对外部应用的调取和数据抓取有明确禁止规定 微信《软件许可及服务协议》明确规定不允许使用未经授权的三方工具进行自动化操作 违反协议微信有权限制账号 [10] - 主流手机厂商的AI助手调用微信功能曾遭终止 荣耀YOYO去年推出帮助查找并关闭微信自动续费服务后该功能被取消 OPPO的“AI一键闪记”在10月底后微信从“一键记账”支持列表中消失 OPPO官方客服称因微信应用限制 [10] - 硬件厂商探索AI助手面临两大问题:涉及用户隐私风险及应用生态反弹 AI时代的智能体分发涉及手机厂商与应用厂商之间的利益博弈 相当于争夺流量入口 动了超级App的蛋糕 [11] - 有分析认为豆包此次试水相当于主动进行“压力测试” 有助于理清用户接受度边界和商业规则模糊地带 利于后续厂商跟进并推动智能体在端侧落地 [11] 互联网大厂入局智能硬件的机遇与挑战 - 缺乏硬件基因的互联网企业试水智能终端存在较大研发难度 谷歌收购HTC部分手机业务后推出的Pixel手机销量持续疲弱 字节跳动收购锤子科技团队后推出的坚果手机项目最终被并入教育硬件团队 不再研发手机 [12] - 数码领域人士对缺乏硬件研发能力的互联网企业入局智能硬件并不十分看好 认为当较大研发投入短期难以回报时 这些厂商未必能坚持迭代超过三代 [12] - 互联网厂商入局硬件也具备独特优势 字节坐拥自媒体社交平台 自带用户流量 甚至能用其用户给硬件企业赋能 阿里在B端有稳定客户 通过AI眼镜可成为平台上电商商家的供货商 在硬件销售和供应链整合上有优势 百度凭借搜索能力 在信息与AI整合方面更强 AI眼镜的办公信息搜索功能是其优势场景 [12][13]
豆包手机跨应用 Agent:充满惊喜,也有遗憾,满是期待|锦秋AI实验室
锦秋集· 2025-12-04 06:44
文章核心观点 - 豆包手机助手是一款由豆包与中兴深度合作的系统级AI Agent,它通过视觉识别和理解能力,能跨应用执行复杂任务,代表了AI手机在入口统一、系统协同和意图驱动方面的现实探索[1] - 该产品目前是面向行业和AI爱好者的“技术预览版”,定价3499元,搭载于nubia M153,并非面向普通消费者的最终方案[1][56] - 测评显示,豆包手机在稳定执行异步、流程化任务方面表现出色,但存在操作延迟、部分应用(如微信)不支持等明显短板[4][5][30][34] - 文章认为,豆包手机标志着端侧AI的“GPT-3时刻”,其系统级Agent模式可能重塑应用生态、交互入口和产业合作范式,是AI OS和主动性Agent发展的重要信号[6][41][46] 场景测评总结 - **测评方法与范围**:测评通过语音指令启动,豆包手机可自主操作手机,用户无需全程盯守[8][9]。测评场景覆盖小红书、高德地图、携程、贝壳找房、抖音、美团外卖、闲鱼、斗地主等实用与娱乐场景[13] - **场景一:小红书旅行攻略**:豆包能连续浏览小红书约10分钟并保持记忆,自主跳转至高德地图收藏地点,并在多轮对话后准确找回原帖继续执行下载任务,对无法下载的应用能明确告知结果[14] - **场景二:贝壳找房买房攻略**:豆包能理解具体找房任务并与中介互动,最终成功联系到中介,但在执行“找10套合适房源”等批量任务时,次数识别可能不准确[16][17][18] - **场景三:携程买票及出差路线规划**:豆包能排除“时间赶不及”等无效信息干扰,直接锁定购票与规划任务,当发现手机无携程App时,可通过自然语言描述补充任务继续执行[22]。其具备推理能力,能识别“从苏州飞上海”指令不合理(苏州无机场),并自主切换至高铁方案[23] - **场景四:闲鱼买二手电驴**:面对结构复杂的闲鱼页面,豆包能清晰导航并准确定位操作入口,完成目标筛选[25] - **场景五:斗地主代打**:豆包能根据画面信息决策下一步行动,但其“截屏-分析-决策-点击”的循环工作逻辑导致操作有秒级延迟,在需要快速连续点击(如出“炸弹”)时容易因超时而失败[29] 产品体验评估 - **超预期的稳定性与泛化能力**:豆包能连续十分钟无差错执行任务,准确操作大量常规及小众App[30]。遇到界面异常时,会自主尝试滑动、点击其他按钮或换路径继续任务,而非死机[30]。其基于视觉识别屏幕,理论上不依赖App开发者开放权限或担心UI更新,只要人眼能看懂的按钮,它大体都能理解[30] - **卓越的协同性**:产品将中兴的硬件、锤子科技改造的系统、端侧模型、输入法、语音和Agent能力链路整合成一个闭环,实现了1+1>2的整机体验[32] - **适用任务类型**:目前在异步、无时效性要求、流程化、可清晰描述的任务上,豆包手机的任务成功率和使用体验已经非常高[31] - **明显的体验短板**:操作延迟显著,每一步操作都有秒级反应速度,例如出斗地主一张牌要等5秒[34]。目前已暂停操作微信,这直接影响了中国用户40%的高频连接和分享场景[34]。此外,存在次数识别不准确、初期缺乏记忆(如点外卖需重复选择规格)、部分内容生成能力僵硬等问题[34] 行业影响与未来展望 - **主动性Agent走入现实**:豆包手机在常用App设置钩子,点击收藏按钮时会自动截图存入全局记忆,未来可能支持用户设置定时任务,挖掘更多主动功能[37][38] - **构建强大的用户上下文**:端侧Agent理论上可异步遍历用户所有App内容(聊天、购买、出行等),构建最完整的用户上下文,但目前基于用户操作记录的AI功能尚未显现[39][40] - **端侧AI的“GPT-3时刻”**:豆包手机可被称为端侧AI的GPT-3(2020年)时刻,准确率已很高,主要问题是操作速度慢[41]。若视觉语言模型速度提升10到50倍,将达到端侧AI的“ChatGPT时刻”,许多任务可由端侧通用Agent完成,这要求端侧创业公司重新审视现状[41][42] - **操作系统的认知变革**:传统操作系统要求用户学习界面和流程,而豆包手机让功能、内容、文件成为可被Agent调用的模块,用户只需提出需求,由Agent解决操作问题[43][44] - **产业合作新范式**:合作超越“把模型塞进手机”,走向操作系统级的Agent调用[45]。应用侧广泛接入,但核心能力可能不开放,需通过豆包模型的页面视觉识别来实现操作,而非直接调用API,这呈现出“AI OS系统供应商”意义上的行业重构力量[45][46] - **未来的交互入口之争**:入口从分散的应用转向“任务意图”,这牵动10万亿级产业利益[47]。应用巨头不愿沦为“后台API”,应用间会竖起高墙(如微信登录被动下线),AI手机以任务入口统一入口的可能性与原有入口的争夺,将成为2025至2026年的热门话题[47][48][49][50] - **隐私安全挑战**:AI权限高、触达深,引发用户对安全的担忧,尤其是在考虑给大龄父母使用时[51]。系统在支付等高敏感操作上采用“最小权限原则”,需交还用户手动确认,未来的竞争关键在于如何在AI能干的同时让用户安心[51]。用户可通过指令覆盖默认安全基线,各方均需在此环节改进优化[52] - **应用价值重构**:未来应用的价值不在于功能密度,而在于能否被Agent精准调度及将自身能力结构化暴露出来[53]。人的主动性被置于中心,用户从被动浏览者转变为目标明确的任务发起者[53][54]