端侧多模态模型
搜索文档
半个月三场大会,AI战火蔓延手机圈
36氪· 2025-10-27 23:26
行业战略重心转移 - 手机厂商已大幅减少对大规模参数基础模型的投入,将主要精力转向端侧多模态模型的开发[1][8] - 行业技术发展经历三个阶段:从两年前发布全尺寸语言模型,到一年前重心转向多模态与端侧化,再到当前聚焦于端侧多模态模型的优化与落地[3] 主要厂商AI进展与应用场景 - vivo展示了18个端侧智能应用,包括卡证识别、文件名自动填充及UI Agent,其AI助手月活达亿级,日活达千万级[1][4] - OPPO重点演示一键问屏和一键闪记功能,其AI助手小布助手月活用户达1.7亿[2][4] - 荣耀披露手机可自动执行场景超过3000个,覆盖衣食住行购,其YOYO智能体月活用户达1.3亿[2][4] - 各厂商AI团队规模庞大,vivo和OPPO团队均超1000人,荣耀团队达2600人[4] 端侧多模态模型技术趋势 - 当前端侧模型集中在3B的轻量化尺寸,并在大语言模型基础上新增多模态能力[4] - 行业通过低比特混合量化方案和端侧Lora训练方案,显著缩小模型体积和内存开销,例如3B模型已达到过去8B模型的效果[7] - 技术实现三大突破:端侧实现深度思考模式、引入GUI Agent模型、采用1+N架构使单一模型支撑十余个业务场景[7] - 端侧模型能力大幅提升,vivo的3B端侧模型在文本摘要任务上已达到云侧大模型97%-98%的能力[10] 端云协同策略与成本考量 - 手机厂商普遍采用端云协同方案,但核心优化重点在端侧模型[11] - 云端API调用存在成本与延迟问题,例如使用ASR模型进行转录翻译,每小时云成本约2元[11] - 端侧模型在本地处理数据具有更高隐私安全性和更低额外成本,成为手机落地的关键[11] - 厂商策略为不与云厂商在通用世界知识模型上竞争,而是侧重基于手机端多维数据的个人化智能[10] 智能体生态构建与挑战 - 各厂商积极搭建智能体生态,vivo提炼系统级智能体作为“通控设施组”,OPPO将生态框架作为技术基石,荣耀发布系统级MCP架构并接入超4000个生态智能体[15] - 当前自动化任务主要局限于厂商一方应用,用户85%的使用时长在第三方应用,跨应用协作需解决安全授权标准问题[13] - 生态合作初见成效,例如蚂蚁集团AI健康智能体在vivo健康场景的流量份额从年初至今提升三倍[16] - 面临挑战包括App厂商对流量分配和数据权限的担忧,业内普遍采用GUI大模型作为温和解决方案[16] 产业链协同与未来挑战 - 芯片厂商如高通骁龙和联发科天玑最新旗舰芯片AI算力已达100TOPS,正积极寻找明星应用场景以支撑高算力芯片销售[12] - 云厂商缺乏强烈意愿投入端侧模型,因其核心商业模式是售卖MaaS服务[11] - 行业面临缺乏爆款AI应用导致用户感知有限的问题,进而影响芯片厂商的投入决心[11][12]