Workflow
Armv9.3架构
icon
搜索文档
ArmUnlocked速递(1):端侧AI回归理性效率时代,Arm平台化战略重塑移动生态
海通国际证券· 2025-09-10 13:39
行业投资评级 - 报告未明确提供对行业的投资评级 [1][2][3][4][5][6][7][8][9][11][12][13][14][15][16][17] 核心观点 - Arm通过SME2技术推动端侧AI向"CPU-first"路径回归 实现矩阵运算单元集成至通用CPU流水线 体现效率与实用化趋势 [2][13] - Arm战略从传统IP授权转向"平台化交付" 以Lumex移动计算子系统为代表 整合硬件与软件栈 减少OEM厂商设计周期与系统集成成本 [3][14] - 端侧AI架构呈现CPU、GPU、NPU协同分工 CPU负责常驻任务与轻量化模型 GPU专注图形渲染 NPU处理大模型主干推理 形成高效低功耗解决方案 [4][15] - 中国端侧AI生态快速发展 受益于丰富应用场景与产业链协同 vivo、阿里云、网易等企业形成从芯片到应用的完整闭环 [5][16] 技术架构创新 - SME2扩展在经典计算机视觉任务中实现3-6倍加速 且无需代码改造 [4][15] - C1-Ultra处理器性能提升约25% G1-Ultra提升约20% 光线追踪性能实现翻倍 [4][15] - CPU通过SME2承担大量传统视觉及轻量化模型推理任务 从GPU/NPU重新分配至CPU 显著降低端侧实时任务延迟 [2][13] 产品与生态进展 - Arm正式推出Lumex移动计算子系统 整合CPU/GPU及系统IP、互连与缓存架构 配套KleidiAI软件栈与Day-0驱动支持 [1][12][3][14] - 阿里云推出端侧多模态推理工具套件 网易实现AI玩家与UGC内容生成的规模化部署 [5][16] - vivo早期导入SME2技术 体现中国企业在芯片架构层面的快速落地能力 [5][16] 性能与瓶颈分析 - 当前处理器性能提升进入实用化阶段 为核心手游及混合AI与渲染负载提供有效支撑 [4][15] - 内存带宽与缓存命中率仍是大模型长序列推理场景的关键瓶颈 NPU/GPU在此场景不可替代 [4][15]