文章核心观点 - 人工智能的计算范式正从云端向终端设备(端侧)转移,端侧AI将成为未来产业竞争的新战场和AI价值实现的关键 [3] - 端侧AI的发展由模型压缩技术进步、端侧算力需求激增与供给跃迁、以及数据传输的物理限制等多重因素驱动,将重塑计算芯片的产业格局 [11][13][15] - 端侧计算架构将复制云端从CPU为主导向AI专用芯片(NPU)为主导的演变路径,独立的专用NPU(dNPU)预计将成为主流,推动智能终端向更高级的自主形态演进 [12][19][21] 计算范式历史性转变 - 计算技术由范式转换驱动:从1940年代的通用计算(CPU),到2006年英伟达CUDA开启的加速计算(GPU),再到2020年后生成式AI催生的“认知级计算” [4][5] - 云端算力主导权已完成从CPU到GPU的交接:2019年TOP500超算近90%算力完全依赖CPU,到2025年这一比例已急剧下降至不足15% [6] - 大模型催生“云端训练-端侧部署”协同生态:云端负责训练与全局决策,端侧负责感知、实时交互与本地推理 [5] 端侧AI成为新战场的驱动因素 - 市场需求与规模:全球端侧AI市场规模预计在2029年增至1.2万亿元,复合年增长率达39.6%;中国市场规模预计2029年达3077亿元,复合年增长率39.9% [8] - 政策强力支持:中国“十五五”规划等政策明确实施“人工智能+”行动,目标到2030年智能终端普及率超90%、产业规模突破10万亿元 [9] - 技术瓶颈倒逼:完全依赖云端处理面临数据传输的物理上限,以4K流媒体带宽需求估算,全球海底光缆总带宽理论仅能支持约4000万用户同时使用,远不能满足ChatGPT等应用的用户体量,端侧推理成为架构上的必然选择 [13] - 产业生态成熟:中国已形成完整产业链,上游有华为昇腾、地平线、瑞芯微、后摩智能等芯片厂商,中游有DeepSeek、阿里、讯飞等算法模型企业,下游有荣耀、联想、小米等终端厂商 [9] 端侧AI发展的核心动能 - 模型“瘦身”技术突破:模型蒸馏、量化等技术大幅降低部署门槛,例如华为CBQ量化算法将模型压缩至原体积1/7且性能保留99%,阿里逆向蒸馏技术使20亿参数模型性能反超70亿参数模型8.8% [14] - 端侧算力需求激增:多模态大模型(如处理视觉与文本的VLM)和智能体(Agent)应用推高算力需求,例如Qwen3 VL 80亿参数模型需要几十TOPS算力,智能体反复调用模型会导致推理算力指数级增长 [15] - 端侧算力供给跃迁:AI芯片算力从前大模型时代的几TOPS跃升至百TOPS级别,例如后摩智能M50 NPU算力达160TOPS,瑞芯微RK182X NPU算力为20TOPS [15] 端侧计算芯片格局与演进趋势 - 当前格局以“SoC+NPU协同”为主: - SoC芯片:集成轻量级NPU,主打性价比与通用性,适配1-100亿参数模型,应用于对AI性能要求较低的设备,如瑞芯微RK3588(6TOPS NPU)[16] - 专用NPU:提供极致AI性能,分为集成式(iNPU)和独立式(dNPU),适配300亿至1000亿参数模型,例如华为Atlas 200I A2(20TOPS)、算能BM1684X(32TOPS)、后摩智能M50(160TOPS)[17][18] - 未来将形成以独立NPU(dNPU)为主导的新范式: - 端侧将复制云端“X86+GPGPU”的异构计算模式,形成“ARM/RISC-V + dNPU”的主流架构 [19] - 根据算力需求分层:低算力场景(<10TOPS)用SoC集成iNPU;中算力场景(10-50TOPS)用独立dNPU;高算力场景(>50TOPS)必须用独立dNPU,目前国内仅后摩智能M50满足 [19][20] - 独立NPU具备适配灵活、组合成本最优、开发迭代快、性能极致等优势,类比高性能独立显卡(dGPU)在游戏市场的统治地位,dNPU预计将成为端侧AI的主导形态 [21][22][23] 端侧AI的形态演进与架构创新 - 形态分级:从初级联网节点(算力<1TOPS),到交互入口(算力<5TOPS),再到推理节点(算力达百TOPS,实现毫秒级延迟、数据本地化),最终向自主智能体(算力500TOPS以上,跨场景自主规划)和终极形态演进 [25][26] - 架构创新突破算力功耗墙:为满足高阶形态的指数级算力需求,需突破传统冯·诺依曼架构限制,涌现出光子计算、量子计算、可重构数据流、Chiplet、存算一体等新架构 [27] - 存算一体成为可行量产方案:通过融合计算与存储单元,大幅提升能效比,是更适合端侧AI且能商业量产的技术之一,国内外公司如美国的D-Matrix、Encharge AI,中国的知存科技、后摩智能均已布局 [28] 行业巨头动态与市场信号 - 2025年5月,OpenAI以65亿美元收购由苹果前首席设计官创立的AI硬件公司io,计划2026年底推出无屏幕AI硬件 [3] - 2025年11月,马斯克预言未来5-6年内传统手机将消失,由作为“AI推理边缘节点”的设备取代 [3] - 2025年12月,字节跳动试水豆包AI手机 [3] - 联想AI PC渗透率已达其PC总出货量的30%以上,Meta AI眼镜发布两天售罄,预计2026年销量破千万台 [8] - OpenAI CEO Sam Altman指出,AI发展核心瓶颈已从算法转向算力、存储与能源构成的“三位一体”基础设施挑战 [28]
大模型战火烧到端侧:一场重构产业格局的算力革命
36氪·2025-12-04 14:08