模型的迭代远未结束
国盛证券·2025-12-14 06:32

行业投资评级 - 增持(维持)[6] 核心观点 - 全球顶尖大模型仍处于高速迭代阶段,技术路线与能力边界持续刷新,算法创新、后训练扩展与Scaling Law仍在持续生效,顶尖模型的竞争与演进远未结束[1][19] - AI算力底座正从Hopper架构过渡至Blackwell架构,其系统性跃升不仅缩短训练时间、改善经济性,更通过支持更大Batch Size等方式,有望推动2026年起新一代模型智能水平的系统性提升[2][3][20][25] - 字节豆包手机助手将大模型深度嵌入操作系统,革新移动交互体验,标志着端侧Agent时代的开启,移动交互范式正从GUI向Agentic交互演进[4][28] 模型技术迭代 - 谷歌Gemini 3 Pro:核心突破在于世界领先的多模态理解与长期规划能力,能在文本、图像、视频、音频与代码间进行精细推理,尤其在屏幕理解(Screen Understanding)任务上表现突出,并在Vending-Bench 2测试中展现了长达一年的可靠规划与工具使用能力[1][13] - OpenAI GPT-5.2:聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系从真实职业任务出发衡量模型经济价值,GPT-5.2在70.9%的对比项目中表现优于或与顶尖人类专家持平[1][14][15] - 国产模型DeepSeek V3.2:通过DSA稀疏注意力机制、大规模后训练(后训练算力预算超预训练成本10%)与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,官方坦承其相比顶尖闭源模型的弱势在于预训练算力不足,表明模型能力尚未触及天花板[1][16][17][18][19] 算力底座升级 - 性能全面领先:Blackwell架构在FP32、FP16、BF16、INT8等主流精度下计算性能全面领先于Hopper架构,并原生支持FP4精度计算[2][21][23] - 内存与互联升级:单卡显存容量与带宽同步升级(如B200显存达192GB HBM3e,带宽达7.7TB/s),更适合承载大参数模型并减少跨卡通信开销;新一代NVLink互联带宽达1.8TB/s,显著提升多卡及集群扩展效率[2][21][23] - 经济性与训练优势:Blackwell性能提升幅度高于价格提升,带来显著的“每美元性能”改善,在基于MLPerf的Llama 3.1 405B训练对比中,GB200 NVL72的美元性能几乎是H100的2倍[2][23] - 赋能模型设计:更强的单卡能力与集群互联支持使用更大的Batch Size,有利于梯度稳定性、收敛质量和计算效率,同时使开发者能探索更深的网络结构、更复杂的算法及更长上下文的训练方式,为2026年新一代模型奠定基础[3][24][25] 应用落地突破 - 字节豆包手机助手:作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,用户可通过语音或简单指令替代复杂手动操作,能力覆盖跨平台比价点外卖、内容搜索与攻略整理等场景[4][26] - 引发行业反应:上线后引发部分App(如微信、农行、建行等)的抗拒,出现登录异常、功能受限甚至短暂封禁问题,字节随后主动发布说明,对刷激励、金融类应用及部分游戏场景的AI操作能力进行规范化调整[4][27][28] - 标志性意义:该产品是大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示移动交互范式将从以应用为中心的GUI向由手机Agent完成跨App任务编排的Agentic交互跃迁[4][28] 建议关注标的 - 算力:寒武纪、海光信息、中际旭创、新易盛、神州数码、中科曙光、浪潮信息、沪电股份、兴森科技、中芯国际、华虹半导体等[5][8][29] - Agent:谷歌、阿里巴巴、腾讯控股、科大讯飞、金山云、拓尔思、同花顺、恒生电子、用友网络、金蝶国际等[8][29][30] - GUI/API Agent:字节跳动、谷歌、阿里巴巴、中兴通讯、腾讯控股[29] - 自动驾驶:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线[9][30] - 军工AI:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图[9][30]