模型的迭代远未结束

行业投资评级 - 增持（维持）[6] 核心观点 - 全球顶尖大模型仍处于高速迭代阶段，技术路线与能力边界持续刷新，算法创新、后训练扩展与Scaling Law仍在持续生效，顶尖模型的竞争与演进远未结束[1][19] - AI算力底座正从Hopper架构过渡至Blackwell架构，其系统性跃升不仅缩短训练时间、改善经济性，更通过支持更大Batch Size等方式，有望推动2026年起新一代模型智能水平的系统性提升[2][3][20][25] - 字节豆包手机助手将大模型深度嵌入操作系统，革新移动交互体验，标志着端侧Agent时代的开启，移动交互范式正从GUI向Agentic交互演进[4][28] 模型技术迭代 - 谷歌Gemini 3 Pro：核心突破在于世界领先的多模态理解与长期规划能力，能在文本、图像、视频、音频与代码间进行精细推理，尤其在屏幕理解（Screen Understanding）任务上表现突出，并在Vending-Bench 2测试中展现了长达一年的可靠规划与工具使用能力[1][13] - OpenAI GPT-5.2：聚焦专业知识型工作场景，在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升，其提出的GDPval评测体系从真实职业任务出发衡量模型经济价值，GPT-5.2在70.9%的对比项目中表现优于或与顶尖人类专家持平[1][14][15] - 国产模型DeepSeek V3.2：通过DSA稀疏注意力机制、大规模后训练（后训练算力预算超预训练成本10%）与合成数据等创新路径实现能力跃升，在公开推理基准测试中达到GPT-5水平，官方坦承其相比顶尖闭源模型的弱势在于预训练算力不足，表明模型能力尚未触及天花板[1][16][17][18][19] 算力底座升级 - 性能全面领先：Blackwell架构在FP32、FP16、BF16、INT8等主流精度下计算性能全面领先于Hopper架构，并原生支持FP4精度计算[2][21][23] - 内存与互联升级：单卡显存容量与带宽同步升级（如B200显存达192GB HBM3e，带宽达7.7TB/s），更适合承载大参数模型并减少跨卡通信开销；新一代NVLink互联带宽达1.8TB/s，显著提升多卡及集群扩展效率[2][21][23] - 经济性与训练优势：Blackwell性能提升幅度高于价格提升，带来显著的“每美元性能”改善，在基于MLPerf的Llama 3.1 405B训练对比中，GB200 NVL72的美元性能几乎是H100的2倍[2][23] - 赋能模型设计：更强的单卡能力与集群互联支持使用更大的Batch Size，有利于梯度稳定性、收敛质量和计算效率，同时使开发者能探索更深的网络结构、更复杂的算法及更长上下文的训练方式，为2026年新一代模型奠定基础[3][24][25] 应用落地突破 - 字节豆包手机助手：作为面向手机厂商的系统级AI服务，将豆包大模型深度嵌入操作系统，用户可通过语音或简单指令替代复杂手动操作，能力覆盖跨平台比价点外卖、内容搜索与攻略整理等场景[4][26] - 引发行业反应：上线后引发部分App（如微信、农行、建行等）的抗拒，出现登录异常、功能受限甚至短暂封禁问题，字节随后主动发布说明，对刷激励、金融类应用及部分游戏场景的AI操作能力进行规范化调整[4][27][28] - 标志性意义：该产品是大模型应用落地的重要突破，标志着端侧Agent时代的开启，预示移动交互范式将从以应用为中心的GUI向由手机Agent完成跨App任务编排的Agentic交互跃迁[4][28] 建议关注标的 - 算力：寒武纪、海光信息、中际旭创、新易盛、神州数码、中科曙光、浪潮信息、沪电股份、兴森科技、中芯国际、华虹半导体等[5][8][29] - Agent：谷歌、阿里巴巴、腾讯控股、科大讯飞、金山云、拓尔思、同花顺、恒生电子、用友网络、金蝶国际等[8][29][30] - GUI/API Agent：字节跳动、谷歌、阿里巴巴、中兴通讯、腾讯控股[29] - 自动驾驶：江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线[9][30] - 军工AI：拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图[9][30]