Workflow
端侧Agent
icon
搜索文档
【国盛计算机】算力&存力依旧
新浪财经· 2025-12-21 02:42
字节与腾讯的AI战略动态 - 字节跳动在FORCE原动力大会上宣布,截至今年12月,其豆包大模型日均tokens使用量已突破50万亿,位居中国第一、全球第三,已有超过100家企业在火山引擎上累计tokens使用量超过一万亿,而今年5月底该数据为超过16.4万亿,较去年5月发布时增长137倍 [1][7][24][30] - 字节在大会上发布了豆包大模型1.8和豆包视频生成模型Seedance 1.5 pro,并宣布其大模型家族在多模态理解和生成能力、Agent能力上已位于全球第一梯队,同时火山引擎升级了AI云原生全栈服务,推出企业级AI Agent平台AgentKit和HiAgent智能体工作站 [8][31] - 腾讯于12月17日宣布升级大模型研发架构,新成立AI Infra部、AI Data部和数据计算平台部,并任命前OpenAI研究员姚顺雨为“CEO/总裁办公室”首席AI科学家,同时兼任AI Infra部和大语言模型部负责人,旨在提升AI大模型研究能力与研发效率 [1][9][24][32] 全球大模型技术迭代与竞争 - 谷歌发布的Gemini 3 Pro在多模态理解和长期规划能力上实现核心突破,模型可在文本、图像、视频、音频与代码之间进行精细推理,尤其在屏幕理解任务上表现突出,并在Vending-Bench 2测试中展示出长达一年的可靠规划与工具使用能力 [2][10][25][33] - OpenAI发布的GPT-5.2聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系显示,GPT-5.2在70.9%的知识型任务中表现优于或与顶尖人类专家持平 [2][11][12][25][34][35] - 国产模型DeepSeek V3.2系列通过稀疏注意力机制、大规模后训练与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,略低于Gemini-3.0-Pro,但团队坦承其世界知识广度仍落后于顶尖闭源模型,主要受限于预训练算力 [2][12][13][25][35][36][37] AI驱动的存储需求与供应格局 - 存储芯片巨头美光科技2026财年Q1营收达136.4亿美元,同比增长57%,远超预期的129.5亿美元,调整后净利润为54.82亿美元,同比增长58%,其中云存储部门销售额52.8亿美元,同比翻倍 [3][14][26][37] - 美光科技表示其2026日历年的所有HBM产能已全部售罄且价格销量锁定,预计HBM市场规模到2028年将达到1000亿美元,比之前预测提前两年,公司正首次与客户谈判带有强制性条款的多年期供货合同,并将2026财年资本支出上调至200亿美元 [3][15][26][38] - 2025年10月,OpenAI以“星际之门”为名与三星和SK海力士签署协议,锁定每月高达90万片DRAM晶圆供应,约占全球DRAM产量的40%,AI服务器对HBM和DDR5企业级内存的需求正大量消耗晶圆产能,导致原厂将产能优先分配给高利润产品,对消费级产品造成排挤 [3][16][26][39] 端侧AI Agent的应用突破 - 字节跳动于12月1日发布豆包手机助手预览版,作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,实现以语音或简单指令替代复杂手动操作,功能覆盖跨平台比价点外卖、内容搜索等场景,并与中兴合作推出首款售价3499元的打样手机 [4][17][27][40] - 豆包手机助手上线后引发了部分被操作App的抗拒,在微信、农行、建行等社交和金融类应用中出现登录异常、功能受限甚至账号短暂封禁的问题,字节于12月5日发布说明,对AI操作手机能力进行规范化调整,主动限制刷激励、金融类应用及部分游戏场景 [4][18][27][41] - 豆包手机助手被视为大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示着移动交互范式将从以应用为中心的图形用户界面向由自然语言驱动、能完成跨App任务编排与执行的Agentic交互演进 [4][19][27][42] 建议关注的投资方向 - 算力领域建议关注的公司包括寒武纪、海光信息、中际旭创、中芯国际、浪潮信息、中科曙光等 [6][20][29][43] - Agent领域建议关注的公司包括谷歌、阿里巴巴、腾讯控股、第四范式、科大讯飞、恒生电子等 [6][20][29][43] - 其他相关领域建议关注自动驾驶方向的江淮汽车、赛力斯、小鹏汽车、理想汽车等,以及军工AI方向的拓尔思、能科科技、中科星图等 [6][21][29][44]
模型的迭代远未结束
国盛证券· 2025-12-14 06:32
行业投资评级 - 增持(维持)[6] 核心观点 - 全球顶尖大模型仍处于高速迭代阶段,技术路线与能力边界持续刷新,算法创新、后训练扩展与Scaling Law仍在持续生效,顶尖模型的竞争与演进远未结束[1][19] - AI算力底座正从Hopper架构过渡至Blackwell架构,其系统性跃升不仅缩短训练时间、改善经济性,更通过支持更大Batch Size等方式,有望推动2026年起新一代模型智能水平的系统性提升[2][3][20][25] - 字节豆包手机助手将大模型深度嵌入操作系统,革新移动交互体验,标志着端侧Agent时代的开启,移动交互范式正从GUI向Agentic交互演进[4][28] 模型技术迭代 - **谷歌Gemini 3 Pro**:核心突破在于世界领先的多模态理解与长期规划能力,能在文本、图像、视频、音频与代码间进行精细推理,尤其在屏幕理解(Screen Understanding)任务上表现突出,并在Vending-Bench 2测试中展现了长达一年的可靠规划与工具使用能力[1][13] - **OpenAI GPT-5.2**:聚焦专业知识型工作场景,在复杂文档、数据分析、代码开发和多步骤项目管理中表现显著提升,其提出的GDPval评测体系从真实职业任务出发衡量模型经济价值,GPT-5.2在70.9%的对比项目中表现优于或与顶尖人类专家持平[1][14][15] - **国产模型DeepSeek V3.2**:通过DSA稀疏注意力机制、大规模后训练(后训练算力预算超预训练成本10%)与合成数据等创新路径实现能力跃升,在公开推理基准测试中达到GPT-5水平,官方坦承其相比顶尖闭源模型的弱势在于预训练算力不足,表明模型能力尚未触及天花板[1][16][17][18][19] 算力底座升级 - **性能全面领先**:Blackwell架构在FP32、FP16、BF16、INT8等主流精度下计算性能全面领先于Hopper架构,并原生支持FP4精度计算[2][21][23] - **内存与互联升级**:单卡显存容量与带宽同步升级(如B200显存达192GB HBM3e,带宽达7.7TB/s),更适合承载大参数模型并减少跨卡通信开销;新一代NVLink互联带宽达1.8TB/s,显著提升多卡及集群扩展效率[2][21][23] - **经济性与训练优势**:Blackwell性能提升幅度高于价格提升,带来显著的“每美元性能”改善,在基于MLPerf的Llama 3.1 405B训练对比中,GB200 NVL72的美元性能几乎是H100的2倍[2][23] - **赋能模型设计**:更强的单卡能力与集群互联支持使用更大的Batch Size,有利于梯度稳定性、收敛质量和计算效率,同时使开发者能探索更深的网络结构、更复杂的算法及更长上下文的训练方式,为2026年新一代模型奠定基础[3][24][25] 应用落地突破 - **字节豆包手机助手**:作为面向手机厂商的系统级AI服务,将豆包大模型深度嵌入操作系统,用户可通过语音或简单指令替代复杂手动操作,能力覆盖跨平台比价点外卖、内容搜索与攻略整理等场景[4][26] - **引发行业反应**:上线后引发部分App(如微信、农行、建行等)的抗拒,出现登录异常、功能受限甚至短暂封禁问题,字节随后主动发布说明,对刷激励、金融类应用及部分游戏场景的AI操作能力进行规范化调整[4][27][28] - **标志性意义**:该产品是大模型应用落地的重要突破,标志着端侧Agent时代的开启,预示移动交互范式将从以应用为中心的GUI向由手机Agent完成跨App任务编排的Agentic交互跃迁[4][28] 建议关注标的 - **算力**:寒武纪、海光信息、中际旭创、新易盛、神州数码、中科曙光、浪潮信息、沪电股份、兴森科技、中芯国际、华虹半导体等[5][8][29] - **Agent**:谷歌、阿里巴巴、腾讯控股、科大讯飞、金山云、拓尔思、同花顺、恒生电子、用友网络、金蝶国际等[8][29][30] - **GUI/API Agent**:字节跳动、谷歌、阿里巴巴、中兴通讯、腾讯控股[29] - **自动驾驶**:江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线[9][30] - **军工AI**:拓尔思、能科科技、普天科技、品高股份、海格通信、中科星图[9][30]