行业投资评级 - 行业评级:超配 [2][6] 核心观点 - DeepSeek发布名为“mHC”的新架构,该架构建立在字节豆包大模型Foundation团队2024年11月发布的Hyper-Connections基础上,旨在让大模型训练更稳、更快、更省 [2] - mHC的核心创新在于引入“流形约束”,通过Sinkhorn-Knopp算法将残差映射矩阵投影到“双随机矩阵”构成的Birkhoff多面体上,实验证明其在大规模训练中表现稳定、性能优越、可扩展性强且具有高性价比和高效率 [2] - mHC架构或为下一代基础架构指明演进方向,为未来研究开辟了多个前景广阔的路径,并可能重新激发学界对宏观架构设计的兴趣 [3] - mHC有望带来AI芯片设计新范式,通过“软件主动适配硬件瓶颈”的逻辑,挑战传统芯片设计范式,推动行业向“效率优先”的软硬件协同方向演进 [4] 技术架构分析 - mHC是HC范式的广义扩展,其框架能容纳针对特定学习目标设计的多种流形约束探索,对几何约束特性的进一步研究可能在可塑性与稳定性之间实现更优权衡 [3] - mHC通过流形约束与工程优化的结合,为解决算力与带宽的错配问题提供了全新思路 [4] - mHC通过内核融合、选择性重计算等优化,将原本分散的多次内存访问整合为单次访问,大幅降低了对带宽的需求,这种软件层面的“带宽节约”可能改变芯片对高带宽HBM显存的依赖 [4] - mHC中的Sinkhorn-Knopp投影算子具有独特的计算特性,随着该架构的普及,芯片设计可能会加入专门的投影算子加速单元,推动AI芯片向“通用+专用”的异构架构演进 [4] 市场表现与关注标的 - 近一年计算机行业指数表现:截至报告发布时,计算机行业指数近12个月上涨29.68%,同期沪深300指数上涨22.64% [8] - 相对市场表现:计算机行业近1个月相对沪深300指数超额收益为0.52个百分点(1.51% vs 0.99%),近3个月相对收益为-7.42个百分点(-7.65% vs -0.23%)[8] - 建议关注国产AI芯片公司:寒武纪(已覆盖)、海光信息(已覆盖)、摩尔线程、沐曦股份、壁仞科技 [5]
DeepSeek发布mHC框架,或为下一代基础架构指明演进方向
西部证券·2026-01-05 08:20