Workflow
计算机行业深度分析:三大要素齐发力,AI应用步入全面加速期
中原证券·2025-03-07 11:47

报告行业投资评级 - 强于大市(上调) [1] 报告的核心观点 - 2024年11月30日报告提出“o1的问世”让Agent步入发展快车道,AI在应用软件层发展潜力待释放,DeepSeek - R1发布后大模型成本下降、开源阵营性能超越,AI应用集齐全面落地三大关键要素,具有里程碑意义 [4][11] 根据相关目录分别进行总结 要素一:逻辑推理能力提升 - o1开启逻辑推理能力提升新路径,此前大模型在语言能力构建有突破,但推理和逻辑能力与人类差距大,o1提升了大模型解决科学、编码、数学等领域复杂问题的能力,对LLM实现AGI意义重大 [13][14][17] - DeepSeek首次公开验证强化学习对大模型推理能力提升的有效性,用DeepSeek - V3 - Base作基础模型,经强化学习训练出DeepSeek - R1 - Zero,AIME 2024得分从15.6%提升到71.0%,后又加入多阶段训练得到DeepSeek - R1,还对Llama和Qwen系列开源大模型蒸馏得到6个小模型,提高了推理能力 [19][21][22] 要素二:推理成本下降 - DeepSeek开启低成本路线,2024年5月的DeepSeek - V2显示高性价比优势,后续V3和R1延续该优势,V3性能看齐GPT - 4o,训练成本仅为其1/20,R1性能看齐o1,API调用成本仅为其1/30 [26][27] - DeepSeek算力节省关键点包括多头潜注意力机制(MLA)和DeepSeek MoE架构,分别贡献2 - 4倍和4倍以上计算效率提升,训练架构有软硬协同优化能力,包括FP8混合精度训练框架、DualPipe算法、跨节点All - to - All通信内核 [31][32][35] - 大模型能力构建路径分两类,一是通过精细化模型和软硬件结合训练构架,在低算力消耗基础上建设模型能力,DeepSeek在此方向能力强且契合现状;二是通过大算力投入带动模型能力提升,xAI的Grok3用此方法暂时有效,但该路径瓶颈明显 [41][44][45] - 根据DeepSeek数据测算,其用278台H800服务器提供推理服务,平均占用GPU数量1814张,远低于市场预期,理论毛利率达84.5%,但实际利润因网页和APP免费、V3价格低、夜间有折扣等因素会少于理论值 [48][51][53] 要素三:开源阵营的性能超越 - 主流大模型厂商开源路线分三类,闭源路线为主的如OpenAI等;开源落后或轻量模型的如xAI、谷歌;坚定开源路线的如Meta、阿里、DeepSeek,DeepSeek的R1和V3模型追平最先进闭源模型能力且成本优势明显,开源大模型在先进性上首次超越闭源大模型 [61][63][66] - DeepSeek开源条款更开放,使用MIT协议,可商用且无特定许可和法律管辖条款,海内外云厂商、国产芯片、下游软件厂商快速接入其模型,加速应用落地和国产替代进程 [73][75] - DeepSeek将核心代码悉数开源,R1开源仓库包含多种要素,还发布训练过程论文,“Open Source Week”活动中共享节省算力和高效运算核心技术,其开源刺激其他大模型厂商加大开源力度 [83][86][90] AI产业发展趋势的预判 - 大模型开发范式改变,未来模型后训练阶段和单次推理消耗算力增加,应用爆发期B端AI应用带来部署机会,相关爆款应用成资金关注点,科技大厂加速AI投入 [91] - 大模型推理成本下降带来应用爆发,将产生更多应用需求,拉动算力增长,中国在AI应用发展有望全球领先 [91][93] 河南借助智算带动人工智能应用发展 - 2024年11月河南出台规划,提出2026年全省算力规模超120EFlops、智算规模达100EFlops以上,智算等高性能算力占比超90%,目标名列前茅 [94] - DeepSeek - R1发布后,河南本地数据中心加快接入其模型,鹤壁京东云(中原)算力中心和河南空港智算中心分别于2月7日和2月8日接入 [98]