计算机行业深度分析：三大要素齐发力，AI应用步入全面加速期

报告行业投资评级 - 强于大市（上调） [1] 报告的核心观点 - 2024年11月30日报告提出“o1的问世”让Agent步入发展快车道，AI在应用软件层发展潜力待释放，DeepSeek - R1发布后大模型成本下降、开源阵营性能超越，AI应用集齐全面落地三大关键要素，具有里程碑意义 [4][11] 根据相关目录分别进行总结要素一：逻辑推理能力提升 - o1开启逻辑推理能力提升新路径，此前大模型在语言能力构建有突破，但推理和逻辑能力与人类差距大，o1提升了大模型解决科学、编码、数学等领域复杂问题的能力，对LLM实现AGI意义重大 [13][14][17] - DeepSeek首次公开验证强化学习对大模型推理能力提升的有效性，用DeepSeek - V3 - Base作基础模型，经强化学习训练出DeepSeek - R1 - Zero，AIME 2024得分从15.6%提升到71.0%，后又加入多阶段训练得到DeepSeek - R1，还对Llama和Qwen系列开源大模型蒸馏得到6个小模型，提高了推理能力 [19][21][22] 要素二：推理成本下降 - DeepSeek开启低成本路线，2024年5月的DeepSeek - V2显示高性价比优势，后续V3和R1延续该优势，V3性能看齐GPT - 4o，训练成本仅为其1/20，R1性能看齐o1，API调用成本仅为其1/30 [26][27] - DeepSeek算力节省关键点包括多头潜注意力机制（MLA）和DeepSeek MoE架构，分别贡献2 - 4倍和4倍以上计算效率提升，训练架构有软硬协同优化能力，包括FP8混合精度训练框架、DualPipe算法、跨节点All - to - All通信内核 [31][32][35] - 大模型能力构建路径分两类，一是通过精细化模型和软硬件结合训练构架，在低算力消耗基础上建设模型能力，DeepSeek在此方向能力强且契合现状；二是通过大算力投入带动模型能力提升，xAI的Grok3用此方法暂时有效，但该路径瓶颈明显 [41][44][45] - 根据DeepSeek数据测算，其用278台H800服务器提供推理服务，平均占用GPU数量1814张，远低于市场预期，理论毛利率达84.5%，但实际利润因网页和APP免费、V3价格低、夜间有折扣等因素会少于理论值 [48][51][53] 要素三：开源阵营的性能超越 - 主流大模型厂商开源路线分三类，闭源路线为主的如OpenAI等；开源落后或轻量模型的如xAI、谷歌；坚定开源路线的如Meta、阿里、DeepSeek，DeepSeek的R1和V3模型追平最先进闭源模型能力且成本优势明显，开源大模型在先进性上首次超越闭源大模型 [61][63][66] - DeepSeek开源条款更开放，使用MIT协议，可商用且无特定许可和法律管辖条款，海内外云厂商、国产芯片、下游软件厂商快速接入其模型，加速应用落地和国产替代进程 [73][75] - DeepSeek将核心代码悉数开源，R1开源仓库包含多种要素，还发布训练过程论文，“Open Source Week”活动中共享节省算力和高效运算核心技术，其开源刺激其他大模型厂商加大开源力度 [83][86][90] AI产业发展趋势的预判 - 大模型开发范式改变，未来模型后训练阶段和单次推理消耗算力增加，应用爆发期B端AI应用带来部署机会，相关爆款应用成资金关注点，科技大厂加速AI投入 [91] - 大模型推理成本下降带来应用爆发，将产生更多应用需求，拉动算力增长，中国在AI应用发展有望全球领先 [91][93] 河南借助智算带动人工智能应用发展 - 2024年11月河南出台规划，提出2026年全省算力规模超120EFlops、智算规模达100EFlops以上，智算等高性能算力占比超90%，目标名列前茅 [94] - DeepSeek - R1发布后，河南本地数据中心加快接入其模型，鹤壁京东云（中原）算力中心和河南空港智算中心分别于2月7日和2月8日接入 [98]