行业投资评级 - 科技行业评级为增持(维持)[6] - 计算机行业评级为增持(维持)[6] 核心观点 - DeepSeek通过大模型跨节点专家并行(EP)实现低成本推理,日均成本为$87,072,显著提升有效算力[1] - 推理成本大幅降低,平均每百万Token处理成本为$0.11,理想状态下15%付费率即可实现盈亏平衡[2] - 技术优化包括大规模跨节点专家并行、计算/通信重叠及负载平衡,实现更高吞吐量和更低延迟[3] - 与海外模型相比,DeepSeek具备显著性价比优势(如R1每百万Token输入定价0.55),反映国内外算力供应差异[4] - DeepEP开源有望推动LLM商业化应用加速,带动推理需求释放,利好IaaS服务商和AI应用渗透[5] - 国产算力硬件适配DeepEP体系后,国产AI算力板块或迎来成长机遇[5] 核心数据与性能指标 - 峰值占用278个节点,平均占用226.75个节点,GPU租赁成本为$2/小时[2] - 24小时内处理Token总量776B(输入608B+输出168B)[2] - 若按R1定价计算,单日理论收入$562,027,成本利润率545%[2] 受益方向与标的 - 算力产业推荐浪潮信息(目标价61.41元,买入评级),其他相关公司包括寒武纪、海光信息、金山云等[5][9][14] - 云厂商受益于推理需求带动的IaaS稼动率提升[5] - AI应用加速渗透受益于R1模型低成本部署能力[5] 技术实现细节 - 采用预填充-解码分解架构,实现多专家并行计算[3] - GPU的SM划分为计算与通信两部分,减少延迟等待时间[3] - 通过三重负载平衡(预填充、解码、专家并行)优化GPU计算与通信分配[3]
DeEPSeek:EP降本,关注应用与算力