报告行业投资评级 - 优于大势 [4] 报告的核心观点 - 中美AI差距缩小,中国迎来AI发展大时代,中国AI实验室发展迅速,从追赶性能转向定义场景新赛道,且中美短期内主导全球AI发展趋势 [1][11][12] - 中国多个模型在工程能力上各有特点,如DeepSeek高效性与性价比高、Qwen2.5多模态能力领先、混元T1混合Mamba架构创新 [2] - AI应用落地存在幻觉问题,可通过规模化容错、知识增强+可信生成等技术路径缓解,也可学会利用AI幻觉生成,建议关注医疗、教育等领域AI带来的新市场增量 [3] 根据相关目录分别进行总结 AI竞合拐点:中国智起 - 中美AI差距缩小,中国凭借数据资源、制造业基础和科技创新重视奋起直追,2024年第四季度中国AI实验室推出千亿级模型,将与美国顶尖实验室智能差距从24个月压缩至6个月,且在多轮推理任务中达GPT - 4的90%水平 [11][12] - 全球AI竞争格局中,除中美外其他国家和地区发展滞后,美国国内AI竞争围绕OpenAI展开,谷歌和Meta等推进自身模型研发;中国AI实验室崛起,从追赶者成为重要参与者和潜在领导者 [14][16][17] 中国AI的工程创新,从Deepseek、Qwen还有混元说起 DeepSeek:技术创新+高性价比 - DeepSeek - R1训练启动数据量低,采用强化学习技术,提高训练效率、降低成本,具有强大推理能力和高性价比 [19] - 训练高效原因在于模型架构与训练架构相辅相成,采用MLA机制减少KV Cache使用量、提升推理效率,引入FP8训练减少GPU内存使用量和计算开销,采用MoE架构减少计算量并解决技术难题 [22][24] - 训推能力高效,整体预训练用14.8万亿高质量Token,模型参数量671B但每个Token仅激活37B参数,自主研发MLA注意力机制和无辅助损失负载均衡策略 [26] - DeepSeekMoE采用更细粒度专家划分和共享专家设置,减少知识冗余,门控网络采用Top - K策略,提出无辅助损失负载均衡策略解决专家负载不均问题 [31][32] - MLA多头潜在注意力对键和值进行低秩联合压缩,减少KV缓存使用量,提升模型性能和推理效率 [35] - 推理部署采用预填充与解码分离策略,确保高吞吐量和低延迟,通过冗余专家部署和动态路由策略实现负载均衡,成本低、利润率高 [39][43] Qwen2.5:持续发力多模态 - Qwen2.5 - Max在Chatbot Arena LLM Leaderboard中表现出色,位列全球第七,在数学和编程能力等方面排名靠前,综合性能优秀 [44] - QwQ - 32B跑分不输671B的DeepSeek R1,以约1/10成本达到介于DeepSeek - R1和o3 - mini - high之间的性能水平 [46][47] - Qwen2.5 - VL架构由大语言模型、视觉编码器和视觉语言融合器构成,能处理复杂多模态输入 [49] - 视觉编码器重新设计ViT架构,引入窗口注意力机制和二维RoPE,降低计算开销,减少输入到语言模型的token数量 [51] - 原生动态分辨率和帧率在空间和时间维度创新,能处理多样化多模态输入,提升处理不同分辨率图像和捕捉视频时间动态的能力 [52] - 多模态旋转位置嵌入与绝对时间对齐扩展MRoPE能力,将时间组件与绝对时间对齐,使模型在多模态理解和交互方面取得进展 [55][56] 混元T1:混合Mamba架构带来高速推理体验 - 混元T1采用Hybrid - Mamba - Transformer融合模式,降低计算复杂度和内存占用,解决长文推理问题,提升解码速度,推理能力强 [60] - 在常见benchmark上成绩优异,在多项任务中展现强适应性 [62] - 混合Mamba架构模块化设计,Mamba模块处理局部特征,Transformer模块捕捉全局依赖,具有选择机制和硬件感知型算法,提升计算速度 [66] - 架构融合Mamba和Transformer技术,动态权重分配智能,根据输入调整模块权重 [68][71] - 具有高效处理长序列数据、强大多模态能力和智能路由机制等优势 [74] 大模型的技术缺陷和未来演进方向 - 技术缺陷包括ORM监督信号稀疏与反馈路径冗长、对正确性验证强依赖与推理能力局限、纯语言模型信息源受限、复杂长时任务处理能力不足 [73][74][77] - 未来发展方向包括Scaling螺旋式上升带动成本降低,多模态深度融合迈向世界模型,从“推理者”到“智能体”转变 [75][78][80] 从幻觉的角度来说,如何看应用前景 AI应用无法回避的对手之一,幻觉 - 大模型幻觉问题阻碍垂类客户向AI付费,影响AI在专业领域应用,分为事实性幻觉和忠实性幻觉 [82][84][85] - 幻觉原因包括数据缺陷、目标错位、知识边界模糊 [89] - 技术层面解决方法有知识增强、人类反馈驯化、领域特化 [91][92][93] 规模化“容错解”:当误差成本低于效率红利 - 当批量处理规模效应使错误修正成本低于人工执行机会成本时,AI幻觉可成为“效率催化剂”,在容错率大于或等于15%的业务领域具有经济合理性 [96] - 在内容生产、数据标注等场景中,“用1%的错误率换取90%效率提升”模式显著,可实现人机协同成本再分配 [97] - AI在数据标注和文字识别场景中提高效率、降低成本,在自动驾驶行业能完成复杂标注,在AI HR场景中帮助企业降本增效 [99][104][107] 投资建议 - 国内AI在技术追赶与场景创新上加速突破,通过架构优化与多模态融合推动产业升级,建议关注医疗(AI预问诊)、教育(个性化教学)、自动驾驶(3D/4D标注)、人力资源(AI招聘)及创意产业(AI生成内容)中AI带来的新市场增量 [3]
中国AI崛起:技术突破与应用落地
东北证券·2025-03-26 08:43