行业投资评级 - 电子行业评级为"强于大市" [1] 核心观点 - DeepSeek开源周发布五大技术,包括FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies和3FS,显著提升AI模型训练和推理效率 [6][9][11][16][19][23][28] - OpenAI发布GPT-4.5,计算效率较GPT-4提升10倍,但API成本高达75美元/百万tokens输入、150美元/百万tokens输出 [34][35] - 三星与长江存储签署3D NAND混合键合专利许可协议,计划2025年下半年量产420-430层V10 NAND [40] - 英伟达2025财年Q4营收393亿美元,同比增长78%,数据中心业务收入356亿美元,同比增长93% [30][32] - 阿里巴巴宣布未来三年投入3800亿元建设云和AI硬件基础设施 [36] - 台积电先进封装订单激增,英伟达包下七成CoWoS-L产能,预计全年出货量突破200万颗 [37] 目录分组总结 1 DeepSeek开源周发布五大技术 - FlashMLA:为Hopper架构GPU设计的高效MLA解码内核,在H800平台上实现3000GB/s数据吞吐与580 TFLOPS算力,性能较FlashAttention-2提升2倍 [6][8] - DeepEP:优化MoE模型训练和推理,节点内通信带宽达153GB/s(NVLink),节点间稳定在43-46GB/s(RDMA) [11][12] - DeepGEMM:FP8矩阵运算库,计算性能达1358 TFLOPS,加速比最高2.7倍 [16][17] - Optimized Parallelism Strategies:包含DualPipe和EPLB技术,优化并行计算和负载均衡 [19][21] - 3FS:分布式文件系统,聚合读取吞吐量6.6 TiB/s,GraySort基准测试吞吐量3.66 TiB/分钟 [23][26] 2 全球产业动态 - 英伟达财报:2025财年收入1305亿美元,同比增长114%,数据中心业务收入1152亿美元,同比增长142% [30][32] - OpenAI GPT-4.5:SimpleQA基准测试准确率62.5%,幻觉率37.1%,API成本为GPT-4o的30倍 [34][35] - 三星与长江存储:合作开发420-430层V10 NAND,采用W2W混合键合技术 [40] - 阿里巴巴:未来三年投入3800亿元建设云和AI基础设施 [36] - 台积电:英伟达包下七成CoWoS-L产能,预计全年出货量200万颗 [37] - SiC AR眼镜:天科合达与慕德微纳合作,利用碳化硅衬底实现80°全彩视场角 [41][42] 3 本周市场回顾 - SW一级行业:钢铁(+3.2%)、房地产(+2.2%)、食品饮料(+1.8%)领涨,电子行业下跌4.9%,排名28/31 [44][47] - SW三级行业:半导体材料(+0.4%)、数字芯片设计(-2.1%)、半导体设备(-3.4%)表现较好 [47][48] - 海外市场:费城半导体指数下跌11.7%,恒生指数上涨1.6% [51][53]
爱建证券电子行业周报:DeepSeek开源周发布五大技术
爱建证券·2025-03-03 10:10