Workflow
GeForce RTX 50 系列 GPU
icon
搜索文档
COMPUTEX现场走访:主权AI、美国制造、NVLinkFusion是三大话题
华泰证券· 2025-05-21 09:31
报告行业投资评级 - 科技行业投资评级为增持(维持) [4] 报告的核心观点 - 中东等地主权AI相关投资短期弥补中国市场销售受限影响,但AI应用发展缓慢或是产业链最大风险 [1] - 中国台湾有完备产业链集群,满足美国政府要求实现美国本土制造是产业链面临的最大挑战 [1][2] - NVLink Fusion是英伟达发布的新技术,或进一步强化其产业地位 [1][3] 各公司情况总结 英伟达 - 战略上强调AI成企业IT架构核心驱动力,宣布在中国台湾建全新总部“NVIDIA星座” [9] - 产品推出NVLink Fusion架构、AI - Q数据库框架、RTX新品,展示Grace Blackwell超级芯片及其NVL72,预计三季度推GB300 [9] - 拓展端侧AI应用,展示Cosmos平台、开源物理引擎Newton和人形机器人开源模型Isaac GR00T N1 [13] 联发科 - AI数据中心业务预计2026年实现数十亿美元销售规模,强调定制AI加速器设计技术优势,GB10芯片量产 [14] - 端侧AI方面2025年Q1手机营收同环比增长6%,旗舰产品支持大语言模型,预计Q2多款搭载该芯片手机上市 [15] - 美国市场直接营收占比约10%,关税政策影响有限,关注全球贸易和主要市场经济动态 [16] 高通 - 重返数据中心CPU赛道,推出定制化CPU,采用NVLink Fusion技术与英伟达GPU高速互联,与沙特公司签署供应协议 [17] - 预计2026年超100款搭载Snapdragon X处理器的PC产品上市,在美国消费类PC市场有10%份额,欧洲前五大市场约9%市占率,与小米有长期合作 [21] 鸿海 - AI数据中心产业2025年Q1 AI服务器营收同比增超50%,预计全年营收达兆元新台币,占整体服务器营收比重超50%,Q2预计环比、同比近倍数增长,云端网络产品占比提升 [22] - 端侧AI进入AI ASIC设计领域,在智慧制造、智能机器人及电动车领域布局,与相关方合作开发平台、推进量产 [25] - 区域制造布局完善,印度布局满足客户需求,受关税提前拉货影响,对下半年看法审慎 [26][27] 日月光 - AI机会方面先进封装收入占比稳步提升,测试业务增长强劲,预计2025年底测试营收占比达19% - 20%,加大资本支出扩充产能 [30] - Q1业绩受提前拉货影响,评估赴美设厂可能性,认为关税影响有限,通过多元客户结构和产能调整减缓不确定性 [31]
电子行业周报:DeepSeek开源周发布五大技术
爱建证券· 2025-03-03 10:52
报告行业投资评级 - 电子行业评级为"强于大市" [1] 核心观点 - DeepSeek开源周发布五大技术,包括FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies和3FS,显著提升AI模型推理和训练效率 [6][9][16][19][23] - OpenAI发布GPT-4 5,计算效率较GPT-4提升10倍,但API成本高达75美元/百万tokens输入、150美元/百万tokens输出 [34] - 三星与长江存储签署3D NAND混合键合专利许可协议,计划2025年下半年量产堆叠层数达420-430层的V10 NAND [40] - 英伟达2025Q4营收393亿美元,同比增长78%,数据中心业务收入356亿美元,同比增长93% [30][32] - 阿里巴巴宣布未来三年投入3800亿元建设云和AI硬件基础设施 [36] 行业动态与技术进展 DeepSeek开源技术 - FlashMLA在H800平台上实现3000GB/s数据吞吐与580 TFLOPS算力,性能较FlashAttention-2提升近2倍 [6][8] - DeepEP在NVLink环境下实现153GB/s的分发带宽和158GB/s的合并带宽,RDMA环境下稳定在43-46GB/s [11][12] - DeepGEMM计算性能达1358 TFLOPS,内存带宽最高2668 GB/s,较CUTLASS 3 6优化最高提速2 7倍 [16][17] - 3FS在25节点集群GraySort基准测试中实现3 66 TiB/min吞吐量,键值缓存查找峰值吞吐量超40 GiB/s [23][27] 全球产业动态 - 英伟达GeForce RTX 50系列GPU性能较上一代提升最高2倍 [31] - 台积电CoWoS-L先进封装产能被英伟达包下七成,预计全年出货量突破200万颗 [37] - 天科合达与慕德微纳合作开发SiC基AR衍射光波导镜片,单层镜片可实现80°以上全彩视场角 [41] 市场表现 - 本周电子行业涨跌幅-4 9%,排名28/31,半导体材料子行业涨幅+0 4% [2][47] - 费城半导体指数本周跌11 7%,恒生指数涨1 6% [51][52] - SW电子个股涨幅前三:翱捷科技+30 0%、芯原股份+27 4%、卓翼科技+26 4% [48]
爱建证券电子行业周报:DeepSeek开源周发布五大技术
爱建证券· 2025-03-03 10:10
行业投资评级 - 电子行业评级为"强于大市" [1] 核心观点 - DeepSeek开源周发布五大技术,包括FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies和3FS,显著提升AI模型训练和推理效率 [6][9][11][16][19][23][28] - OpenAI发布GPT-4.5,计算效率较GPT-4提升10倍,但API成本高达75美元/百万tokens输入、150美元/百万tokens输出 [34][35] - 三星与长江存储签署3D NAND混合键合专利许可协议,计划2025年下半年量产420-430层V10 NAND [40] - 英伟达2025财年Q4营收393亿美元,同比增长78%,数据中心业务收入356亿美元,同比增长93% [30][32] - 阿里巴巴宣布未来三年投入3800亿元建设云和AI硬件基础设施 [36] - 台积电先进封装订单激增,英伟达包下七成CoWoS-L产能,预计全年出货量突破200万颗 [37] 目录分组总结 1 DeepSeek开源周发布五大技术 - **FlashMLA**:为Hopper架构GPU设计的高效MLA解码内核,在H800平台上实现3000GB/s数据吞吐与580 TFLOPS算力,性能较FlashAttention-2提升2倍 [6][8] - **DeepEP**:优化MoE模型训练和推理,节点内通信带宽达153GB/s(NVLink),节点间稳定在43-46GB/s(RDMA) [11][12] - **DeepGEMM**:FP8矩阵运算库,计算性能达1358 TFLOPS,加速比最高2.7倍 [16][17] - **Optimized Parallelism Strategies**:包含DualPipe和EPLB技术,优化并行计算和负载均衡 [19][21] - **3FS**:分布式文件系统,聚合读取吞吐量6.6 TiB/s,GraySort基准测试吞吐量3.66 TiB/分钟 [23][26] 2 全球产业动态 - **英伟达财报**:2025财年收入1305亿美元,同比增长114%,数据中心业务收入1152亿美元,同比增长142% [30][32] - **OpenAI GPT-4.5**:SimpleQA基准测试准确率62.5%,幻觉率37.1%,API成本为GPT-4o的30倍 [34][35] - **三星与长江存储**:合作开发420-430层V10 NAND,采用W2W混合键合技术 [40] - **阿里巴巴**:未来三年投入3800亿元建设云和AI基础设施 [36] - **台积电**:英伟达包下七成CoWoS-L产能,预计全年出货量200万颗 [37] - **SiC AR眼镜**:天科合达与慕德微纳合作,利用碳化硅衬底实现80°全彩视场角 [41][42] 3 本周市场回顾 - **SW一级行业**:钢铁(+3.2%)、房地产(+2.2%)、食品饮料(+1.8%)领涨,电子行业下跌4.9%,排名28/31 [44][47] - **SW三级行业**:半导体材料(+0.4%)、数字芯片设计(-2.1%)、半导体设备(-3.4%)表现较好 [47][48] - **海外市场**:费城半导体指数下跌11.7%,恒生指数上涨1.6% [51][53]