GPU架构

搜索文档
AMD RDNA4 GPU 架构,详细解读!
半导体行业观察· 2025-09-14 02:55
核心观点 - AMD RDNA4架构在光线追踪和机器学习效率方面实现显著提升,同时优化光栅化性能,并增强媒体与显示功能,整体采用单片设计以平衡性能与成本 [2][4][54][55][58] 架构效率改进 - 光线追踪单元和BVH节点结构优化,结合动态寄存器分配模式,减少波间内存依赖问题 [16] - 标量单元新增浮点指令(延迟4周期),较矢量指令(延迟5周期)效率更高,支持整数运算卸载以提升能效 [17][18][20] - 二级缓存容量增至8MB,较RDNA3(6MB)和RDNA2(4MB)提升显著,减少对Infinity Cache的依赖 [23][25] - 透明压缩技术扩展至全SoC(包括显示和媒体引擎),降低带宽需求并提升能效 [29][33][42] 媒体引擎增强 - 高端型号(如RX 9070XT)配备双媒体引擎,支持H.265和AV1编解码器,优化低延迟编码模式 [5][7] - 在《上古卷轴OL》测试中,低延迟VBR模式下Netflix VMAF质量评分更高,文本处理能力优于前代 [9][10][12] - 编码速度从RDNA3.5的190 FPS提升至200 FPS,VBV缓冲区限制为3帧以平衡延迟与质量 [12] 显示引擎优化 - 新增"Radeon图像锐化"硬件滤镜,独立于GPU着色器运行,不影响性能且能效更高 [13] - 利用FreeSync可变刷新率动态调整像素率,降低多显示器空闲功耗 [14][15] - RX 9070在双显示器高刷新率场景下(如1080P 60Hz + 1440P 360Hz)功耗仅12W,较RX 6900XT(36W)显著降低 [15] 内存与缓存系统 - Infinity Fabric内存子系统包含16个CS块,每块配对4MB缓存,支持1.5-2.5 GHz动态频率调节,理论带宽达2.5 TB/s [49][51] - 取消中级L1缓存,重点扩大L2容量以应对光线追踪等高压工作负载 [28] - GDDR6内存控制器支持256位配置,通过压缩技术弥补Infinity Cache容量缩减 [42][58] 计算与同步改进 - 引入分拆屏障指令(s_barrier_signal/s_barrier_wait),替代传统s_barrier,减少线程等待时间 [21][22] - 工作组处理器针对光线追踪优化,提升BVH遍历效率 [16] SoC集成与功能 - 强化RAS(可靠性、可用性和可服务性)功能,支持错误检测与部分模块重初始化 [43] - 安全模块采用MP0/MP1架构,与CPU端设计协同,支持DRM和SEV功能 [45] - 通过Infinity Fabric实现多路一致性系统,支持大型末级缓存 [46][47] - 采用单片设计,基于性能目标、成本及封装效率综合考量 [54]
传奇游戏GPU,英伟达停止支持
半导体行业观察· 2025-07-02 01:50
Nvidia终止对老架构GPU的驱动支持 - 即将发布的580系列驱动程序将是最后一款支持Maxwell、Pascal和Volta架构GPU的版本,之后这些显卡将不再获得错误修复或代码优化 [2] - 受影响的显卡包括2014年推出的Maxwell架构GTX 750、2016年Pascal架构的GeForce 10系列以及2017年Volta架构的Titan V [3] - 用户仍可期待额外一年的关键安全更新,但功能更新将完全停止 [3] 受影响GPU的市场现状 - Pascal架构显卡如GTX 1080/1080 Ti至今仍有用户在使用,部分玩家尚未升级到现代GPU [3] - 2017年移动版GTX 1060曾能在1080p分辨率下以80-120FPS流畅运行《毁灭战士》重制版 [3] - 目前尚不清楚这些老显卡能否满足现代游戏如《Elden Ring》的最低30FPS运行需求 [3] Nvidia当前的驱动开发重点 - 公司未透露580系列驱动程序的具体发布时间 [4] - 近期专注于解决50系列和40系列GPU在新版Game Ready驱动中出现的问题 [4] - 例如566.36版本驱动在RTX 4080 Super上表现稳定,可支持《毁灭战士:黑暗时代》100+ FPS流畅运行 [4] 行业技术演进趋势 - 该决定通过Unix图形功能弃用计划宣布,影响Linux/Unix和Windows系统用户 [2] - 反映出GPU技术迭代加速,老硬件逐渐被淘汰的行业常态 [2][3] - 与公司快速迭代新驱动、优先支持最新硬件的战略方向一致 [4]