Workflow
「Virtual VRAM」虚拟显存扩展卡
icon
搜索文档
第四范式(06682.HK)发布「Virtual VRAM」虚拟显存扩展卡,GPU资源利用率实现突破
格隆汇· 2025-09-30 01:37
在AI大模型迅速发展的背景下,GPU显存容量正成为制约模型训练与推理效率的关键瓶颈。单卡运行 时显存不足,又或是轻负载场景中一模型一卡的部署形态,无不反映出市场对高效、低成本扩展显存资 源的迫切需求。 近日,第四范式正式推出了「Virtual VRAM」可插入式虚拟显存扩展卡,该产品通过将物理内存转化 为可动态调度的显存缓冲池,实现了GPU算力资源的弹性扩展。第四范式创始人戴文渊,第四范式联合 创始人、首席科学家陈雨强出席发布活动。 传统GPU显存容量固定且扩展成本高昂,限制了AI模型规模的扩大与多任务并发能力。用户往往只能 通过购置更高端显卡或多卡并行来缓解压力,导致投入成本急剧上升。第四范式的「Virtual VRAM」 创新性地构建了显存与内存之间的高速数据通道,将内存虚拟为显存使用,相当于为原有的"固定备菜 台"配置了一个可灵活调度的"储藏室",从而在不大幅变更硬件结构的前提下,突破显存容量限制。 据第四范式联合创始人、首席科学家陈雨强介绍,单张显卡在使用该扩展卡后,虚拟显存容量最高可扩 展至256GB。以NVIDIA H20显卡为例,其原生显存为96GB,扩展后相当于10张NVIDIA RTX 40 ...