Workflow
记忆数据分级管理
icon
搜索文档
HBM价格暴涨之际,华为开源AI推理加速关键技术
观察者网· 2025-11-06 03:10
HBM市场动态与价格趋势 - SK海力士计划向英伟达供应的下一代HBM4单价约为560美元,比当前HBM3E的约370美元价格上涨50%以上[1] - 全球HBM市场出货量份额高度集中,SK海力士以62%位居第一,美光科技和三星电子分别占21%和17%[4] - HBM4作为第六代产品,目标带宽超过2TB/s,容量可达64GB,并计划于明年扩大销售[4] 华为UCM技术创新与开源 - 华为开源UCM(Unified Cache Manager)推理记忆数据管理技术,可根据记忆热度在HBM、DRAM和SSD等不同存储介质中分级缓存数据[1] - 该技术通过稀疏注意力等四大关键能力,可实现首Token时延最高降低90%,系统吞吐最大提升22倍,并达到10倍级上下文窗口扩展[1] - UCM技术旨在提高HBM利用率并平衡成本,通过分级管理KV Cache记忆数据来优化计算效率和减少重复运算[1] 华为AI存储产品布局 - 华为推出多款高性能AI SSD,例如Huawei OceanDisk EX 560随机写性能最高达1500K IOPS,Huawei OceanDisk LC 560最大单盘容量245TB且读带宽达14.7GB/s[3][4] - 公司计划与一体机厂商合作,改变AI存储器市场现有局面,形成百花齐放的竞争态势[4] - 华为自研了两种HBM(HiBL 1.0和HiZQ 2.0),分别与Ascend 950 Die合封构成面向不同场景的芯片,其中HiBL 1.0旨在降低推理Prefill阶段和推荐业务的投资[6] 行业技术发展方向 - 业界正探索将HBM堆栈更直接地连接到处理器芯片上,甚至研究使用光子技术以追求极致的传输速度和能效[4] - 华为UCM等记忆数据分级管理技术,关键意义在于让更多开发者和企业降低对高端HBM的依赖,实现降本增效[5] - 技术发展可能模糊逻辑芯片和存储芯片之间的界限,让两者更紧密地集成在一起[4]