Workflow
忆阻器(Memristor)
icon
搜索文档
新型AI芯片能耗重大突破,已登Nature子刊
机器之心· 2025-11-25 00:02
存算一体技术的瓶颈与挑战 - AI算力需求激增导致传统冯・诺依曼架构出现严重能耗问题,数据在CPU和内存间搬运的能耗可达计算本身的200倍[3][9] - 存算一体技术通过直接在内存中执行计算来消除数据搬运瓶颈,被视为提升能效的终极方案之一[4] - 然而存算一体系统中的模数转换器成为新的能效瓶颈,在先进系统中ADC可能消耗高达87%的总能量和75%的芯片面积[6][7] 传统ADC的技术缺陷 - 传统ADC采用均匀量化方式,使用固定的等距量化边界处理所有信号,与神经网络各层输出信号千差万别的分布特征严重不匹配[12] - 这种不匹配导致在信号密集区域分辨率不足,在信号稀疏区域又浪费量化资源,造成精度严重损失[12] - 为弥补精度损失而使用更高精度ADC会导致硬件开销呈指数级暴涨,形成恶性循环[13] 基于忆阻器的自适应ADC创新方案 - 研究团队利用忆阻器的可编程电阻特性,设计了一种全新的量化单元,实现了硬件层面可编程的自适应量化边界[15][16][18] - 该方法先通过算法分析AI模型每层输出的数据分布,寻找最优的非均匀量化边界,然后通过忆阻器将定制边界写入硬件[19] - 在VGG8网络和CIFAR-10数据集上,4-bit精度下自适应ADC将准确率从传统均匀量化的52.3%提升至88.9%,5-bit精度下达到89.55%[21] 系统级能效与面积优化成果 - 忆阻器ADC本身在5-bit精度下实现了15.1倍的能效提升和12.9倍的面积缩减[25] - 集成到存算一体系统后,在VGG8网络中ADC模块的系统能耗占比从79.8%降至22.5%,系统总能耗降低57.2%[26] - 系统面积优化同样显著,ADC面积占比从47.6%降至16.9%,系统总面积降低30.7%[26] - 在ResNet18网络上实现了56.9%的能耗节省和25.1%的面积节省[28]