绕开光刻机“卡脖子”,中国新型芯片问世!专访北大孙仲:支撑AI训练和具身智能,可在28纳米及以上成熟工艺量产
每日经济新闻·2025-12-29 10:20

技术突破与核心优势 - 北京大学团队成功研制出基于阻变存储器的高精度、可扩展模拟矩阵计算芯片,在全球范围内首次将模拟计算的精度提升至24位定点精度[2] - 该芯片将模拟计算的相对误差从1%大幅降低至千万分之一(10⁻⁷),精度提升了5个数量级,首次使模拟计算具备与主流数字计算(如FP32)接轨的数值可靠性[8][13] - 核心创新点包括:器件层面采用可量产的阻变存储器实现“现代模拟计算”范式;电路层面设计全新反馈电路实现快速近似求解;算法层面结合“位切片”与迭代优化算法高效实现高精度矩阵方程求解[15] - 相较于数字计算,模拟计算通过物理定律直接进行运算,无需二进制编码和逻辑门操作,因此在硬件资源开销与能耗上均下降数个量级,能效提升百倍,算力吞吐量提升千倍[6][10] - 该芯片可在28纳米及以上成熟制程量产,能够利用现有芯片生产线,有效绕开先进光刻机等“卡脖子”环节[2][10] 应用场景与市场定位 - 该芯片面向矩阵计算,是AI推理(矩阵乘法)、AI二阶训练(矩阵方程求解)、6G通信、具身智能及科学计算等前沿领域的核心运算单元[2][10] - 该技术特别适用于AI模型的二阶训练加速,因为二阶训练每次迭代都需解矩阵方程,计算量巨大,而该芯片擅长快速矩阵方程求解[19] - 除AI与6G外,超级计算(如气象预报、量子力学模拟)是更庞大且契合的应用场景,因为超算中心的大量算力实质上都用于求解矩阵方程[21] - 目前芯片处于实验室原理验证阶段,矩阵规模为16x16,更适用于中等规模场景,在小规模任务上性能优势不明显,尚未进行大规模应用[11][18] - 团队计划在2年内将芯片阵列规模从16x16提升至128x128,并力争达到512x512,以在具身智能、6G通信等中等规模场景产生实际效用[11][25] 行业影响与战略意义 - 该技术为算力领域提供了一条全新的“模拟计算”技术路线,有助于减少对单一数字计算范式(如GPU)的依赖[4] - 随着摩尔定律趋于终结,晶体管微缩困难,数字计算陷入能耗困局,横向堆叠计算卡(从百卡到十万卡)的方式在能耗和碳排放上不可持续,模拟计算被视为一种潜在的突破路径[5] - 该成果由中国团队在全球范围内首次实现,在模拟计算赛道上处于领先位置,为中国在算力领域提供了“换道超车”的可能性,有望降低对先进制程和英伟达GPU的单一依赖[11] - 新型芯片的问世证实了新路径的可行性,但距离真正大规模应用和“摆脱依赖”仍有很长的路,需要国家、科技界和产业界持续投入进行技术储备,以抓住未来算力需求爆发的窗口期[11][26]