21专访|中昊芯英CTO郑瀚寻:国产AI芯片也将兼容不同平台
21世纪经济报道·2025-09-24 10:40

AI芯片市场趋势 - 旺盛的AI智算需求驱动下,GPU路线之外的AI芯片正获得更多市场关注,包括博通、谷歌TPU和Groq LPU等典型代表 [1] - 在国内市场,立足于ASIC定制芯片的众多厂商正在快速发展,产业界持续追求更高费效比的路径 [1] - 寻找GPU芯片之外的发展机会早已是一种新趋势,市场对GPU之外的AI计算芯片有关注度,如博通的百亿美元订单和谷歌TPU的演进 [2] 技术路线与架构创新 - 近年间硅谷涌现的芯片新玩家如Groq、SambaNova和Cerebras等,均致力于通过架构创新实现性能和能效突破,而非选择GPU或类似GPU架构 [2] - 渐进式能力提升难以缩小与英伟达的差距,需要求新求变以实现类似新能源汽车领域的“弯道超车” [2] - GPU的成功很大程度上在于英伟达深厚的工程化实验团队积累,这已不是后来者可以直接复制的路线 [2] 张量计算单元的优势 - 在大模型时代,对张量计算单元进行投资很划算,每多N倍数据传输量,张量运算单元就能完成N2的计算量,实现相对划算的计算效果 [3] - TPU像一台3D打印机,能够把计算任务一次性打印成型,在同样算力数量级前提下,可实现更好的数据迁移和存储表现,同时实现更低的能源消耗 [4] - TPU可对计算效率和能耗带来突破性变化,在传统深度学习、AI for science和科学模拟等领域,采用Tensor Core的计算架构均可受益 [4] 集群互联与数据传输 - 未来数据传输会是AI基础设施面临的瓶颈之一,需要发挥Tensor Core的优势并提升互联能力 [5] - 谷歌推出第三代TPU产品时,已支持多达千片芯片规模的片间互联,中昊芯英能够支持千卡集群内1024片芯片直接光模块高速片间互联 [5] - 英伟达通过构建InfiniBand高速互联协议形成护城河,但其竞争对手更积极推进以太网协议发展,这也是多数国产AI芯片厂商选择的方向 [5] 以太网技术与软件生态 - 近两年来,头部AI芯片厂商积极构建以太网联盟,该技术路线在物理介质和带宽能力上已大幅提升,十分具竞争力 [6] - 特斯拉基于以太网推出的TTPoE连接协议能够实现很低延迟,中昊芯英的互联延迟表现已优于特斯拉 [6] - 国产AI芯片平台需自主建设软件栈和工具链,未来将通过持续的工具链完善,实现不同平台间的兼容与流畅体验 [6] 模型架构与芯片研发 - 目前绝大多数大语言模型本质上仍脱胎于Transformer架构,整体结构并未出现根本性变化 [7] - 这给了AI芯片厂商发展机会,可按照1-2年的产品迭代周期有序推进研发进程 [7] - 公司团队持续关注模型演进方向,会及时把相关功能落地到芯片中 [7]