深圳理工大学唐志敏：异构计算已成必然，软件决定芯片胜负丨GAIR 2025

算力概念的演进与重新定义 - “算力”是中国创造的概念，其本质是在可接受的资源与时间内完成计算任务的能力 [7][8] - 有观点提出用“Computility”一词替代“Computing Power”，以强调算力应像水电一样成为基础设施 [7] - 在传统算力基础上，衍生出“训力”（快速训练大模型）和“推力”（基于大模型快速推理）等新概念 [9][10] - 算力体系的演进可能催生多模态生成能力，例如未来或将小说直接“演”成电视剧 [10] 算力需求增长与异构计算的必然性 - 生成式AI对算力的需求持续快速增长，其增速远超制程工艺带来的性能提升 [12] - 仅靠CPU已无法满足需求，CPU主频与架构在过去二十多年未发生本质变化 [16] - 行业必然选择CPU+XPU（如GPGPU）的异构计算架构，以在通用性、性能、能耗和成本间寻求平衡 [16] XPU的本质与软件生态的核心地位 - XPU属于保守型硬件结构，仅提供计算资源，性能能否发挥取决于软件、编译器与程序员 [18][19] - 算力芯片的核心问题并非硬件架构，而是应用生态，生态包括操作系统、编译器、应用软件等所有软件的总和 [20][24] - 真正产生生产力的是应用软件而非芯片本身，成熟的软件体系对释放硬件性能至关重要 [24] - 硬件峰值性能只是指标，真实应用软件通常仅能发挥整机20%～30%的效率，优化空间巨大 [38] CPU生态格局：x86、Arm与RISC-V的挑战 - x86生态经过四五十年发展，拥有极高的市场占有率和生态惯性 [24] - 根据Gartner数据，基于x86软件的销售收入达3000多亿美元，而其年研发费用约600亿美元，远超全球服务器市场约800亿美元的总收入 [24] - Arm架构在服务器领域屡战屡败，其成功需要两个条件：掌握全栈技术的大公司弃用x86，以及端云融合促进应用迁移 [27] - RISC-V面临商业化困难，例如行业顶级人物Jim Keller创办的Tenstorrent公司已开始裁员，其芯片面临“不知卖给谁”的困境 [29] - RISC-V目前仅在软件简单的嵌入式场景（如存储控制器）应用较好，一旦进入计算领域则面临软硬件生态不成熟的多重问题 [29] - RISC-V在多核CPU所需的片上互联网络等硬件生态上尚不成熟，可能仍需依赖Arm的解决方案 [29] CUDA生态的壁垒与国产化必要性 - 硬件指令的直接支持对性能和能效始终有价值，Intel不断加入新指令即是例证 [32] - 兼容CUDA的API接口从技术角度看并不难，但复制其背后的完整软件生态（包括算力库、函数库、开发工具等）则极其困难 [32] - 国家层面已意识到生态建设的重要性，正在推动打造自主算力生态，以避免长期受制于人 [33] 芯片成功的核心：软件生态与差异化价值 - 在半导体发展放慢、中国面临制程限制的背景下，需通过跨学科交叉在系统、软件和算法层面寻求性能突破 [35] - 通过软件、编译和系统层面的优化，完全有可能在峰值性能较低的芯片上获得不错的应用效果 [44] - 实现AIGC生成影视内容等愿景，不仅需要GPGPU的计算能力，也需要GPU基础的图形渲染能力 [44] - 系统与平台厂商自研芯片能否成功，关键在于能否为产品和服务提供足够大的增值，以及能否掌控全栈软件体系 [44] - 苹果基于Arm自研芯片的成功，关键在于通过自研高性能芯片与自有软件体系结合，打造领先体验并实现产品高溢价 [45] - 架构创新不一定需要新指令系统，在现有指令体系（如RISC-V）下完全可以进行创新 [45] - 平台或系统厂商自研芯片必须有清晰的、能为系统或服务带来显著增值的差异化，否则使用成熟商用芯片是更理性的选择 [46] RISC-V的未来潜力与行业愿景 - RISC-V具备一定的包容性，有机会融合CPU、GPU和AI处理器的特性 [1] - 行业希望将RISC-V作为统一的指令系统方向，让各类处理器尽量统一到同一架构平台，以减少重复投入 [46] - 未来计算架构可能从当前的CPU+XPU异构体系，回归到以CPU为中心的新一体化架构 [47] - RISC-V有机会吸收开源体系的力量，逐步突破CUDA的生态壁垒 [47]