算力概念的演进与重新定义 - “算力”是中国创造的概念,其本质是在可接受的资源与时间内完成计算任务的能力 [7][8] - 有观点提出用“Computility”一词替代“Computing Power”,以强调算力应像水电一样成为基础设施 [7] - 在传统算力基础上,衍生出“训力”(快速训练大模型)和“推力”(基于大模型快速推理)等新概念 [9][10] - 算力体系的演进可能催生多模态生成能力,例如未来或将小说直接“演”成电视剧 [10] 算力需求增长与异构计算的必然性 - 生成式AI对算力的需求持续快速增长,其增速远超制程工艺带来的性能提升 [12] - 仅靠CPU已无法满足需求,CPU主频与架构在过去二十多年未发生本质变化 [16] - 行业必然选择CPU+XPU(如GPGPU)的异构计算架构,以在通用性、性能、能耗和成本间寻求平衡 [16] XPU的本质与软件生态的核心地位 - XPU属于保守型硬件结构,仅提供计算资源,性能能否发挥取决于软件、编译器与程序员 [18][19] - 算力芯片的核心问题并非硬件架构,而是应用生态,生态包括操作系统、编译器、应用软件等所有软件的总和 [20][24] - 真正产生生产力的是应用软件而非芯片本身,成熟的软件体系对释放硬件性能至关重要 [24] - 硬件峰值性能只是指标,真实应用软件通常仅能发挥整机20%~30%的效率,优化空间巨大 [38] CPU生态格局:x86、Arm与RISC-V的挑战 - x86生态经过四五十年发展,拥有极高的市场占有率和生态惯性 [24] - 根据Gartner数据,基于x86软件的销售收入达3000多亿美元,而其年研发费用约600亿美元,远超全球服务器市场约800亿美元的总收入 [24] - Arm架构在服务器领域屡战屡败,其成功需要两个条件:掌握全栈技术的大公司弃用x86,以及端云融合促进应用迁移 [27] - RISC-V面临商业化困难,例如行业顶级人物Jim Keller创办的Tenstorrent公司已开始裁员,其芯片面临“不知卖给谁”的困境 [29] - RISC-V目前仅在软件简单的嵌入式场景(如存储控制器)应用较好,一旦进入计算领域则面临软硬件生态不成熟的多重问题 [29] - RISC-V在多核CPU所需的片上互联网络等硬件生态上尚不成熟,可能仍需依赖Arm的解决方案 [29] CUDA生态的壁垒与国产化必要性 - 硬件指令的直接支持对性能和能效始终有价值,Intel不断加入新指令即是例证 [32] - 兼容CUDA的API接口从技术角度看并不难,但复制其背后的完整软件生态(包括算力库、函数库、开发工具等)则极其困难 [32] - 国家层面已意识到生态建设的重要性,正在推动打造自主算力生态,以避免长期受制于人 [33] 芯片成功的核心:软件生态与差异化价值 - 在半导体发展放慢、中国面临制程限制的背景下,需通过跨学科交叉在系统、软件和算法层面寻求性能突破 [35] - 通过软件、编译和系统层面的优化,完全有可能在峰值性能较低的芯片上获得不错的应用效果 [44] - 实现AIGC生成影视内容等愿景,不仅需要GPGPU的计算能力,也需要GPU基础的图形渲染能力 [44] - 系统与平台厂商自研芯片能否成功,关键在于能否为产品和服务提供足够大的增值,以及能否掌控全栈软件体系 [44] - 苹果基于Arm自研芯片的成功,关键在于通过自研高性能芯片与自有软件体系结合,打造领先体验并实现产品高溢价 [45] - 架构创新不一定需要新指令系统,在现有指令体系(如RISC-V)下完全可以进行创新 [45] - 平台或系统厂商自研芯片必须有清晰的、能为系统或服务带来显著增值的差异化,否则使用成熟商用芯片是更理性的选择 [46] RISC-V的未来潜力与行业愿景 - RISC-V具备一定的包容性,有机会融合CPU、GPU和AI处理器的特性 [1] - 行业希望将RISC-V作为统一的指令系统方向,让各类处理器尽量统一到同一架构平台,以减少重复投入 [46] - 未来计算架构可能从当前的CPU+XPU异构体系,回归到以CPU为中心的新一体化架构 [47] - RISC-V有机会吸收开源体系的力量,逐步突破CUDA的生态壁垒 [47]
深圳理工大学唐志敏:异构计算已成必然,软件决定芯片胜负丨GAIR 2025
雷峰网·2025-12-24 03:19