Workflow
GPNPU
icon
搜索文档
云天励飞董事长陈宁:AI推理时代已至 推理芯片崛起将是中国科技复兴巨大机遇
每日经济新闻· 2025-12-29 12:34
当对话式人工智能工具——ChatGPT点燃的全球AI(人工智能)训练竞赛逐渐开始白热化,一个更深层 次的产业变革悄然发生。2025年,被业界普遍视为"AI应用大爆发的元年",智能体(Agent)正从概念 走向现实。而在应用爆发的背后,是百倍增长的推理算力需求与高昂成本之间的尖锐矛盾。在这场 由"训练"转向"推理"的算力范式革命中,中国AI芯片产业能否抓住历史性机遇? 在日前举办的雪球嘉年华会议期间,云天励飞董事长兼CEO(首席执行官)陈宁在接受《每日经济新 闻》记者专访时表示,人工智能就像当年的第一台蒸汽机、第一个灯泡、第一台计算机,可以说,人工 智能是未来五年科技突破的关键。 陈宁认为,中国在算法上已能够将跟世界先进水平之间的差距缩短至数月,甚至在应用、数据、能源、 系统集成方面更有优势。 在陈宁看来,推理芯片赛道是中国实现"超车"的关键。这场关于重新定义算力的竞赛才刚刚吹响号角, 中国第一次与全球站在相近的起跑线。"我们有机会,也必须抓住这个机会。" 推理芯片展现巨大潜力 在陈宁看来,人工智能产业的发展可以清晰地划分为三个阶段。 第一阶段是2012年至2020年的"智能感知"时代,以小模型驱动特定场景的解 ...
云天励飞董事长陈宁:AI推理时代已至 推理芯片崛起将是中国科技复兴巨大机遇
每日经济新闻· 2025-12-29 12:33
人工智能产业发展阶段 - 人工智能产业发展可划分为三个阶段:2012至2020年为“智能感知”时代,以小模型驱动特定场景解决方案为主,市场碎片化[4];2020至2025年为AIGC时代,大模型展现强大内容生成能力,行业寻找盈利闭环[4];2025年进入第三个阶段“代理式人工智能(Agentic AI)时代”,其核心特征是大模型、操作系统与硬件深度融合的智能体(Agent)引发应用爆发[4] 算力范式革命与产业机遇 - 2025年被视为AI应用爆发元年,应用爆发背后是百倍增长的推理算力需求与高昂成本之间的矛盾[1] - 算力范式正从以训练为主转向以推理为主,这是根本性转折,训练追求极致性能,而推理大规模商业化必须追求极高的性价比[5] - 推理芯片赛道的崛起打破了英伟达凭借CUDA生态和GPGPU在训练时代建立的垄断格局,谷歌TPU战略明确“训推分离”,博通为Meta、OpenAI定制推理芯片,证明了该赛道的独立性与巨大潜力[6] - 推理芯片是中国实现“超车”的关键机遇,全球刚刚起步,游戏规则不同,中国在应用、数据、能源、系统集成方面有优势,更擅长为用户提供高性价比产品[3][6] 推理芯片的技术挑战与架构创新 - 推理任务的计算范式发生根本变化,尤其是Prefill(预填充)和Decode(解码)两个阶段对算力和带宽需求不同,传统GPGPU架构面临瓶颈[7] - 云天励飞提出了新的GPNPU芯片架构,旨在融合三大核心能力:顶层结合GPGPU的SIMT编程范式以兼容CUDA生态;结合指令集微架构设计优化矩阵计算硬件;基于国产工艺和先进封装技术打破内存瓶颈并降低成本[7] - GPNPU目标是在计算算力、存储带宽、存储容量三者间实现更优配比,通过提升单位硅芯片面积的计算性能、降低模型迁移成本、提升硬件利用率以及实现高能效低功耗,全方位降低用户的总体拥有成本[7] 推理需求的规模与成本目标 - 以豆包大模型为例,其日均Token处理量已达50万亿且增速惊人,即便以此为基础不再增长,大规模在线推理的资本与运营开支也非常可观[8] - 若Token规模短期继续上行,明年上半年可能触及100万亿,在单位能效无显著改善的情况下,电力与散热等基础设施压力可能出现“千倍级”跃迁[8] - 为支撑AI规模化、产业化,需在较短周期内把“百万Token”的推理综合成本降低到“一分钱”级别,这需要通过架构革命和工艺创新实现[8]