Workflow
NVIDIA Rubin Ultra
icon
搜索文档
一颗2nm芯片发布,吊打英伟达
半导体行业观察· 2025-11-13 01:35
核心观点 - Tachyum公司发布2nm Prodigy芯片,宣称其性能大幅超越英伟达即将推出的Rubin Ultra平台,AI推理性能超过1000 PFLOPs,比NVIDIA Rubin快21倍[2][6] - 该芯片采用多芯片设计,最高集成1024个64位核心,时钟频率达6GHz,支持超高速DDR5内存和PCIe 7.0,目标市场包括大型AI、高性能计算、云计算等领域[2][9][10][18] - 公司计划2025年完成芯片流片,但此前已多次延期,实际性能和市场前景仍有待验证[45][47] 芯片规格与性能 - Prodigy 2nm芯片提供11种SKU配置,核心数从32到1024个,TDP范围30W至1600W,最高支持24个DDR5-17600内存控制器和128条PCIe 7.0通道[11][13] - 芯片集成1MB L2+L3缓存,每个插槽最高支持48TB DDR5内存,采用乱序执行架构,每时钟周期可执行8条指令[10][13] - 与NVIDIA Rubin Ultra相比,Prodigy Ultimate的AI机架性能高21.3倍,Prodigy Premium比NVIDIA Rubin高25.9倍[6] 技术优势与设计特点 - 公司通过升级至2nm工艺,实现整数性能提升5倍,AI性能提升16倍,DRAM带宽提升8倍,能效提升2倍,同时降低每个核心成本[9] - 芯片采用多芯片系统级封装设计,每个计算芯片含256个通用核心,通过缩短导线长度优化时钟频率和散热[9][28][30] - 芯片支持最新矩阵和向量扩展,专为AI和HPC应用设计,并开源所有软件及内存技术,使基于DIMM的内存带宽提升10倍[10][17] 市场定位与应用前景 - Prodigy芯片定位为通用处理器,可覆盖大型AI、百亿亿次超级计算、HPC、数字货币、云计算、大数据分析等多类应用[18] - 公司宣称其解决方案可比传统AI方案大幅降低成本,从超过8万亿美元降至780亿美元,电力需求从276GW降至1GW[18] - 芯片提供开箱即用的原生系统软件,支持运行未经修改的Intel/AMD x86二进制文件,确保客户从第一天起即可使用[18] 公司背景与研发历程 - Tachyum由资深行业专家创立,CEO Radoslav Danilak曾任职于英伟达并设计PlayStation 2处理器,团队在芯片设计和编译器开发方面经验丰富[20][23][24] - 公司自2016年成立以来,Prodigy芯片设计已多次延期,从最初计划的2019年流片推迟至2025年,近期获得2.2亿美元投资及5亿美元采购订单[21][45][47][49] - 公司通过FPGA硬件和1600页优化指南帮助开发者提前适配,强调芯片在AI、云计算和HPC工作负载上的性能优势[47][48]