Workflow
GPU集群连接技术
icon
搜索文档
英伟达,为何重金收购这家芯片公司?
半导体行业观察· 2025-09-21 02:59
收购交易概览 - 英伟达于2025年9月以超过9亿美元的价格,收购了AI硬件初创公司Enfabrica的核心技术,交易采用现金与股票结合的方式[2][3] - 交易完成后,英伟达吸纳了Enfabrica的CEO罗尚・桑卡尔及多名核心技术人员,并获得了该公司全套技术的授权[3] - 此次收购是英伟达近期AI基础设施布局的一环,同期公司还宣布以50亿美元入股英特尔,并向英国数据中心初创公司Nscale投资近7亿美元[6] 被收购方Enfabrica背景 - Enfabrica成立于2019年,在收购前已完成多轮融资,2024年底C轮融资后估值约6亿美元,投资方包括Spark Capital、Arm、三星、思科等[3] - 公司核心产品围绕“AI超大规模连接”展开,主要包括ACF-S“千禧”超级网卡芯片与EMFASYS弹性内存fabric系统[4] 技术细节与优势 - **ACF-S芯片**:采用“PCIe + 高速以太网”双接口设计,一侧配备128条PCIe 5.0/6.0通道连接GPU,另一侧支持3.2Tbps以太网带宽,可将超过10万块GPU高效连接[4] - **EMFASYS系统**:通过CXL控制器支持4.5TB-18TB的共享DDR5内存池,GPU通过RDMA协议访问的读取延迟低至3微秒,仅为传统GPU直连存储延迟的1/50-1/200[5] - **成本效益**:EMFASYS内存成本为每GB 20美元,远低于GPU高带宽内存(HBM3e)每GB 100美元的成本,能将AI推理场景的“每token成本”降低50%,同时减少50%的GPU算力需求[5] - **高可靠性**:ACF-S芯片支持多路径冗余设计,单条链路故障仅损失约3%带宽,在52.4万块GPU的超大规模集群中,系统“首次故障时间”可达2.02×10^56小时,远超传统架构的5分钟[6] 行业背景与战略意义 - 此次交易是科技巨头“人才争夺战”的延续,Meta、谷歌等公司近期也通过“收购式招聘”吸纳AI顶尖团队,例如Meta在2025年6月以143亿美元收购Scale AI创始人团队并持股49%[3] - 随着大模型参数规模突破万亿,单集群GPU数量向数十万块迈进,高效连接与调度成为关键瓶颈,Enfabrica的技术填补了这一空白[7] - 英伟达将Enfabrica的技术视为对下一代GPU集群连接技术的提前锁定,其ACF-S芯片可与现有NVL72 GPU机架无缝适配,EMFASYS内存池能缓解HBM内存成本压力,有望巩固公司在超大规模AI集群市场的主导地位[7] - 此次收购延续了英伟达通过并购强化连接技术的路径,公司曾于2019年以69亿美元收购Mellanox,获得的高速网络技术至今仍是Blackwell系列GPU的核心组网基础[7] 商业化前景 - 加入英伟达为Enfabrica的技术提供了规模化优势,借助英伟达的全球供应链、客户渠道与研发资源,其技术有望更快实现商业化落地,覆盖数据中心、大模型训练、智能驾驶等核心场景[8] - 收购前,Enfabrica已启动ACF-S芯片的预生产采样,并有客户进入EMFASYS系统试点阶段[8]