苹果首款AI服务器芯片曝光,联手博通
苹果AI服务器芯片开发计划 - 苹果正在开发首款代号为"Baltra"的AI服务器芯片,旨在避免从英伟达购买芯片,以控制成本[1] - 该芯片是与博通合作开发,并采用台积电3nm工艺,预计2026年量产,2027年实际部署[1] - 苹果此举被描述为“宁愿重新发明芯片,也不愿为英伟达的高额利润买单”[1] 芯片定位与架构推测 - Baltra芯片预计主要用于满足AI推理需求,而非模型训练[1][2] - 推理芯片架构更注重时延与吞吐量优化,并可能采用基于低精度运算的设计,如INT8精度[2] - 有推测认为,苹果可能不会打造大规模算力集群,而是推出类似英伟达GB300架构的产品,采用64颗芯片互连并搭配大容量高带宽LPDDR内存,以降低成本并匹配需求[2] 公司AI战略与合作 - 苹果预计不会自己训练大模型,已放弃打造内部大模型,选择每年支付约10亿美元使用谷歌定制的1.2万亿参数Gemini模型[2] - 公司是垂直集成的爱好者,倾向于将关键技术节点保留在内部,庞大的定制芯片设计项目是这一范式的例证[1] - 自主研发AI服务器芯片旨在优化其AI算法,以提升产品AI性能和能效,增强在AI领域的竞争力[7] 潜在技术方向与专利 - 苹果去年3月提交了“基于光学的分布式统一内存系统”专利,该专利涉及硅光子学计算系统[4] - 专利描述的计算系统包含多个计算芯片封装单元和内存芯片封装单元,通过光接口和内存控制器实现分布式内存的统一访问[4] - 该技术方案可能暗示了苹果未来在芯片内存架构方面的发展方向[4]