核心观点 - AWS在re:Invent 2025大会上正式发布了第三代自研AI训练芯片Trainium3及配套的UltraServer系统,并预告了下一代Trainium4芯片的研发计划,旨在提升性能、能效并增强与英伟达生态的互操作性,以降低客户AI云服务成本并扩大市场吸引力 [1][2][7] 产品发布与性能规格 - AWS正式推出由3纳米制程Trainium3芯片驱动的Trainium3 UltraServer系统 [2] - 第三代芯片和系统在AI训练和推理性能上相比第二代有大幅提升 [2] - 系统速度提升超过4倍,内存容量增加4倍,不仅能用于训练,还能在需求高峰时交付AI应用 [3] - 数千台UltraServer可互联,为一个应用提供高达100万颗Trainium3芯片,是上一代连接能力的10倍 [3] - 每台UltraServer可搭载144颗芯片 [3] 能效与成本优势 - Trainium3芯片和系统比上一代能效提高40% [4] - 提升能效符合AWS在数据中心电力消耗激增背景下的直接利益,并延续了亚马逊的成本控制理念 [4] - 公司承诺这些系统能为使用其AI云服务的客户节省资金 [4] - 客户如Anthropic、日本LLM Karakuri、Splashmusic和Decart已在使用第三代芯片和系统,并显著降低了推理成本 [5] 技术路线图与生态整合 - AWS已着手开发下一代芯片Trainium4 [1][7] - Trainium4承诺将在性能上再次实现重大飞跃,并支持英伟达的NVLink Fusion高速芯片互连技术 [7] - 这意味着基于Trainium4的系统将能够与英伟达GPU互操作并扩展性能,同时仍使用亚马逊自研的低成本服务器机架技术 [7] - 支持英伟达技术可能有助于吸引那些基于英伟达GPU构建的大型AI应用迁移至亚马逊云平台 [8] - 公司未公布Trainium4的具体时间表,但若遵循以往的发布节奏,预计在明年的大会上会有更多信息 [9]
Amazon releases an impressive new AI chip and teases a Nvidia-friendly roadmap