AWS推出新一代AI芯片Trainium 3 - 公司发布第四代AI训练芯片Trainium 3,采用3纳米制程,专为下一代智能体、推理和视频生成应用设计[7] - 搭载Trainium 3的Trn3 UltraServer系统性能较第二代提升超过4倍,内存容量增加4倍[7] - 单颗芯片提供2.52 PFLOPs的FP8算力,内存容量提升1.5倍至144GB HBM3e,带宽提升1.7倍至4.9TB/s[8] - 完整配置服务器可容纳144颗芯片,总算力达362 PFLOPs,内存20.7TB,聚合带宽706TB/s[9] - 能效比前代提高40%,性能功耗比提升4倍,在Bedrock平台性能提升3倍,每兆瓦token输出增加超过5倍[9] Trainium 4开发计划与技术兼容性 - 预告下一代Trainium 4芯片,将支持英伟达NVLink Fusion高速互联技术[10] - 技术兼容性使AWS系统能与英伟达GPU互操作,降低基于英伟达的大型AI应用迁移门槛[11] - 未公布具体发布时间表,预计明年re:Invent大会将有更多信息[12] 软件生态挑战与客户情况 - 与英伟达相比缺乏深度软件库,面临生态系统挑战[13] - 主要客户Anthropic已使用超过50万颗芯片,计划年底前提供100万颗芯片[14] - 其他客户包括日本的Karakuri、Splashmusic和Decart,使用第三代芯片显著降低推理成本[15] - 通过AWS Neuron SDK和原生PyTorch集成试图缩小软件生态差距[16] Nova 2系列模型发布 - 推出四款Nova 2模型,涵盖推理、多模态处理、对话式AI和代码生成领域[3] - Nova 2 Lite在15项测试中13项优于或持平Claude Haiku 4.5,17项测试中11项优于或持平GPT-5 Mini[18] - Nova 2 Pro在16项测试中10项优于或持平Claude Sonnet 4.5,16项测试中8项优于或持平GPT-5.1[19] - Nova 2 Sonic支持实时语音对话,拥有100万token上下文窗口,支持多语言[20] - Nova 2 Omni可同时处理75万单词、数小时音频、长视频和数百页文档[21] Nova Forge开放式训练服务 - 首创"开放式训练"模式,让企业构建Nova模型定制版本[22] - 提供预训练、中期训练和后训练模型检查点独家访问权限[22] - 客户包括Reddit、Booking.com、Cosine AI等,Reddit用其改进内容审核系统[23] - 提供强化学习环境、创建小模型选项和负责任AI工具包三项核心功能[23] Nova Act浏览器自动化服务 - 新服务用于构建高可靠性AI代理,在浏览器中执行操作[24] - 由定制Nova 2 Lite模型驱动,早期客户工作流程实现90%可靠性[24] - 1Password用其减少登录手动步骤,Hertz将软件交付速度提高5倍[26] - 开发人员可通过自然语言提示快速原型设计,在VS Code中完善代理[26] 市场反应与竞争影响 - 消息公布后亚马逊股价日内涨幅扩大至近2.2%,英伟达涨幅收窄,AMD跌近1.7%[3] - 公司宣称Trainium芯片能以比英伟达GPU更低廉高效的方式为AI模型提供动力[2] - 芯片推出速度超出常规,部署前代产品约一年后即发布Trainium 3[1]
亚马逊重磅发布!挑战谷歌英伟达