Amazon EC2 Trainium 3 UltraServers
搜索文档
数十亿AI员工上岗倒计时,云计算一哥“没有魔法,只有真能解决问题的Agent”
36氪· 2025-12-04 01:41
行业核心观点 - AI产业价值实现路径正从“模型能力展示”转向“Agent实际部署”,进入真正获得价值的时代 [1] - 尽管生成式AI服务了超过10万家企业,处理了超1万亿tokens,但许多企业仍未看到AI投资带来相匹配的业务回报 [1] - 未来每个公司内部和每个可以想象的领域都会有数十亿的Agent [3] AI基础设施与算力革命 - 亚马逊云科技自研芯片性能大幅提升,已部署超过100万颗自研Trainium芯片,Trainium 2的量产速度是此前芯片的4倍 [5] - 最新Amazon EC2 Trainium 3 UltraServers服务器提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽,计算性能相比前代提升4.4倍,内存带宽提升3.9倍,能效比提升5倍 [5][6] - 下一代Trainium 4预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量 [8] - 推出Amazon AI Factories服务,允许企业在自己数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理 [8] 模型生态战略 - 亚马逊云科技采用多元化模型战略,不相信会有一个模型统治一切,过去一年Amazon Bedrock平台提供的模型数量翻倍 [9] - 2025 re:Invent新增18款全托管开源模型,包含4款中国顶尖模型(千问、DeepSeek、Kimi、MiniMax),中国模型占1/4席位 [9] - 自研Amazon Nova 2系列模型覆盖从轻量推理到复杂多模态全场景需求,其中Nova 2 Pro在两项Agent基准测试中表现超过GPT-5.1和Gemini 3 Pro Preview [9][10] 数据与模型融合技术 - 推出革命性Amazon Nova Forge服务,引入“开放式训练模型”概念,企业可在模型训练任意阶段将专有数据与训练数据集混合,创建定制模型 [13][14] - 该服务解决了传统微调中的核心矛盾,避免模型“遗忘”已掌握的核心推理能力,还提供使用远程奖励函数和强化学习微调的能力 [16] - 早期采用者索尼通过微调Amazon Nova 2 Lite模型,目标是将合规审查和评估流程的效率提升100倍 [16] Agent前沿部署与应用 - 推出三类“前沿Agent”:Kiro autonomous agent、Amazon Security Agent、Amazon DevOps Agent,代表AI能力的阶跃式提升 [17] - Kiro autonomous agent能自主处理复杂任务,案例显示原本需要30名开发者18个月完成的重架构项目,使用后仅需6人76天完成 [17] - Amazon Bedrock AgentCore自SDK预览版发布以来,5个月内下载量超过200万次,新增AgentCore Policy和AgentCore Evaluations功能以应对企业部署核心关切 [19][22] - 此外还公布了25个新发布,覆盖计算、存储、数据库、大数据、安全等多个领域,为Agent部署提供稳定支撑 [23]
数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”
新浪财经· 2025-12-03 13:24
行业核心观点 - 生成式AI产业正经历从“模型能力展示”到“Agent实际部署”的根本性转变,价值实现路径发生关键转折 [2][26] - 亚马逊云科技CEO指出,Agent的出现标志着AI从“技术奇迹的时代”转向“真正获得价值的时代” [2][26] - 尽管生成式AI服务广泛(如Amazon Bedrock已服务超10万家企业),但许多企业仍未看到相匹配的业务回报,而Agent被视为获得实质性商业回报的关键 [2][26] 基础设施与算力革命 - 亚马逊云科技推出基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器,最极致配置互联144颗Trainium 3芯片,提供362 PFLOPS(FP8)算力和超700TB/秒总带宽 [6][30] - Trainium 3服务器相比前代Trainium 2,计算性能提升4.4倍,内存带宽提升3.9倍,能效比(每兆瓦电力处理的AI token数量)提升5倍 [7][31] - 下一代Trainium 4芯片预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量 [8][32] - 公司已部署超过100万颗自研Trainium芯片,且Trainium 2的量产速度是此前芯片的4倍 [6][30] - 推出Amazon AI Factories服务,允许企业在自有数据中心部署专用AI基础设施,同时享受全套云服务,以平衡数据主权、合规与性能需求 [8][32] 模型生态与战略 - 亚马逊云科技采取多元化模型战略,不相信“一个模型统治一切”,过去一年Amazon Bedrock平台提供的模型数量已翻倍 [9][33] - 在2025 re:Invent新增的18款全托管开源模型中,包含4款中国顶尖模型(千问、DeepSeek、Kimi、MiniMax),中国模型占1/4席位 [9][33] - 推出自研Amazon Nova 2系列模型,包含四款新型号覆盖全场景需求 [10][34] - **Nova 2 Lite**:在指令遵循、工具调用、信息提取、代码生成能力上全面超越Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量模型,仅编程能力略逊于GPT-5 mini [10][34] - **Nova 2 Pro**:支持文字、图像、视频、语音输入和文本输出,在两项Agent基准测试中表现超过GPT-5.1(high)、Gemini 3 Pro Preview(high) [10][34] - **Nova 2 Sonic**:语音转语音模型,在语音理解和推理任务上性能超过GPT Realtime、Gemini 2.5 Flash [10][34] - **Nova 2 Omni**:业界首个支持文本、图像、视频、音频输入,并支持文本和图像生成输出的推理模型 [11][35] 数据与模型融合技术 - 传统RAG技术存在局限,无法让模型真正“理解”企业深层次领域知识 [13][37] - 推出革命性服务Amazon Nova Forge,引入“开放式训练模型”概念,允许企业在模型训练任意阶段将专有数据与训练数据集混合,创建名为“Novellas”的定制模型 [14][38] - 该服务解决了传统微调中教授新知识与避免遗忘核心能力的矛盾,并支持使用远程奖励函数和强化学习进行微调 [17][41] - 索尼作为早期采用者,通过对Nova 2 Lite微调创建了深度理解自身业务的模型,目标是将合规审查和评估流程效率提升100倍 [17][41] 前沿Agent与应用 - 推出三类“前沿Agent”,代表AI能力向自主、可扩展、长期运行的阶跃式提升 [17][41] - **Kiro autonomous agent**:能自主处理复杂任务,如升级关键库时自动识别受影响服务、更新代码、运行测试等。一个内部案例显示,原需30名开发者18个月的重架构项目,使用Kiro后仅需6人76天完成 [18][42] - **Amazon Security Agent**:持续、主动的内置AI安全专家,将安全实践从“事后检查”变为“持续嵌入” [19][43] - **Amazon DevOps Agent**:重新定义运维响应机制,能立即诊断警报根本原因并提供修复方案 [19][43] - Agent开发基础设施Amazon Bedrock AgentCore SDK预览版发布5个月内,下载量超过200万次 [19][43] - 新增两项关键功能以应对企业部署核心关切: - **Amazon AgentCore Policy(预览版)**:为Agent与企业工具及数据的交互提供实时确定性控制,允许开发者通过自然语言定义行为界限 [19][43] - **Amazon AgentCore Evaluations(预览版)**:全托管服务,可根据实际行为持续检查Agent质量,支持内置评估器与定制评分系统 [22][46] 全栈能力与平台支撑 - 亚马逊云科技在2025 re:Invent上共公布25个新发布,覆盖计算、存储、数据库、大数据、安全等多个领域,为企业Agent部署提供支撑 [23][47] - 公司正在构建支持Agent从实验到落地生产的完整平台,其“全家桶”式的全栈能力被认为是企业将AI投资转化为实际业务回报所需的基础设施 [23][47]