行业核心观点 - 生成式AI产业正经历从“模型能力展示”到“Agent实际部署”的根本性转变,价值实现路径发生关键转折 [2][26] - 亚马逊云科技CEO指出,Agent的出现标志着AI从“技术奇迹的时代”转向“真正获得价值的时代” [2][26] - 尽管生成式AI服务广泛(如Amazon Bedrock已服务超10万家企业),但许多企业仍未看到相匹配的业务回报,而Agent被视为获得实质性商业回报的关键 [2][26] 基础设施与算力革命 - 亚马逊云科技推出基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器,最极致配置互联144颗Trainium 3芯片,提供362 PFLOPS(FP8)算力和超700TB/秒总带宽 [6][30] - Trainium 3服务器相比前代Trainium 2,计算性能提升4.4倍,内存带宽提升3.9倍,能效比(每兆瓦电力处理的AI token数量)提升5倍 [7][31] - 下一代Trainium 4芯片预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量 [8][32] - 公司已部署超过100万颗自研Trainium芯片,且Trainium 2的量产速度是此前芯片的4倍 [6][30] - 推出Amazon AI Factories服务,允许企业在自有数据中心部署专用AI基础设施,同时享受全套云服务,以平衡数据主权、合规与性能需求 [8][32] 模型生态与战略 - 亚马逊云科技采取多元化模型战略,不相信“一个模型统治一切”,过去一年Amazon Bedrock平台提供的模型数量已翻倍 [9][33] - 在2025 re:Invent新增的18款全托管开源模型中,包含4款中国顶尖模型(千问、DeepSeek、Kimi、MiniMax),中国模型占1/4席位 [9][33] - 推出自研Amazon Nova 2系列模型,包含四款新型号覆盖全场景需求 [10][34] - Nova 2 Lite:在指令遵循、工具调用、信息提取、代码生成能力上全面超越Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量模型,仅编程能力略逊于GPT-5 mini [10][34] - Nova 2 Pro:支持文字、图像、视频、语音输入和文本输出,在两项Agent基准测试中表现超过GPT-5.1(high)、Gemini 3 Pro Preview(high) [10][34] - Nova 2 Sonic:语音转语音模型,在语音理解和推理任务上性能超过GPT Realtime、Gemini 2.5 Flash [10][34] - Nova 2 Omni:业界首个支持文本、图像、视频、音频输入,并支持文本和图像生成输出的推理模型 [11][35] 数据与模型融合技术 - 传统RAG技术存在局限,无法让模型真正“理解”企业深层次领域知识 [13][37] - 推出革命性服务Amazon Nova Forge,引入“开放式训练模型”概念,允许企业在模型训练任意阶段将专有数据与训练数据集混合,创建名为“Novellas”的定制模型 [14][38] - 该服务解决了传统微调中教授新知识与避免遗忘核心能力的矛盾,并支持使用远程奖励函数和强化学习进行微调 [17][41] - 索尼作为早期采用者,通过对Nova 2 Lite微调创建了深度理解自身业务的模型,目标是将合规审查和评估流程效率提升100倍 [17][41] 前沿Agent与应用 - 推出三类“前沿Agent”,代表AI能力向自主、可扩展、长期运行的阶跃式提升 [17][41] - Kiro autonomous agent:能自主处理复杂任务,如升级关键库时自动识别受影响服务、更新代码、运行测试等。一个内部案例显示,原需30名开发者18个月的重架构项目,使用Kiro后仅需6人76天完成 [18][42] - Amazon Security Agent:持续、主动的内置AI安全专家,将安全实践从“事后检查”变为“持续嵌入” [19][43] - Amazon DevOps Agent:重新定义运维响应机制,能立即诊断警报根本原因并提供修复方案 [19][43] - Agent开发基础设施Amazon Bedrock AgentCore SDK预览版发布5个月内,下载量超过200万次 [19][43] - 新增两项关键功能以应对企业部署核心关切: - Amazon AgentCore Policy(预览版):为Agent与企业工具及数据的交互提供实时确定性控制,允许开发者通过自然语言定义行为界限 [19][43] - Amazon AgentCore Evaluations(预览版):全托管服务,可根据实际行为持续检查Agent质量,支持内置评估器与定制评分系统 [22][46] 全栈能力与平台支撑 - 亚马逊云科技在2025 re:Invent上共公布25个新发布,覆盖计算、存储、数据库、大数据、安全等多个领域,为企业Agent部署提供支撑 [23][47] - 公司正在构建支持Agent从实验到落地生产的完整平台,其“全家桶”式的全栈能力被认为是企业将AI投资转化为实际业务回报所需的基础设施 [23][47]
数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”