直面AI泡沫争议,亚马逊云科技交出了一份实干答卷

文章核心观点 - AI技术正经历从对话机器人到自主智能体(Agent)的范式转移,AI正以“数字化员工”身份嵌入企业核心业务流 [1] - 资本市场在狂热后回归冷静,开始严肃审视AI基础设施的巨额资本支出与短期营收增长不成比例的问题,市场关注点转向AI能否成为成本可控、生产力明确的工具 [1] - 亚马逊云科技通过2025年re:Invent大会,以工程化思维系统性地回应市场对成本与落地性的焦虑,提供了一套从底层基础设施到上层应用、旨在重构AI成本模型与推动规模化落地的解决方案 [1][2] 行业趋势与市场环境 - AI角色发生根本性质变:从被动响应进化为具备自主思考、任务拆解与工具调用能力的智能主体 [1] - 企业AI应用需求转变:从迷信单一超级模型转向寻找适合特定业务场景、性价比最高的模型组合 [11] - 企业面临遗留系统现代化挑战:据艾哲森统计,企业每年约70%的IT预算用于维护遗留系统,形成了高达数万亿美元的“技术债” [24] 基础设施创新:算力与存储 - 存储能力升级:Amazon S3单个对象最大容量从5TB提升至50TB,简化了千亿参数模型的保存与加载流程 [3] - 向量存储革新:新发布的Amazon S3 Vectors允许直接存储管理数万亿级向量数据,将存储与查询总体成本降低90% [4] - 向量检索加速:Amazon OpenSearch Service新增GPU向量索引加速功能,索引创建速度提升10倍,成本仅为原来的四分之一 [4] - 计算双轨策略:一方面与NVIDIA深度合作,推出搭载GB300 NVL72系统的EC2 P6e实例,并托管NVIDIA的Project Ceiba集群;另一方面加速自研芯片部署以提供极致性价比 [6] - 自研芯片进展:公司已部署超过100万片自研芯片,其中Trainium2的部署速度达到前代产品的4倍 [7] - 新一代自研芯片性能:基于Trainium 3的EC2 Trn3 UltraServers相比前代带来4.4倍计算能力和3.9倍内存带宽提升,每兆瓦功耗处理的token数量提升5倍 [9] - 未来芯片规划:正在研发的Amazon Trainium 4预计将带来6倍的FP4计算性能 [9] - 基础设施新理念:提出“数据园区即计算机”构建理念,Claude最新模型所依赖的Project Rainier即基于此理念构建 [9] - 混合部署方案:推出Amazon AI Factories,允许在企业自有数据中心内由公司建设管理隔离的AI基础设施,兼顾安全与效率 [10] 模型生态与战略 - 模型平台规模:全托管生成式AI服务平台Amazon Bedrock已拥有超过10万家客户 [11] - 模型生态扩展:平台新增包括Google Gemma 3、NVIDIA Nemotron和OpenAI GPT OSS Safeguard等在内的18款开源模型 [11] - 引入中国领先模型:平台在已有DeepSeek和阿里千问基础上,正式引入Kimi K2 Thinking和MiniMax M2模型,为出海企业提供全球统一基础设施调用本土优势模型的便利 [13] - 自研模型矩阵发布:推出全新的Amazon Nova 2系列模型,旨在解决企业具体痛点而非刷榜 [14] - 低成本模型:Nova 2 Lite专为高频次、低复杂度任务设计,将推理成本压缩到极致,现场演示仅用几分钟就从零构建完整房地产管理系统 [14] - 高性能模型:Nova 2 Pro专为深度推理等复杂场景,在多项基准测试中强于Claude Sonnet 4.5、GPT 5.1和预览版Gemini 3 Pro [15] - 多模态模型:Nova 2 Omni为首个统一多模态模型,能同时支持文本、图像、视频和音频输入,并输出文本和图像 [15] - 语音模型:Nova 2 Sonic能实现毫秒级实时对话体验,适用于呼叫中心等场景 [15] 智能体(Agent)开发与落地 - 标准化开发平台:推出Amazon Bedrock AgentCore,旨在将Agent开发从“手工艺术”变为标准化工业生产 [16][17] - 多Agent协作范式:通过“贷款审批”案例展示,将复杂业务流拆解为由Intake、Analyze、Underwriting等多个各司其职的Agent协作完成 [18] - 灵活模型调度:允许在同一业务流的不同环节,根据成本与性能需求灵活指派不同模型(如Nova 2 Pro、Claude 3.5 Sonnet) [18] - 企业系统集成:AgentCore能深度连接企业IT系统,如从DynamoDB、S3及第三方API实时查询数据 [19] - 安全与可控性:引入基于Cedar语言的Policy功能,可设定刚性策略(如“退款超1000元须转人工”)以约束Agent行为 [20] - 质量评估体系:AgentCore Evaluations内置13种评估器,可从准确性、安全性等多维度对Agent进行自动化测试与量化评估 [20] 企业级应用与生产力工具 - 办公效率套件:推出Amazon Quick Suite,能穿透企业内部各类办公套件与业务软件,串联分散数据资产,变“人找数据”为“数据找人” [21][22] - 智能客服升级:Amazon Connect引入Agentic AI能力与Nova 2 Sonic模型,使客服Agent具备理解情绪、处理复杂非线性任务(如退换货)的行动力 [23] - 遗留系统现代化:推出Amazon Transform,能理解业务逻辑依赖,将遗留代码(如150万行Windows代码)自动迁移至现代云环境,新发布的Custom功能允许通过自然语言自定义转换规则 [24] - 软件开发自动化:推出Kiro Autonomous Agent、Amazon Security Agent和Amazon DevOps Agent,标志着软件开发向“人定目标、机器实现”的自主化进阶转变 [25][27]