Workflow
Kiro autonomous agent
icon
搜索文档
拐点来临!亚马逊云科技开启Agent时代,数十亿Agents重构产业生产范式
第一财经· 2025-12-10 10:44
文章核心观点 - AI Agent技术正处于从“技术奇迹”向提供实际业务价值的“实用工具”的关键转折点,未来将有数十亿Agents在各行各业运行,帮助企业实现10倍效率提升 [1] - 云计算下半场的核心命题是将算力转化为生产力,AI Agent正成为竞争新战场,行业焦点从“谁训练出最强大模型”转向“谁能让AI真正进入企业生产流程” [3] - 亚马逊云科技的战略已超越单一芯片或模型的竞赛,致力于构建覆盖基础设施、大模型到Agent工具链的全栈工程化能力,目标是成为支撑社会经济智能转型的“价值实现平台” [9][19] - AI商业化已进入“实用主义”阶段,其最大价值在于解决旧问题而非创造新东西,AI正成为企业运营的“新一代自动化”底座,企业关注点转向如何安全、可控、可衡量地用AI解决具体业务痛点 [10][14] - AI竞争的下半场将从技术标杆竞赛转向生态系统与落地能力的较量,焦点在于提供完整的工具链、丰富的模型选择和安全的部署环境 [19] 行业趋势与转折 - 2025年,AI产业叙事发生转变,从追逐参数规模和Benchmark排名,转向关注如何让AI进入企业生产流程并将算力转化为生产力 [3] - AI商业化落地正从面向消费者的、显性的“应用创新”,坚定地转向面向企业的、隐性的“过程创新”,企业评估标准从技术新奇度彻底转向投资回报率与安全合规保障 [15] - 在资本市场狂热与疑虑交织的背景下,行业逐渐认识到,真正的价值产生于AI技术与复杂业务流程的安全、可靠、深度集成,最终表现为成本降低、效率提升或收入增长 [16] 亚马逊云科技的全栈AI战略 - **自研芯片与能效比优化**:公司系统性地披露了覆盖基础设施、大模型到Agent工具链的全栈创新图谱 [4] 自研芯片Amazon Trainium系列快速迭代,核心锚定“能效比”指标 [4] Amazon Trainium3 UltraServers是首款搭载3纳米工艺AI芯片的服务器,计算能力比Trainium2提升4.4倍,内存带宽提升3.9倍,每兆瓦算力处理的AI token数量提升5倍 [4] 在运行GPT-OSS-120B模型时,每兆瓦输出token数是上一代的5倍以上 [4] 首次披露的Trainium4芯片,承诺将较上一代实现6倍的FP4计算性能、4倍内存带宽和2倍高内存容量 [5] - **开放的模型生态**:Amazon Bedrock平台新增众多开源模型,一年间模型数量近乎翻倍,为企业提供丰富的“货架式选择” [8] 自研Amazon Nova 2系列基础模型家族覆盖多细分场景,其中Nova 2 Omni是业界首个支持文本、图像、视频和语音输入,同时生成文本和图像输出的推理模型 [8] - **AI Agent工具与平台**:发布一系列旨在降低Agent构建门槛、确保安全可控、并拓展其能力边界的前沿工具 [9] 前沿Agent必须具备自主决策、横向扩展、长时运行三大特征,成为能主动完成端到端任务的“数字员工” [8] Amazon Bedrock AgentCore提供控制策略、可观测性与评估框架,确保Agent在高度自动化下满足严苛的审计、合规与行为可追溯要求 [13] - **战略定位演进**:公司目标不仅是提供算力资源,更是成为帮助企业治理、控制和规模化其AI能力的战略伙伴与“赋能平台” [9][19] 其全栈布局凸显了云计算核心属性(安全性、高可用性、弹性与成本优化)在AI时代更为关键 [9] AI Agent的实际应用与商业价值 - **自动化与效率提升**:AI Agent作为一种新型生产力工具,其价值首先体现在对复杂、重复工作的自动化 [10] 例如,技术债务每年在美国造成约2.4万亿美元成本,70%的IT预算用于维护历史系统 [10] - **具体案例与效果**: - **技术债务清理**:Amazon Transform custom帮助客户从VMware、大型机等历史平台迁移,全栈Windows现代化速度提升5倍,消除70%的维护成本 [10] 该产品已分析十多亿行大型机代码 [10] 加拿大航空、Experian等企业正使用该产品以减少技术债务 [12] - **内部流程优化**:索尼基于亚马逊云科技构建的Data Ocean每天处理来自500多个数据源的760TB数据 [12] 其使用Amazon Bedrock构建的企业大语言模型拥有57000名用户,每天处理超过15万个推理请求 [12] 通过微调Amazon Nova 2 Lite模型,目标是将合规审查与评估流程效率提升100倍 [12] - **数据安全与运维**:Druva通过AI Agent,使客户在数据备份失败时能从手动排查日志数小时变为获得即时分析和数据恢复 [13] - **金融行业部署**:S&P Global的内部Agentic工作流平台Astra将新应用部署时间从“几周”压缩至“几分钟” [13] - **价值本质**:AI Agent的价值不仅是效率提升,更是业务模式的重构,让企业团队能专注于更高价值的创新 [13] 这些案例的投资回报率更容易说服企业买单 [13] 合作伙伴案例与生态系统 - **Adobe的AI转型**:Adobe将生成式AI深度集成于其产品,90%以上创作者已积极使用生成式AI工具 [18] 其转型与亚马逊云科技的深度合作息息相关,后者提供了从Amazon EC2、S3到SageMaker和Bedrock的全栈工具集,使Adobe能专注于释放用户创造力 [18][19] - **生态竞争焦点**:竞争的焦点在于谁能提供最完整的工具链、最丰富的模型选择和最安全的部署环境,让百万企业能够真正用好AI [19]
数十亿AI员工上岗倒计时,云计算一哥“没有魔法,只有真能解决问题的Agent”
36氪· 2025-12-04 01:41
行业核心观点 - AI产业价值实现路径正从“模型能力展示”转向“Agent实际部署”,进入真正获得价值的时代 [1] - 尽管生成式AI服务了超过10万家企业,处理了超1万亿tokens,但许多企业仍未看到AI投资带来相匹配的业务回报 [1] - 未来每个公司内部和每个可以想象的领域都会有数十亿的Agent [3] AI基础设施与算力革命 - 亚马逊云科技自研芯片性能大幅提升,已部署超过100万颗自研Trainium芯片,Trainium 2的量产速度是此前芯片的4倍 [5] - 最新Amazon EC2 Trainium 3 UltraServers服务器提供362PFLOPS(FP8)算力和超过700TB/秒的总带宽,计算性能相比前代提升4.4倍,内存带宽提升3.9倍,能效比提升5倍 [5][6] - 下一代Trainium 4预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量 [8] - 推出Amazon AI Factories服务,允许企业在自己数据中心部署专用AI基础设施,同时享受亚马逊云科技的全套服务和管理 [8] 模型生态战略 - 亚马逊云科技采用多元化模型战略,不相信会有一个模型统治一切,过去一年Amazon Bedrock平台提供的模型数量翻倍 [9] - 2025 re:Invent新增18款全托管开源模型,包含4款中国顶尖模型(千问、DeepSeek、Kimi、MiniMax),中国模型占1/4席位 [9] - 自研Amazon Nova 2系列模型覆盖从轻量推理到复杂多模态全场景需求,其中Nova 2 Pro在两项Agent基准测试中表现超过GPT-5.1和Gemini 3 Pro Preview [9][10] 数据与模型融合技术 - 推出革命性Amazon Nova Forge服务,引入“开放式训练模型”概念,企业可在模型训练任意阶段将专有数据与训练数据集混合,创建定制模型 [13][14] - 该服务解决了传统微调中的核心矛盾,避免模型“遗忘”已掌握的核心推理能力,还提供使用远程奖励函数和强化学习微调的能力 [16] - 早期采用者索尼通过微调Amazon Nova 2 Lite模型,目标是将合规审查和评估流程的效率提升100倍 [16] Agent前沿部署与应用 - 推出三类“前沿Agent”:Kiro autonomous agent、Amazon Security Agent、Amazon DevOps Agent,代表AI能力的阶跃式提升 [17] - Kiro autonomous agent能自主处理复杂任务,案例显示原本需要30名开发者18个月完成的重架构项目,使用后仅需6人76天完成 [17] - Amazon Bedrock AgentCore自SDK预览版发布以来,5个月内下载量超过200万次,新增AgentCore Policy和AgentCore Evaluations功能以应对企业部署核心关切 [19][22] - 此外还公布了25个新发布,覆盖计算、存储、数据库、大数据、安全等多个领域,为Agent部署提供稳定支撑 [23]
数十亿AI员工上岗倒计时!云计算一哥“没有魔法,只有真能解决问题的Agent”
新浪财经· 2025-12-03 13:24
行业核心观点 - 生成式AI产业正经历从“模型能力展示”到“Agent实际部署”的根本性转变,价值实现路径发生关键转折 [2][26] - 亚马逊云科技CEO指出,Agent的出现标志着AI从“技术奇迹的时代”转向“真正获得价值的时代” [2][26] - 尽管生成式AI服务广泛(如Amazon Bedrock已服务超10万家企业),但许多企业仍未看到相匹配的业务回报,而Agent被视为获得实质性商业回报的关键 [2][26] 基础设施与算力革命 - 亚马逊云科技推出基于自研3nm芯片的Amazon EC2 Trainium 3 UltraServers服务器,最极致配置互联144颗Trainium 3芯片,提供362 PFLOPS(FP8)算力和超700TB/秒总带宽 [6][30] - Trainium 3服务器相比前代Trainium 2,计算性能提升4.4倍,内存带宽提升3.9倍,能效比(每兆瓦电力处理的AI token数量)提升5倍 [7][31] - 下一代Trainium 4芯片预计提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量 [8][32] - 公司已部署超过100万颗自研Trainium芯片,且Trainium 2的量产速度是此前芯片的4倍 [6][30] - 推出Amazon AI Factories服务,允许企业在自有数据中心部署专用AI基础设施,同时享受全套云服务,以平衡数据主权、合规与性能需求 [8][32] 模型生态与战略 - 亚马逊云科技采取多元化模型战略,不相信“一个模型统治一切”,过去一年Amazon Bedrock平台提供的模型数量已翻倍 [9][33] - 在2025 re:Invent新增的18款全托管开源模型中,包含4款中国顶尖模型(千问、DeepSeek、Kimi、MiniMax),中国模型占1/4席位 [9][33] - 推出自研Amazon Nova 2系列模型,包含四款新型号覆盖全场景需求 [10][34] - **Nova 2 Lite**:在指令遵循、工具调用、信息提取、代码生成能力上全面超越Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量模型,仅编程能力略逊于GPT-5 mini [10][34] - **Nova 2 Pro**:支持文字、图像、视频、语音输入和文本输出,在两项Agent基准测试中表现超过GPT-5.1(high)、Gemini 3 Pro Preview(high) [10][34] - **Nova 2 Sonic**:语音转语音模型,在语音理解和推理任务上性能超过GPT Realtime、Gemini 2.5 Flash [10][34] - **Nova 2 Omni**:业界首个支持文本、图像、视频、音频输入,并支持文本和图像生成输出的推理模型 [11][35] 数据与模型融合技术 - 传统RAG技术存在局限,无法让模型真正“理解”企业深层次领域知识 [13][37] - 推出革命性服务Amazon Nova Forge,引入“开放式训练模型”概念,允许企业在模型训练任意阶段将专有数据与训练数据集混合,创建名为“Novellas”的定制模型 [14][38] - 该服务解决了传统微调中教授新知识与避免遗忘核心能力的矛盾,并支持使用远程奖励函数和强化学习进行微调 [17][41] - 索尼作为早期采用者,通过对Nova 2 Lite微调创建了深度理解自身业务的模型,目标是将合规审查和评估流程效率提升100倍 [17][41] 前沿Agent与应用 - 推出三类“前沿Agent”,代表AI能力向自主、可扩展、长期运行的阶跃式提升 [17][41] - **Kiro autonomous agent**:能自主处理复杂任务,如升级关键库时自动识别受影响服务、更新代码、运行测试等。一个内部案例显示,原需30名开发者18个月的重架构项目,使用Kiro后仅需6人76天完成 [18][42] - **Amazon Security Agent**:持续、主动的内置AI安全专家,将安全实践从“事后检查”变为“持续嵌入” [19][43] - **Amazon DevOps Agent**:重新定义运维响应机制,能立即诊断警报根本原因并提供修复方案 [19][43] - Agent开发基础设施Amazon Bedrock AgentCore SDK预览版发布5个月内,下载量超过200万次 [19][43] - 新增两项关键功能以应对企业部署核心关切: - **Amazon AgentCore Policy(预览版)**:为Agent与企业工具及数据的交互提供实时确定性控制,允许开发者通过自然语言定义行为界限 [19][43] - **Amazon AgentCore Evaluations(预览版)**:全托管服务,可根据实际行为持续检查Agent质量,支持内置评估器与定制评分系统 [22][46] 全栈能力与平台支撑 - 亚马逊云科技在2025 re:Invent上共公布25个新发布,覆盖计算、存储、数据库、大数据、安全等多个领域,为企业Agent部署提供支撑 [23][47] - 公司正在构建支持Agent从实验到落地生产的完整平台,其“全家桶”式的全栈能力被认为是企业将AI投资转化为实际业务回报所需的基础设施 [23][47]
Amazon previews 3 AI agents, including ‘Kiro' that can code on its own for days
TechCrunch· 2025-12-02 22:18
AWS发布新型AI智能体 - AWS于周二宣布推出三款新型AI智能体,统称为“前沿智能体”,包括一款旨在学习用户工作方式并能自主运行数天的智能体,这些智能体目前提供预览版本 [1] - 三款智能体分别处理不同任务:编写代码、执行代码审查等安全流程、以及自动化开发运维任务,例如防止新代码上线时发生事故 [1] Kiro自主智能体的核心功能 - Kiro自主智能体是AWS承诺的最大亮点,据称能够一次性自主工作数天 [2] - 该智能体基于AWS七月发布的现有AI编码工具Kiro构建,旨在生成可投入生产运营的代码,而不仅仅是原型 [3] - Kiro通过“规范驱动开发”概念工作,在编码过程中由人类指导、确认或纠正其假设,从而创建规范,并通过扫描现有代码等方式学习团队在各种工具中的工作方式,最终实现独立工作 [3] - AWS首席执行官Matt Garman表示,用户只需从待办事项中分配一项复杂任务,该智能体便能独立找出完成方法,并持续深化对用户代码、产品及团队遵循标准的理解 [4] - 亚马逊称Kiro能在多个会话间保持“持久上下文”,即不会因内存耗尽而忘记任务,因此可在最少人为干预下被分配任务并独立工作数小时或数天 [6] Kiro自主智能体的应用实例 - Garman举例描述了一项任务:更新一段被15个企业软件使用的关键代码,Kiro可被一次性指派修复所有15处,而无需逐一分配和验证 [6] 配套的Security Agent与DevOps Agent - 为完成编码任务的自动化,AWS开发了Security Agent,该智能体可独立工作,在代码编写时识别安全问题、事后进行测试并提供修复建议 [7] - DevOps Agent完善了该智能体组合,能自动测试新代码的性能问题,或与其他软件、硬件或云设置的兼容性问题 [7] 行业竞争与技术挑战 - 亚马逊的智能体并非首个宣称支持长时间工作的产品,例如OpenAI上月表示其智能体编码模型GPT‑5.1-Codex-Max也设计用于长达24小时的运行 [8] - 行业观点认为,智能体采用的最大障碍可能并非上下文窗口(即持续工作能力),大型语言模型仍存在幻觉和准确性问题,导致开发者需像“保姆”一样监督,因此开发者通常希望分配短期任务并快速验证 [9] - 尽管如此,在智能体能成为类似同事的存在之前,上下文窗口必须扩大,亚马逊的技术是朝该方向迈出的又一大步 [9]
AWS Unveils Frontier Agents, a New Class of AI Agents That Work as an Extension of Your Software Development Team
Businesswire· 2025-12-02 18:30
公司动态 - 亚马逊旗下亚马逊网络服务公司在AWS re:Invent大会上宣布推出三款前沿智能体:Kiro自主智能体、AWS安全智能体和AWS DevOps智能体 [1] - 这些前沿智能体代表了一类新型AI智能体,其特点是自主、可扩展,且能在无需持续干预的情况下工作数小时或数天 [1] - Kiro自主智能体被定位为虚拟开发人员,能够在独立工作的同时保持上下文关联并持续学习 [1]