Workflow
Amazon SageMaker
icon
搜索文档
超强开源模型Qwen3、DeepSeek-V3.1,都被云计算一哥「收」了
机器之心· 2025-09-19 10:43
亚马逊云科技AI平台模型扩展 - Amazon Bedrock和Amazon SageMaker两大AI平台新增支持OpenAI新开源模型[2] - 两大国产大模型Qwen3和DeepSeek-V3.1被纳入Amazon Bedrock平台[3] - 目前Qwen3和DeepSeek-V3.1已在Amazon Bedrock全球上线 覆盖美国西部(俄勒冈)、亚太地区(孟买、东京)、欧洲(伦敦、斯德哥尔摩)等区域[4] 平台模型生态与战略 - Amazon Bedrock已提供249款大模型 覆盖通用对话、生成、多语言理解与代码助手等多个应用类型[16] - 平台汇聚十四家主流厂商 包括Anthropic、DeepSeek、亚马逊云科技自研Nova模型等[16] - 公司坚持"Choice Matters"战略 强调多模型互补协同 没有一个大模型可以解决所有问题[5] - 客户数据完全由客户控制 亚马逊云科技不会将模型输入输出数据与模型提供商共享或用于改进基础模型[5] Qwen3模型技术特性 - Qwen3是阿里巴巴开源的新一代通义千问模型 在推理、指令遵循、多语言支持和工具调用等方面大幅提升[9] - 部署成本大幅下降 仅需4张H20实现满血版部署 显存占用仅为性能相近模型的三分之一[9] - 采用MoE和密集型架构 MoE模型如Qwen3-Coder-480B-A35B-Instruct和Qwen3-Coder-30B-A3B-Instruct通过动态激活部分参数实现高效推理[10] - 支持256K个token的上下文窗口 使用外推方法可扩展到100万个token[10] - 具备强大的智能体能力 能够执行多步推理和结构化规划 支持与外部环境标准化通信[10] DeepSeek-V3.1模型性能表现 - DeepSeek-V3.1是混合推理模型 同时支持思考模式与非思考模式[14] - 在Browsecomp测试中得分30.0 较DeepSeek-R1-0528的8.9有显著提升[15] - 在Browsecomp_zh测试中得分49.2 较DeepSeek-R1-0528的35.7提升明显[15] - 在SWE-bench Verified测试中得分66.0 较DeepSeek-R1-0528的44.6有大幅提升[15] 模型应用场景优化 - Qwen3-Coder-480B-A35B-Instruct专为复杂软件工程任务设计 擅长高级代码生成和代码库分析[13] - Qwen3-Coder-30B-A3B-Instruct优化代码补全、重构及编程问题解答 支持多种编程语言[13] - Qwen3-235B-A22B-Instruct-2507提供强大的通用推理和指令跟随能力[13] - Qwen3-32B-Dense适用于要求稳定性能、低延迟和成本优化的场景 如移动设备和边缘计算[13] 平台实测性能表现 - DeepSeek-V3.1和Qwen3-235B-A22B-Instruct-2507在简单数学问题上均能在半秒左右给出正确答案[23] - 在多步计算任务中 两个模型都能正确完成并给出完整推理过程[26] - Qwen3-Coder-480B-A35B-Instruct仅用半分钟就完成了"俄罗斯方块+贪吃蛇"游戏的代码编写[28] - Amazon Bedrock提供的服务非常稳定高速 全量模型的性能得到充分保证[31] 开源模型战略价值 - 开源模型在定制化开发和透明性方面具有独特优势 给用户带来更大灵活性和控制权[36] - 用户可通过开源模型直接调用经过优化的托管推理服务 实现快速应用部署[36] - 开放权重特性允许用户根据自身行业数据和需求进行二次开发和定制训练[36] - 高透明性使企业能够清晰了解模型结构、训练数据和算法流程 增强合规性和道德可控性[36] 公司AI发展战略 - 亚马逊云科技CEO将AI描述为"几十年来见过的可能发展最快的技术"[38] - 公司在Amazon Bedrock和SageMaker上构建了拥有超过400款模型的模型库[39] - 开放共赢策略避免与模型提供商正面竞争 专注于成为中立、丰富且可靠的AI基础设施层[40] - 该策略吸引了包括初创公司、大型企业在内的多样化客户生态[40]
连续15年霸榜Gartner魔力象限,揭秘亚马逊云科技的领导者“内核”
搜狐财经· 2025-08-22 10:18
Gartner魔力象限评级 - 亚马逊云科技连续15年被评为战略云平台服务领导者 在执行能力维度位列最高位置 [1] - Gartner通过执行能力和愿景完整性两个维度评估厂商 执行能力涵盖产品与服务、运营、客户体验与市场响应 愿景完整性考察战略方向、创新能力、行业方案和全球布局 [3] 全球基础设施优势 - 截至2025年8月在全球37个区域部署117个可用区 并计划新增4个区域和13个可用区 [5] - 多可用区和多区域架构设计提供低延迟和高可用服务 高标准SLA承诺保障关键业务运行 [5] - 中国大陆云服务可用性达99.99%以上 整体故障时长低于其他云提供商平均值的五分之一 [6] 技术创新与AI能力 - 自研第四代ARM架构Graviton处理器提供更高计算性能和能效优势 [6] - 构建生成式AI全栈能力:包括自研Trainium和Inferentia芯片 以及Bedrock、SageMaker和Q等服务 [6] - 覆盖从IaaS、PaaS到AI/ML和生成式AI的企业全生命周期服务能力 [5] 中国企业出海支持 - 通过"三横一纵"战略支持中国企业出海:三横包括全球基础设施/云服务、安全合规能力、全球资源网络 一纵指行业解决方案资产库 [7] - 2025年组建专属团队全面升级出海业务战略 涵盖产品、安全合规、合作伙伴等领域的全球支持团队 [8] - 将全球云平台优势转化为中国企业拓展国际业务和加速AI应用的实际路径 [1] 行业领导地位 - 战略云平台服务需支撑生产环境中的大规模关键工作负载 是企业业务连续性和创新能力的核心底座 [3] - 云服务商需具备弹性扩展、按需计费和自动化特征 并支撑企业数字化转型与生成式AI发展需求 [3] - 公司在技术交付、全球运营和客户支持方面保持优势 体现以客户为中心和长期创新的战略定力 [4]
Gartner报告指出云平台演进方向:全栈能力成企业创新关键支撑
环球网· 2025-08-22 07:07
战略云平台服务演进趋势 - 现代企业级云平台服务正从传统IT资源供给向覆盖IaaS、PaaS及AI/ML与生成式AI的全栈支持模式演进[1] - 战略云平台服务需涵盖IaaS、PaaS及转型服务 具备弹性扩展、按需计费和自动化特征 支撑生产环境大规模关键工作负载[3] - 企业数字化进入深水区 单一云服务难以支撑系统化创新和全球竞争需求[1] 头部厂商技术布局 - 亚马逊云科技自研第四代Graviton处理器性能提升30% 内存带宽提升75% 针对真实工作负载优化[4] - 开发专用AI训练芯片Trainium和推理芯片Inferentia 降低大规模AI应用算力门槛[4] - 通过模型服务平台Bedrock、机器学习工具SageMaker和代码助手Q提供从模型构建到部署的全流程支持[4] 行业应用与转型需求 - 生成式AI已深入业务流程自动化、用户体验重构及产品创新核心 不再是技术试验[4] - 企业越来越多依赖云平台完成AI集成与业务转型[4] - 战略云平台服务成为企业业务连续性和创新能力的关键底座 决定全球化竞争中的长期竞争力[4] 技术架构发展方向 - 优秀战略云平台需在自研技术深度优化同时保持对开源框架和异构硬件的兼容[5] - 提供"可选择、可迁移、可组合"的灵活架构 平衡高性能解决方案与技术选型自由度[5] - 服务边界从资源弹性扩展至智能系统构建、运行和迭代的全生命周期支撑[5]
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
机器之心· 2025-08-07 10:30
亚马逊云科技与OpenAI合作 - 亚马逊云科技首次通过Amazon Bedrock和Amazon SageMaker两大平台支持OpenAI新开源模型gpt-oss(120b和20b)[1] - 此举打破微软独家转售OpenAI服务的局面,标志着AI行业格局变化[3] - 合作填补了亚马逊云科技模型库的关键空白,使其模型托管厂商增至13家[13][15] 亚马逊云科技AI生态系统战略 - 公司提出"Choice Matters"战略,强调多模型协同而非单一模型主导[6][9] - Amazon Bedrock和Amazon SageMaker两大平台已汇聚400+款商业及开源模型[10] - Bedrock专注于商业API调用,SageMaker侧重开源模型部署和定制化[9] 技术优势与性能表现 - gpt-oss-120b在Bedrock上的性价比是Google Gemini的3倍、DeepSeek-R1的5倍[14] - 平台安全功能可阻止88%有害内容,支持定制模型导入和知识库[13] - Claude Opus 4.1支持混合推理模式,在多步骤工作流中表现突出[17] 行业影响与未来展望 - 合作使OpenAI技术触达亚马逊数百万客户,扩大商业化渠道[15] - 公司角色从云服务商升级为AI能力聚合平台[19] - 多模型自由组合可能催生下一代颠覆性AI应用[31] 模型选择与应用场景 - 不同场景需特定模型组合:翻译用DeepSeek R1+Claude 3.7,研究用DeepSeek R1+Claude 4[9] - 开发者可按需选择模型,如Claude Opus 4.1适合编程,gpt-oss-20b适合日常任务[23] - 企业可通过统一API实现安全合规的规模化部署[24]
全球最大AI模型聚合平台诞生!不争冠军只做擂台
量子位· 2025-08-07 09:02
战略核心 - 亚马逊云科技提出"Choice Matters"战略,强调AI价值在于为不同场景选择最适合的模型而非追求单一最强模型 [1][2] - 该战略基于云计算领域的洞察:AWS提供429项计算服务、266项存储服务、513项数据库服务和421项AI/机器学习服务 [3][4] - 战略得到市场验证,OpenAI开源模型加入Amazon Bedrock平台,gpt-oss-120b与gpt-oss-20b展现3倍于Gemini、5倍于DeepSeek-R1的性价比优势 [6][8] 平台能力 - Amazon Bedrock平台提供217款商业API服务,Amazon SageMaker支持185款商业和开源模型部署 [21] - 平台聚合超过400款主流商业及开源大模型,成为全球最大AI模型聚合平台 [22] - 平台模型合作伙伴包括Anthropic、Meta、DeepSeek、Google、OpenAI等顶级AI公司 [22] 模型性能 - Claude Opus 4.1在Agentic coding SWE-bench测试中达74.5%,高于OpenAI 03的69.1%和Gemini 2.5 Pro的67.2% [12] - Claude Opus 4.1在Graduate-level reasoning GPQA测试中达80.9%,低于OpenAI 03的83.3%和Gemini 2.5 Pro的86.4% [12] - Claude Opus 4.1在Multilingual Q&A MMMLU测试中达89.5%,与OpenAI 03的88.8%相当 [12] 应用模式 - "最佳匹配"模式:特定场景选用单一模型,如实时翻译选Nova、学术研究选DeepSeek、内容创作选Claude [14] - "协同增效"模式:复杂场景多模型协作,如翻译系统组合DeepSeek R1/Claude 3.7与Nova Lite [15][16] 生态发展 - 2023年4月Anthropic入驻,2023年7月Meta Llama系列加入,2023年9月Stability AI推出Stable Diffusion系列 [23] - 2024年2月Mistral AI带来混合专家模型,2025年2月DeepSeek R1模型登陆,2025年8月OpenAI开源模型加入 [23] - 生态案例包括野村证券使用Llama处理数据、Doordash使用Claude优化客服、Zalando借助Mistral AI实现电商智能化 [25]
亚马逊云科技“瘦身”进行时:解散上海AI研究院背后的成本控制与创新博弈
每日经济新闻· 2025-07-23 10:05
亚马逊云科技上海AI研究院解散事件 - 亚马逊云科技上海AI研究院正式解散,该研究院是公司最后一个海外研究院 [1] - 研究院成立于2018年秋,隶属于亚马逊云科技机器学习部门,聚焦四大方向:开源项目开发、图神经网络基础研究、AI技术商业化落地、学术合作 [2] - 研究院曾开发全球知名的DeepGraphLibrary(DGL)框架,并在金融、医疗等行业实现技术应用 [3] 外企在华研究院调整背景 - 近年来IBM、微软等外企相继调整在华研究院布局,IBM终止中国系统实验室和开发实验室的研发活动,微软亚洲研究院压缩部分研究方向 [3] - 中国本土科技企业如华为、阿里、腾讯加大AI研发投入,外企技术优势减弱 [3] - 全球经济形势变化促使企业更关注投入产出比,海外研发成本高企导致资源重新配置 [4] 亚马逊云科技战略调整动因 - 云计算市场竞争加剧,微软Azure和谷歌云分别凭借混合云优势、AI技术整合抢占份额,国内阿里云、腾讯云通过本地化服务和价格竞争扩张 [6] - 公司2025年计划资本支出达1000亿美元,重点投向AI数据中心、硬件及生成式AI服务 [6] - 2024年推出Amazon Nova六款基础模型,升级Amazon SageMaker等核心服务,需集中资源加速技术迭代 [6] 战略优先级变化 - 公司将研发资源转向生成式AI等前沿领域,认为其商业回报更直接 [7] - 上海AI研究院的图神经网络研究因周期长、商业化路径间接被降低优先级 [7] - AI大模型行业价格战加剧,公司需平衡研发投入与成本控制 [7]
10 Artificial Intelligence (AI) Companies to Buy Now and Hold Forever
The Motley Fool· 2025-06-29 10:30
AI行业概述 - AI技术正日益融入生活,包括自动驾驶汽车和生成式AI的发展 [1] - 投资者应关注领先的AI公司,这些股票未来可能带来可观回报 [1] 公司分析 1 Nvidia - 公司是半导体行业领导者,率先开发图形处理器(GPU),GPU对AI应用至关重要 [3] - 公司持续产生强劲的自由现金流,是投资者获取AI敞口的优选 [3] 2 Alphabet - 公司通过大型语言模型Gemini整合到Google搜索和Android手机等产品中 [4] - 其他公司如Snap和Accenture也使用Gemini [4] - 通过Google Cloud提供广泛的AI服务 [4] 3 Microsoft - 通过生成式AI助手Copilot整合到Microsoft 365等产品中 [5] - 通过Microsoft Azure云计算平台提供AI服务 [5] - 公司是OpenAI的主要投资者,间接提供AI敞口 [6] 4 Meta Platforms - 公司开发了基于Llama LLM的AI助手Meta AI,并整合到其他Meta应用中 [7] - 2025年6月投资143亿美元于Scale AI,拓展人工通用智能领域 [7] 5 Broadcom - 公司是半导体行业领导者,数据中心增长推动AI加速器需求 [8] - 2025年Q2 AI半导体收入达44亿美元,同比增长46% [8] - AI网络收入占AI总收入的40%,同比增长70% [8] 6 Amazon - 通过Amazon Web Services(AWS)提供云计算服务,支持企业开发AI资源 [9] - 提供AI工具如Amazon Bedrock和Amazon SageMaker [9] - 2024年底AWS年化收入达1150亿美元 [10] - 2024年公司总收入达6380亿美元 [10] 7 Palantir Technologies - 公司开发了用于分析大型数据集的复杂平台,服务于多个行业 [11] - 2025年Q1末持有54亿美元现金及等价物,无债务 [11] - 持续产生强劲的自由现金流 [11] 8 Taiwan Semiconductor - 公司采用专用IC代工模式,为Nvidia等客户生产半导体 [12] - 2024年AI加速器收入占总收入"接近中双位数百分比" [13] 9 Tesla - 公司电动汽车具备先进的自动驾驶能力,并持续推进机器人出租车业务 [14] - 2024年AI相关资本支出约50亿美元,2025年预计持平 [15] - 可能收购Elon Musk的AI初创公司xAI [15] 10 CoreWeave - 公司开发了支持AI高计算需求的云平台 [16] - 与OpenAI达成119亿美元协议,开发AI基础设施 [16] - 2025年Q1收入达9.82亿美元,同比增长420% [16]
Oracle Launches AI Centre in Southeast Asia to Steer Competition
ZACKS· 2025-03-14 15:05
文章核心观点 - 甲骨文公司在新加坡设立人工智能卓越中心或是为在东南亚云与人工智能竞争中保持影响力的无奈之举 ,公司面临诸多挑战,股票被高估,是2025年的强烈卖出候选股 [1][12] 财务预警信号增多 - 2025年第三季度财报显示公司未达预期,每股收益1.47美元,低于预期2美分,营收141.3亿美元,同比增长6.4%,但低于预期2.5918亿美元 [2] - 软件许可证收入下降8%至11亿美元,战略SaaS应用仅增长8%,远低于竞争对手 [3] 区域竞争压力加剧 - 亚马逊旗下AWS计划到2030年在印度投资127亿美元,其中83亿美元用于马哈拉施特拉邦的云基础设施建设,预计为印度GDP贡献153亿美元,支持超8.13万个全职工作岗位 [4][5] - 微软计划2025年第二季度在印尼中部推出云区域,投资17亿美元提升印尼云与人工智能能力 [5] - 谷歌宣布在泰国投资10亿美元建设数据中心,预计到2029年推动当地经济增长40亿美元,创造1.4万个就业岗位 [6] 技术局限削弱地位 - 甲骨文OCI基础设施处理的工作量仅为AWS、Azure和谷歌云的一小部分,其宣布的“第101个云区域”规模小、服务少 [7] - 甲骨文所谓的“巨大的64000个GPU、液冷NVIDIA GB 200集群”无法与超大规模企业已部署的AI基础设施相比,亚马逊SageMaker AI平台能力和规模远超甲骨文 [8] 投资前景负面 - 甲骨文人工智能中心的宣布更像公关活动,未披露具体资本承诺,缺乏透明度 [9] - 公司积压订单增长至1300亿美元存疑,运营利润率持续压缩,资本支出高,第三季度运营现金流仅勉强覆盖资本支出,资助AI创新能力受限 [10][11]