Gemini系列模型
搜索文档
Gartner最新报告:亚太为何只有一家GenAI“领导者”?
21世纪经济报道· 2025-11-26 05:32
市场地位与权威认可 - 国际权威机构Gartner在其第八期《生成式AI技术创新指南》中将阿里云列为“领导者象限”成员,成为亚太地区唯一入选厂商,与谷歌、OpenAI并列 [1] - 不同于传统报告聚焦营收,Gartner将生成式AI拆分为四个维度进行评估,阿里云是亚太唯一在全部四个维度(云基础设施、工程平台、基础模型、知识管理应用)均被评为“领导者”的企业 [3] - 沙利文报告显示,在2025年上半年的中国企业级大模型调用市场中,通义大模型占比位列第一;Omdia报告指出超7成《财富》中国500强企业已采用GenAI,其中阿里云渗透率达53%,排名第一 [3] 全栈AI能力布局 - 在最底层的GenAI云基础设施方面,公司持续加码硬件投入,于今年2月宣布投入3800亿元用于AI基础设施建设,并计划到2032年将云数据中心能耗规模扩大十倍,其HPN8.0网络支持10万卡互联 [6] - 在GenAI工程能力层,一站式AI研发平台PAI与通义大模型联合优化,使模型训练端到端加速比提升3倍以上;一站式模型服务和Agent开发平台“百炼”可一键调用两百多款模型,过去一年其模型日均调用量增长15倍 [6] - 在GenAI模型层,通义大模型家族覆盖全模态、全尺寸,屡次斩获全球最强开源大模型榜单,目前已服务超100万家客户,在《财富》中国500强中渗透率第一达53% [8] - 在最上层的AI知识管理与应用层,公司依然处于Gartner评估的新兴领导者象限,且是中国唯一厂商 [11] 垂直整合的竞争战略 - 全球AI竞争已进入深水区,真正的较量在于全栈整合能力,Gartner报告中的领导者象限仅坐稳谷歌和阿里云两家,其他巨头如亚马逊、微软缺乏顶级模型,OpenAI则缺乏云底座和芯片 [13] - 公司走软硬一体路径,其自研AI芯片已用于内部大模型训练,通义千问与PAI平台、CIPU的联合优化提升了效率,新产品如“无影Agentic Computer”试图实现端云协同的智能体计算 [14] - 公司将通义千问全面开源,累计开源模型超300个,衍生模型数量超18万,已成为全球性能强、应用广泛的开源大模型,新加坡国家人工智能计划(AISG)的最新项目已放弃Meta模型转向通义千问架构 [14] - 垂直整合模式虽前期投入巨大,但一旦跑通能在性能调优、成本控制和迭代速度上建立系统性优势,公司在亚太地区是唯一能同时在芯片、云平台、大模型和应用生态上形成闭环的云厂商 [14][16]
MaaS定义AI下半场:一场对大模型生产力的投票
华尔街见闻· 2025-11-21 11:19
AI行业进入价值落地的“下半场” - 2025年人工智能赛道迎来关键资本热潮,智谱与MiniMax相继申请公开上市,争夺“大模型第一股”[1] - 行业面临价值鸿沟,企业巨额投入与大量组织停滞在试点阶段无法产生实际损益影响形成矛盾[1] - Deepseek等模型以极低成本实现SOTA性能,迫使企业决策层陷入“害怕错过”与“担心烧钱无果”的两难境地[1] - 市场转向模型价值落地的下半场,从“卖模型参数”转向“交付MaaS(模型即服务)”[2] 全球MaaS平台竞争格局重塑 - 企业级LLM API市场出现戏剧性王座易主,Anthropic以32%生产环境使用份额跃居第一,OpenAI从2023年底50%份额下滑至25%,谷歌Gemini系列以20%份额位列第三[4] - Anthropic凭借“企业优先”战略专注于B2B客户看重的可靠性、安全性和特定任务性能,其年化经常性收入从2025年初10亿美元飙升至8月份50亿美元[9] - OpenAI在消费者市场建立品牌护城河,但Anthropic在垂直B2B工作流API预算战中获胜,市场从单一走向分化[9] 中国市场多元化竞争策略 - 阿里云等传统云巨头采用“建厨房”全栈解决方案打法,涵盖IaaS、PaaS到MaaS,通过价格战和开源换生态锁定高利润底层算力[10][11] - 单纯Token降价已非灵丹妙药,企业开始真正关注模型效果和效率[13] - 智谱等创业公司聚焦ToB战场,开创API调用、自定义微调、云端私有化部署三种MaaS商业化方式,GLM-4.5发布后平台tokens调用量海内外均实现10倍速增长[1][14] 垂直场景商业化突破 - 智谱针对编程场景推出GLM Coding套餐,两个月内吸引15万开发者订阅,有望实现年化经常性收入过亿人民币[14] - 在代码编写、金融研报分析等容错率极低场景中,模型能力微小提升带来生产力从不可用到可用的质变[18] - 中国大模型日均Token消耗量呈指数级增长,从2024年初1000亿增长至2025年6月突破30万亿,证明MaaS模式爆发和模型真实可用[18] MaaS模式的技术与经济逻辑 - 基础模型能力边界经历指数级扩张,每两三个月就会出现新性能颠覆者,使得投资静态本地部署模型在经济上变得“不理性”[17] - 对于追求SOTA性能的客户,MaaS是确保处在技术前沿最具经济效益的选择,智谱客户花费数月精调的GLM-3模型性能很快被基础版GLM-4超越[17] - 对于金融、法律、医疗等高度监管行业,私有化部署成为刚性需求,但交付模式从项目制转向“模型驱动的高溢价服务”[19][20] 模型即应用的终局猜想 - 基座模型本身正在成为唯一超级应用,所有不掌握模型权重的“薄封装”应用护城河将随基座模型迭代被填平[22][24] - 智谱Auto GLM展示模型从“副驾驶”进化到“驾驶员”,能自主操作界面执行复杂任务,价值链从应用层回流到基座层[24] - 大模型商业本质从软件升级为新生产要素,是从千亿级软件市场向万亿级劳动力市场的质变[26] 资本市场估值重估机遇 - 全球资本以疯狂溢价抢购AGI“终极门票”,OpenAI估值从3000亿美元飙升至5000亿美元,xAI计划融资150亿美元对应估值达2300亿美元[26] - 当前资本市场对中国独立基座厂商存在巨大认知错配,硅谷同行按AGI定价而中国厂商仍被传统定价[26][27] - 智谱GLM-4.6模型在编程任务上与Claude系列和GPT-5并列首位,并迅速转化为过亿ARR的杀手级应用[27] - 随着模型即应用终局确立,掌握核心模型权重的中国独立厂商将迎来价值重估[27][28]
AI彻底重塑全球云计算:Gemini企业版发布,谷歌云年化超500亿美元
36氪· 2025-10-11 00:46
产品发布核心 - 谷歌云于10月10日发布企业级AI解决方案Gemini Enterprise(Gemini企业版),旨在成为“工作场所AI的新入口”[1] - 该产品定位为一个全面、安全且集成的平台,超越简单的聊天机器人,致力于将AI智能、企业数据、业务流程和员工无缝连接起来[1][12] - 谷歌CEO表示,谷歌云年化收益已突破500亿美元,大部分增长由AI驱动,超过65%的云客户正在使用其AI产品[1][8] 平台架构与核心组件 - Gemini企业版被定义为一个统一了六大核心组件的端到端平台,而非孤立应用[2][15] - 平台核心是谷歌最先进的Gemini系列模型,其中Gemini 2.5 Pro在行业基准测试中已领先超过六个月[2][11] - 工作台(Workbench)支持“无代码”方式构建和编排AI Agent,使业务人员可像开发者一样创建智能体[2][16] - 平台包含一套预构建的专业Agent,如深度研究、数据洞察和编码助手,开箱即用[2][16] - 平台能安全连接到企业几乎所有的数据源,并学习员工的个人工作习惯,提供个性化回答[2][17] - 平台提供集中的可视化管理、审计和安全控制,并已满足许多国家的主权要求和行业合规标准[2][17] - 平台包含一个汇集了海量合作伙伴构建的Agent的市场[2][18] 产品价值与客户案例 - 现场演示案例显示,营销经理通过其创建的Agent,在几分钟内完成了传统模式需数周、跨部门的万圣节营销活动策划[3][20] - 该营销Agent协调了市场研究、库存管理、内部沟通和媒体生成四个专业代理,实现了工作流的端到端自动化[3][21] - HCA Healthcare预计其由Gemini驱动的解决方案每年可为护士节省数百万小时[13][32] - Best Buy已改造其客户服务,使自主改期交付的客户数量增长了200%,并在特定话题上多解决30%的问题[13][32] - 在谷歌内部,近一半的新代码由AI生成[13] - Klarna借助Gemini等工具打造个性化搭配手册,使订单量增长超过50%[43] 技术战略与竞争优势 - 谷歌的底气来自于由四个紧密集成的层次构成的“全栈AI”战略[4] - 基础设施层包括比上一代性能提升10倍的最新TPU,是全球数十亿用户服务的算力基石[4][9] - 研究层由谷歌搜索和DeepMind世界一流的研究团队构成,持续在前沿领域驱动创新[4][10] - 模型层以Gemini为首的行业领先基础模型矩阵,目前已有超过1300万开发者在使用谷歌的生成模型进行构建[4][11] - 产品与平台层将AI能力大规模落地,如Search中的AI概览月处理标记已超过万亿[4][11] - 谷歌强调其提供的是完整的、为AI优化的平台,而非让企业自行组装的模型和工具包[4][18] 生态系统与行业合作 - “开放”与“生态”是发布会的核心关键词,谷歌正与Box、ServiceNow、Workday等合作伙伴深化产品整合[5][49] - 谷歌正在推动建立“智能体经济”,并制定了A2A开放标准用于规范智能体之间的通信[5][41] - 谷歌与Visa、PayPal等上百家机构共同开发了“代理支付协议 (AP2)”,为智能体的安全交易和支付奠定基础[5][41][42] - 谷歌公布人才培养计划,通过Google Skills平台提供免费培训,并启动“GEAR”计划,目标在一年内赋能100万名新开发者[5][50] - 对于复杂需求,谷歌专门组建了由顶级AI工程师构成的“Delta”精英团队提供深度技术支持[5][50] - 谷歌宣布成为LA28奥运会与残奥会的官方云合作伙伴,将利用其平台和技术提升赛事体验[46][47]
全球AI云竞赛,阿里靠什么打?
虎嗅APP· 2025-09-21 02:50
文章核心观点 - 全球AI竞赛范式已从模型竞赛转向全栈技术体系竞争,胜负关键取决于迭代速度和成本效率[4][5][7] - 阿里巴巴是全球四朵“超级AI云”中唯一的中国公司,并与谷歌同属“全栈自研”战略路径,具备长期竞争优势[2][3][10] - “全栈自研”模式通过对AI芯片、云计算平台和基础大模型的端到端控制,实现更快的创新迭代和更优的成本结构[8][17] - 阿里云在AI基础设施上投入激进,过去四个季度累计投入超过1000亿元,支撑其全球竞争力[11] 全球AI竞赛范式转变 - AI竞赛终局形态是构建集模型、云平台、芯片、生态于一体的强大AI全栈技术体系,而非决出最聪明的单一模型[5] - 大模型性能出现“平台化”现象,顶尖AI能力正从少数公司的专利转变为人人可用的普惠基础设施[4][5] - 决定竞争胜负的两个核心变量是迭代速度和成本效率,优化它们需要垂直整合的AI全栈技术体系[7] “超级AI云”的四大要素与格局 - 构建“超级AI云”体系需要四大要素:千亿级资本投入、百万级集群云计算能力、世界级基础大模型、自主AI芯片布局[7] - 全球科技版图中,仅美国谷歌、微软、亚马逊和中国阿里巴巴四家公司集齐了四大要素,形成第一梯队[10][11] - 阿里云在全球IaaS市场位列前四,是合计份额近80%的第一梯队中唯一的中国公司[10] - 阿里巴巴宣布未来三年投入3800亿元用于云和AI基础设施建设,金额超过去十年总和[11] 战略路径分化:“全栈自研”vs“云+生态” - 四家“超级AI云”公司分化为两种战略模式:“全栈自研”(谷歌、阿里巴巴)和“云+生态”(微软、亚马逊)[13][15] - “云+生态”模式通过投资/绑定AI明星公司快速集成先进能力,但面临协同效率和战略稳定性的挑战[15][16] - “全栈自研”模式通过对技术栈的端到端控制,实现更快的创新迭代和更优的成本结构,但投入巨大且研发周期长[8][15][17] - 采用“全栈自研”的谷歌云和阿里云收入增速显著提升,分别加速至32%和26%,显示该模式正转化为业绩增长[17] 阿里巴巴的竞争态势与成果 - 阿里巴巴采取“模型开源吸引生态,硬件自研控制成本”策略,通义千问Qwen衍生模型数量已突破17万,成为全球第一AI开源模型[10][17] - 公司近期密集发布并开源Qwen3推理模型、Qwen3-Coder编程模型等多个重量级模型,技术成果显著[17] - 在AI芯片层面进行自主布局,旨在实现硬件与模型的深度协同,以构筑长期成本优势[3][10]
“后搜索时代”来临,谷歌能否重塑辉煌?
贝塔投资智库· 2025-08-27 04:00
核心观点 - 公司在生成式AI浪潮中通过AI Overviews、Gemini模型和云服务实现强劲增长 而非被淘汰 体现其持续竞争力 [1] - 2025年Q2财报显示总营收964亿美元(同比+14%) 净利润282亿美元(同比+19%) 超出市场预期 [16] - 当前市值2.53万亿美元 动态市盈率22.08 PEG比率1.62低于同业 显示估值优势 [21] 公司业务结构 - Google Services占总营收70%以上 包括搜索广告(全球份额63%)、YouTube(广告收入同比+13%)、Android(30亿活跃设备)和Chrome(市占率超60%) [5][6] - Google Cloud年化营收超500亿美元 Q2收入136亿美元(同比+32%) 运营利润率达20.7% 积压订单1082亿美元 [7][18][19] - Other Bets季度营收3.7亿美元 包括Waymo(预计2027年营收13亿美元)和Verily等探索性业务 [8][9] 竞争优势 - 形成搜索/Android/YouTube/Gmail的生态闭环 产生数据飞轮效应和用户迁移成本壁垒 [9] - Gemini 2.5 Pro在多模态能力上超越竞争对手 配套Gemma开源模型降低开发门槛 [10][11] - 自研TPUv7芯片推理能效较英伟达A100提升1.9倍 超算集群算力达42.5 ExaFlops [11] - 在量子计算(Sycamore处理器)和端侧AI(Gemini Nano)领域保持技术领先 [13] 财务表现 - Q2毛利率59.5%(同比+1.4%) 净利率29.2%(同比+1.4%) [16] - 搜索广告收入542亿美元(同比+12%) YouTube广告98亿美元(同比+13%) [17] - 订阅与硬件业务收入112亿美元(同比+20%) [19] - 亚太地区收入165亿美元(同比+19%)为增长最快市场 [20] 资本配置 - Q2资本支出224.5亿美元(同比+70.2%) 全年预算上调13%至850亿美元 [14] - 约三分之二资金投向AI服务器 其余用于数据中心与网络设备 [14] 市场定位 - 股价从4月143美元低点回升至8月207美元 反映市场信心修复 [2] - 华尔街机构目标价区间202-234美元 较当前股价存在最高12.96%上行空间 [22]
90%被大模型吃掉,AI Agent的困局
投中网· 2025-07-25 08:33
通用Agent行业现状 - 通用Agent面临尴尬境地,90%的市场份额可能被大模型吞噬[3][4][8] - Manus等头部公司出现收入下滑和用户活跃度下降,Manus 6月访问量1781万次,较3月峰值2376万次下降25%[5][22] - Genspark发布45天即达3600万美元ARR,但6月MRR环比下跌13.58%至295万美元[20][22] 商业化与竞争格局 - 头部产品商业化表现分化:Manus 5月ARR达936万美元,但6月MRR环比暴跌51.79%至167万美元[20][21] - 国内大厂主导市场,百度、字节等通过免费策略挤压创业公司空间[26][27][29] - 收费模式对比:Manus Pro会员199美元/月限积分制(约10次/天),Claude Opus 4同价但支持不限量使用[9][11] 技术瓶颈与场景困境 - 大模型能力溢出直接冲击Agent价值,用户更倾向使用基础模型API[9][12] - 垂类Agent在企业端优势显著,可对接内部知识库实现精准输出[15][16] - 当前通用Agent核心场景局限在PPT生成、深度研究等办公功能,但存在信息错漏和低价值输出问题[24][32][34] 技术演进方向 - MiniMax采用线性注意力机制支持100万上下文输入,强化法律文书处理能力[35] - 强化学习(RL)成为突破关键,月之暗面Agent模型在HLE测试得分从8.6%提升至26.9%[36][38] - OpenAI最新Agent产品ChatGPT Agent在HLE测试创41.6%的SOTA成绩[38] 市场趋势 - 行业呈现"模型即Agent"趋势,大模型公司直接切入Agent赛道[28][29] - 开发者生态成竞争焦点,阿里、字节等通过平台推广和比赛吸引开发者[26] - 深度研究功能因成本较低成为主流方向,多模态能力成为标配[30][32]
90%被大模型吃掉,AI Agent的困局
36氪· 2025-07-18 10:48
通用Agent市场现状 - 通用Agent面临增长放缓困境,Manus访问量从3月2376万次下跌至6月1781万次(跌幅25%),Genspark访问量下降8% [10] - 商业化表现波动明显:Manus 5月ARR达936万美元但6月MRR环比下跌超50%至254万美元,Genspark同期ARR 3600万美元但MRR下跌13.58%至295万美元 [9][11] - 核心问题在于缺乏杀手级应用场景,当前功能集中于PPT生成、多模态处理等办公场景,用户付费持续性不足 [2][11] 竞争格局变化 - 基础模型能力溢出侵蚀市场:Claude Opus 4等模型提供不限量服务(200美元/月),相较Manus Pro会员199美元/月但限制每日约10次任务更具性价比 [4][6] - 垂类Agent在企业端形成优势:Head AI等垂类产品能对接内部知识库,准确度显著高于通用Agent [7] - 大厂主导国内市场:百度、字节等通过免费策略挤压创业公司空间,MiniMax等采用积分制但难敌大厂资源 [12][13] 技术演进方向 - 强化学习(RL)成为突破重点:月之暗面Kimi-Researcher通过RL将HLE测试得分从8.6%提升至26.9%,OpenAI ChatGPT Agent最新达41.6% [18][20] - 长文本处理能力升级:MiniMax M1模型支持100万token上下文,优于Gemini 2.5 Pro的200K上限 [17][18] - 多模态集成趋势明显:MiniMax融入视频生成能力,百度心响整合原有对话系统 [15] 商业模式挑战 - 成本转嫁矛盾突出:Manus采用积分制导致高频用户成本高企,对比基础模型API无使用次数限制 [6] - B端落地障碍:企业需求与通用Agent"黑盒"特性存在冲突,需深度集成内部系统 [7] - 大厂生态战略:阿里、字节等侧重开发者平台建设,通过比赛推广而非直接产品竞争 [11]
腾讯研究院AI速递 20250710
腾讯研究院· 2025-07-09 14:49
一、AI视频生成技术升级 - 谷歌Veo 3升级支持仅用一张图片生成音频和视频,角色在多镜头下保持高度一致性[1] - 新功能通过Flow平台的"Frames to Video"选项实现,加入丰富运镜功能[1] - 用户实测显示人物表情自然、表演到位,适用于广告、动画等多领域[1] - Vidu Q1多参考生视频功能可上传最多7张参考图像,实现角色一致性强、多元素同框和零分镜视频生成[4] - 清晰度升级至1080P,支持主体库存储角色素材,单条视频成本不到9毛钱[5] 二、开源大模型进展 - Hugging Face开源3B参数模型SmolLM3,性能超越Llama-3.2-3B和Qwen2.5-3B,支持128K上下文窗口及6种语言[2] - 模型采用双模式系统,用户可在深度思考和非思考模式间灵活切换[2] - 昆仑万维开源Skywork-R1V 3.0多模态模型,高考数学得142分,MMMU评测达76分,超越部分闭源模型[3] - 模型通过强化学习策略GRPO和关键熵驱动机制,仅用1.2万条监督样本和1.3万条强化学习样本实现高性能[3] 三、端侧与多模态模型 - vivo发布端侧多模态模型BlueLM-2.5-3B,支持GUI界面理解,在20余项评测中表现优异[6] - 模型支持长短思考模式自由切换,引入思考预算控制机制[6] - 采用精巧结构(ViT+Adapter+LLM)和四阶段预训练策略,缓解多模态模型文本能力遗忘问题[6] 四、AI系统突破 - X-Masters系统在"人类最后的考试"(HLE)上首次突破30分,达到32.1分,超越OpenAI和谷歌[7] - 系统基于DeepSeek-R1模型构建了工具增强推理智能体X-Master,能在内部推理和外部工具使用间流畅切换[7] - 采用分散-堆叠式多智能体工作流,通过求解器、批评者、重写器和选择器多角色协作[7] 五、行业并购与市场格局 - 智元机器人以21亿元收购科创板上市公司上纬新材控制权,预计收购63.62%-66.99%股份[8] - 2025年上半年Gemini系列模型占据大模型API市场近一半份额,谷歌以43.1%位居第一[9] - DeepSeek V3自发布以来用户留存率极高,位列使用量前五[9] - 细分领域呈现差异化竞争格局:Claude-Sonnet-4在编程领域领先(44.5%),GPT-4o在营销领域领先(32.5%)[9] 六、AI应用趋势 - 全球已有18亿AI用户,但付费率仅3%,学生使用率高达85%,家长群体成为AI重度用户[10] - AI主要应用于邮件撰写(19%)、研究兴趣主题(18%)和管理待办事项(18%)等日常场景[10] - 未来18-24个月AI将迎来六大趋势:垂直领域工具崛起、完整流程自动化、语音AI爆发等[10]
120页深度报告,搞懂今年大模型和应用的现状与未来
Founder Park· 2025-07-03 11:07
模型篇 - 基础模型训练成本五年内增长近两个数量级 从2020年GPT-3的450万美元增至2025年Llama 4的3亿美元[3][6] - 模型生命周期急剧缩短 闭源前沿模型的领先地位可能在6-12个月内被颠覆 如GPT-4在一年后被成本低10倍的开源模型DeepSeek-VL超越[6] - 开源模型性能快速收敛闭源模型 新模型在排行榜前五保持领先的中位数时间仅3周[8] - 行业从追求参数规模转向计算效率 新一代顶尖模型如Claude 3.5 Sonnet参数规模反而下降[12] - 推理计算成为新前沿 30亿参数模型通过深度思考可超越700亿参数大模型的数学能力[16] - 混合专家模型(MoE)架构普及 通过部分参数激活降低单次推理成本[22] 技术突破 - 自监督学习突破数据规模化瓶颈 允许模型从海量未标注数据学习[24] - 注意力架构(Transformer)实现计算效率革命 完美契合GPU并行计算特性[25] - 模型规模达到临界点后出现"涌现"能力 性能从随机猜测跃升至高度准确[26] - 参数量三年增长15,500倍 远超摩尔定律的两年翻一番[27] - 上下文窗口扩展100-500倍 从数千token增至百万级[28][34] - 多模态能力持续进步 但全能模型(Omni-modal)仍处早期阶段[28] 应用篇 - AI代码生成工具形成20亿美元市场 Cursor创SaaS最快增长记录 年收入近10亿美元[42] - YC创业公司中25%的代码库95%由LLM生成 标志"氛围编程"时代到来[44] - 软件工程全生命周期被重塑 从代码审查到测试QA各环节都出现AI工具[45] - 专业Copilot矩阵快速扩张 覆盖硬件/创意/工程/金融等领域[47][48] - AI个人生活整合加速 核心用例从"生成想法"转向"治疗/陪伴"和"生活管理"[52] 市场动态 - 2024年全球风险投资10.5%流向基础模型公司 总额330亿美元[112] - OpenAI收入结构分化 73%来自ChatGPT订阅 Anthropic 85%来自API[119] - AI原生应用ARR超12亿美元 Midjourney/Cursor/ElevenLabs等突破1亿美元[130][133] - 物理世界AI公司获巨额融资 Figure AI获6.75亿美元 OpenAI/微软等参投[127][128] - GPU生态系统重塑 英伟达AI推理token生成量一年增长十倍[139] 未来趋势 - 软件开发范式迁移 CI/CD/Git等传统流程面临AI适配挑战[152] - 数据即服务(DaaS)复兴 LLM使数据收集/结构化成本降低1000倍[156] - 创意工具护城河转向网络效应/运行环境/工作流特异性[158] - AI与科学结合催生"生成+验证"闭环系统 如AI科学家[161] - 智能体基础设施需求爆发 需专用浏览器/支付系统/身份认证[161]
亚马逊云现场一手
小熊跑的快· 2025-06-20 08:13
大模型竞争格局 - Claude 3.7和4系列模型性能已与OpenAI O1系列分庭抗礼 单日token处理量接近持平 [1] - 云计算厂商模型阵营分化明显 AWS不主推OpenAI GPT和Gemini系列 Google云部署Claude而非GPT 微软云亦未主推Claude [2] 芯片技术进展 - Trainium2当前支持6万卡集群部署 在推理需求推动下加速推广 Inferentia芯片迭代停滞 预计年底推出Trainium3 [3] 云计算基础设施 - 亚马逊基于CPU的计算基础云规模居行业首位 持续获得市场认可并通过降本优化竞争力 [4] - 应用开发架构分为三层:基于GPU的Sagemaker 基础模型API一体化平台Bedrock 面向高阶用户的Q平台 [5]