Nova 2系列模型
搜索文档
AI产业跟踪:海外:HPE携手博通推出AMD"Helios"AI机架,搭载业界首创纵向扩展以太网
国泰海通证券· 2025-12-10 08:58
报告行业投资评级 - 报告未明确给出行业投资评级 [1] 报告的核心观点 - 报告跟踪了AI产业的最新动态,核心观点是AI产业正处在技术快速迭代、应用场景拓宽和基础设施创新的活跃期,硬件、软件、模型和应用层面均出现重要进展 [1] 根据相关目录分别进行总结 AI 行业动态 - **OpenAI** 在2025年进行了第四起收购,目标是其付费客户、提供AI模型训练跟踪工具的初创公司 **Neptune** [4] - **Meta** 组建全明星设计团队攻坚AI眼镜,由前苹果设计副总裁 **Alan Dye** 领导,旨在融合时尚与科技,打造非侵入式用户体验的设备 [5] - **Marvell** 宣布收购拥有光子互联技术的半导体初创公司 **Celestial AI**,旨在解决AI算力瓶颈,强化其在AI数据中心连接领域的竞争力,并获得主要客户 **亚马逊** 的支持 [6] - **HPE** 携手 **博通** 推出基于 **AMD Instinct MI455X** 显卡加速器的“Helios”机架级AI解决方案,搭载业界首创的纵向扩展以太网网络,可提供合计 **260TB/s** 的纵向扩展聚合带宽,AI FP4算力达到 **2.9 exaflops**,计划于2026年全球交付 [16] AI 应用资讯 - **苹果** 研究显示,AI可从 **Apple Watch** 光学传感器中挖掘更深入的心脏健康数据,其“高血压提醒”功能基于长达30天的数据趋势分析 [8] - **谷歌** 发布 **Workspace Studio**,支持用户通过自然语言描述创建、管理和分享AI智能体,该工具依托 **Gemini** 模型,可与 **Asana**、**Jira**、**Salesforce** 等第三方平台集成 [9] - **川崎重工** 宣布正式着手生产可载人移动的四足机器人“CORLEO”,计划与户外休闲服务结合,目标在2040年达成 **3000亿日元** 的业务规模 [10] - **XREAL** 发布 **AR** 眼镜新品 **XREAL 1S**,全球首发内容 **2D → 3D** 自动转换功能,重量为 **82g**,搭载自研 **X1** 空间计算芯片,延迟低至 **3ms** [10] AI 大模型资讯 - **亚马逊云科技** 发布 **Nova 2** 系列AI模型,并同步推出 **Nova Forge** 定制服务,使企业客户能够构建专属的定制化模型版本 [11] - **英伟达** 发布专注于自动驾驶的视觉语言动作模型 **Alpamayo-R1**,这是业界首个专注于该领域的开源推理型视觉语言模型 [12] - **Mistral AI** 推出 **Mistral 3** 系列模型,参数规模从 **3B** 到 **675B**,均以 **Apache 2.0** 许可证开源,其中 **Mistral Large** 总参数量为 **675B**,使用 **3000** 块英伟达 **H200 GPU** 训练 [13] - **Runway** 推出 **Gen 4.5** AI视频模型,在独立基准测试中表现超过谷歌和OpenAI的同类产品,登顶 **Video Arena** 榜单 [13] 科技前沿 - **亚马逊** 发布新一代自研AI芯片 **Trainium3**,其系统在训练和高负载推理场景下的速度相较第二代产品提升超过 **4** 倍,内存容量也增至 **4** 倍,可构建搭载最多 **100万** 颗 **Trainium3** 芯片的超大规模集群 [14][15] - **蓝色起源** 公布由AI设计的“月球吸尘器”,该设备能吸入月球尘埃并从中提取热量转化为能源 [16] - **英伟达** 发布 **CUDA Toolkit 13.1**,这是自2006年CUDA平台诞生以来规模最大、最全面的更新,引入了基于 **tile** 的编程模型等新特性 [16][18]
CPO概念爆发,“易中天”大涨,天孚通信、中际旭创创历史新高
21世纪经济报道· 2025-12-08 09:45
市场表现 - 12月8日A股三大股指高开高走,创业板指涨幅超过2% [2] - CPO板块全线爆发,东田微、致尚科技股价20cm涨停,易天股份涨幅超过10% [2] - 中际旭创、天孚通信股价均创下历史新高 [2] 行业动态与催化剂 - 亚马逊云计算部门AWS在re:Invent大会上推出新一代AI训练芯片Trainium,并预告了下一代产品Trainium 4的开发计划 [2] - AWS同时推出了Nova 2系列模型和全新的AI服务 [2] 机构研究与预测 - 摩根士丹利供应链调研显示,谷歌TPU产量有望大幅上升,可能为Alphabet带来可观营收增长 [2] - 摩根士丹利亚洲半导体团队将谷歌2027年TPU产量预测从约300万块上调至500万块,上调幅度达67% [2] - 该团队将谷歌2028年TPU产量预测从约320万块上调至700万块,上调幅度高达120% [2]
CPO板块全线爆发,通信设备ETF、创业板人工智能ETF、通信ETF涨超5%
格隆汇· 2025-12-08 08:44
市场整体表现 - 重磅会议定调明年继续实施更加积极的财政政策和适度宽松的货币政策 [1] - A股三大指数集体走高,沪指涨0.54%报3924点,深证成指涨1.39%,创业板指涨2.6% [1] - 全市场成交额达2.05万亿元,较前一交易日增加3127亿元,超3400只个股上涨 [1] 通信与AI算力板块行情 - CPO板块全线爆发,天孚通信20cm涨停,新易盛、中际旭创涨超6%,天孚通信、中际旭创股价创历史新高 [2] - 多只通信设备及人工智能相关ETF涨幅显著,通信设备ETF、多只创业板人工智能ETF涨超5%,通信ETF、5GETF等涨超4.5% [2] - 国盛证券指出,AI算力需求驱动全球光模块产业加速向800G/1.6T升级,光隔离器因上游材料短缺成为产能扩张的“卡脖子”环节 [2] - 长城证券认为,AI应用落地将倒逼算力基础设施建设,看好AIDC产业链的光模块、PCB、主设备商及铜缆等环节,需求快速释放有望迎来业绩及估值的戴维斯双击 [2] - 此次上涨为光模块行情启动以来首次大规模全面上扬,一线龙头公司带头上涨,二三线公司逐渐跟涨,回应了订单外溢预期 [5] 产业动态与公司战略 - Marvell宣布以32.5亿美元收购光互连解决方案商Celestial AI,交易预计2026年第一季度完成,以加速其下一代AI和云数据中心互连战略 [3] - Celestial AI的Photonic Fabric技术平台可为下一代数据中心提供封装、系统和机架级的光学I/O互连 [3] - AWS推出新一代Trainium 3芯片,并预告下一代Trainium 4将支持英伟达的NVLink Fusion高速芯片互联技术,以实现与英伟达GPU的互操作和性能扩展 [3] - Meta计划削减元宇宙资源投入,管理层考虑在2026年缩减该业务30%的预算,节省资金将用于AI眼镜与可穿戴设备等业务,预计未来还将投入数百亿美元用于数据中心和AI开发 [4] 板块上涨驱动因素 - 外部因素:美国国家安全策略调整,外部冲突缓和预期升温,为国内通信企业海外业务拓展扫清部分障碍 [4] - 内部因素:保险资金投资风险因子下调有望释放千亿级增量资金,券商杠杆空间拓宽带来万亿级资金潜力,资金持续流向科技创新领域 [4] - 产业景气度:海外大厂如谷歌、Meta继续加大资本开支,直接拉动光模块等通信核心器件需求 [4] - 国内市场中,摩尔、沐曦的IPO进程加速,让算力投资前景愈发清晰,市场普遍看好通信产业景气度延续至2027年 [4] - 通信设备指数凭借政策、资金与产业的三重共振逻辑,成为当前市场最值得关注的核心主线之一 [5] 相关ETF产品数据 - 食品饮料ETF(515170):近五日跌2.43%,市盈率20.32倍,最新份额110.1亿份,增加8250.0万份,净申赎4624.1万元,估值分位19.24% [7] - 游戏ETF(159869):近五日跌2.48%,市盈率35.18倍,最新份额79.5亿份,减少6800.0万份,净申赎-9334.6万元,估值分位49.61% [7] - 科创50ETF(588000):近五日涨0.07%,市盈率149.33倍,最新份额516.4亿份,增加4050.0万份,净申赎5592.1万元,估值分位94.78% [7] - 云计算50ETF(516630):近五日涨0.51%,市盈率93.24倍,最新份额2.8亿份,份额无变化,净申赎0.0元,估值分位79.80% [7][8]
三大股指期货齐涨 迈威尔科技绩后大涨 11月“小非农”今晚来袭
智通财经· 2025-12-03 12:57
市场指数与大宗商品表现 - 12月3日美股盘前,三大股指期货齐涨,道指期货涨0.23%至47,626.80点,标普500指数期货涨0.20%至6,848.70点,纳指期货涨0.18%至25,639.30点 [1][2] - 欧洲主要股指涨跌互现,德国DAX指数涨0.23%至23,847.55点,英国富时100指数跌0.13%至9,713.95点,法国CAC40指数涨0.02%至8,103.14点,欧洲斯托克50指数涨0.34%至5,724.75点 [2][3] - 国际油价上涨,WTI原油涨1.38%至59.45美元/桶,布伦特原油涨1.18%至63.19美元/桶 [3][4] 宏观经济与货币政策动向 - 美国11月ADP就业数据成为美联储12月会议前重要参考,市场预测分歧明显,FactSet调查预计私营部门新增4万人,而媒体共识仅预期增加5,000人 [5] - 市场押注若白宫国家经济委员会主任凯文·哈塞特接替鲍威尔,美联储2026年将实施更激进的降息,相关利率期货需求上升 [6] - 德意志银行指出,美联储主席鲍威尔在2026年5月主席任期结束后,可能选择留任理事至2028年1月,以维护美联储政策独立性 [7] - 摩根大通预警市场降息预期过热,预计10年期美债收益率在2025年底降至4.08%后,将在2026年底前攀升至4.35%,该行认为美联储未来一年仅会降息两次,而利率互换市场押注将进行近四次25个基点的降息 [8] - 白银价格续刷历史新高,上涨0.8%至每盎司58.9471美元,市场押注美联储降息及供应紧张,交易员押注美联储12月会议降息25个基点的概率超过90% [9] 人工智能(AI)与半导体行业动态 - 迈威尔科技第三财季总营收同比增长37%至20.7亿美元,GAAP净利润约19亿美元,环比激增876%,预计第四财季营收约为22亿美元,盘前股价涨超11% [11] - CrowdStrike第三季度营收为12.3亿美元,同比增长22%,年度经常性收入(ARR)同比增长23%至49.2亿美元,公司上调全年营收指引至47.97亿至48.07亿美元,调整后每股收益指引上调至3.70至3.72美元 [12] - 亚马逊AWS推出新一代自研AI训练芯片Trainium 3,并预告Trainium 4开发计划,旨在挑战英伟达和谷歌的市场主导地位 [13] - 模拟芯片制造商SiTime据传正洽谈收购日本瑞萨电子的计时部门,估值可能高达20亿美元,该部门生产用于数据中心等领域的同步信号时钟芯片 [14] 公司业绩与事件预告 - 重要经济数据预告包括北京时间21:15的美国11月ADP就业人数变动、22:15的美国9月工业产出月率以及23:00的美国11月ISM非制造业PMI [15] - 业绩预告显示,赛富时、Snowflake、C3.ai将于周四早间发布财报,克罗格、老虎证券将于周四盘前发布财报 [15]
美股前瞻 | 三大股指期货齐涨 迈威尔科技绩后大涨 11月“小非农”今晚来袭
智通财经网· 2025-12-03 11:59
盘前市场动向 - 12月3日美股盘前,三大股指期货齐涨,道指期货涨0.23%,标普500指数期货涨0.20%,纳指期货涨0.18% [1] - 欧洲主要股指涨跌互现,德国DAX指数涨0.23%,英国富时100指数跌0.13%,法国CAC40指数涨0.02%,欧洲斯托克50指数涨0.34% [2] - 国际油价上涨,WTI原油涨1.38%至59.45美元/桶,布伦特原油涨1.18%至63.19美元/桶 [3] 宏观经济与货币政策 - 美国11月ADP就业数据成为美联储12月会议前重要参考,市场预测分歧明显,FactSet调查预计私营部门新增4万人,媒体共识仅预期增加5,000人 [4] - 市场押注若极度鸽派的凯文·哈塞特接替鲍威尔,美联储2026年降息步伐可能加快,相关利率期货需求上升 [5] - 德意志银行分析指出,鲍威尔2026年5月主席任期结束后,可能选择留任理事至2028年1月,以维护美联储货币政策独立性 [6] - 摩根大通预警市场降息预期过热,预计10年期美债收益率在2025年降至4.08%后,将于2026年底攀升至4.35%,该行预计未来仅降息两次,而市场押注近四次降息 [7] - 白银价格续刷历史新高,一度上涨0.8%至每盎司58.9471美元,受美联储降息预期及供应紧张押注支撑,市场预期美联储明年累计降息85-100个基点,12月降息概率超90% [8] 人工智能(AI)行业动态 - 迈威尔科技第三财季总营收同比增长37%至20.7亿美元,GAAP净利润约19亿美元,环比激增876%,第四财季营收指引约22亿美元超预期,盘前股价涨超11%,业绩反映AI ASIC算力需求强劲 [10] - CrowdStrike第三财季营收12.3亿美元同比增长22%,调整后每股收益0.96美元,均超预期,并上调全年营收指引至47.97亿-48.07亿美元,调整后每股收益指引上调至3.70-3.72美元 [11] - 亚马逊AWS推出新一代自研AI训练芯片Trainium 3,并预告Trainium 4开发计划,旨在以更低成本、更高效率挑战英伟达和谷歌在AI芯片市场的主导地位 [12] - 模拟芯片制造商SiTime据传正洽谈收购瑞萨电子的计时部门,估值或达20亿美元,该部门生产用于数据中心等的同步信号时钟芯片,SiTime的计时芯片对AI数据中心性能和效率至关重要 [13] 重要日程预告 - 重要经济数据:北京时间21:15美国11月ADP就业人数、22:15美国9月工业产出月率、23:00美国11月ISM非制造业PMI [13] - 业绩预告:周四早间赛富时、Snowflake、C3.ai发布财报;周四盘前克罗格、老虎证券发布财报 [13]
集齐三大王牌,亚马逊云科技转向AI全栈
21世纪经济报道· 2025-12-03 11:16
AWS的战略转型与核心布局 - AWS的re:Invent大会已全面转向“AI全栈竞争”的核心布局阵地,试图通过“自研芯片+云基础设施+应用层AI”的组合拳建立从底层到上层的闭环体系 [1] - AWS CEO披露Trainium业务规模已达数十亿美元,并已部署100万颗Trainium芯片 [1] - 云计算厂商的竞争正从算力规模走向AI能力结构的全面竞赛,各大厂商资本开支全面上涨,推动全球云计算市场进入新的加速期 [1] AI基础设施与自研芯片进展 - AWS迭代了一系列AI基础设施能力,包括Trainium系列芯片、UltraServers训练服务器、Nova 2系列基础模型及Frontier Agents,目标是从传统云服务提供者转变为从芯片到模型的AI全栈技术供应商 [2] - AWS在芯片层面主要有Graviton、Trainium、Inferentia三个系列,分别对标英特尔、英伟达和AMD [2] - 基于3nm的Trainium3芯片推出了UltraServers,单集群可集成144颗芯片,算力达362 PFLOPS(FP8),性能相对上一代提升超过4倍 [2] - 推进自研芯片旨在应对全球GPU供应链紧张和成本抬升,以掌握更可控的算力来源,与英伟达形成竞合关系 [3] - AWS仍是全球部署英伟达GPU规模最大的云厂商,其P6e-GB300实例采用了英伟达GB300 NVL72 GPU [3] - 云巨头均在加码芯片部署,AWS的AI芯片和谷歌的TPU已从内部供应走向公开市场,与英伟达、AMD的竞合态势愈演愈烈 [3] 模型、平台与企业级市场布局 - AWS主张企业需要多个模型而非一个模型,其Amazon Bedrock平台新增了18款开源模型,涵盖谷歌、英伟达、OpenAI、Mistral AI及国内阿里、月之暗面、稀宇科技等公司的模型 [4] - AWS发布了4款Nova 2系列模型,并推出Nova Forge服务,允许企业将自身数据整合进模型训练流程,构建“企业知识 + 基础模型”的专属能力 [4] - 面向企业端,AWS推出了AI Factories服务,为客户定制AI设施,旨在重塑自身的“AI基建”护城河 [4] AI Agent应用生态竞争 - 2025年被视为AI Agent爆发元年,底层硬件厂商开始向AI应用靠拢 [5] - AWS发布了Frontier Agents系列,包括面向运维、安全、开发工作流程及复杂编程的多种Agent,旨在通过自动执行企业内部流程、调度云资源等提升企业对云资源的依赖度,扩大云生态规模 [5] - 与AWS的“基础设施型Agent”相比,OpenAI的Agent更适用于知识工作和个人效率工具,谷歌Gemini Agent优势在于检索、内容生成及与Workspace结合,微软Copilot Agents深度绑定Office、Teams和Windows,阿里则全力进军C端AI应用 [6] - 各式各样的Agent上线是新一轮AI云生态竞争的“前哨战”,真正的竞争正从单纯云计算转向AI计算和AI生态 [6] 行业资本开支与竞争态势 - 生成式AI推动算力需求爆炸式增长,大模型训练、Agent长时间运行、多云互联要求云厂商具备多样化能力 [6] - 从芯片、硬件、软件到应用,巨头们已集齐能力,并在持续巩固长板、补短板,市场格局未定,投资持续猛烈 [6] - 2025年,亚马逊、微软、谷歌、Meta合计指引资本开支投入超3000亿美元,主要用于服务器、数据中心等基础设施投资 [6] - 2025年第二季度,北美四大互联网厂商资本开支总计958亿美元,同比增长64%,谷歌和Meta上调了全年指引 [7] - 亚马逊2025财年第三季度资本支出同比增长61%,达到创纪录的342亿美元,今年以来累计支出达899亿美元 [7] - AWS在2025年第三季度营收同比增长20%,达到330亿美元,超出预期 [7] - 国内市场方面,阿里巴巴宣布投入3800亿元用于AI基础设施建设,其云智能集团第二季度收入为333.98亿元,增速加快至26%,创三年新高,其中AI相关产品收入占阿里云外部商业化收入的超20% [7] - AI正在重新定义云的形态,云也在重塑AI的产业边界,胜负将取决于未来数年的产品打磨、生态建设与资本耐力 [7]
亚马逊云科技:与云计算一样,Agent也将带来巨大变革
搜狐财经· 2025-12-03 08:15
文章核心观点 - 2025年被行业视为AI Agent爆发元年,其在标准化和短周期任务中已展现出强大应用能力,并有望在长周期、复杂任务领域取得飞速进展,从而彻底重塑众多行业的业务、流程和组织 [1] - 亚马逊云科技在AWS re:Invent 2025大会上发布了一系列全栈AI创新服务,旨在从基础设施、推理平台、数据和工具等方面,为AI Agent在企业生产环境中的深度应用与大规模协同提供清晰路径和解决方案 [1][19] AI Agent的发展趋势与行业影响 - AI Agent时代正加速到来,其影响力被认为与云计算一样具有变革性,未来将出现数十亿AI Agent协同工作的场景 [1] - AI Agent的爆发将彻底颠覆企业的组织架构、业务流程和用户体验,让Agent融入生产环境并实现更好协作成为企业数智化转型的必答题 [18][19] AI基础设施:AWS AI Factory - 亚马逊云科技发布AWS AI Factory,这是一个可将专用的全栈AI基础设施直接部署到客户现有数据中心内的完整技术方案 [5] - 该方案结合了NVIDIA GPU、AWS Trainium芯片、高速低延迟网络以及Amazon Bedrock和Amazon SageMaker等核心AI服务,使用户能利用自身设施,而由AWS负责部署、运维和生命周期管理,类似于获得一个私有的AWS区域 [6] - AWS AI Factory的意义在于为用户提供了一个经过验证、成熟且可持续迭代的全栈AI方案,能帮助用户屏蔽基础设施复杂性,大幅缩短部署周期并降低运维难度,尤其适合看重安全与合规性又渴望快速应用AI的行业 [6][7] AI芯片创新:Trainium与NVIDIA平台 - 亚马逊云科技正式发布采用3nm Trainium3 AI芯片的Amazon EC2 Trn3 UltraServer超级服务器,单个服务器最多可扩展144个Trainium3芯片 [7] - 与Trainium2相比,Trainium3可提供高达4.4倍的计算性能、4倍的能源效率和近4倍的内存带宽 [7] - Trainium3 UltraServer专为AI、混合专家模型和大规模强化学习等工作负载设计,在GPT-OSS等开源模型的测试中,其推理响应速度、单芯片吞吐、训练与成本均取得业界领先成绩 [11] - 公司预览了下一代Trainium 4芯片,其计算能力将比Trainium 3提升八倍,内存带宽也将大幅增加 [15] - 除了自研芯片,公司还推出采用NVIDIA最先进GB300 NVL72平台的全新P6e-GB300 UltraServers,主要针对生产环境中的万亿参数AI推理和高级推理模型 [15] 大模型与训练服务:Nova系列与AWS Nova Forge - 亚马逊云科技正式发布下一代Nova 2系列模型,包括Nova 2 Lite、Nova 2 Pro和Nova 2 Omni,基准测试表明其能力可与Claude 3.5、GPT-4.5和Gemini Flash 2.5等模型媲美 [15] - 针对企业在微调模型时可能遇到的“模型退化”问题(即加入专有数据后模型遗忘原始训练数据),公司发布了开创性服务AWS Nova Forge [16] - AWS Nova Forge允许企业基于Nova系列模型训练自己的AI模型,提供对模型训练各阶段检查点的独家访问权限,使用户可在早期阶段注入专有数据并与精选数据集协同训练,确保模型最佳训练效果且不退化 [16] Agent平台与工具:Amazon Bedrock AgentCore - Amazon Bedrock AgentCore是一个Agent平台,核心目的是帮助企业大规模地安全构建、部署和运行高性能代理,支持广泛的基础模型和框架 [17] - 该平台在大会上功能得到增强,新增了Amazon Bedrock AgentCore Policy和Evaluations两项功能 [17] - AgentCore Policy旨在通过实时、确定性的控制措施来确保组织未经授权的操作,为Agent设定清晰边界,遏制未经授权的数据访问和不当交互 [18] - AgentCore Evaluations则帮助企业了解Agent的行为和结果,简化了确保Agent质量的复杂流程,并允许开发人员使用自定义的大型语言模型和提示词编写评估器 [18] - 此外,公司还推出了Kiro、DevOps Agent、Security Agent、Quick等一系列Agent [18] 公司创新与市场地位 - 亚马逊云科技在年收入达到1320亿美元之际,技术产品创新能力依然强悍,在本次大会上一口气发布了25项核心服务更新,涵盖从芯片、大模型到Agent平台和工具的全栈AI创新 [19] - 公司以全栈AI创新推动用户全面拥抱Agent变革时代,其提出的清晰路径为AI Agent未来在企业中的持续落地带来巨大参考 [19]
AI驱动光模块,新易盛涨超4%逆市冲击七连涨!云计算ETF汇添富(159273)冲高回落再度吸金!海外算力大战持续火热,亚马逊重磅发布!
搜狐财经· 2025-12-03 02:47
云计算与AI算力板块市场表现 - 12月3日,算力板块震荡飘红,云计算ETF汇添富(159273)冲高回落,成交额放量超1500万元,盘中净流入超520亿元 [1] - 该ETF标的指数成分股多数下跌,华胜天成、数据港跌超3%,中际旭创、阿里巴巴-W、腾讯控股跌超1%,中科曙光微跌;上涨方面,新易盛涨超4%,科华数据涨近1% [3] - 指数前十大成分股中,新易盛(代码300502)估算权重16.74%,上涨4.84%,市值129.30亿元;中际旭创(代码300308)估算权重20.71%,下跌0.92%,市值91.26亿元;阿里巴巴-W(代码9988)估算权重8.57%,下跌1.91%,市值25.03亿元;腾讯控股(代码0700)估算权重7.63%,下跌0.97% [4] 全球AI芯片与云服务竞争动态 - 12月2日,亚马逊AWS在re:Invent大会上推出新一代AI训练芯片Trainium 3,并预告Trainium 4开发计划,加大力度挑战英伟达和谷歌在AI芯片市场的主导地位 [3] - 亚马逊AWS同时推出Nova 2系列模型和全新AI服务,试图在激烈的AI竞争中抢占更多市场份额 [3] - 摩根士丹利上调谷歌2027-2028年TPU产量预测 [3] - 12月1日,DeepSeek发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新 [3] AI基础设施资本开支与光模块行业展望 - 美国四大云厂商(谷歌、微软、Meta、亚马逊)2024年资本开支达2300亿美元,同比增长55% [5] - 2025年前三季度,四大云厂商资本开支进一步投入2590亿美元,同比增长65% [5] - 据一致预期,2025年资本开支预计为3670亿美元,同比增长59%,而2026年资本开支增速将同比增长35%至4950亿美元 [5] - 几大云厂商均重申积极的投资计划,AI基础设施建设需求正快速扩展至其他云服务商、国家主权和企业客户 [5] - 英伟达超5000亿美元的收入可见度进一步提振了对本轮超级周期的信心 [5] - 2025年对具有高AI业务占比的光模块供应商而言是表现突出的一年,主要厂商实现了显著的营收增长和利润率扩张 [5] - 预计在AI基础设施投资周期未见减弱以及产品结构持续升级的驱动下,这一优异表现有望延续至2026年及以后 [5] 光模块龙头厂商业绩与供应链状况 - 光模块龙头厂商借助AI热潮实现业绩强劲增长,Coherent、中际旭创与新易盛的营收均实现大幅增长(2024年收入增速分别为15%/120%/175%,2025年前三季度分别为19%/44%/221%) [7] - 毛利率受AI网络部署向800G/1.6T光模块升级的驱动同步提升(2024年三季度至2025年三季度分别提升2.5/9.2/5.4个百分点) [7] - 展望2026年,预计在出货量增长、产品结构优化及1.6T产品带来价格提升的共同推动下,行业龙头有望延续强势表现 [7] - 供应链持续紧张,关键元器件如EML芯片的供需矛盾尤为突出,当前EML行业正积极扩产(如Lumentum计划将产能提升40%) [8] - 不依赖EML芯片的硅光技术正加速渗透,有助于缓解EML芯片的供应瓶颈,预测到2026年,硅光份额将超过50%(据LightCounting数据,2018年和2024年该比例分别为10%和33%) [8] - 预估2026年全球800G与1.6T光模块产品出货量将分别达到4900万与2200万个,但仍存在数百万单位的供需缺口(1.6T最为显著) [8] - 预计到2026年,800G产品中EML与硅光方案占比为5:5,而1.6T产品中这一比例有望达到3:7 [8] 全球AI数据中心项目规划 - Meta正在俄亥俄州建设Prometheus超级集群,规划超过1GW,预计在2026年成为Meta首个多GW级AI超级计算集群 [8] - Meta与Blue Owl等投资方在路易斯安那州规划Meta Hyperion AI园区,长期计划扩展至约5GW,地基工程已启动 [8] - 谷歌计划在印度安得拉邦建设Visakhapatnam AI中心,作为其“AI hub”五年150亿美元投资的一部分,最高达1GW [8] - xAI在美国南黑文孟菲斯建设Colossus 2项目,目标约1.1-1.2GW,已从约200MW扩展至数百MW,目标在2027年左右达到GW级 [8] - 谷歌将投资250亿美元于美国最大电网PJM范围内的数十个州的数据中心和AI基础设施 [8] - 微软在威斯康星州的AI数据中心规划容量达3.9GW,过去一年新增2GW数据中心容量,已承诺投资33亿,后续追加投资40亿美元 [8] - Crusoe与Tallgrass在美国怀俄明州规划Crusoe AI园区,规划1.8GW(可扩展至10GW),已于7月25日宣布选址 [8] - Poolside与CoreWeave在美国德克萨斯州规划“地平线计划”,总容量2GW,首个250MW阶段以CoreWeave为主要租户,约4万台GB300 GPU预计于2025年12月上线 [8] 主要供应商扩产战略 - Lumentum计划在未来几个季度增加40%的产能 [9] - Coherent于2025年7月在越南开设价值1.27亿美元的半导体与光子学制造工厂 [9] - GlobalFoundries收购新加坡硅光芯片制造商Advanced Micro Foundry [9] - Tower Semiconductor宣布投入6.5亿美元资本支出扩产硅光与储硅产能,主要用于升级8英寸产线 [9] - STMicroelectronics于2025年初重返硅光业务,并与AWS展开合作 [9] - 中际旭创推进中国与泰国双地扩产计划,当前产能将优先保障1.6T产品 [9] - 新易盛位于泰国的第二座工厂正加速提升1.6T光模块产量 [9] AI应用落地与端侧算力发展 - 12月1日,中兴通讯官方发布搭载豆包手机助手技术预览版的工程样机nubia M153少量发售 [10] - 豆包手机助手是豆包和手机厂商在操作系统层面合作的手机AI助手,基于豆包大模型的能力,豆包没有开发手机的计划,正在和多家手机厂商推进合作落地 [10] - 2025年8月,高层发布《关于深入实施“人工智能+”行动的意见》,明确提出到2027年,新一代智能终端、智能体等应用普及率超70%;到2030年,普及率超90% [10] - AI应用的不断落地,将进一步倒逼算力基础设施以及端侧算力基础设施加快建设 [11] - 以AIDC产业链为代表的光模块、PCB、主设备商以及铜缆等环节,作为算力基础的基本支撑,需求快速释放,产业链迎业绩及估值的戴维斯双击 [11] - 以模组为代表的端侧算力产业链也将持续受益,需求逐步从传统的数传模组向智能模组以及算力模组转变,模组成为边缘算力的重要一环 [11] 相关ETF产品概况 - 云计算ETF汇添富(159273)一指横跨沪港深,全面布局AI算力驱动下的云计算机遇,标的指数涵盖硬件设备、云计算服务、IT服务、应用软件、数据中心运营、平台软件等领域,软硬件比例6:4,指数港股权重超26% [11]
亚马逊重磅发布,挑战谷歌英伟达
36氪· 2025-12-03 02:27
新产品发布 - AWS在re:Invent大会上推出新一代AI训练芯片Trainium 3,并预告下一代Trainium 4的开发计划,旨在挑战英伟达和谷歌的市场地位[1] - 同时推出Nova 2系列模型和Nova Forge、Nova Act等全新AI服务,以在AI竞争中抢占更多市场份额[1] - Trainium 3芯片已部署至部分数据中心并于发布当天向客户开放,公司计划在明年初快速扩大规模[1] 新一代AI芯片性能 - Trainium 3是首款采用3纳米制程的AWS AI芯片,专为下一代智能体、推理和视频生成应用设计[7] - 搭载Trainium 3的Trn3 UltraServer系统训练和推理性能较第二代提升超过4倍,内存容量增加4倍[7] - 单颗Trainium 3芯片提供2.52 PFLOPs的FP8算力,内存容量提升1.5倍至144GB HBM3e,内存带宽提升1.7倍至4.9TB/s[7] - 单台完整配置的Trn3 UltraServer可容纳144颗芯片,总算力达362 PFLOPs,提供20.7TB HBM3e内存和706TB/s聚合内存带宽[7] - 系统能效比前代提高40%,性能功耗比提升4倍,在Amazon Bedrock平台上性能较Trainium 2提升3倍,每兆瓦输出token数量增加超过5倍[7] 未来芯片规划与兼容性 - 正在开发的Trainium 4芯片将支持英伟达的NVLink Fusion高速芯片互联技术,实现与英伟达GPU的互操作[9] - 该兼容性有助于降低基于英伟达GPU的大型AI应用迁移至AWS平台的技术门槛[9] 软件与服务生态 - 推出四款Nova 2模型:Nova 2 Lite(快速经济推理)、Nova 2 Pro(高度复杂任务)、Nova 2 Sonic(语音到语音)、Nova 2 Omni(多模态推理和生成)[12][13][14] - Nova 2 Lite在基准测试中,15项测试有13项优于或持平Claude Haiku 4.5,17项测试有11项优于或持平GPT-5 Mini[12] - Nova 2 Pro在基准测试中,与Claude Sonnet 4.5的16项测试有10项更优或持平,与GPT-5.1的16项测试有8项更优或持平,与Gemini 2.5 Pro的19项测试有15项更优或持平[12] - 推出业内首创的“开放式训练”服务Nova Forge,允许企业构建自己的Nova模型定制版本[15] - 推出专注于浏览器任务自动化的代理服务Nova Act,由定制的Nova 2 Lite模型驱动,在早期客户工作流程中实现90%的可靠性[16][18] 客户案例与市场影响 - 主要客户Anthropic已使用超过50万颗Trainium芯片,公司计划在年底前为其提供100万颗芯片[8][10] - 其他客户包括日本的LLM Karakuri、Splashmusic和Decart等,使用第三代Trainium芯片显著降低了推理成本[11] - Nova Forge的客户包括Reddit、Booking.com、Cosine AI等,Reddit用以改进内容审核系统[15] - Nova Act的客户Sola Systems每月自动化数十万个工作流程,1Password用以简化登录步骤,Hertz将软件交付速度提高5倍[18] - 新芯片消息公布后,亚马逊股价日内涨幅扩大至近2.2%,英伟达涨幅收窄,AMD股价下跌近1.7%[3]
AI芯片大战升级!亚马逊推出首款3nmAI芯片Trainium 3,挑战英伟达、谷歌
钛媒体APP· 2025-12-03 02:12
亚马逊新一代AI芯片发布 - 亚马逊云科技在re:Invent全球大会上正式推出新一代自研AI芯片Trainium 3,采用台积电3nm制程 [2] - 该芯片专为满足下一代生成式AI工作负载的高性能需求设计,计算能力较Trainium 2大幅提升,旨在帮助客户更快建立更大模型并提供卓越效能 [2] - 同时发布集成144颗Trainium 3芯片的Trainium3 UltraServer服务器,新服务器计算能力是上一代产品的4.4倍,内存带宽是上一代的4倍,能效提升40% [3] - 通过服务器互联互通,最多可部署多达百万颗Trainium 3芯片,将部署能力上限提高10倍 [3] 与竞争对手的性能比较 - 每颗Trainium 3集成144GB高带宽内存,而谷歌最新TPU为192GB,英伟达最新的Blackwell GB30高达288GB,性能上存在明显差距 [3] - 亚马逊强调其芯片为定制化设计,针对AWS云基础设施和Bedrock平台优化,与同等GPU系统相比可将训练和推理成本降低50% [4][5] - 英伟达方面表示其产品领先业界一代,是唯一能运行所有AI模型并应用于各种计算场景的平台,强调其护城河在于标准和生态 [5][6] 与英伟达的合作关系 - AWS宣布将在下一代芯片Trainium 4中使用英伟达的NVLink Fusion技术,以实现不同类型芯片间的高速连接和服务器间的快速通信 [8] - 该合作旨在帮助依赖英伟达工作负载的企业更轻松地迁移到Trainium基础设施,并构建规模更大、适用性更强的AI服务器 [8] - 英伟达CEO黄仁勋表示,双方将携手打造AI产业革命的计算架构 [8] 市场前景与客户基础 - Trainium芯片的主要客户包括Anthropic和理光等,用户基础不多,其中Anthropic是最大客户 [10] - AWS计划在年底前向Anthropic提供100万个Trainium芯片,但Anthropic也对芯片有多种选择,例如去年曾协议采购谷歌100万颗TPU芯片 [10] - 未来若电力供应充足,AWS可复制为Anthropic打造的架构以吸引其他大型客户 [10] AWS的AI垂直一体化战略 - 除自研芯片外,AWS还发布了Nova 2系列模型(包括推理、语音、纯文本模型)和“开放式训练”服务Nova Forge [11] - 推出Nova Act进军代理服务市场,帮助构建自动化网页操作智能体,显示出公司全面押注AI垂直一体化的趋势 [11][12] - 资本市场对相关战略前景判断尚不明确,亚马逊股价在发布日微涨0.23%,年内涨幅6.85%,在“美股科技七巨头”中处于较低水平 [12]