AI推理

搜索文档
每周观察 |Nearline SSD需求攀升;4Q25 DRAM和NAND Flash价格上涨;LCD电视面板大厂计划调降稼动率
TrendForce集邦· 2025-09-26 04:09
AI推理催化大容量储存产品结构性改变,Nearline SSD需求急升 根据Tr endFor c e集邦咨询最新研究,未来两年AI基础设施的建置重心将更偏向支持高效能的推 理(Inf e r enc e)服务,在传统大容量HDD严重供不应求的情况下,CSP业者纷纷转向NAND Fl a sh供应商寻求解方,催生专为Inf e r enc e AI(AI推理)设计的Ne a rline SSD(近线固态硬 盘),以满足市场的迫切需求。 点击右边 阅读原文 了解更多详情 4Q25 DRAM价格延续涨势,服务器需求提前发酵、旧制程产品涨幅仍较大 根 据 Tr endFor c e 集 邦 咨 询 最 新 调 查 , 由 于 三 大 DRAM 原 厂 持 续 优 先 分 配 先 进 制 程 产 能 给 高 阶 Se rve r DRAM和HBM,排挤PC、Mobil e和Consume r应用的产能,同时受各终端产品需求分化 影响,第四季旧制程DRAM价格涨幅依旧可观,新世代产品涨势相对温和。 预估整体一般型 DRAM (Conventional DRAM)价格将季增8-13%,若加计HBM,涨幅将扩大至13-18 ...
9月23日晚间公告 | 云天励飞AI玩具四季度上市;海目星固态电池设备正在批量交付
选股宝· 2025-09-23 12:00
并购重组 - 华菱线缆拟以不超过2.7亿元收购三竹智能控制权 三竹智能为工业连接产品方案提供商 [1] 回购计划 - 神马股份拟以1亿元至2亿元回购股份 [2] - 烽火通信拟以7500万元至1.5亿元回购股份并注销 [2] 人工智能与机器人技术 - 云天励飞自研AI驱动产品噜咔博士AI毛绒玩具预计2025年年底推出 正在开发新一代大脑芯片DeepXBot系列用于加速人形机器人推理任务 已完成第四代NPU研发并推进下一代高性能NPU研发 [3] - 浙海德曼人形机器人和机器狗项目处于样机试制阶段 [3] - 福莱新材已与国内外多家灵巧手公司及人形机器人公司合作 [5] 固态电池与设备 - 海目星为最早实现氧化物加锂金属负极技术路线并完成锂金属固态电池商业闭环的设备公司 相关设备正批量交付 应用于低空飞行器 [3] 影视与文化 - 果麦文化主投电影《三国的星空第一部》定于10月1日上映 [3] 显示技术 - 维信诺拟以苏州国显作为项目公司开展昆山全球新型显示产业创新中心项目前期工作 [4] 锂业与膜处理 - 久吾高科与国投新疆锂业签订8150万元膜处理系统采购合同 [6] 新材料与医药 - 沃尔核材控股子公司拟投资10亿元建设科特苏州新材料项目 [7] - 恒瑞医药SHR7280片药品上市许可申请获受理 国内外辅助生殖领域尚无口服GnRH拮抗剂获批上市 [7] - 甘李药业与FZ及BIOMM就巴西生产开发伙伴关系签订技术转移与供应协议 与BIOMM签订供应框架协议 合同总金额预计不低于30亿元 [7] 医疗器械与药品 - 科兴制仙人干扰素α1b吸入溶液纳入突破性治疗品种名单 [8] - 佰仁医疗射频消融系统进入创新医疗器械特别审查程序 [8] 存储与半导体 - 江波龙表示下半年服务器NAND市场备货需求升温 四季度存储市场价格将全面上涨 企业级PCIe SSD与RDIMM产品已批量导入国内头部企业 [8] - 精智达高速FT测试机提前完成年初目标 KGSD CP测试机稳步推进验证 结合存储行业技术方案持续迭代升级 [8] 战略合作 - 富煌钢构与二十二冶集团签订战略合作协议 [9] 债券发行 - 保利发展拟发行不超过150亿元公司债券 [10] 股权变更 - 上纬新材股份转让完成过户登记 控股股东变更为智元机器人关联公司出资设立的持股平台智元恒岳 [11]
AMD 在 AI 推理领域悄然领先
美股研究社· 2025-09-23 11:46
AMD ( NASDAQ: AMD ) 在过去数年中从落后者成长为有力竞争者,这得益于其在数据中心 CPU 领域的某些优势以及向 AI 加速器迁移的加 速。上个季度该公司表现强劲,但过于关注 短期波动的投资者却忽略了整体情况。 AMD 构建了涵盖 CPU、GPU、AI PC 以及未来机架式系统的多引擎增长基础设施。后者将推动 CPU 的长期增长周期,并将在未来十年内规划 其未来发展。 分析 师仍然看好AMD。最近的回调与其说是疲软,不如说是健康的调整,并重新定位至新的高点,此前其已从 最初看涨的97美元 上涨了62% 。 AMD 未来最关键的战场就在数据中心 —— 因为现在推理任务的算力需求已经超过了训练,成了算力需求的第一驱动力。不管是超大规模科技 公司、各国政府,还是普通企业,都在想办法降低成本,同时支撑更大规模的模型落地。 这说到底,其实是改变了 AMD 的竞争逻辑:以前比的是训练速度,现在 "每单位 token 的成本" 才是核心指标。 AMD 2025 年第二季度数据中心收入达到 32.4 亿美元 ,同比增长 14%,这得益于创纪录的 EPYC CPU 销量。Turin 的采用率正在极快增长, EP ...
研报 | AI推理催化大容量储存产品结构性改变,Nearline SSD需求急升
TrendForce集邦· 2025-09-22 09:04
AI基础设施建置重心转移 - AI基础设施建置重心未来两年将更偏向支持高效能推理服务[2] - 传统大容量HDD严重供不应求 CSP业者转向NAND Flash供应商寻求解决方案[2] - 催生专为AI推理设计的Nearline SSD以满足市场迫切需求[2] NAND Flash技术发展路径 - 各大NAND Flash供应商加速Nearline QLC NAND Flash产品验证与导入[2] - QLC技术能以更低成本储存更多资料 成为满足大容量需求的关键[2] - 供应商正扩大QLC SSD产出 预计2026年逐步提高产能利用率[2] 企业级SSD供应状况 - 推理AI应用扩张使需求热潮延续至2027年[2] - 2026年企业级SSD供应将呈吃紧状态[2] - Nearline SSD产品朝更大容量、更低成本方向发展以取代HDD[3] NAND Flash多元应用拓展 - NAND Flash供应商同步发表HBF产品扩大AI训练应用市占率[4] - SanDisk阵营采用HBM与HBF混合设计兼顾容量与效能[4] - Samsung和Kioxia阵营采用SCM XL-Flash和Z-NAND技术提供更具成本效益方案[4] 技术路线竞争影响 - 技术路线竞争推动NAND Flash应用从单纯储存走向深层AI运算整合[4] - 预示着NAND Flash应用将更加多元[4] - Nearline SSD在电力消耗方面显著降低[3]
每周观察 | 预计2026年QLC SSD出货有望爆发性增长;英伟达尝试调升HBM4规格;全球笔电出货量;全球AR装置出货…
TrendForce集邦· 2025-09-20 02:03
AI推理需求对存储市场的影响 - AI创造的庞大数据量冲击全球数据中心存储设施 导致Nearline HDD出现供应短缺[2] - Nearline HDD交付周期达52周 每GB平均售价0.015美元 最大容量32TB[3] - QLC SSD交付周期仅8周 每GB平均售价0.05-0.06美元 最大容量122TB 能效较高[3] - 大容量QLC SSD出货可能于2026年出现爆发性增长[2] HBM4规格升级与供应商格局 - 英伟达要求HBM4的Speed per Pin调升至10Gbps以应对AMD 2026年推出的MI450 Helios平台[3] - SK海力士在HBM4量产初期预计维持最大供应商优势[3] 全球笔记本电脑市场趋势 - 2025年全球笔电出货量预计年增2.2% 突破1.8亿台[5] - 东南亚产能持续扩张 因笔电产品享有美国进口免关税待遇[4] - 供应链为应对美国对等关税政策加速在东南亚进行产能布局[4][5] AR显示技术发展前景 - Meta首款量产AR装置采用LCoS显示技术[8] - LCoS显示产品市场占比预计2026年上升至13%[8] - 单片全彩LEDoS有望于2028年迎来技术及成本重大突破[8] 其他行业动态 - 2Q25全球智能手机生产总数达3亿支 季增约4%[13] - Micro LED手表应用推动2029年芯片市场规模突破4.61亿美元[15]
AI推理是下一个万亿市场?七牛智能与五象云谷合作,卡位产业爆发拐点
格隆汇APP· 2025-09-19 12:58
行业趋势与市场机会 - AI产业正经历从重训练向重推理的范式迁移 推理环节成为算力消耗主体 商业化爆发刚开始[2] - 未来AI算力结构将呈现训练5% 推理95%的极端分布 推理需求呈指数级膨胀[3] - Google月Token处理量从5月480万亿飙升至7月960万亿 两个月翻倍 中国日均Token量一年增长300倍达30万亿[3] - AI Agent在投研客服编程等场景落地使Token调用量比传统Chatbot提升十倍 算力需求可能增长百倍[3] 公司战略合作与竞争优势 - 与五象云谷智算中心战略合作 目标将AI推理算力做成普惠价 进军千亿级AI推理市场[2] - 推理算力核心要求是算得近算得省算得稳 对延迟成本稳定性敏感度远高于训练[4] - 拥有169万平台开发者 音视频云技术积累形成AI推理服务独特竞争优势[5] - 合作模式为生态+基础设施互补 五象云谷一期总投资36亿元 提供40000P智能算力 形成强竞争壁垒[5] 业务增长与财务表现 - AI Cloud平台调用大模型超50个 2025年上半年AI收入1.84亿港元同比增64.6% 营收占比提升至22.2%[10] - 2025年上半年经调整EBITDA收窄至-350万港元 接近盈亏平衡 亏损同比大幅收窄[13] - AI用户从8月初超1万快速增至1.5万 呈现S曲线启动态势[13] - 高毛利率AI业务加速放量 显著高于传统云业务 带来收入弹性与盈利弹性[11][12] 未来发展空间 - 政策层面契合国务院人工智能+行动意见中5次强调的普惠概念 有望获得政策支持[6] - 探索AI+教育AI+能源等垂直行业解决方案 教育领域AI批阅智能答疑等需大量推理算力[6] - 通过五象云谷位于广西的节点提供跨境推理服务 切入东南亚AI应用新兴市场[6] - 端侧多模态操作系统灵矽AI切入智能硬件市场 与云端协同处理实时交互和复杂推理[12] 商业模式与生态价值 - 完成底层基础设施-AI引擎-终端场景全栈布局 形成三层飞轮模型[8][12] - Media Cloud提供稳定现金流和169万开发者流量池 AI Cloud为增长引擎 LinX OS拓展硬件生态[9][10][12] - 庞大开发者生态构成业务安全垫 微小付费转化率提升将带来巨大收入弹性[15] - 估值相较海外同业存在显著折扣 海外同业PS倍数高达97倍[17]
AI推理是下一个万亿市场?七牛智能与五象云谷合作,卡位产业爆发拐点
格隆汇APP· 2025-09-19 12:19
文章核心观点 - 七牛智能与五象云谷智算中心战略合作 目标是将AI推理算力做成普惠价 共同开拓千亿级AI推理市场 此次合作标志着公司精准卡位AI产业从训练转向推理的拐点 并依托三层业务飞轮模型实现从工具提供商向生态赋能者的转型 公司财务表现显示盈利拐点临近 是港股市场稀缺的全栈型多模态AI平台标的 [2][3][8][9][14][17] AI推理赛道爆发背景 - 全球AI产业正经历从重训练向重推理的范式迁移 推理环节成为算力消耗绝对主体 商业化爆发刚起步 [2] - 未来AI算力结构将呈现训练5%、推理95%的极端分布 推理需求呈指数级膨胀 [3] - AI Agent智能体在投研、客服、编程等场景落地使Token调用量比传统Chatbot提升十倍以上 算力需求可能增长百倍 [4] - Google月Token处理量从2025年5月的480万亿飙升至7月的960万亿 两个月翻倍 中国日均Token量一年内增长300倍达30万亿 [4] 合作战略价值与竞争壁垒 - 推理算力核心要求是算得近、算得省、算得稳 对延迟、成本、稳定性敏感度远高于训练 技术和服务门槛更高 [5] - 七牛智能自2011年起深耕音视频云 拥有超过169万平台开发者 在音视频云技术和客户积累基础上迭代AI推理算力服务形成平台能力 [5] - 五象云谷智算中心一期总投资36亿元 可承载两个万卡集群 提供高达40000P智能算力 合作本质是生态+基础设施互补 形成难以复制的竞争壁垒 [5] - 合作完全契合2025年6月国务院《深入实施人工智能+行动的意见》中5次强调的普惠战略和智能原生概念 有望获得政策支持 [6] - 合作将探索AI+教育、AI+能源等垂直行业解决方案 这些行业数字化程度低但场景丰富需求刚性 可提供定制化推理服务实现溢价定价 [6] - 五象云谷位于广西 是中国-东盟区域桥头堡 七牛智能可通过其节点为国内开发者提供跨境推理服务 帮助中国AI应用出海东南亚市场 [7] 三层飞轮业务模型 - 底层基石Media Cloud是公司起家核心业务 提供稳定现金流和庞大高粘性开发者生态 作为向AI业务导流的天然流量池 [10] - 新增长引擎AI Cloud平台可调用大模型超过50个 支持从LLM推理到AI编程多种功能 2025年上半年AI相关收入达1.84亿港元同比大增64.6% 营收占比提升至22.2% 且毛利率显著高于传统云业务 [11] - 顶层生态延展多模态OS灵矽AI是端侧操作系统 让智能硬件具备看、听、说、理解能力 与云端协同处理实时交互和复杂推理 切入智能硬件蓝海市场 [12] - 三层飞轮串联形成闭环 Media Cloud输血获客 AI Cloud提供增长弹性 LinX OS拓展增量场景 公司转型为AI时代运营平台 客户粘性、定价权和现金流质量有望跳档 [13] 财务表现与估值潜力 - 2025年上半年公司经调整EBITDA收窄至-350万港元 非常接近盈亏平衡点 亏损同比大幅收窄 驱动因素是高毛利率AI业务加速放量 [15] - AI相关用户从2025年8月初超1万快速增至1.5万 呈现典型S曲线启动态势 [15] - 合作将为企业级客户和个人开发者提供更精细的大模型推理与算力租赁服务 缩短从概念验证到规模化商用周期 吸引长尾客户 ARPU值有望提升 [16] - 超过169万平台开发者构成坚实基本盘和流量来源 微小付费转化率提升将为收入带来巨大弹性 [16] - 当前市值估值倍数相较海外同业如Nebius的97倍PS存在显著折扣 未来催化剂包括合作项目订单落地、LinX OS与智能硬件厂商合作、2025年报AI收入占比提升等 [17]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
搜狐财经· 2025-09-18 06:34
项目进展 - 6个月建成算力集群 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72 [1] - 项目进度远超行业标准 6个月完成OpenAI和甲骨文等合作方15个月的工作量 [1] - 2025年3月7日启动Colossus II项目 收购100万平方英尺仓库及100英亩地块 [4] - 截至8月22日安装119台风冷式冷水机组 提供200MW冷却能力 [4] - 第一阶段部署11万个GPU 最终目标超过55万个GPU 峰值功率需求超1.1吉瓦 [4] - 部署168个特斯拉Megapack电池储能系统 避免对当地电网造成冲击 [5] 技术架构 - 基于xAI大型语言模型Grok构建多智能体系统 部署数百个专用智能体 [2] - 智能体分工涵盖编码 图像视频生成 软件测试等全流程 [2] - 系统通过虚拟机模拟人类用户交互 实现软件开发生命周期全自动化 [2] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 [4] - 发电厂已运行7台35MW燃气涡轮机 总输出245MW [4] - 通过合资公司获得400MW燃气涡轮机服务 占供应商总容量600MW的67% [5] 战略布局 - 项目命名为"巨硬计划"(MACROHARD) 2021年已有初步构想 [2] - Colossus II专为AI推理设计 规模较Colossus I扩大数十倍 [4] - 与特斯拉形成协同效应 AI软件优化自动驾驶算法及工厂自动化 [6] - 特斯拉提供海量真实世界训练数据 公司定位转向"AI机器人公司" [6] - 长远路线图计划将GPU总量扩展至100万个 [4] 资源投入 - 合资公司第二季度资本支出1.12亿美元 [5] - 密西西比州监管机构特批12个月燃气轮机运行许可 无需正式审批 [4] - 马斯克亲自督导项目 包括电力生产审查和技术评审 [5]
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
量子位· 2025-09-18 06:09
巨硬计划项目概述 - 马斯克旗下xAI推进"巨硬计划" 基于Grok大型语言模型构建多智能体系统 部署数百个专门AI代理协同模拟完整软件开发团队[3] - 项目核心逻辑为软件公司不生产实体硬件 因此从编码设计测试到管理的全部流程均可被AI复制[5] - 巨硬计划开发的AI软件将用于优化特斯拉自动驾驶算法 工厂自动化和人形机器人Optimus功能 特斯拉海量真实世界数据反哺训练[17] 算力基础设施部署 - Colossus II算力集群6个月从零建成 已完成200MW供电规模 支持11万台英伟达GB200 GPU NVL72[1][12] - 项目第一阶段部署11万个GB200 GPU 最终目标超55万个GPU 峰值功率需求超1.1吉瓦 长远规划扩展至100万个GPU[13][14] - 采用跨区域能源策略 在密西西比州收购前杜克能源发电厂 现有7台35MW燃气轮机运行 另部署168个特斯拉Megapack电池储能系统保障供电[15] 建设进度与比较优势 - 仅用6个月完成OpenAI和甲骨文等合作方15个月的工作量 创造行业新纪录[2] - Colossus I集群曾用122天建成约20万台H200 GPU 92天内规模翻倍 至今仍是最大AI训练算力集群[6][8] - Colossus II于2025年3月7日启动 收购100万平方英尺仓库和100英亩地块 7月已开始安装机架[10][11] 资源投入与执行力度 - 与Solaris Energy Infrastructure成立合资公司(Solaris持股50.1% xAI持股49.9%) 第二季度投入1.12亿美元资本支出[15] - 马斯克亲自督战 周末连续进行技术评审 现场审查变压器和电力生产进展 项目进入冲刺阶段[16] - 密西西比州监管机构临时批准发电厂运行燃气轮机12个月 无需正式许可 加速部署进程[15]
AI芯片黑马融资53亿,估值490亿
半导体行业观察· 2025-09-18 02:09
公众号记得加星标⭐️,第一时间看推送不会错过。 来源 : 内容 编译自 siliconangle 。 人工智能推理芯片开发商 Groq Inc. 今天宣布已筹集 7.5 亿美元的新资金。 Databricks Inc. 的支持者 Disruptive 领投了此轮融资。思科系统公司 (Cisco Systems Inc.)、三星 电 子 公 司 (Samsung Electronics Co.) 、 德 国 电 信 资 本 合 伙 公 司 (Deutsche Telekom Capital Partners) 和多家投资公司也参与了此次融资。Groq 目前的估值为 690 万美元,高于去年的 28 亿美 元。 Groq 推出了一款名为语言处理单元 (LPU) 的处理器。该公司声称,该芯片能够以比显卡高 10 倍的 能效运行某些推理工作负载。Groq 表示,LPU 的高效运行得益于多项竞争对手芯片所不具备的优 化。 协调运行 AI 模型所涉及的不同处理器组件可能会消耗大量的计算能力。据 Groq 称,其 LPU 降低 了这种开销,从而为推理留下了更多的处理能力。该公司表示,其芯片可以运行包含 1 万亿个参数的 模 ...