Workflow
SCADA
icon
搜索文档
下一个“AI卖铲人”:算力调度是推理盈利关键,向量数据库成刚需
华尔街见闻· 2025-12-24 04:17
AI基础设施软件行业概览 - 生成式AI应用加速渗透,AI基础设施软件成为应用落地的关键“卖铲人”,行业正迎来黄金发展期 [1] - 与模型训练环节被巨头垄断不同,推理和应用部署环节为独立软件厂商打开了新的商业空间 [1] - 当前两类产品最为关键:算力调度软件和数据类软件 [1] 算力调度软件 - 算力调度能力是决定模型推理服务盈利水平的核心变量,直接决定毛利率 [1][6] - 在单日10亿查询量场景下,使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点 [1][6] - 敏感性分析显示,当单卡吞吐从基准值的0.6倍提升至1.4倍时,毛利率可从52%提升至80% [6] - 海外云厂商毛利率差异显著,2025年三季度谷歌云毛利率43.3%,微软智能云34.6%,亚马逊AWS仅为23.7%,硬件调度能力影响关键 [8] 国内厂商算力调度实践 - 国内模型价格战激烈,成本控制至关重要,例如Deepseek V3定价为每百万token输入2元、输出3元,远低于海外同类产品1.25-5美元的价格 [5] - 华为Flex:ai实现异构算力统一调度,通过芯片级切分技术,在特定场景下可将平均利用率提升30% [5] - 阿里巴巴Aegaeon实现token级动态调度,将10个模型所需GPU数量从1192张锐减至213张,资源节约率达82% [5] - 英伟达Run:ai可将GPU利用率提升5倍,Deepseek自研调度系统实现成本利润率545% [6] 向量数据库与RAG技术 - 向量数据库是RAG应用的刚需基础,Gartner预测2025年企业RAG技术采用率将达68% [1][10] - 2024年全球已有45%的企业在智能客服、数据分析等场景部署RAG系统 [10] - 向量数据库核心价值在于支撑海量数据的毫秒级检索,需在亿级数据规模下保持高QPS实时检索能力 [10] - 从2024年四季度开始,通过API接口接入大模型的Token消耗量一年内翻了近10倍,直接拉动了向量数据库需求 [11] 数据库格局重塑 - 生成式AI时代,数据架构正从“分析优先”转向“实时运营+分析协同”,高频、低延迟的实时事务处理需求凸显OLTP数据库优势 [12] - MongoDB凭借低门槛、高弹性契合中小客户AI落地需求,2026财年一至三季度核心产品Atlas收入增速分别为26%、29%、30% [15][16] - MongoDB在2025年2月以2.2亿美元收购Voyage AI补齐向量检索能力,其嵌入模型在HuggingFace RTEB测评中排名前列 [16] - 2026财年三季度MongoDB毛利率达76%,预计年底经营利润率达18%,全年营收增长率约21%-22% [16] 数据平台厂商的应对策略 - Snowflake与Databricks选择向上下游纵向拓展,打造全栈工具链 [15][17] - Snowflake 2025财年收入达36.26亿美元,同比增长29.21%,预计2026财年收入44.46亿美元 [17] - Databricks 2025年年化收入超48亿美元,同比增长55%,数据湖仓产品年化收入超10亿美元,净留存率超140% [17] - 截至2026财年三季度,Snowflake年消费超100万美元的高价值客户达688家,福布斯全球2000强企业中已有766家成为其客户 [17] 存储架构技术升级 - AI推理进入实时化、PB级数据访问新阶段,存储IO性能至关重要,LLM推理的KV缓存访问粒度仅8KB-4MB,向量数据库检索粒度低至64B-8KB [18] - 英伟达推出SCADA方案实现GPU直连SSD,将IO延迟从毫秒级降至微秒级,测试显示1颗H100 GPU的IO调度效率是Gen5 Intel Xeon Platinum CPU的2倍以上 [18] - 向量数据库需进行技术升级,包括采用GPU适配的列式存储、将检索算法改为GPU并行版本、自主管理GPU显存分配 [19]
收官|川投能源:拉满冲刺“进度条”坚决打赢“收官战”
新浪财经· 2025-12-12 10:31
公司整体经营与战略 - 公司正全力落实集团“六大战役”部署,以奋进姿态冲刺年度经营目标 [1][6] - 公司今冬明春机组检修已全面启动,一批在建项目迎来重要节点,自主创新成果得到广泛应用 [1][6] 川投电力公司运营 - 公司以智能调度技术为支撑,建立“日调度、周分析、月总结”智慧调控机制,发电计划细化至小时级,并动态参与电力现货交易 [2][7] - 公司于12月3日提前28天完成年度发电目标,所属脚基坪电厂发电量创历史新高 [2][7] - 机组检修工作取得进展,高奉山电厂2号机组C级检修完成,百花滩电厂3号机组及天彭电力凤鸣桥电站1号机组A级检修已完成转子吊装 [2][7] 攀水电公司项目进展 - 银江水电站6号机组通过启动阶段质量监督检查,专家组认为其形象面貌基本满足启动条件,完成消缺整改后可具备启动条件 [3][8] - 此次检查为银江水电站实现全面投产发电目标奠定了坚实基础 [3][8] 攀新能源公司项目进展 - 四川时代项目正加速推进联合调试、消防、防雷及并网验收等关键工程,目标在2026年前实现并网运行 [4][9] - 广西融安光伏二期项目直流侧32.1MW建设任务已基本完成,正加紧办理并网手续 [4][9] - 屏山抽蓄项目前期工作稳步推进,实物指标调查已结束,水源迁建工程全面开展,预计12月底完成主体工程施工 [4][9] 交大光芒公司技术业务 - 公司自主研发的辅助监控系统在青藏铁路西格线完成调试,为兰青线、西格线提供的行电调融合平台进入试运营阶段 [5][10] - 服务于包银高铁的SCADA、PDMS系统已进入最后准备阶段 [5][10] - 公司正为马来西亚东海岸铁路项目安装PSCADA系统设备,冲刺联调联试节点,助力“一带一路”项目 [5][10]
计算机行业跟踪周报:构建数据库的“CUDA”,英伟达存储变革下软件重构-20251207
东吴证券· 2025-12-07 08:46
报告行业投资评级 - 增持(维持)[1] 报告的核心观点 - 随着AI推理时代的到来,传统的以CPU为中心的存储与计算架构已成为瓶颈,行业正经历从“以CPU为中心”到“以GPU为中心”的根本性变革[4][9] - 为满足AI推理“小块高频”的极致I/O需求,硬件上出现GPU直连SSD的新架构,软件上则需要重构以GPU为核心的数据库(GPU-Native数据库),这将为数据库产业带来新的机遇[4][18][25] 根据相关目录分别进行总结 1. AI推理时代来临,GPU直连SSD存储新架构出现 - AI推理与训练对存储的需求差异巨大:训练需要大数据块(10MB-1GB)、少并发、总容量相对较低(1-10TB);而推理需要小数据块(低至8B、64B、512B)、高并发(数千条)、大存储容量(高达1PB或数百TB)[4][9][10] - AI工作负载分化推动存储评估指标从传统的“每TB成本”(TB/TCO)转向“每IOPS成本”(IOPS/TCO),推理和预测式AI的性能瓶颈在于处理海量、高并发、小I/O请求的能力(IOPS)[9][10] - 传统以CPU为中心的架构无法满足AI推理的高并发需求,成为瓶颈,需要提升GPU地位,使其成为数据访问的控制中心,实现从CPU“推送”数据到GPU“拉取”数据的转变[4][11][14] - 解决方案是通过GPU直连SSD硬件(如通过NVMe-of、RDMA、GPUDirect Storage等技术)和SCADA软件架构,让GPU绕过CPU直接、高效地从SSD读写数据,彻底旁路CPU在数据流中的角色[4][14][16] 2. 存储架构变化带来数据库架构的变化 - 架构层面发生根本变化:从“以CPU为中心”转向“以GPU为中心”,GPU成为主计算单元,CPU角色退化为任务调度器、事务协调器和元数据管理器[4][18] - 数据库核心组件需要升级改造:1) 存储引擎革新,新的缓存管理器需直接管理GPU显存和直连SSD间的数据流动;2) 数据布局优化,为匹配GPU的SIMD架构,可能采用纯列式或混合存储格式并原生支持Apache Arrow等零拷贝格式;3) 查询执行引擎重构,核心算子需深度重写为GPU内核并能直接从SSD流式消费数据,实现计算与I/O的完全重叠[4][19][21] - 查询优化器面临挑战,成本模型需纳入GPU计算核心占用率、HBM与SSD间带宽、PCIe传输延迟等新因素,并优先考虑数据本地性优化[21] - GPU直连SSD技术将使得数据库从一个在通用操作系统上运行的应用程序,演变为一个直接调度和管理GPU、SSD的“数据中心级操作系统内核”[4][21] 3. 产业进展逐步加快 - 硬件方面:1) 2025年8月,闪迪与SK海力士签署谅解备忘录,共同制定高带宽闪存(HBF)技术规范,目标在2026下半年发布HBF样品,首批搭载HBF的AI推理系统预计于2027年初面世[4][21][22];2) 2025年9月,铠侠宣布将与英伟达合作,开发可直接连接到GPU并进行数据交换的SSD,目标性能需达到2亿IOPS,并计划支持PCIe 7.0标准[4][22] - 软件方面:1) Hammerspace通过优化元数据读取和GPU服务器直连存储驱动器中的数据放置策略,加速了其数据编排平台软件的性能[4][23];2) Cloudian HyperStore通过RDMA over S3技术,实现对象存储与GPU内存的直接数据传输,使基于S3接口的向量数据库性能提升8倍[4][24] 4. 投资建议 - 投资逻辑基于AI推理爆发驱动GPU地位提升及硬件架构变革(GPU直连SSD),进而引发软件生态(尤其是数据库)的重大重构需求,数据库产业有望迎来新机遇[4][25] - 报告提及的相关标的包括:【星环科技】、达梦数据、海量数据、MongoDB、Snowflake等[4][26]
2025年中国工控系统‌行业产业链、发展现状、细分市场、竞争格局及发展趋势研判:政策驱动国产替代加速,2025年市场规模破3200亿[图]
产业信息网· 2025-08-10 00:36
行业概述 - 工业控制系统(ICS)是现代工业生产的核心中枢,正经历从传统自动化向智能化、自主化的战略转型 [1] - 主要分类包括SCADA、DCS、PLC、RTU和SIS系统,按行业或控制层级可进一步细分 [2] - 国际标准IEC 62264-1定义了五层架构体系:企业资源层、生产管理层、过程监控层、现场控制层和现场设备层 [4] 市场规模与增长 - 2024年中国工控系统市场规模突破3000亿元,年复合增长率保持10%以上 [1][14] - 预计2025年市场规模达3200亿元,政策推动下2027年前计划完成80万台工控设备更新改造 [14] - 工业机器人产量从2020年23.71万台增至2024年55.64万台,2025年上半年同比激增35.6%至36.93万台 [12] 细分市场表现 - DCS系统2024年市场规模148亿元,石化/电力领域渗透率超95%,国产化率突破45% [1][17] - SCADA系统2024年规模196.9亿元,云化产品占比40%,电力/轨道交通贡献60%营收 [17] - PLC市场2024年规模176.6亿元,小型设备国产替代率32%,中大型PLC外资占比仍超70% [1][17] 竞争格局 - 外资主导高端市场:西门子占PLC市场48%份额,ABB/施耐德把控协作机器人/能效管理领域 [20][21] - 本土企业中端突破:汇川伺服系统国产市占率28.3%,中控技术DCS在石化行业国产化率40.4% [1][20] - 小型PLC市场大陆品牌份额从2020年12.91%提升至2024年23.80%,日系品牌份额同期下降近10个百分点 [22] 技术发展趋势 - AI驱动的预测性维护方案使设备停机时间减少60%,维护成本降低40% [14] - 5G与TSN网络架构提升工业通信可靠性,数字孪生技术优化产线效率 [24] - 绿色工控解决方案推动行业碳强度下降25%,2025年渗透率预计超60% [14][27] 政策支持 - 2024年出台《工业控制系统网络安全防护指南》等多项政策,要求2026年前覆盖4.5万家企业数据分级保护 [8][9] - 《制造业数字化转型行动方案》重点推进PLC、DCS等工业操作系统更新换代 [9] - 中小企业数字化赋能专项行动推动AI/5G/区块链技术在县域中小企业应用 [9] 产业链生态 - 上游核心零部件国产化率提升但高端芯片仍依赖进口,中游国产厂商在中端市场实现替代 [10] - 下游新能源(锂电/光伏)、智能制造、轨道交通等领域需求旺盛 [10] - 本土企业通过"工业操作系统+行业APP"模式拓展能源管理、虚拟电厂等新兴场景 [17] 国际化进展 - 国产工控系统出口额占比从2022年12%向2030年25%目标迈进,东南亚/中东欧成为重点市场 [26] - 头部企业通过"技术出海+本地化服务"中标海外高端项目,加速全球化布局 [26]