下一个“AI卖铲人”:算力调度是推理盈利关键,向量数据库成刚需
随着生成式AI应用加速渗透,AI基础设施软件(AI Infra)正成为应用落地的关键"卖铲人",算力调度能力已成为决定模型推理盈利 水平的核心变量。 数据层面,向量数据库已成刚需,Gartner预测2025年企业RAG技术采用率将达68%。海外数据厂商如MongoDB在2024年二季度收入 增速出现明显拐点,验证了这一趋势。 算力调度:推理盈利的核心变量 AI Infra指的是专门为AI工作负载的设计、构建、管理和优化的底层硬件与软件系统。 它的核心目标是高效、大规模地完成AI模型的 训练和推理任务。如果将开发大模型比做是 "造房子",那 AI Infra 就是"工具箱",包括构建、部署和维护人工智能 (AI) 系统所需的 硬件、 软件和服务的组合。 国内模型价格战背景下,成本控制成为生死攸关的问题。Deepseek V3官方定价仅为每百万token输入2元、输出3元,而海外同类产品 价格普遍在1.25-5美元之间。这种显著的价格差异使得国内厂商对成本的敏感度远超海外。 大厂算力调度能力对比: 华为Flex:ai实现了异构算力统一调度,支持英伟达、昇腾及第三方算力,通过芯片级切分技术(精准至10%粒度),在无 ...