Workflow
九章云极COO尚明栋:算力利用率不足30%,根源在于「堆硬件」而非「重运营」丨智算想象力十人谈
雷峰网·2025-09-02 10:09

行业现状与挑战 - 行业内平均算力使用率不足30%,大量算力闲置浪费 [3] - 算力闲置主要由于供大于求以及裸金属租赁模式锁定时间与资源边界 [3] - 裸金属租赁模式仅适合少数拥有大规模模型训练需求的厂商,市场需求易饱和 [3] - 推理算力需求迎来爆发,但厂商难以应对零散而弹性的算力需求 [3] 算力运营模式创新 - 算力作为基础设施本质是运营型生意,核心价值在于持续被使用和消纳 [4] - 智算中心操作系统需统筹硬件、定义软件、孵化生态,优化成本和效率 [5] - 九章云极推出Alaya NeW智算中心操作系统,定义"一度算力"标准化单位 [6] - 按实际消耗计算量计费模式打破对算力时间和资源边界的锁定 [16] 算力普惠与成本优化 - 实现算力普惠需降低使用成本和技术门槛 [9] - 按算量计费模式确保客户只为真正使用的算力付费,避免资源闲置浪费 [15] - 九章云极按算量计费单位算力单价高于裸金属租赁,但通过提高使用效率降低客户总成本 [16] - 裸金属租赁模式适合技术能力强、能保持高GPU利用率进行大规模训练的客户 [17] 算力资源池与组网方案 - 九章云极采用多元化算力资源池构建策略,与战略投资伙伴合作 [20] - 组网方案需满足专业架构设计,简单裸金属链接组网难以达到云化服务要求 [21] - 九章云极当前只运营自建智算中心,因第三方集群改造消耗专业团队 [21] 竞争格局与生态建设 - 智算云竞争力体现在性价比和生态化规模 [23] - AWS在2011-2013年间每年降价12次,体现云服务性价比竞争重要性 [22] - 数据迁移成本与上层工具链绑定形成用户粘性,带来可持续收入 [23] - 智算云平台价值在于解决传统云计算AI任务算力调度低效、弹性不足问题 [24] 推理算力发展趋势 - 推理算力占比快速上升,增速和规模潜力远超训练算力 [26] - 算力利用效率需从不足30%提升至40%、50%甚至更高 [27] - 国产芯片厂商优先发力推理芯片市场,带来异构计算挑战与机遇 [27] - 人工智能技术从单一模态走向多模态融合与感知 [28]