沐曦MX1系列
搜索文档
围观!预算2100万GPU服务器别样标书
是说芯语· 2025-11-18 07:57
采购项目概况 - 某985高校发布总预算2100万+的GPU服务器采购需求,计划采购13台服务器 [1] - 采购核心逻辑从传统“参数堆砌”转向“实用性”与“适配性”,重点关注国产化、实测性能和模型兼容性 [1][3] - 采购清单包括10台标准GPU服务器和3台高密度GPU服务器(单台搭载≥16张GPU卡) [4][8] 技术规格要求 - 服务器CPU要求采用国产x86架构,配置≥2颗处理器,单颗基础主频≥2.7GHz,核数≥64核,线程数≥128 [6][8] - 标准服务器要求配置≥8张国产AI加速卡,单卡显存≥96GB,整机FP16算力≥2.2 PFLOPS [6] - 高密度服务器要求单台配置≥16张GPU卡,整机HBM显存容量≥1400GB,GPU卡间互联带宽≥700GB [8] - 网络配置要求支持IB和RoCE联合组网,标准服务器需配备≥4*400G光口网卡,高密度服务器需配备≥1*双口200G卡 [6][8] 性能与兼容性测试 - 要求服务器支持CUDA生态,需现场演示通用AI相关主流Cuda Samples算子的兼容能力 [8][9] - 高密度服务器需在BF16精度下运行DeepSeek-V3 671B或DeepSeek-R1 671B模型推理服务,在256/256输入输出场景下TPOT≤50ms时,承载≥32并发,单机生成吞吐≥600 Tokens/秒 [8] - 同时要求运行QWEN3-235B-INT8模型,在256/256输入输出场景下TPOT≤100ms时,承载≥512并发,单机生成吞吐≥4700 Tokens/秒 [9] 采购趋势变化 - 趋势一:从“指标比拼”转向“模型实测”,高校直接将DeepSeek、Qwen等主流大模型作为测试标准,要求算力从理论性能落地为实用价值 [10] - 趋势二:从“N卡封闭生态”转向“国产兼容生态”,标书明确国产化导向,同时要求兼容现有成熟软件生态,降低科研机构迁移成本 [10] - 趋势三:从“硬件采购”转向“算力体系建设”,采购目的是搭建AI算力支撑体系,厂商需提供从硬件部署到模型优化的全链条服务 [11] 国产算力厂商机遇 - GPU领域海光DCU、壁仞BR100、沐曦MX1系列已具备技术积累,部分产品算力指标接近主流N卡 [11] - CPU方面海光3号、飞腾2000+、鲲鹏920等产品凭借稳定性能成为高校服务器常用选择 [11] - 软件生态上海光DCU已实现对PyTorch、TensorFlow等主流框架兼容,壁仞科技通过完善工具链降低CUDA迁移成本 [12]