Workflow
T4
icon
搜索文档
定期更新
小熊跑的快· 2025-08-11 08:26
推理算力需求 - A10 T4 L4等推理算力硬件价格表现良好 需求得到进一步验证 [1] 英伟达业务动态 - 彭博一致预期英伟达本季度营收455亿美元 下季度指引525亿美元 [4] - H20和AMD MI308芯片可能恢复对华出口 需缴纳15%收入给美国政府 [4] - 2024年预计出货3万台GB200和1万台GB300服务器 外加200万张B200单卡 [4] - 2025年GB300出货预期上调至10万台 三季度进入组装旺季 [4] - GB200/300采用液冷方案 性能比风冷版提升25% 功耗降低30% [4] - 液冷服务器将带动散热和电源系统升级 144卡/256卡超大机柜成为趋势 [4] AMD技术进展 - MI355X液冷方案支持128卡扩展 MI350仅支持64卡 [4] - AMD单瓦算力贡献显著低于英伟达 因此建议客户配套液冷方案 [4] TPU发展前景 - 2025年TPU液冷比例预计超过65% [5] - v7系列TPU算力达4614TFLOPs 较v6提升2.5倍 [5] - 单芯片内存容量提升4.5倍 [5] - TPU单价仅为B200的1/4 可能采用国产液冷方案降低成本 [5] 技术演进逻辑 - 行业技术发展遵循经济学和物理学的基本规律 [6]
cutting同时 推理价格涨了
小熊跑的快· 2025-05-13 23:30
2025年AI裁员与推理芯片租赁价格变化 - 2025年可能成为AI裁员元年 各公司裁员比例在个位数百分比 [1] - 纯推理芯片租赁价格出现上涨趋势 [1] - A10和T4芯片仅能用于推理 无法进行训练 [1] - 阿里云上主力推理租赁芯片为A10 [1] - A10芯片租赁价格近期持续上涨 [1]