Servers

搜索文档
Super Micro Stock Falls 23%: Falling Knife Or Buying Opportunity?
Forbes· 2025-08-12 13:10
Super Micro Computer stock (NASDAQ:SMCI) has declined by close to 23% over the last five trading sessions, falling to about $45 per share. The sell-off follows the company's tough Q4 2025 earnings report, which missed estimates and saw margins contract. SMCI was touted as a major AI play amid surging demand for its servers, which are essential for deploying the latest AI GPU chips. SMCI built its growth story around a product roadmap tightly aligned with Nvidia's GPU cycle. The company has typically been qu ...
让64张卡像一张卡!浪潮信息发布新一代AI超节点,支持四大国产开源模型同时运行
量子位· 2025-08-11 07:48
国产开源模型发展 - 国产开源模型如DeepSeek R1、Kimi K2等在Hugging Face热度榜及关键指标(推理能力、长文本处理、多模态理解)上表现突出 [1] - 主流开源模型参数量突破万亿级别,显存需求达数TB量级 [1] - Agentic AI范式推动多模型协同与复杂推理链,计算与通信需求爆炸式增长 [2] 元脑SD200技术突破 - 浪潮信息发布超节点AI服务器元脑SD200,支持单机运行四大国产开源模型及超万亿参数推理 [3][5] - 64卡整机实现超线性扩展(DeepSeek R1推理性能提升3.7倍,Kimi K2提升1.7倍) [6][11] - 采用3D Mesh开放架构,通过Open Fabric Switch实现64卡统一编址,显存达4TB,内存64TB [7][8] - 百纳秒级低延迟通信,支持原生内存语义对齐,优于业界主流方案 [8] - 内置Smart Fabric Manager优化全局路由,PD分离框架提升推理效率 [9] Agentic AI对基础设施的挑战 - 智能体AI需多模型协同(如代码生成、逻辑推理、知识检索模型),交互频次与计算量激增 [14][15] - 万亿参数模型跨机通信延迟问题突出,传统InfiniBand网络难以应对高频小数据包场景 [15][16] - 元脑SD200通过统一计算域与8倍地址空间扩增,解决显存容量与延迟问题 [19] 超节点设计理念 - Scale Up路径选择:硅基芯片性能提升受限,Scale Out架构高延迟问题显著 [20][21] - 元脑SD200在有限物理空间内聚合64路GPU,平衡物理定律与工程实践 [22][24] - 系统化设计整合现有技术,最大化用户价值 [22] 开放生态战略 - 基于OCM(开放算力模组)与OAM(开放加速模块)架构,支持Intel、AMD、ARM等多平台及异构加速器协同 [25][27][29] - 兼容PyTorch、vllm等主流框架,降低用户迁移成本 [11][32] - 推动"智能平权",通过开放架构降低企业使用门槛,共享AI技术红利 [33][34][35]
浪潮信息“元脑SD200”超节点实现单机内运行超万亿参数大模型
科技日报· 2025-08-09 10:21
产品发布 - 公司发布面向万亿参数大模型的超节点AI服务器"元脑SD200",基于多主机低延迟内存语义通信架构,支持64路本土GPU芯片[2] - "元脑SD200"可实现单机内运行超万亿参数大模型,支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,已实现商用[2] - 超节点通过GPU互联技术将多台服务器、多张算力芯片卡整合为规模更大、算力更强的整体算力单元,突破传统算力部署边界[2] 技术特点 - 超节点通过优化节点内互联技术、液冷散热等手段提升集群整体能效、通信带宽与空间利用效率[2] - 产品基于开放总线交换技术构建,解决万亿大模型对超大显存空间和超低通信延时的核心需求[3] - 通过智能总线管理和开放的预填充—解码(PD)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务[3] 性能表现 - SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍[4] - 满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍[4] - 公司通过软硬协同系统创新突破芯片性能边界,在大模型场景中展示出优异性能表现[4] 行业背景 - 混合专家模型驱动大模型参数规模持续扩展,国内外前沿大模型参数量快速突破万亿规模[3] - 模型参数量增加和序列长度增加导致键值缓存激增,需要智能计算系统具有超大显存空间[3] - 智能体AI开启多模型协作新范式,推理过程需要生成比传统模型多近百倍的数据词元[3] 产业影响 - 公司通过开放系统架构创新为开源大模型的规模化落地和应用创新提供关键支撑[4] - 超节点搭建带动高速连接器、高速线缆、板材等上下游相关技术创新和应用[4] - 推动形成更好的产业生态,提高生态竞争力[4]
大模型进入万亿参数时代,超节点是唯一“解”么?丨ToB产业观察
钛媒体APP· 2025-08-08 09:57
模型发展趋势 - 企业级应用侧小参数模型成为落地最佳选择 通用大模型参数进入万亿时代 [2] - MoE架构驱动大模型参数规模提升 如KIMI K2开源模型总参数量达1.2万亿 每个Token推理仅激活32B参数 [2] 算力系统挑战 - 万亿参数模型训练算力需求激增 GPT-3训练需2.5万张A100 GPU运行90-100天 万亿模型需求可能达数十倍 [3] - 模型并行和数据并行导致跨节点通信开销大 GPT-4训练算力利用率仅32%-36% 受显存带宽限制 [3] - MoE模型训练稳定性挑战大 梯度范数频繁突刺 KV cache存储需求呈指数级增长 [3] 显存与计算需求 - FP16格式下万亿参数模型权重需20TB显存 动态数据需求超50TB GPT-3需350GB显存 万亿模型需2.3TB [4] - 长序列训练使计算复杂度平方级增长 2000K Tokens训练加剧内存压力 [4] - MoE路由机制导致专家负载不均衡 部分专家过度使用成为瓶颈 [4] 解决方案与技术进展 - 阿里云提出全局负载均衡损失 使模型PPL降低1.5个点 [5] - AI技术方向从预训练转向推理 算力需求从训练侧转向推理侧 [5] - MoE架构分布式训练通信时间占比高达40% 需构建更大Scale Up高速互连域 [5] Scale Up系统优势 - Scale Out集群节点间通信瓶颈放大 InfiniBand时延达10微秒 Scale Up系统将数百颗AI芯片封装为统一计算实体 [6] - 并行计算技术如专家并行、张量并行可拆分模型权重与KV Cache到多芯片 [6] - 构建大规模Scale Up系统是解决万亿模型计算挑战的唯一可行路径 [6] 产品与架构创新 - 浪潮信息发布超节点AI服务器"元脑SD200" 支持64路本土GPU芯片 可单机运行1.2万亿参数Kimi K2模型 [7] - 元脑SD200采用多主机低延迟内存语义通信架构 支持多模型同时运行 [7] - 3D Mesh系统架构实现64卡P2P全互连 拓展跨域互连能力 [8][9] 软硬协同与未来方向 - 软硬协同是突破算力瓶颈核心路径 字节跳动COMET技术将MoE通信延迟从0.944秒降至0.053秒 [10] - 超节点功耗密度达兆瓦级 需软件适配动态功耗调节避免过热降频 [11] - Scale Up与Scale Out将同步发展 Scale Up成为大模型技术重点探索领域 [9]
液冷服务器概念再度活跃 强瑞技术、淳中科技续创历史新高
每日经济新闻· 2025-08-07 01:56
液冷服务器概念股表现 - 南方泵业早盘涨幅超过10% [1] - 强瑞技术和淳中科技股价创历史新高 [1] - 润禾材料、飞龙股份、大元泵业、冰轮环境等公司跟涨 [1] 行业板块走势 - 液冷服务器概念早盘延续强势行情 [1]
台湾ODM品牌_3 个月展望_苹果供应链进入新产品周期;人工智能服务器处于机型转换阶段;个人电脑基数高企-Taiwan ODM_Brands_ 3-month Preview_ Apple supply chain in new product cycle; AI servers in model transition; PC high base
2025-08-05 03:19
台湾ODM/品牌企业3个月预览:苹果供应链进入新产品周期 AI服务器处于型号转换期 PC面临高基数压力 行业与公司概述 * 涉及行业:AI服务器/PC供应链 包括苹果供应链、AI服务器组件(如液冷)、AI PC等领域[1] * 覆盖公司:广达(Quanta)、纬颖(Wiwynn)、纬创(Wistron)、技嘉(Gigabyte)、华硕(ASUS)、英业达(Inventec)、和硕(Pegatron)、仁宝(Compal)等10家公司[1] 核心观点与论据 月度增长预期 * 预计10家公司平均月环比增长:2025年7月-4% 8月+2% 9月+8%[3] * 苹果供应链表现更优:鸿海(Hon Hai)7月环比+7% 和硕(Pegatron)+9%[3] * AI服务器/PC供应链面临型号转换和高基数压力:品牌客户在2025Q2因关税不确定性提前拉货[3] 年度增长预期 * 预计10家公司平均同比增长:2025年7月+41% 8月+30% 9月+26%[4] * 主要驱动力:机架级AI服务器上量、ASIC AI服务器增长、液冷渗透率提升、AI PC放量[4] * 表现突出公司: - 纬颖(Wiwynn)7月同比+152%(6月+179%)[4] - 纬创(Wistron)7月同比+101%[4] - AVC(液冷供应商)7月同比+74%(6月+76%)[4] 液冷技术趋势 * 液冷供应商表现优于ODM厂商:受益于从风冷向液冷的技术升级和产品线扩展[3] * AVC液冷收入贡献预期:2025年28% 2026年43%[38] 公司具体分析 鸿海(Hon Hai) * 2025Q3收入预期:同比+4% 环比+7%至NT$1,927bn[17] * 驱动因素:AI服务器上量和主要客户新智能手机发布[17] * 目标价:NT$242 基于14.9x 2026E P/E[21] 广达(Quanta) * 2025Q3收入预期:同比+29% 环比+9%至NT$548bn[24] * 笔记本出货量:2025年6月同比+11%至5.0m台[24] * 评级:中性 目标价NT$273(12.8x 2026E P/E)[30] 纬颖(Wiwynn) * 2025Q3收入预期:同比+126% 环比+0%至NT$221bn[43] * 驱动因素:ASIC AI服务器需求增长和通用服务器新产品周期[43] * 目标价上调6%至NT$4,078(20.0x 2026E P/E)[50] 纬创(Wistron) * 面临高基数压力:2025Q2笔记本出货5.9m台(2022年以来最高季度)[59] * 2025Q3收入预期:环比-18%[59] * 目标价上调2%至NT$155(15x 2026E P/E)[67] 技嘉(Gigabyte) * 2025Q3收入预期:同比+22% 环比-16%至NT$86bn[75] * 目标价上调13%至NT$390(15.3x 2025E P/E)[80] 华硕(ASUS) * 2025Q3收入预期:同比+11% 环比-1%至NT$186bn[90] * 新产品:基于NVIDIA GB10芯片组的ASUS ASCENT GX10 AI超级计算机[90] * 目标价:NT$856(14.6x 2026E P/E)[97] 英业达(Inventec) * 2025Q3收入预期:环比-5%[101] * 笔记本出货:2025年预期同比+4%[101] * 评级:中性 目标价NT$46.3(15.7x 2026E P/E)[107] 仁宝(Compal) * 2025Q3收入预期:环比+11% 同比-18%[113] * 业务多元化:向通用服务器、AI服务器、5G和汽车电子领域拓展[113] * 评级:中性[113] 重要但可能被忽略的内容 * 关税不确定性和竞争加剧可能影响消费电子终端市场需求[4][9] * 液冷技术渗透率提升和规格升级带来的投资机会[1][3] * 折叠手机趋势对AVC子公司Fositek的潜在利好[38] * 汇率波动风险:纬创在2023Q4因新台币兑美元升值5%遭受NT$2.7bn汇兑损失[65]
HPC Server and DLC Traction Likely to Boost SMCI's Q4 Earnings
ZACKS· 2025-08-01 17:20
财报前瞻 - Super Micro Computer将于8月5日公布2025财年第四季度财报 投资者重点关注其服务器和存储业务的表现 该业务受超大规模客户 高性能计算和人工智能客户需求推动 [1] - 公司快速采用直接液冷技术(DLC) 数据中心模块化解决方案以及基于NVIDIA AMD和Intel芯片的强大服务器 [1] 服务器和存储业务驱动增长 - 服务器和存储系统部门是公司财务实力的主要驱动力 针对AI工作负载优化的GPU服务器需求增长是成功核心 [3] - 公司整合Intel Gaudi NVIDIA Blackwell芯片和AMD处理器到服务器中 有望吸引更多高性能计算 AI和超大规模客户 [3] - 公司早期提供基于NVIDIA Blackwell GPU架构的系统 Hopper架构系统持续强劲 数据中心模块化解决方案扩展进一步推动企业和超大规模客户采用 [4] 技术优势与市场趋势 - 公司充分利用客户对气冷和DLC机架级平台的强烈兴趣 这些平台对下一波AI数据中心扩张至关重要 DLC技术领导地位是强大竞争优势 [5] - 随着AI训练模型对资源需求增加 数据中心越来越多采用DLC解决方案以满足能效和密度要求 这一趋势可能推动第四季度服务器和存储系统部门收入增长 [5] 潜在挑战 - 许多客户选择等待NVIDIA Blackwell等新AI平台发布后再下单 这可能影响公司本季度订单量 [6] - 由于产品客户组合不利 为获取客户的竞争性定价 DLC AI GPU集群部署成本上升以及DLC技术增产前期成本增加 公司利润率持续收缩 [6] - 尽管客户组合和对下一代平台的投资增加使利润率承压 但服务器和存储业务的强劲营收增长可能部分抵消盈利压力 [7] 同业比较 - Alkami Technology年初至今股价下跌34 5% 2025财年全年每股收益预期为15美分 较30天前上调2美分 同比增长51 7% [9][10] - Arista Networks年初至今股价下跌11 9% 2025财年全年每股收益预期为65美分 较30天前上调1美分 同比增长13 66% [10] - Amphenol年初至今股价上涨45 1% 2025财年全年每股收益预期上调至2 69美元 同比增长42 33% [11]
A股7月收官!创业板指涨超8% 沪指3600点得而复失
财联社· 2025-07-31 07:18
市场表现 - 三大指数均跌超1% 沪指跌1.18% 深成指跌1.73% 创业板指跌1.66% [2] - 创业板指本月累计涨超8% 沪指3600点得而复失 [1] - 沪深两市全天成交额1.94万亿 较上个交易日放量917亿 [1] - 全市场超4200只个股下跌 个股跌多涨少 [1] 板块表现 上涨板块 - 创新药概念反复走强 南新制药等多股涨停 [1] - AI应用端全天逆势活跃 易点天下等涨停 [1] - AI硬件股表现分化 液冷服务器概念全天强势 英维克等涨停 [1] - 辅助生殖 液冷IDC 信创 华为昇腾等板块涨幅居前 [1] 下跌板块 - 钢铁 有色等顺周期方向集体走弱 安阳钢铁跌超7% [1] - 大金融板块全天低迷 中银证券跌超5% [1] - 钢铁 煤炭 有色 影视等板块跌幅居前 [1]
002837,瞬间涨停!
上海证券报· 2025-07-31 05:04
A股市场早盘表现 - 上证指数报3591.26点,跌0.68%,深证成指跌0.45%,创业板指涨0.43% [1] - 资源类周期股大幅回调拖累沪指失守3600点,AI相关板块全线上涨带动创业板指飘红 [1][3] AI板块表现 - AI硬件、软件板块集体大涨,液冷服务器、AI智能体、PCB等细分方向涨势突出 [5] - AI服务器龙头工业富联盘中触及涨停,市值突破7000亿元,股价创历史新高 [4][10] - 液冷服务器概念股英维克开盘瞬间涨停,走出2连板,成交额9.08亿元,报40.21元/股 [3][5] - 思泉新材、淳中科技等液冷服务器概念股均收获涨停,涨幅达20% [6][7] - 美股AI板块隔夜表现强劲,英伟达股价涨超2%创历史新高,Meta盘后涨幅超11% [13] 周期股表现 - 钢铁、有色、化工等资源类周期股高位回调,钢铁板块早盘跌超3%,有色金属、煤炭板块跌超2% [15] - 安阳钢铁、包钢股份、北方稀土等个股跌超5% [15] - 期货市场玻璃、焦煤主力合约跌超6%,碳酸锂跌6%,硅铁、纯碱跌超5% [16] - 广期所调整工业硅、多晶硅、碳酸锂期货部分合约交易限额,单日开仓量不得超过500手 [17] 行业动态 - OpenAI年化收入翻倍至120亿美元,ChatGPT周活跃用户突破7亿 [13] - 百度搜索电脑端测试开放智能体应用入口,集成文心智能体平台及外部AI应用 [13]
华泰证券:AI进入落地新阶段,服务器和机器人产业火热
快讯· 2025-07-31 00:14
行业趋势判断 - AI行业进入Token增长驱动的新阶段 [1] - AI Agent在垂直场景应用显著丰富 涵盖办公、医疗、金融等多个领域 [1] - 生成式AI发展呈现2B领先2C、应用领先终端的特征 [1] - B端商业化进展明显快于C端消费级产品 [1] - 国内外厂商形成良性竞争推动行业进步 [1] 服务器算力需求 - 服务器算力需求持续增长 [1] - 各厂商重点推广基于大模型的后训练和推理算力服务 [1] - 技术迭代带来重估机会不变 [1] 投资机会关注点 - 关注AI应用落地机会 [1] - 关注服务器和机器人产业 [1]