H800

搜索文档
OpenAI和英伟达,正在把GPU玩成“金融产品”
36氪· 2025-09-30 03:25
9 月 23 日,一则消息搅动全球科技圈:英伟达可能向 OpenAI 投入高达 1000 亿美元,共同建设规模达 10 吉瓦(GW) 的 AI 数据中 心。虽然这一消息尚未得到权威确认,但无论真假,它都折射出一个更重要的事实——算力正在被金融化。 为什么说这不是空穴来风? 回顾过去一年,全球 AI 产业的资金流向已发生显著变化。 根据PitchBook 数据,2 024年全球生成式AI融资560亿美元,占到 A I 产业总 融资额的一半以上。微软、谷歌、Meta 的资本开支也刷新纪录,仅微软在 2024 年的资本开支就达到 550 亿美元,其中大部分用于建设 GPU 数据中心。 如果说 ChatGPT 的发布改变了人机交互方式,那么 GPU 金融化可能会改变整个 AI 产业的资本运行逻辑。这不是一家公司、一桩投资 的孤立新闻,而是正在发生的趋势。 GPU的"金融化时刻" 单笔投入过大:要支撑万亿级参数模型的训练,单次算力采购成本可能超过 50 亿美元。哪怕是微软、谷歌这样的巨头,也难以长期维 持"买断模式"。 硬件价值迅速缩水:当新架构 GPU 上市时,旧卡的价值立刻跳水。A100 在二级市场的价格一年内下跌 ...
黄仁勋的H20,也许真的要提前“退役”了
美股研究社· 2025-09-02 10:45
英伟达中国特供芯片H20的波折命运 - H20芯片可能提前退役 英伟达已指示关键零部件供应商暂停与H20芯片相关的生产[5][8] - H20基于Hooper架构 是英伟达在美国芯片禁令下针对中国市场推出的合规阉割版 牺牲训练通用算力 强化内存和IO优势[9] - H20曾经是英伟达在中国销售受阻情况下的主要希望 给中国收入贡献的比例达到80%[9] H20芯片2024年重要事件时间线 - 4月特朗普政府要求英伟达在未经许可的情况下禁止在中国销售H20芯片[10] - 7月15日英伟达宣布H20获得批准 在华恢复供应[11] - 7月31日国家互联网信息办公室要求英伟达就H20漏洞后门安全风险问题进行说明并提交相关证明材料[12] 美国芯片禁令对英伟达的影响 - 2022年10月美国商务部发布先进计算芯片出口控制规则 禁止出口先进节点芯片和高性能AI芯片到中国[18] - 禁令直接让英伟达当时的两代旗舰芯片A100和H100无法出口中国[18] - 英伟达迅速做出反应 在禁令颁布次月推出A100的中国替代版A800 2023年3月推出H800作为H100在中国市场的替代版本[19] - 2023年10月美国商务部更新规则 进一步收紧芯片禁令 将禁令扩展到性能略低的变体 新增对推理芯片限制 阈值调整为TPP≥1600[22] - 新规使得专门为中国市场推出的A800和H800也被涵盖 第一代中国特供退出舞台[23] 第二代特供芯片H20的技术规格 - H20对比原始H100峰值算力被限制到约296 TFLOPs 低于消费级RTX 4090显卡的661 TFLOPs 更远低于H100的1979 TFLOPs[23] - H20在缓存和内存带宽上做了优化 配备96GB的HBM3高带宽显存 显存带宽提升至4TB/s[23] - 二级缓存达到60MB 高于H100的50MB 完整保留了第四代NVLink高速互联接口 芯片间互联带宽高达900GB/s[23] 中国市场对英伟达的重要性变化 - 三年前ChatGPT发布前英伟达季度财报显示中国市场收入占比20%以上[25] - 2026财年第一财季英伟达季度总收入达到441亿美元 中国市场贡献55亿美元 占比降至13%[25] - 英伟达在中国的市场份额已从几年前的95%降至约50% 许多中国客户转向国产替代方案[25] 中国本土AI芯片的发展 - DeepSeek发布新模型V3 1 使用UE8M0 FP8 Scale参数精度 针对即将发布的下一代国产芯片设计[26] - 国内包括华为 寒武纪在内多家厂商的新一代AI芯片都可以支持FP8格式[26] - 国产芯片企业暴涨 寒武纪盘中大涨近14% 半导体ETF在半天的时间里大涨5 89%[26] 英伟达的未来计划 - 英伟达正在研发新的中国特供AI芯片 代号B30A 基于Blackwell架构 性能优于H20 但仍符合出口管制[29] - 新芯片最快可能在9月提供测试样片[29] - 黄仁勋透露英伟达正在就一款新的中国特供芯片和美国进行谈判[6][30] 特供芯片策略面临的挑战 - 今年4月的禁令特别针对H20 直接从技术规格限制转变为精准打击特定芯片[31] - 中国开始质疑英伟达中国特供芯片的安全性 英伟达需要同时应对中美两方的监管要求[32] - 英伟达中国特供芯片的不确定性从很高升级为了极高 影响中国客户信心及供应链企业的计划与产能分配[32]
开学&教师节双重豪礼,英博云算力低至8毛8/卡时,赶紧薅起来
机器之心· 2025-09-02 09:33
活动概述 - 公司启动"金秋算力感恩回馈"专项活动 包括开学季和教师节双重福利 活动时间为9月1日至9月30日[1][6][9] - 活动提供算力代金券和限时特惠价格 旨在降低用户算力使用成本[6][8][9] 开学季活动详情 - 新用户注册并完成实名认证可免费领取50元算力代金券[8] - 首充返利:实名认证7日内首次单笔充值满100元返100元算力代金券[8] - 分享返利:首充后再次单笔充值满100元并在朋友圈分享宣传内容可再领100元算力代金券[8] - 活动期间4090显卡算力价格低至0.88元/卡时[6][8] 教师节活动详情 - A800卡时原价6.39元 活动价低至4.92元 降幅达23%[9] - H800卡时原价13.99元 活动价低至10.76元 降幅达23%[9] - 大额充值返利:单次充值满1000元返100元 满3000元返400元 满5000元返900元 满8000元返2400元 超过8000元返充值金额30%算力代金券[13] 平台技术特性 - 采用云原生架构 支持容器实例秒级启停和精细化计费[11] - 支持GPU+CPU混合集群 InfiniBand高速网络和企业级并行存储[11] - 提供SSH与kubectl多通道管理 Pod级直连公网IP[11] - 自研Container Server和丰富数据镜像资源帮助快速复用环境[11] 平台服务模式 - 提供专属Booking分区支持提前预约算力[11] - 调度系统支持On-Demand Reserved Spot等多种资源分配模式[11] - 团队模式支持统一管理算力资源 分配资金额度 实时查看运行记录[11] - 学生端可直接使用预置镜像 模型和数据集快速上手Notebook环境[11] 业务发展现状 - 公司正持续助力多家高校与科研机构开展AI科研项目[12] - 正在拓展2025年秋季AI课程教学合作[12] - 邀请高校加入"AI课程合作伙伴计划" 需提供学校名称 主讲教师 课程名称和联系方式[12]
亲自走了一趟北京后,黄仁勋终于明白,中方已不再需要英伟达
搜狐财经· 2025-08-19 21:10
英伟达中国市场现状 - 英伟达CEO黄仁勋近期访问北京试图修复与中国关系但收效甚微[1][14] - 中国市场曾占英伟达总收入20%以上但受美国芯片禁令影响业务受阻[3][12] - 公司曾推出性能阉割版A800/H800芯片但价格未降引发中国市场不满[5][7] 中国AI芯片产业进展 - 华为昇腾910、寒武纪思元290、阿里含光800等国产芯片性能已接近英伟达A100[3][5] - 百度/阿里/腾讯等企业已采用国产芯片训练ChatGPT级别大模型[7][9] - 华为昇腾芯片订单排至明年下半年呈现供不应求态势且性价比优势显著[7][12] 中美技术竞争影响 - 美国2022年芯片禁令直接导致英伟达A100/H100对华断供[5][12] - 禁令刺激中国加速自主创新AI芯片全产业链已基本成型[10][14] - 中国在北斗/5G/新能源/AI等领域通过技术封锁压力实现突破[12][14] 行业格局变化 - 中国AI产业从芯片设计到应用场景已形成完整生态体系[9][14] - 英伟达试图重返中国市场但面临国产替代和行业壁垒的双重阻力[7][14] - 国产芯片性能提升叠加政策支持使外企市场空间持续收窄[5][12][14]
AI芯片对华出口“有条件解封” 美银高呼英伟达(NVDA.US)与AMD(AMD.US)获“重大增量利好”
智通财经网· 2025-08-12 14:23
美国银行对英伟达和AMD的评级与目标价 - 美国银行维持英伟达和AMD的"买入"评级 目标股价分别为220美元和200美元 [1] - 英伟达和AMD同意将中国市场AI芯片整体营收的15%上缴美国政府以换取出口许可证 [1] - 截至周一美股收盘 英伟达与AMD股价分别收于182.06美元与172.28美元 [1] AI算力基础设施投资浪潮 - 华尔街机构预测全球AI基础设施投资浪潮规模有望高达2万亿美元 [2] - Loop Capital预测英伟达市值可能达到6万亿美元 目标股价从175美元上调至250美元 [2] - 到2028年全球云计算巨头和科技企业在英伟达AI GPU算力基础设施上累计支出约2万亿美元 [3] 中国市场策略与影响 - 英伟达/AMD可通过定价权抵消15%罚金影响 并动用此前计提减值的库存实现毛利回收 [4] - 英伟达透露减记约45亿美元 AMD减记约8亿美元 但可能尝试彻底收回减记金额 [5] - H20芯片在AI推理场景单卡吞吐可与H100持平甚至高出20% 但在训练性能上明显落后 [5][6] 英特尔面临的挑战 - 美国银行维持英特尔"中性"评级 目标价25美元 [7] - 英特尔面临AMD竞争 AI芯片市场份额几乎为零 且缺乏独立验证的先进制造工艺 [7] - 英特尔估值低迷 面临x86 CPU市场竞争和重组动荡等核心业务挑战 [7][8] 全球半导体市场展望 - WSTS预计2025年全球半导体市场增长11.2% 达到7009亿美元 [9][10] - 2026年预计增长8.5% 达到7607亿美元 [10] - 存储芯片将引领增长 逻辑芯片2025年预计增长23.9% 内存芯片2024年增长79.3% [10] - 美洲地区2024年增长45.2% 亚太地区2024年增长16.4% [10]
A800、H800都低到这个价了,这个暑假搞了点算力福利
机器之心· 2025-07-25 07:15
暑期现金消耗返券活动 - 面向高校用户推出暑期促销活动,提供A800和H800算力卡折扣价格 [1] - A800最低价格4.26元/卡/小时起,H800最低价格9.33元/卡/小时起 [2] - 活动时间从即日起至8月31日 [3][4] 返券规则 - 高校用户现金消耗达指定金额可领取比例代金券,支持单笔或累计 [4][5] - 返利比例阶梯式上升,满10000元及以上返30% [5] - 代金券有效期为3个月,需提前规划使用 [11] 福利叠加机制 - 三重福利:注册赠券、充值满额赠券、现金消耗满额赠券 [6][7] - 注册成功赠送100元代金券(8月1日起减半),首次充值满100元赠200元代金券(8月1日起减半) [7] - 单次充值满8000元返1600元代金券,超过8000元返20%充值金额 [8] 价格对比示例 - A800刊例价6.39元/卡小时(友商7.45元),H800刊例价13.99元/卡小时(友商14.93元) [9] - 消耗满10000元时A800低至4.26元/卡小时(较刊例价降33%),H800低至9.33元/卡小时(较刊例价降33%) [9] 公司背景 - 英博数科为鸿博股份(002229)全资子公司,成立于2022年6月 [14] - 业务覆盖智算中心建设、GPU容器服务、算力实验室及产业孵化器 [14] - 旗下英博云提供GPU智算服务,支持K8s集群、IB高速网络及全闪存储 [15] - 四大核心优势:稳定算力供应链、大集群运维专长、性能优化能力、技术团队基因 [16][17]
H20恢复供应,市场如何
傅里叶的猫· 2025-07-15 14:36
H20供应情况 - H20当前供应来源为库存而非新生产 库存数量存在两种说法 30w~40w片或60w~100w片 供应量有限[1] - 中国企业正积极抢购H20 大公司已提交大量采购申请 具体数字未披露[1] H20技术规格与市场需求 - H20通过"点断"技术实现硬件降规 从H200/H800改回H200成本过高被放弃[2] - Hopper系列(H200为主)国内需求疲软 近期价格大幅下跌 市场等待B200/B300服务器[2] H20未来生产计划 - H20库存售罄后大概率停产 英伟达重心转向Blackwell架构产品[3] - Hopper系列仅靠库存维持短期供应[3] 采购建议 - 潜在买家需尽快行动 避免后期供应短缺[4] 行业动态 - 英伟达B系列服务器已可接受国内样品订单[5]
从限售到“解封”:黄仁勋访华,H20回归,英伟达为何力保中国市场?
每日经济新闻· 2025-07-15 13:06
英伟达恢复H20在华销售及新产品布局 - 公司宣布恢复H20 GPU在中国的销售,并推出面向中国市场的新款完全兼容GPU [1] - H20恢复销售旨在稳住云计算等大客户,避免市场份额流失 [1] - 最新推出的RTX PRO GPU定位工业数字化转型市场,避开高算力训练敏感领域 [1] - 公司创始人黄仁勋在中美间奔走,强调AI对全球商业和社会的益处 [1][2] 英伟达中国市场战略及财务影响 - 公司因H20"禁售"导致2026财年第一季度产生45亿美元费用 [3] - 禁售前H20产品销售额为46亿美元,另有25亿美元订单无法交付 [3] - 公司股价在宣布恢复H20销售后一度站上168美元 [3] - 中国市场对公司实现6年后4000亿美元销售目标至关重要 [4] 新产品B30的技术特点与市场定位 - B30是基于Blackwell RTX Pro 6000处理器的修改版本,为符合出口管制特别设计 [6] - 该芯片移除了HBM和NVLink等先进技术 [6] - RTX PRO 6000将采用96GB GDDR7内存,定位AI推理、边缘端深度学习等应用 [6] - 新产品通过架构优化,FP4算力超越H20,能效比更高 [7] 技术调整对性能的影响 - 移除HBM对百亿级以上大模型训练有影响,但通过架构优化仍可保持推理优势 [7] - 改用GDDR7后带宽和性能有所下降,但仍能满足部分需求 [7] - 国内已有曦智科技的光互联技术可替代NVLink [8] 中国市场竞争格局 - 国内头部AI企业正积极测试昇腾、寒武纪等本土替代方案 [8] - 阿里巴巴推出Hanguang 800 AI推理芯片,百度开发Kunlun III [8][9] - 腾讯采用自研AI推理芯片Zixiao及燧原科技解决方案 [9] - 全球半导体产业链已离不开中国市场 [9]
Nvidia is set to resume China chip sales after months of regulatory whiplash
TechCrunch· 2025-07-15 04:36
公司动态 - 英伟达宣布提交申请重启向中国销售H20人工智能芯片 [1] - 公司预计将很快获得美国政府许可并开始交付 [2] - 英伟达针对中国市场推出新款"RTX Pro"芯片 称其完全符合监管要求 适用于智能工厂和物流等数字制造应用 [2] 产品与技术 - H20芯片是美国对中国技术限制下的最强大合规AI芯片 专注于推理任务而非训练新AI系统 [3] - 该芯片因内存带宽优于中国替代品及英伟达广泛采用的软件生态系统而受青睐 [4] - H800芯片(比H20略强)已于2023年10月被美国禁售 但中国供应商已找到变通方案 [6] 市场反应 - 字节跳动、阿里巴巴和腾讯等中国科技巨头在今年前三个月积极囤积H20芯片 [4] - 仅第一季度中国公司采购H20芯片的金额就达150-160亿美元 [5] - 中国初创公司DeepSeek使用H800芯片开发出媲美ChatGPT的AI模型 [6] 政策影响 - 美国4月实施H20销售限制 但很快在英伟达CEO黄仁勋参加特朗普晚宴后暂停禁令 [5][6] - 政策反复引发美国议员批评 认为削弱了限制中国AI能力的努力 [6] - 黄仁勋本月分别与华盛顿和北京官员会面 强调AI对全球商业和社会的益处 [9] 行业趋势 - 英伟达计划未来四年在美国建造价值5000亿美元的AI服务器 [6] - 事件凸显美国政策制定者在国家安全与商业利益间的平衡难题 [10]
CoWoS,劲敌来了
36氪· 2025-06-09 10:54
先进封装技术重要性提升 - 先进封装正成为技术发展关键领域,从辅助角色转变为技术帝国边疆要塞[1] - 行业受HPC和生成式AI推动,先进封装市场收入将从2023年392亿美元增长至2029年811亿美元,复合年增长率达12.9%[8] - FOPLP市场2022年规模4100万美元,预计以32.5%复合年增长率增长至2028年2.21亿美元[11] 先进封装技术分类 - 倒装芯片(Flip chip)作为传统与先进封装过渡技术,通过凸点实现芯片与基板电气连接[2] - 2.5D/3D IC封装通过中介层垂直堆叠芯片,代表技术为台积电CoWoS,可缩小接点间距并减少功耗[2] - 扇出型封装通过RDL向外延伸布线提升I/O接点数量密度,分为晶圆级(FOWLP)和面板级(FOPLP)两种形式[2][4] CoWoS封装产能与需求 - 台积电CoWoS当前月产能3.5万片晶圆,占总收入7%-9%,计划2025年末提升至每月7万片(贡献超10%收入),2026年末进一步扩大至每月9万片[3] - 2022-2026年CoWoS产能复合年增长率达50%,2025年营收贡献预计从2024年8%成长至10%[3] - 当前产能无法满足AI市场需求,英伟达A100、A800、H100、H800、GH200等芯片均依赖该技术[3] FOPLP技术优势 - 采用方形面板载板(如600mm×600mm),面积利用率高于圆形晶圆,600mm×600mm面板面积是12寸晶圆载板5.1倍[4][6] - 单次曝光面积是FOWLP的4倍以上,生产效率与良率大幅提升[6] - 使用玻璃基板解决大尺寸载板翘曲问题,台积电、三星、英特尔等厂商均已布局[7] 主要厂商布局动态 - 台积电投资171.4亿元新台币购买群创南科厂房,成立FOPLP研发团队,规划2027年量产,初期采用300×300mm面板[12][13] - 日月光投入2亿美元在高雄厂建立FOPLP产线,预计2024年底试产,采用600×600mm规格,十年研发经验[14] - 力成科技2016年建设首条FOPLP产线,2024年6月进入小批量生产,采用510×515mm规格,良率超预期[16] - 长电科技拥有FOPLP技术储备,在大尺寸倒装及晶圆级扇出型封装具备量产经验[17] 技术应用与挑战 - FOPLP主要应用领域包括电源管理IC/射频IC、CPU/GPU、AI GPU三类产品[18] - 当前未放量主因是良率未达理想值且缺乏尺寸标准化,面板尺寸差异导致设备设计不一致[19] - 三星已将FOPLP用于Exynos W920处理器(5nm EUV技术),谷歌Tensor G4芯片也采用该技术[11]