Workflow
RTX 5090
icon
搜索文档
Advanced Micro Devices, Inc. (AMD): A Bull Case Theory
Yahoo Finance· 2025-09-28 23:43
We came across a bullish thesis on Advanced Micro Devices, Inc. on Phaetrix Investing’s Substack by Phaetrix. In this article, we will summarize the bulls’ thesis on AMD. Advanced Micro Devices, Inc.'s share was trading at $159.79 as of September 22nd. AMD’s trailing and forward P/E were 95.68 and 26.88 respectively according to Yahoo Finance. Benchmark Rates Canaan Inc. (CAN) as a ‘Buy’ as Bitcoin Treasury Grows Advanced Micro Devices (AMD) presents a compelling 12–18 month investment opportunity, targe ...
BluSky AI Inc. and Lilac Sign Letter of Intent to Launch Strategic GPU Marketplace Partnership
Globenewswire· 2025-08-26 13:42
核心观点 - BluSky AI与Lilac签署意向书 建立战略合作 通过GPU资源共享提升AI生态计算资源利用效率并实现闲置容量货币化 [1][2][3] 合作内容 - BluSky AI将提供GPU云计算资源网络 包括未分配库存和客户选择加入的容量 通过Lilac平台出租 [2] - 合作涵盖工程集成 联合营销和客户获取框架 最终协议预计未来数月内达成 [3] - Lilac将转售BluSky AI及其客户网络的闲置GPU容量 为终端用户提供更高投资回报率和灵活租赁选项 [6] - BluSky AI将Lilac指定为"首选市场合作伙伴"并向其生态圈积极推广该平台 [6] - 双方将合作开展营销活动 包括联合新闻稿 社交媒体激活 白皮书 视频演示和活动合作 [6] - BluSky AI将提供季度GPU库存透明度报告 以指导市场策略和绩效跟踪 [6] 技术资源 - BluSky AI提供企业级高性能GPU型号 包括NVIDIA B200 H200 H100 A100 L40 RTX 5090和RTX 4090 [2] 公司背景 - BluSky AI总部位于犹他州盐湖城 是专为人工智能构建的Neocloud 通过快速部署的SkyMod数据中心提供可扩展的AI工厂 [1][4] - Lilac总部位于旧金山湾区 正在构建权威的GPU计算现货市场 通过动态价格驱动平台连接全球GPU供应与AI开发者 初创企业和企业 [5] 战略意义 - 合作旨在提高BluSky AI计算资产利用率 同时扩大Lilac的高性能GPU供应商基础 [2] - 通过整合闲置容量到Lilac平台 优化资源效率并使客户能够从未充分利用资产产生新收入流 [3] - 合作代表计算资源供应 货币化和扩展方式的重大进步 降低AI采用门槛并构建更高效公平的云经济 [3]
减配不减价?英伟达在华推出“二次阉割”显卡
观察者网· 2025-08-15 07:32
产品发布与市场反应 - 英伟达面向中国大陆市场推出GeForce RTX 5090D v2版本,显存和带宽削减25%,定价维持16499元人民币(约2298美元)[1] - 华硕、七彩虹、技嘉等厂商已全面上架5090D V2,起售价16499元,部分旗舰型号价格升至17499-19000元[1] - 被禁售的5090及5090D新卡在二手市场出现溢价,呈现"一卡难求"现象[1] - 技嘉5090D V2京东自营售价16499元,近7日销量200+,100%好评[3] 技术规格与性能差异 - RTX 5090D V2保留GB202-240 GPU芯片,基准时钟2.01GHz,升压时钟2.41GHz,但显存从512-bit 32GB GDDR7降至384-bit 24GB GDDR7,带宽从1792GB/s降至1344GB/s[5] - CUDA核心数量保持21760不变,支持Blackwell架构和第5代Tensor Core(2375 AI TOPS),但AI算力较5090D降低29.15%[7][8] - 游戏性能降低1-2%,AI及生产力性能下滑10-25%[8] 政策影响与产品策略 - 5090D V2的显存带宽降至1344GB/s,符合美国出口管制1.4GB/s上限要求[5] - 5090D作为中国特供版旗舰显卡,算力削减超29%后定价16499元,高于国际版5090的1999美元定价[9] - 2024年4月美国升级AI芯片出口管制,导致H20芯片和RTX 5090D对华出口受限[9]
叫板英伟达RTX 5090,GPU初创公司做出13倍路径追踪性能的怪兽显卡
36氪· 2025-08-06 02:50
核心观点 - 芯片初创公司Bolt Graphics的首款GPU模组Zeus 4C在路径追踪场景中性能达到RTX 5090的13倍 [1] - Zeus GPU并非针对游戏场景设计,而是专注于高精度图形渲染领域 [4][6] - Bolt Graphics的市场定位更偏向设计硬件公司而非游戏/AI硬件公司 [16] 产品性能对比 - Zeus 4C在4K分辨率每秒120帧的路径追踪任务中性能是RTX 5090的13倍 [4] - Zeus GPU板卡功耗为250W,远低于RTX 4090的450W和RTX 5090的575W [5] - Zeus GPU在FP64/FP32/FP16浮点运算性能上远逊于RTX 4090和RTX 5090 [5] - Zeus GPU路径追踪性能达154 gigarays,远超RTX 5090的32 gigarays [5] - Zeus GPU使用LPDDR5X内存,带宽比RTX 5090的GDDR7低3倍以上 [6] 产品定位与技术特点 - Zeus GPU专注于电影视觉特效、游戏渲染、高性能计算等需要高精度图形渲染的场景 [6] - 产品主打路径追踪技术,可模拟光线与环境互动,创造逼真渲染效果 [7] - 支持FP64双精度浮点运算,适合电影特效、高精度仿真等对细节要求高的领域 [9] - 采用类似AMD的chiplet架构,包含计算芯片和IO芯片 [13] - 提供2/4/8个SODIMM插槽以弥补内存带宽不足 [13] 市场现状与挑战 - 显卡市场长期由NVIDIA和AMD主导,Bolt属于针对特定场景的边缘突破 [20] - 公司暂未公布基准测试方法和性能对比细节 [20] - 开发者套件预计2026年推出,2027年实现量产 [20] - 产品定价尚未公布 [21][22]
叫板英伟达RTX 5090!GPU初创公司做出13倍路径追踪性能的怪兽显卡
量子位· 2025-08-05 13:34
核心观点 - 芯片初创公司Bolt Graphics推出的Zeus 4C GPU在路径追踪场景中性能达到RTX 5090的13倍,但并非针对游戏市场,而是专注于高精度图形渲染领域[1][7][8] - Zeus GPU在浮点运算性能上远逊于NVIDIA旗舰产品,且内存带宽不足,游戏表现可能不及RTX 3060[9][10][11] - 公司技术路线聚焦于电影特效、建筑可视化等专业渲染领域,采用FP64双精度浮点运算架构[12][14] - 产品量产时间表显示2026年推出开发者套件,2027年正式量产,当前缺乏第三方测试验证[29][30] 产品性能对比 硬件规格 - 板卡功耗:Zeus 2c26-064仅250W,显著低于RTX 5090的575W[9] - 浮点运算:FP32性能20 TFLOPS,仅为RTX 5090(105 TFLOPS)的19%[9] - 内存配置:采用LPDDR5X内存,带宽725GB/s,比RTX 5090的GDDR7(1.8TB/s)低60%[9][10] - 路径追踪:154 gigarays性能,是RTX 5090(32 gigarays)的4.8倍[9] 架构特点 - 采用模块化设计:基础型号含1个计算核心,顶配Zeus 4c26-256集成4个计算核心+4个I/O核心[17][18][19] - 扩展能力:提供2-8个SODIMM插槽弥补内存带宽限制[20] - 视频编码:支持4路8K60 AV1编码,优于RTX 4090的3路[9] 市场定位 - 目标行业:电影视觉特效(占渲染市场38%)、建筑可视化(24%)、工业设计(18%)等高精度图形渲染领域[12] - 技术优势:路径追踪性能突破现有硬件水平,4K/120fps渲染效率达行业标杆13倍[8][14] - 竞争策略:避开游戏/AI主战场,专注设计类工作负载的能效比优化[24] 商业化进展 - 开发进度:尚未公布基准测试方法论,缺乏与竞品的直接对比数据[29] - 时间规划:开发者套件预计2026年面世,量产计划定于2027年[30] - 定价策略:未披露具体价格区间,社交媒体回应"Pricing soon"[33] 行业影响 - 潜在颠覆:可能打破NVIDIA/AMD在专业渲染市场的垄断,但需验证实际商用表现[26][27] - 技术壁垒:双精度浮点架构在HPC领域具备差异化优势,但游戏/AI生态建设滞后[14][24] - 市场验证:需观察2026-2027年产品落地后的客户采纳率与生态建设[28][30]
一颗GPU,叫板英伟达
半导体芯闻· 2025-07-23 09:59
GPU行业格局与Bolt Graphics的定位 - GPU市场长期由英伟达、AMD、英特尔主导,英伟达凭借生态和技术积累占据高端游戏与专业图形市场[1] - 初创公司Bolt Graphics推出Zeus GPU,专注于路径追踪技术,试图从不同维度重新定义GPU未来[1] - Zeus GPU放弃传统光栅化图形流水线,从芯片底层定制路径追踪算力通道[5] 路径追踪技术发展 - 实时光线追踪(RT)在过去十年推动游戏画质提升,但本质仍是对可见线路的近似[2] - 路径追踪通过精确采样所有光线路径,实现无噪点结果和物理精确渲染,但计算量是传统GPU的十数倍至百倍[2] - 路径追踪理论源于1986年Jim Kajiya的《渲染方程》,1997年Eric Veach的研究推动其实际应用[3][4] - 迪士尼、皮克斯等机构依赖CPU农场实现4K 60 FPS路径追踪渲染,单帧渲染时间达上千小时[5] Zeus GPU产品细节 - Zeus系列包括1c(120W TDP)、2c(双芯粒)、4c(数据中心版,500W TDP)三个版本[6][7] - 1c版本路径追踪性能达77亿射线/秒,2c版本性能翻倍,4c版本支持2TB DDR5 + 256GB LPDDR5X内存[6][7] - 内存架构采用LPDDR5X(带宽)+DDR5(容量),4c版本总内存达2.25TB,远超消费级显卡[10] - 在4K路径追踪场景下,Zeus效能比英伟达RTX 5090高10倍,功耗仅为1/10[10] - Zeus在FP64计算上单芯版比5090快3倍,双芯版快6倍,电磁波模拟性能号称达Blackwell GPU的300倍[11][12] 技术优势与生态策略 - Zeus基于开源RISC-V标量+向量扩展RVV 1.0,打造开放定制生态平台[14] - 开发专属路径追踪引擎Glow Stick,兼容Blender、Maya等主流渲染工具[15] - 计划推出Apollo电磁仿真器,结合HPC和渲染功能[16] - 已与Unreal、Unity等引擎集成商及渲染农场管理软件展开合作[16] 商业化挑战与前景 - Bolt计划2025 Q3交付首批开发套件,2026年底进入量产,目前仅有模拟器环境[17] - 需克服量产延误、成本超预期、软件生态构建等挑战[17] - 早期访问计划(EAP)已吸引视觉特效艺术家和研究机构参与测试[18] - 潜在应用场景包括专业工作站、数据中心租赁、未来消费级游戏市场[7][8] - 若成功,Zeus可能重新定义游戏图形上限并开启"路径追踪+物理耦合"跨领域市场[18]
一颗野心勃勃的GPU
半导体行业观察· 2025-07-23 00:53
GPU行业格局与Bolt Graphics的定位 - GPU市场长期由英伟达、AMD、英特尔主导,英伟达凭借生态和技术积累占据高端游戏与专业图形市场[1] - 初创公司Bolt Graphics推出Zeus GPU,专注于路径追踪技术,试图从不同维度重新定义GPU未来[1] - Zeus GPU放弃传统光栅化流水线,从芯片底层定制路径追踪算力通道,目标直指"终极路径追踪"[5] 路径追踪技术解析 - 实时光线追踪(RT)是当前游戏画质提升的关键,但本质仍是对真实光线的近似模拟[2] - 路径追踪通过精确采样所有光线路径,实现无噪点、物理精确的渲染效果,但计算量是传统GPU的数十至百倍[2] - 技术起源可追溯至1986年Jim Kajiya的渲染方程论文,1997年Eric Veach的博士论文推动了实际应用[3][4] - 电影级4K/60FPS路径追踪目前依赖CPU农场,单帧渲染需上千小时[5] Zeus GPU产品矩阵 - 单芯片Zeus 1c:120W TDP,77亿射线/秒路径追踪性能,支持INT8/INT16/AV1加速[7] - 双芯粒Zeus 2c:性能与功耗翻倍,芯粒间带宽768GB/s,定位专业工作站[7] - 四芯粒Zeus 4c:500W TDP,2TB DDR5+256GB LPDDR5X内存,支持2U服务器集群部署[8] - 内存架构采用LPDDR5X(带宽)+DDR5(容量)组合,4c卡总内存达2.25TB[10] 性能对比与优势 - 4K路径追踪场景下,Zeus仅需28张卡即可完成英伟达RTX 5090需280张卡的任务,效能提升10倍[10] - 功耗仅为传统GPU的1/10,单位时间内路径追踪密度比英伟达GPU强4-12倍[10][11] - FP64计算性能:单芯版达RTX 5090的3倍,双芯版达6倍,电磁波模拟性能号称超Blackwell GPU 300倍[11] - 4c卡模拟空间达Blackwell B200的40倍(38亿 vs 9110万模拟单元)[12] 生态战略与市场定位 - 采用开源RISC-V架构,支持LLVM工具链定制,打造开放生态平台[14] - 开发专属路径追踪引擎Glow Stick,兼容Blender/Maya/Houdini等主流工具[15] - 计划推出Apollo电磁仿真器,整合HPC与渲染功能[16] - 主攻专业工作站、数据中心租赁(渲染农场/数字孪生)、未来可能进入消费级游戏市场[8][16] 商业化挑战与时间表 - 目前仅有模拟器环境,预计2025 Q3交付开发套件,2026年底量产[17] - 需克服硬件交付性能落差、软件生态构建、行业客户信任等挑战[17] - 已启动早期访问计划(EAP),依赖早期用户案例验证商业价值[18] - 若成功可能重新定义游戏图形上限,并开创"路径追踪+物理耦合"新市场[19]
从CoreWeave视角看算力租赁行业
傅里叶的猫· 2025-06-09 13:40
公司概况 - CoreWeave成立于2017年,前身为加密货币挖矿企业Atlantic,2019年转型聚焦AI云和基础设施建设 [2] - 截至2024年底运营32个数据中心,主要位于美国低电力成本区域,并在欧洲科技中心设立节点 [2] - 累计部署超过25万颗GPU,主要为英伟达Hopper架构产品,是H100、H200、GH200的高性能基础设施云服务商 [2] - 首家全面提供英伟达GB200 NVL72的云厂商 [2] 业务模式 - 提供三类服务:基础设施及服务(裸金属GPU租赁)、管理软件服务(Cloud Net Service)、应用服务(SUNK服务等) [3] - 核心业务为基础设施及服务,采用英伟达InfiniBand架构,适合AI训练和渲染等高强度任务 [3] - 商业模式包括承诺制合同(占2024年收入的96%)和按需付费模式 [4][5] - 承诺制合同期限2-5年,客户需支付合同价值15%-25%的预付款,确保稳定现金流 [4] - 按需付费模式适合突发工作负载和中小客户试用,提升算力利用率 [5] 股东结构 - 英伟达持股3.86%,作为战略股东保障GPU优先供应 [6] - 管理基金为第一大股东,创始人团队通过双重股权结构掌握83%投票权 [6] 核心优势 - 算力利用率优化,模型浮点利用率比行业平均水平高20% [7] - 专为AI打造的平台架构,提高机架密度和数据中心利用率 [7] - 规模化运营能力,25万颗GPU形成规模经济效应 [7] - 电力资源充沛,拥有500兆瓦容量协议和360兆瓦可用电力合约 [7] 财务表现 - 2024年营收19.15亿美元,同比增长超7倍 [8] - 2025年一季度营收9.82亿美元,同比增长4倍以上,环比增长31% [8] - 2024年亏损8.63亿美元,2025年一季度亏损3.15亿美元,主要因财务费用和股权激励 [8][9] - 毛利率2024年为74%,2025年一季度为73.3%,同比提升4个百分点 [9] 行业前景 - AI基础设施市场规模2023-2028年将从790亿美元增长到3990亿美元,年复合增速38% [11] - 行业玩家包括传统云服务商和新型GPU服务商,活跃度显著提升 [11] - H100价格呈下降趋势,NL72推理单位成本比H100降低75% [12] - 国内算力租赁行业在一季度表现显著,部分公司业务已反映业绩贡献 [13] 未来增长点 - 挖掘现有客户需求,拓展新行业如银行、制药等 [10] - 国际化扩张,在北美、欧洲、亚太发展IDC [10] - 加强垂直整合,确保GPU优先获取并构建全栈软件能力 [10] - 管理层重心包括电力合同落地、融资保持低杠杆、平台差异化和并购扩张 [10]
RTX 5090的市场调研
傅里叶的猫· 2025-04-29 14:48
RTX 5090市场供需分析 - 英伟达已停止RTX 4090生产,全面转向RTX 5090系列以应对强劲需求,但受限于台积电产能分配(即使增加25%也难完全满足)和供应链紧张,GeForce系列显卡短期内仍将供不应求,市场缺货和高溢价现象难以改善[1] - RTX 5090市场价格反映其稀缺性,香港地区交易价格约35000元人民币,中国大陆市场价格虽有所回落但仍维持高位[1] - RTX 5090芯片全球年供应量有限,与市场需求存在显著差距,英伟达有意控制投放量以避免影响利润率更高的专业AI计算卡(如A100、H100)的销售策略和市场份额[4] RTX 5090D型号分析 - 针对中国市场特殊推出的RTX 5090D型号主要面向互联网企业,渠道商拿货价格约15000元人民币,预计有进一步下降空间,合理价格区间可能在14000元左右[2] - 大型AI客户采购价格存在差异,平均水平约15000元,议价能力强的客户或通过协议采购可低至10000元左右,制成成品卡后价格在11000至12000元之间[2] - RTX 5090D因DRAM带宽超过美国出口管制规定的1.4T上限被认定为违规产品,英伟达已暂停向中国大陆发货,正在研究解决方案[3] - 英伟达考虑通过降低内存时钟频率以满足带宽规定,预计最快6月底至7月初提供样品测试,待美国商务部批准后恢复供货[3] 供应链与厂商分析 - 华硕、微星、技嘉等全球市场厂商更能从当前高价环境中受益,而七彩虹等主要深耕中国大陆市场的厂商因只能生产和销售5090D获利空间受限[4] - 国内大型科技公司如阿里巴巴和腾讯获取算力主要通过正规渠道直接向英伟达采购,也在外部市场收购消费级显卡(如90系列)但主流需求仍依赖正规途径[4] 价格优势与渠道 - 同型号RTX5090卡比京东便宜几千元(小几千至大几千不等),因省去中间渠道商成本和京东平台费用[7]
深入探秘英特尔最新GPU架构
半导体行业观察· 2025-03-20 01:19
英特尔Xe3 GPU架构进展 - 英特尔Xe3硬件设计已完成,软件工作正在进行中,部分进展可在开源存储库中查看[1] - Xe3渲染切片支持最多16个Xe核心,相比前代Xe/Xe2的4核心实现显著扩展[4] - Xe3理论最大配置可达256个Xe核心和32768个FP32通道,超越Nvidia RTX 5090的21760通道[7] - 公司通过增加渲染切片核心数量,向AMD/Nvidia的多核心设计靠拢(如RX 6900XT每引擎10WGP,RTX 4090每GPC含8SM)[8] Xe矢量引擎(XVE)升级 - Xe3 XVE线程容量从8提升至10个,寄存器文件分配更灵活(64KB按32条目块分配)[10] - 记分牌令牌总数从Xe2的128个增至320个,提升内存级并行性[11] - 新增标量寄存器s0,优化收集发送指令效率,扩展线程依赖寄存器支持[13] 指令集与功能增强 - 新增FCVT指令的饱和度修饰符,支持HF8/BF8两种8位浮点格式[14] - XMX单元引入xdpas指令,实现稀疏矩阵运算优化[14] - 光线追踪新增子三角形不透明度剔除(STOC)技术,测试显示性能提升5.9-42.2%[16][17] - STOC硬件支持两级实现:STOC1(嵌入18位)和STOC3(指针扩展至128B叶节点)[18][19] 架构战略方向 - Xe3延续Xe2的能效提升路径,通过延迟容忍设计(如动态寄存器分配)提高核心利用率[21] - 公司持续优化计算架构,与Nvidia(Ampere至Blackwell SM架构稳定)形成差异化发展路径[22] - STOC等创新需开发者适配,但纯软件实现已能带来性能收益,可能推动硬件功能采用[19][22]