Workflow
AI推理
icon
搜索文档
AI推理成本降低推动应用繁荣,消费电子板块午后上行,消电ETF(561310)涨超1%
每日经济新闻· 2025-06-05 05:06
AI推理与消费电子行业趋势 - AI推理成本降低推动应用繁荣,端侧AI潜力巨大,耳机和眼镜或成为AI Agent重要载体 [1] - 消费级AR眼镜雷鸟X3 Pro搭载全彩Micro-LED光引擎,显示技术商业化进程加快 [1] - 海外厂商财报显示AI推理成为新增长引擎,数据中心业务爆发带动服务器、光模块等环节价值量提升 [1] 半导体与存储行业动态 - 存储价格触底回升,封测环节稼动率逐渐回升 [1] - 国产设备先进工艺突破持续推进,先进工艺扩产将成为自主可控主线 [1] - CoWoS及HBM卡位AI产业趋势 [1] 消费电子指数与ETF产品 - 消电ETF(代码:561310)跟踪消费电子指数(代码:931494),聚焦智能手机、可穿戴设备、智能家居等细分领域 [1] - 消费电子指数由中证指数有限公司编制,反映消费电子行业相关上市公司证券的整体市场表现和发展趋势 [1] - 无股票账户投资者可关注国泰中证消费电子主题ETF发起联接A(014906)和C(014907) [1]
东海证券晨会纪要-20250605
东海证券· 2025-06-05 02:56
报告核心观点 报告围绕电子、非银金融等行业展开分析,指出电子行业需求温和复苏,建议关注四大投资主线;非银金融中券商有望受益政策催化,保险保费稳健增长;同时还提及财经新闻、A股市场表现及市场数据情况 [5][10]。 重点推荐 电子行业周报 - 英伟达一季度营收440.62亿美元,同比增长69%,数据中心收入391.12亿美元,同比增长73%,AI推理需求强劲,token生成量一年激增10倍,但美对华H20禁令使其一季度计提45亿美元费用损失,二财季预计营收450亿美元 [5][6]。 - 美BIS要求头部EDA软件厂商停止对华服务,Synopsys、Cadence已确认收到通知,禁令或针对“军事用途”,短期国产EDA难替代,长期将推动自主研发 [7]。 - 本周电子行业跑赢大盘,沪深300指数下跌1.08%,申万电子指数下跌0.59%,建议关注AIOT、AI驱动、设备材料、消费电子周期筑底板块 [8][9]。 非银金融行业周报 - 上周非银指数上涨0.2%,券商指数下跌0.1%,保险指数上涨0.5%,市场股基日均成交额13090亿元,环比降5.8%,两融余额1.8万亿元基本持平,股票质押市值2.66万亿元,环比增0.3% [10]。 - 资本市场支持中国特色现代企业制度建设,6月18日陆家嘴论坛预计发布活跃资本市场政策,助推上海国际金融中心建设 [11]。 - 1 - 4月人身险公司累计保费19469亿元,同比+1.3%,4月单月同比增速11.6%,产险公司1 - 4月累计保费6486亿元,同比增长5.2%,预计预定利率调整带来“炒停售”催化 [12]。 - 券商建议关注并购重组等三条逻辑主线及大型券商;保险建议关注大型综合险企 [13]。 财经新闻 - 四部门开展人力资源服务业与制造业融合发展试点工作,将在30个左右城市先行先试,培育专业服务机构等 [14]。 - 美国5月ISM服务业PMI回落至49.9,低于预期52.0,自2024年6月以来首次低于50荣枯线 [14]。 - 6月4日公布美国5月ADP新增私营就业人数3.7万人,大幅低于预期11万人 [14]。 A股市场评述 - 上交易日上证指数拉升收红,涨0.42%至3376点,深成指、创业板收涨,短线或延续小幅震荡盘升,趋近3418点压力位 [16]。 - 上证指数周线呈阳K线,5周均线金叉20周均线,3418点压力重,整理后上破或打开上行空间 [17]。 - 上交易日同花顺行业板块多数收红,美容护理板块涨幅第一,通信设备等板块大单资金净流入居前 [18]。 - 商业指数表现活跃,日线技术条件向好,临近压力位,月线技术条件渐次向好 [19]。 市场数据 - 融资余额17927亿元,逆回购到期量2155亿元,操作量2149亿元,1年期MLF为2%,1年期LPR为3%,5年期以上LPR为3.5%等 [22]。 - 上证指数3376.20点,涨0.42%,创业板指数2024.93点,涨1.11%,恒生指数23654.03点,涨0.60%等 [22]。 - 美元指数98.8162,降0.42%,美元/人民币(离岸)7.1716,降202.00BP,欧元/美元1.1419,涨0.43%等 [22]。 - 螺纹钢2974.00元/吨,涨1.57%,铁矿石704.50元/吨,涨1.37%,COMEX黄金3397.40美元/盎司,涨0.61%等 [22]。
AI推理成为新增长引擎,5G通信ETF(515050)蓄力回调,近5日净流入5287万元
每日经济新闻· 2025-06-03 03:38
AI算力与5G通信行业表现 - AI方向表现分化 网络游戏和金融科技概念活跃 5G通信ETF(515050)跌0.29% 持仓股深南电路、移远通信、领益智造、光库科技领涨 [1] - 英伟达2026财年Q1营收达441亿美元 同比增长69% 净利润187.75亿美元 数据中心业务为核心推动力 [1] - AI推理成为主流工作负载 ChatGPT、Gemini、Grok等推动云厂商和科技巨头加速部署大规模推理平台 [1] - AI浪潮带动算力需求爆发 服务器、存储、PCB板等环节价值量大幅提升 [1] 资金流向与ETF布局 - 近5个交易日5G通信ETF(515050)获资金净流入超5287万元 [2] - 5G通信ETF(515050)跟踪中证5G通信主题指数 覆盖5G、AI算力、英伟达产业链 涉及6G、消费电子、PCB、通信设备、服务器、光模块、物联网等细分行业龙头 [2] - 创业板人工智能ETF华夏(159381)跟踪创业板人工智能指数 聚焦AI硬件+软件+应用龙头 前十大成分股包含新易盛、中际旭创、天孚通信三大光模块龙头 [2] ETF产品信息 - 华夏中证5G通信主题ETF(515050)场外联接A类008086 C类008087 [3]
AI服务器需求持续火爆! 戴尔(DELL.US)AI订单猛增 单季度订单超越2025财年出货规模
智通财经网· 2025-05-30 00:10
业绩表现与展望 - 公司2026财年第一财季销售额同比增长5%至234亿美元 高于华尔街预期的231亿美元 调整后每股利润1.55美元同比增长17% [2] - 公司预计2026财年每股收益9.40美元 高于2月预测 重申全年销售额预期中值1030亿美元(区间1010-1050亿) 显著超越华尔街预期的9.21美元每股收益 [1] - 公司预计第二季度每股利润2.25美元 销售额290亿美元(区间285-295亿) 均高于华尔街预期 经营费用将以低个位数步伐下降 [5] AI服务器业务 - 第一财季AI服务器订单价值达121亿美元 超过2025财年全年AI服务器出货量价值 未完成积压订单144亿美元 [2] - 维持全年150亿美元AI服务器销售额预测 较2025财年98亿美元增长约50% [2] - 公司与英伟达合作建造美国能源部旗舰超级计算机 用于聚变研究等前沿领域 [6] - 公司加速生产搭载英伟达Blackwell架构GPU的B200/GB200服务器 客户包括OpenAI/xAI等AI企业及AWS等云巨头 [6][7] 业务结构 - 核心业务分为ISG(服务器/存储/网络)和CSG(商用/消费PC) ISG成为业绩增长引擎 [8] - 消费PC业务销售额第一财季大幅下滑19% 营业利润下降16% 面临价格竞争压力 [10] - 商用PC业务聚焦高利润率产品 但AI服务器中高价GPU/ASIC组件可能压缩利润率 [10] 行业趋势 - 全球AI算力需求持续强劲 未受关税政策影响 推理领域需求呈现指数级增长 [2][3] - AI应用渗透推动云端推理算力需求 黄仁勋指出推理模型消耗算力可达训练100倍以上 [3] - 公司与超微电脑通过英伟达CUDA生态提供优化AI训练/推理解决方案 股价自2023年上涨200% [7] 竞争环境 - 关税政策推高PC行业成本 竞争对手惠普因经济担忧下调盈利预测股价单日跌8.3% [9] - 法院裁定多数关税非法但暂未撤销执行 公司表示业绩指引已反映已知关税影响 [9]
英伟达电话会全文!黄仁勋:“AI推理爆炸式增长”,痛失H20巨额收入但Blackwell芯片周产7.2万颗GPU
硬AI· 2025-05-29 14:05
核心观点 - 英伟达Q1营收同比增长69%至440亿美元,超出预期,但受H20出口限制影响,Q2预计损失80亿美元收入[1][8][25] - Blackwell芯片产能创纪录,周产72,000颗GPU,支撑微软单季处理100万亿Token的推理需求[1][10][28] - AI推理需求呈现爆炸式增长,微软Q1处理Token量同比增长5倍至100万亿[4][12][29] - 中国AI市场价值500亿美元,但受出口限制影响基本对美国关闭,公司正探索替代方案[3][8][45] - 企业AI和工业AI成为重要增长引擎,预计将改造5000亿美元IT基础设施[17][84] 财务表现 - Q1数据中心收入390亿美元,同比增长73%,其中Blackwell贡献近70%[25][27] - Q1网络业务收入环比增长64%至50亿美元,Spectrum-X年化收入超80亿美元[33][35] - Q1游戏业务收入创纪录达38亿美元,环比增48%,AI PC产品线扩展[37] - Q2营收指引450亿美元,GAAP毛利率预计71.8%,Blackwell盈利能力改善[20][43] 产品与技术 - Blackwell架构吞吐量比Hopper高40倍,专为复杂推理设计,软件优化使其性能提升1.5倍[3][10][30] - GB300系统本季度末量产,采用与GB200相同规格,HBM增加50%带来FP4推理性能提升50%[10][28] - NVLink技术实现PCIe Gen5带宽14倍,单机架带宽达130TB/s,Q1出货超10亿美元[34][35] - Omniverse平台助力工业客户:台积电节省数月工期,富士康热仿真提速150倍[39] 市场动态 - 全球近100个AI工厂在建,同比增长一倍,单个工厂平均GPU用量翻倍[31][62] - 主权AI成为新增长点,沙特500兆瓦、阿联酋5吉瓦项目启动,多国建设国家AI平台[49][84] - 开源模型DeepSeek R1和通义千问获认可,展现中国AI研发实力[13][46] - 推理工作负载从简单问答转向复杂代理式AI,计算强度提升100-1000倍[12][53] 供应链与产能 - Blackwell成为史上最快爬坡产品,主要客户每周部署近1,000个NVL72机架[10][28] - 美国本土制造布局加速:台积电亚利桑那厂年底量产,富士康休斯顿建百万平方英尺工厂[47] - 单个GB200 NVLink72机架含120万组件,重近两吨,供应链面临挑战[47] - H20库存减记45亿美元,部分材料被重新利用[26][45]
英伟达CEO黄仁勋:AI推理需求激增,特朗普取消AI扩散制度是利好
快讯· 2025-05-28 22:29
AI行业趋势 - AI推理需求增长超过计算能力提升速度 [1] - 特朗普政府取消拜登AI扩散制度 被认为对美国AI发展有利 [1] AI技术应用 - 企业级AI领域 Agentic AI表现优于通用AI [1] - 全球各地积极投资本土AI制造和应用 [1] - 新建工厂普遍采用AI技术 [1]
清华创业团队打造!国内首个专注AI推理Serverless GPU平台
机器之心· 2025-05-28 03:54
公司介绍 - 共绩科技是全球唯一利用动态闲置资源提供安全稳定服务的分布式计算平台,致力于构建信息、算力、能源一体化的资源调度网络 [1] - 公司核心团队来自清华大学、北京大学及Intel、字节跳动、阿里等知名企业,在分布式资源调度领域深耕多年 [27] - 已承建青海省、河北省省级算力调度平台,累计服务90余家人工智能企业 [27] 产品技术 - 共绩云AI推理Serverless平台支持极简快速部署,RTX 4090价格低至1.68元/小时,按毫秒计费 [2] - 采用Docker容器化技术实现五步部署,提供预制镜像与7x24h免费技术支持 [25][26] - 自研闲时算力调度平台整合26家智算中心资源(包括金山云、火山引擎),形成万卡资源池 [27] 行业痛点 - AI推理市场存在"弹性、稳定、低价"不可能三角,传统整租模式导致闲置成本高或扩容慢 [8][11] - 国内Serverless GPU服务资源稀缺,供需错配造成大量闲置与短租一卡难求并存 [19][12] - 现有服务模式要求长租且管理繁琐,阻碍创业公司快速迭代 [12] 解决方案 - 通过Serverless GPU实现毫秒级按量计费,流量激增时秒级扩容,回落时缩容归零 [23][24] - 独创动态资源调度网络打破单一云厂商边界,将闲置算力转化为可用资源 [21][27] - 支持实时/批量推理、3D渲染等场景,冷启动速度媲美国外RunPod [15][17] 市场活动 - 新用户注册充值可获20%额外积分,邀请好友双方各得50元积分 [3][30] - 活动期限至6月18日,RTX 4090推理服务维持1.68元/小时促销价 [29][30]
Morgan Stanley--出口管制正在缩小中国的HBM差距
傅里叶的猫· 2025-05-27 14:52
中国HBM技术发展 - 中国HBM3技术落后全球领先者3-4年 但差距正通过AI芯片生产规模能力缩小[2] - 长鑫存储计划2025年中期小批量生产HBM2 2026年开发HBM3 2027年生产HBM3/3E[1][14] - 中国在hybrid bonding封装技术领域占据强势地位 长江存储相关专利达119项远超三星(83项)和SK海力士(11项)[20][21] 半导体供应链国产化进展 - 中国前端半导体制造产能占全球20% 后端占40% 预计2027年37%成熟节点产能集中在中国[5] - 本土供应链已覆盖EDA设计(华大九天)、晶圆代工(中芯国际)、存储(长江/长鑫)、封装测试(通富微电)等全环节[6] - 长鑫存储DDR5技术差距从5年缩短至3年 2025年产能预计占全球DRAM市场的14%[18] AI芯片替代方案 - 英伟达计划推出GDDR7替代HBM的6000D GPU 预计2025年出货100万台 带来3.84亿美元收入[6][7] - 游戏GPU可满足中小型企业AI推理需求 预计2023-2027年中国游戏GPU市场CAGR从4%提升至10%[12] - 华为昇腾910C采用8颗HBM2E 壁仞/燧原等厂商也使用韩国HBM2/2E[13] 技术竞争格局 - 全球HBM产能2025年底预计34万片/月 长鑫存储2026年规划10万片/月 2028年扩至40万片/月[16] - hybrid bonding将成为16层以上HBM堆叠关键技术 三星/SK海力士/美光计划2027年HBM4e采用该工艺[27][28] - 长鑫存储在无EUV情况下开发15nm以下DRAM节点 面临良率和生产规模挑战[17] 产能扩张计划 - 长鑫存储2025年产能预计达540kwpm(8英寸等效) 合肥/北京工厂合计30万片/月12英寸晶圆产能[18][19] - 武汉新芯启动HBM专项 长电科技推出XDFOI封装方案 通富微电负责HBM2堆叠组装[22]
万国数据-SW(9698.HK):EBITDA增长提速 上架率提升
格隆汇· 2025-05-21 17:44
财务表现 - 1Q25实现营业收入27.23亿元,同比增长12.0% [1] - 调整后EBITDA 13.24亿元,同比增长16.1%,高于彭博一致预期的12.87亿元 [1] - 净利润4.11亿元,主要受益于首单ABS项目交割确认的资产处置收益10.57亿元 [1] - 调整后EBITDA利润率48.6%,环比提升0.4pct,得益于运营成本下降 [2] 业务运营 - 国内在运营IT规模约1313MW,在运营/储备规模分别达369MW/900MW [2] - 机柜利用率75.7%,环比提升1.9pct,反映国内数据中心需求回暖 [2] - 海外业务累计签约规模537MW,在运营规模143MW,1Q25营收/调整后EBITDA为0.66/0.21亿美元 [2] 业绩展望 - 2025年总收入指引112.9-115.9亿元(同比增长9.4%-12.3%),调整后EBITDA指引51.9-53.9亿元(同比增长6.4%-10.5%) [3] - 预计25-27年调整后EBITDA分别为52.9/59.3/68.8亿元 [3] - 净负债/调整后EBITDA比例降至6.6倍(1Q24:7.7倍),未来杠杆率有望进一步下降 [3] 估值与战略 - SOTP估值目标价上调至40.47港币/股(前值36.37港币/股),国内业务EV/EBITDA目标估值从15倍调至16倍 [3] - 国际业务参考B轮融资估值,给予6.75元/股估值 [3] - 持续推进公募REITs发行,有望改善现金流并降低利息费用 [3] 行业机遇 - 国内AI推理需求增长可能带动数据中心空置率下降,提供估值提升及业绩改善机会 [1] - 公司核心地带资源储备丰富,为后续业务发展提供增长动能 [2]
AI推理加速演进:云计算的变迁抉择
21世纪经济报道· 2025-05-21 11:09
AI发展趋势 - 开源大模型高效迭代推动AI发展从训练转向推理 小模型应用落地需求增加 对云计算市场产生深远影响 [1] - IDC预测未来AI推理市场规模将达训练需求的十倍以上 垂直场景小模型部署潜力更大 [1] - 行业投资重心转向推理 企业需关注推理效率(吞吐量、时延、成本) Akamai服务提升3倍吞吐并降低60%时延 [2][3] 云计算架构变革 - 边缘计算成为重要增长点 分布式架构需满足低延时(10毫秒)、灵活部署 Akamai覆盖130国4200边缘节点 [3] - 混合云/多云策略被绝大多数企业接受 客户探讨如何执行符合业务特性的多云战略 [1] - 边缘推理优势显著:靠近用户提升体验 满足数据主权要求 降低数据传输成本 [3] 模型应用特征 - 实际生产中89%用户采用小模型解决具体问题 商业化程度高于大模型 智能客服等场景已验证效果 [2] - 时延敏感领域更适合边缘部署小模型 "快思考"与"慢思考"模型需差异化云环境部署 [3][4] - 中国企业出海加速嵌入AI推理能力 如商旅行业用AI生成非定制行程建议 [5] 行业挑战与优化 - 企业CTO反映前期过度投入训练 推理准备不足 需构建运营级服务能力(算力/数据管理/边缘运维) [2] - "慢思考"模型推高云计算成本 迫使企业优化服务效率 需平衡资源使用与成本 [3] - 推理需额外考虑可扩展性、合规性等要素 与训练数据中心要求存在差异 [2]