AI推理 - 财报，业绩电话会，研报，新闻 - Reportify

AI推理

搜索文档

AI推理爆发前夜，英伟达打出另一张“王牌”

半导体行业观察· 2025-08-13 01:38

核心观点 - AI网络成为数据中心转型的核心驱动力，推动"AI工厂"和"AI云"的崛起，将原始数据转化为实时智能与解决方案 [1] - 英伟达凭借Spectrum-X以太网平台和InfiniBand技术，在AI网络市场占据领导地位，数据中心以太网交换机收入季度环比增长183.7%，市场份额达12.5%（整体）和21.1%（数据中心细分） [2] - 公司市值飙升至4万亿美元的核心支撑来自GPU互连技术（AI网络），而非单一GPU硬件 [4][5] - 行业正从AI训练时代转向推理时代，推理市场对网络延迟、带宽和同步机制的要求更高，英伟达通过InfiniBand、Spectrum-X、BlueField SuperNIC/DPU等技术构建全栈解决方案 [10][11][12][13][14] - 未来竞争焦点转向系统级协同效率，英伟达通过AI Fabric、CPO光电封装等技术优化推理集群的能耗与扩展性 [13][14][17] AI工厂与AI云 - AI工厂是处理海量数据并生成智能的超级计算机/数据中心，类比工业制造流程，将数据转化为解决方案 [1] - AI云提供弹性可扩展的AI服务，用户无需自建基础设施即可调用模型与算力 [1] - 传统数据中心升级为"制造智能"的核心设施，老旧网络架构难以满足需求 [1] 英伟达网络技术优势 - **InfiniBand技术**：专为高性能计算设计，支持800Gb/s带宽、RDMA和网络计算卸载，显著降低延迟与拥塞，被微软Azure、OpenAI等用于大模型训练 [5][6][9] - **Spectrum-X以太网平台**：针对AI优化传统以太网，集成RDMA、动态路由和性能隔离技术，实现端到端低延迟与多租户互不干扰 [7][8] - **市场表现**：Spectrum-X推动英伟达数据中心以太网收入季度增长183.7%，市场份额跃居全球前三 [2] 战略布局与收购 - 2020年以69亿美元收购Mellanox，获得InfiniBand和Spectrum以太网技术，补齐GPU互连能力 [4] - 创始人黄仁勋与以太网发明者梅特卡夫达成共识：GPU互连技术（而非单一GPU）是公司核心竞争力 [4][16] 推理时代的技术突破 - **分布式推理**：InfiniBand与Spectrum-X提供RDMA和智能拥塞控制，满足多节点并行推理需求 [11] - **P-D分离优化**：NVLink/NVSwitch实现GPU间高速互连，Grace CPU降低CPU-GPU数据搬运延迟 [12] - **KVCache挑战**：BlueField SuperNIC加速GPU间KV共享，DPU优化CPU-GPU数据调度 [12] - **大型推理集群**：AI Fabric架构支持动态路径选择与GPU级资源调度，CPO光电封装降低30%-50%网络能耗 [13][14] 未来趋势 - 推理市场潜力远超训练，但需解决多节点扩展、能耗和稳定性问题 [10][13] - 系统级竞争成为关键，英伟达通过全栈网络技术（硬件+软件）构建生态壁垒 [16][17] - 网络价值遵循梅特卡夫定律，连接规模决定平台上限 [16]

英伟达(US:NVDA)

Spectrum-X以太网网络平台

Blackwell芯片

Spectrum-X以太网网络平台

Blackwell芯片

贴息政策来了！事关个人消费贷款、服务业经营主体贷款丨盘前情报

21世纪经济报道· 2025-08-13 00:43

A股市场表现 - 市场全天震荡走高，三大指数均创年内新高，沪指涨0.5%至3665.92点，深成指涨0.53%至11351.63点，创业板指涨1.24%至2409.4点 [2] - 沪深两市全天成交额达1.88万亿元，较上个交易日放量545亿元 [2] - 市场个股跌多涨少，超3100只个股下跌，半导体、港口、CPO、新疆等板块涨幅居前，PEEK材料、稀土永磁、锂矿等板块跌幅居前 [2] 全球市场概览 - 纽约股市三大股指上涨，道琼斯指数涨1.10%至44458.61点，标普500指数涨1.13%至6445.76点，纳斯达克指数涨1.39%至21681.90点 [3] - 欧洲三大股指涨跌不一，英国富时100指数涨0.20%至9147.81点，法国CAC40指数涨0.71%至7753.42点，德国DAX指数跌0.23%至24024.78点 [3] - 国际油价下跌，纽约商品交易所9月交货的轻质原油期货价格跌1.24%至每桶63.17美元，伦敦布伦特原油期货价格跌0.77%至每桶66.12美元 [4] 政策动态 - 九部门印发《服务业经营主体贷款贴息政策实施方案》，对2025年3月16日至12月31日期间向餐饮住宿、健康、养老等8类消费领域发放的合规贷款提供贴息支持 [5] - 三部门印发《个人消费贷款财政贴息政策实施方案》，2025年9月1日至2026年8月31日期间居民个人消费贷款可享受贴息，单笔5万元以上消费以5万元为贴息上限 [6] - 东北证券指出，贴息政策有助于银行实现消费贷规模上量，拉大分母缓和不良率，利好银行基本面 [6] 行业与企业动态 - 华为发布AI推理创新技术UCM，并计划于9月正式开源，该技术旨在实现高吞吐、低时延的推理体验，降低每Token推理成本 [6][7] - 商务部对原产于加拿大的进口豌豆淀粉发起反倾销立案调查，倾销调查期为2024年1月1日至12月31日 [8] - 干法锂电池隔膜骨干企业就反内卷达成多项共识，包括价格自律、暂停扩产、科学释放产能等，参与企业包括星源材质、恩捷股份等8家 [8] 宏观经济数据 - 美国7月消费者价格指数（CPI）环比增长0.2%，同比增长2.7%，核心CPI环比增长0.3%，同比增长3.1% [9] 机构观点 - 长城证券认为A股市场上涨势头顺畅，恒生科技指数跑输源于流动性压制和外资定价权主导，但随AI商业化提速和中报业绩验证，成长属性将重新吸引资金 [10] - 中银国际指出AI应用商业化进程处于加速阶段，大模型Tokens消耗量快速增长，看好AI编程、AI广告、AI多模态等具备明确用户增长及收入放量能力的赛道 [11] 公司公告摘要 - 臻镭科技上半年净利润同比增长1007% [12] - 白云机场与中免集团签订T3航站楼出境免税项目经营合作合同 [12] - *ST华微无法在责令改正期限内完成资金占用整改，股票停牌 [12] - ST盛屯撤销其他风险警示，股票简称变更为"盛屯矿业" [12] - 金橙子拟购买萨米特55%股权，股票将复牌 [12] - 中国船舶异议股东收购请求权行权价格为30.02元/股 [12] - 衢州发展拟购买先导电子95.46%股份，股票复牌 [12] - 中国重工异议股东现金选择权行权价格为4.03元/股 [12] 资金流向分析 - 主力资金净流入前五大行业为半导体（61.40亿元）、计算机设备（11.85亿元）、通信设备（11.84亿元）、电子化学品（6.59亿元）、航运港口（4.90亿元） [13] - 主力资金净流出前五大行业为小金属（-43.18亿元）、航天航空（-32.51亿元）、通用设备（-27.89亿元）、专用设备（-27.60亿元）、化学制药（-27.11亿元） [13] - 个股方面，寒武纪-U主力资金净流入20.16亿元，北方稀土主力资金净流出10.09亿元 [14]

消费贷款贴息

锂电池隔膜

UCM推理记忆数据管理器

消费贷款贴息

锂电池隔膜

UCM推理记忆数据管理器

车企承诺60天支付账期兑现情况曝光！官方：有三家车企实现；苹果手机 iPhone 17 Pro长得像充电宝引热议；罗马仕重启招聘

雷峰网· 2025-08-13 00:42

苹果iPhone 17 Pro设计引发热议 - iPhone 17 Pro系列采用横向大矩阵Deco设计，左侧三摄右侧集成闪光灯与LiDAR扫描仪，金属+玻璃拼接材质引发"背贴充电宝"吐槽 [4] - 提供5款配色（黑/白/紫/浅蓝/绿），Pro系列独占橙色 [5] - 该机型被官方确认为苹果史上外观变化最大的旗舰手机，距离发布仅剩1个月 [4] 车企60天账期承诺进展 - 中国汽车工业协会确认已有三家车企（一汽/广汽/赛力斯）实现60天内支付供应商货款 [7] - 一汽建立跨部门专项工作组，广汽将60天支付列为铁律，赛力斯采用"厂中厂"模式保障执行 [7] - 该承诺响应2025年施行的《保障中小企业款项支付条例》，涉及17家主流车企包括央企/国企/新势力 [7][8] 华为技术动态 - 发布AI推理创新技术UCM，通过分级管理KV Cache记忆数据实现高吞吐低时延推理，已在中国银联三大业务场景试点 [8][9] - 计划2025年9月开源UCM技术，将贡献给主流推理引擎社区 [9] - 问界M7新车首搭华为ADS 4智驾系统，提供舱内激光与车顶激光雷达双方案，增程版综合续航超1600公里 [20] 电商与本地生活竞争 - 淘宝闪购8月8-9日订单量份额首超美团，7月补贴超100亿元（美团同期补贴约33-50亿） [12] - 京东CEO许冉明确不参与"恶性补贴"，称外卖业务入局为解决行业痛点而非反制美团 [15] - 淘宝闪购非餐品牌表现亮眼：66个品牌月成交破千万，小米门店日均订单较5月增长4倍 [37] 自动驾驶与汽车行业 - 理想i8与乘龙卡车100km/h对撞测试引发争议，长城汽车董事长魏建军直言"不敢撞卡车" [9][10] - 特斯拉Robotaxi将于下月开放公众使用权限，2025年全面普及，目前已在德州/加州试点 [49][50] - 小米SU7/YU7采用动态电池热管理策略，雷军强调"十倍投入"造车理念，YU7实测高温续航600km+ [16] 半导体与硬件 - 美光全球停止移动NAND产品开发（含UFS5），但继续开发SSD/汽车NAND及移动DRAM [50][51] - 寒武纪否认"预定大量载板订单"传闻，定增募资额从49.8亿下调至39.9亿元 [32][33] - 三星Galaxy A07 4G曝光：搭载Helio G99芯片，承诺6年系统更新，5000mAh电池+15W快充 [46][47] 企业组织变动 - GitHub CEO宣布卸任，平台结束独立运营并入微软CoreAI组织，75亿美元收购后首次失去子公司身份 [39][40] - 前荣耀CEO赵明否认加盟智界汽车，奇瑞与华为已组建5000人研发团队投入超100亿元 [31][32] - 哪吒汽车被列为失信被执行人，正通过阿里资产平台招募重整投资人 [27][28] 消费电子新品 - 魅族22系列入网：挑战1.2mm全球最窄四等边，首搭潜望长焦定位Pro级小屏旗舰 [35] - 追觅成立智显事业群进军电视/投影仪市场，首款双机械臂洗地机器人月底发布 [16] - 罗马仕重启招聘：礼品销售岗月薪1.2-3万，此前因充电宝自燃事件仅剩20多人在岗 [13]

智能电动汽车

智能电动汽车

华尔街见闻早餐FM-Radio | 2025年8月13日

搜狐财经· 2025-08-12 23:21

市场表现 - 全球贸易乐观情绪提振投资者信心纳指与标普500均涨超1% 齐创历史新高罗素小盘股指数飙升3% [1] - Meta涨超3% 收创历史新高 [1] - 创业板涨超1% 芯片股午后爆发寒武纪涨停创新高恒指涨0.25% [3] - 标普500指数涨幅1.13% 报6445.76点道指涨幅1.10% 报44458.61点纳指涨幅1.39% 报21681.90点 [12] - 沪指涨0.5% 报3665.92点深成指上涨0.53% 创业板指上涨1.24% [12] 加密货币与区块链 - 以太坊大涨近9% 时隔近四年重回4500美元上方 [2] - 美国以太坊现货ETF周一单日净流入超10亿美元创历史记录 [8] - Circle二季度收入同比大增53% USDC流通量同比激增90% [8] - Bitmine持有超过30万枚以太坊价值约11.3亿美元成为最大企业持有者 [22] 科技与AI - 华为发布AI推理创新技术UCM 破解HBM依赖实现高吞吐、低时延体验 [9] - CoreWeave Q2营收增两倍上调全年指引但利润端逊色盘后跌超10% [8] - 特斯拉解散Dojo超级计算机团队核心成员加入DensityAI [30] - OpenAI联合创办人奥特曼支持Merge Labs进军脑机接口领域估值8.5亿美元 [31] 消费与零售 - 贵州茅台上半年净利润同比增长8.89% 现金流大跌64% [10] - 腾讯音乐在线音乐服务收入达68.5亿元同比增长26.4% SVIP用户突破1500万 [28] 政策与贸易 - 三部门对单笔5万元以上的消费以5万元为上限进行贴息服务业经营主体贷款可享1%贴息贴息贷款规模最高达100万元 [3] - 中美暂停实施24%的关税90天保留10%的关税 [19] - 美国7月关税收入280亿美元创历史新高同比飙升273% [21] 能源与大宗商品 - 原油收跌美油较日高下挫近2% 内盘夜市菜油收涨3.79% 菜粕涨3.57% [2] - WTI 9月原油期货收跌1.23% 报63.17美元/桶布伦特10月原油期货收跌0.76% 报66.12美元/桶 [14] - OPEC将2026年全球石油需求增长预期上调10万桶/日至140万桶/日 [29] 行业趋势 - 液冷成为AI基础设施散热刚需渗透斜率加速向上 [32] - 高端电子布长期成长叠加短期供不应求有望打造周期成长共振行情 [32] - 废纸系成本价格稳步抬升木浆系浆价首涨开启浆纸提价通道 [32] - AI4S将对化工行业竞争格局产生重大影响生物发酵和农业创新领域有望率先突破 [32]

上证早知道｜个人消费贷财政贴息来了！下月开源华为AI大动作！中国恒大被取消上市地位

上海证券报· 2025-08-12 23:06

财政与金融政策 - 财政部、中国人民银行、金融监管总局印发《个人消费贷款财政贴息政策实施方案》，明确在2025年9月1日至2026年8月31日期间对符合条件的个人消费贷款给予财政贴息 [1][3] - 九部门印发《服务业经营主体贷款贴息政策实施方案》，财政部门对服务业经营主体贷款按本金进行贴息，贴息期限不超过1年，年贴息比例1个百分点，中央和省级财政分别承担90%和10%，单户贴息贷款规模最高达100万元 [2] - 国务院批准自2025年8月12日12时01分起，在90天内继续暂停实施24%的对美加征关税税率，保留10%的税率 [2] 科技与创新 - 华为发布AI推理创新技术UCM（推理记忆数据管理器），计划于2025年9月正式开源，旨在扩大推理上下文窗口并降低每Token推理成本 [1][8] - 昆仑万维在中国发布并开源自研世界模型Matrix系列升级版Matrix-Game 2.0，支持生成跨场景长时视频并保持动作和视觉时序一致性 [6] - 中国移动四川公司携手华为完成全国首个1120MHz频谱带宽下的5G-A多载波聚合性能测试，单用户下载速率达到11.13Gbps [6] - 广立微通过全资子公司收购LUCEDA NV 100%股权，LUCEDA是硅光芯片设计自动化软件领域的全球领军企业 [21] 产业发展与规划 - 工业和信息化部等七部门印发《关于推动脑机接口产业创新发展的实施意见》，目标到2027年关键技术取得突破，产业规模壮大，打造2至3个产业发展集聚区；到2030年培育2至3家有全球影响力的领军企业 [10][11] - 福建省通信管理局印发《福建省信息通信行业推动新型信息基础设施高质量发展行动计划（2025-2027年）》，目标到2027年推动"双千兆"网络普及，5G积极演进，万兆光网创新 [4] - 广州市人民政府等印发实施方案，鼓励国内保险机构在南沙设立私募股权投资基金，推动"险资入穗"，支持保险机构通过债券、股票等方式投资科创企业 [4] 市场动态与数据 - 2025年上半年全球智能眼镜市场出货量同比增长110%，主要受Ray-Ban Meta智能眼镜强劲需求及小米、雷鸟科技等新进入者推动 [6] - 浙商证券测算显示，2025年至2027年液冷市场规模预计分别为354亿元、716亿元和1082亿元，2027年有望突破千亿元 [12] - IDC预计2025年至2029年中国液冷服务器市场年复合增长率达48%，2028年市场规模约162亿美元 [12] - 2025年全球存储市场预计维持双位数增长，突破2300亿美元 [9] 公司公告与业绩 - 中国恒大将被联交所取消上市地位，最后上市日为2025年8月22日，8月25日上午九时起取消上市地位 [1][7] - 特斯拉Model 3长续航后轮驱动版正式上线，续航830公里（CLTC），5.2秒百公里加速 [6] - 臻镭科技上半年营业收入2.05亿元，同比增长73.64%，净利润6231.97万元，同比增长1006.99% [17] - 国盾量子拟与中电信量子信息科技集团签订销售合同，金额7654.18万元，另提供技术服务合同金额1400万元 [15] - 海思科收到国家药监局批准，同意HSK47977片开展临床试验，该药品为口服BCL6 PROTAC小分子制剂，用于治疗非霍奇金淋巴瘤 [18][19] 投资与资金流动 - 全市场新基金启动募集连续三周单周不低于30只，权益基金占比超八成，指数基金为主力军 [22] - 今年以来公募净申购权益类基金总额超26亿元，南方基金运用固有资金投资旗下权益基金不少于2.3亿元 [23] 行业倡议与合作 - 中国有色金属工业协会锂业分会倡议锂产业链企业加强上下游协同，维护产业安全，抵制无序竞争，合理布局产能 [5][6]

液冷服务器

液冷服务器

晚报 | 8月13日主题前瞻

选股宝· 2025-08-12 14:37

养鸡 - 7月初白羽鸡毛鸡价格跌破3元/斤，8月最高飙升至3.7元/斤，鸡苗价格从1.5元/只涨至4.2元/只，山东鸡苗价格一个多月上涨300% [1] - 上半年祖代肉种鸡更新量同比下降36.72%，将影响7个月后父母代肉种鸡和14个月后商品代白羽肉鸡供给 [1] - 高温导致雏鸡存活率下降15%，40-60日龄在栏鸡数量环比减少8%，8月补栏对应国庆前出栏 [1] 华为产业链 - 华为发布AI推理创新技术UCM，可扩大推理上下文窗口，降低每Token推理成本，计划2025年9月开源 [2] - UCM技术通过优化KV Cache记忆数据管理解决HBM资源不足导致的推理体验下降问题 [2] - 该技术发布正值AI产业从追求模型能力转向追求推理体验最优化的关键节点 [2] 消费金融 - 财政部等部门实施个人消费贷款贴息政策与服务业经营主体贷款贴息政策 [3] - 政策覆盖餐饮住宿、健康、养老等8类消费领域，通过1%贷款贴息有望增加百亿级消费动力 [3] - 政策从供需两端发力提振消费，餐饮住宿、消费金融公司和信贷金融机构将受益 [3] 量子通信 - 中国科学技术大学团队利用AI技术在60毫秒内构建2024个原子的无缺陷二维和三维原子阵列 [4] - 该方法刷新了中性原子体系无缺陷原子阵列规模的世界纪录 [4] - 研究成果为大规模中性原子量子计算奠定关键技术基础 [4] 宏观行业新闻 - 九部门印发《服务业经营主体贷款贴息政策实施方案》 [5] - 三部门印发《个人消费贷款财政贴息政策实施方案》 [6] - 商务部对加拿大进口豌豆淀粉进行反倾销调查 [6] - 发改委举办推进低空经济高质量发展专题培训 [6] - 中国信通院发布《脑机接口技术与应用研究报告（2025年）》 [6] - 干法锂电池隔膜企业就行业反内卷达成共识 [6] - 广州加强区块链、人工智能等数字服务机构招商引资 [6] 行情回顾 - 国产芯片、AI芯片、液冷服务器、新疆概念、脑科学、光通信、机器人、东数西算/算力、雅江电站、房地产、大消费、军工、RWA、医药、资产重组、ST股等板块表现活跃 [8][9][10][11][12]

UCM（推理记忆数据管理器）

UCM（推理记忆数据管理器）

华为AI推理新技术犀利！中国银联大模型效率提高了125倍

21世纪经济报道· 2025-08-12 14:11

技术发布 - 华为发布AI推理创新技术UCM 专门优化大模型推理过程的缓存管理技术旨在提升推理速度效率和成本效益 [1] - UCM是以KV Cache为中心的推理加速套件融合多类型缓存加速算法工具分级管理推理过程中产生的KV Cache记忆数据扩大推理上下文窗口 [1] - 技术通过推理框架算力存储三层协同实现高吞吐低时延的推理体验降低每Token推理成本 [1][5] 技术原理 - KV Cache是一种优化Transformer模型推理速度的技术通过缓存历史token的Key和Value矩阵避免重复计算提升推理速度并降低计算成本 [3] - KV Cache采用用内存换计算的工程优化手段作为模型推理过程中的记忆本临时保存计算中间结果 [3] - UCM包含三大组件：推理引擎插件Connector 支持多级KV Cache管理及加速算法的功能库Accelerator 高性能KV Cache存取适配器Adapter [5] 性能提升 - 依托UCM层级化自适应的全局前缀缓存技术系统可直接调用KV缓存数据使首Token时延最大降低90% [5] - 在中国银联客户之声业务场景试点中大模型推理速度提升125倍仅需10秒即可精准识别客户高频问题 [5] - 国外主流模型单用户输出速度达200 Tokens/s（时延5ms）而国内普遍小于60 Tokens/s（时延50-100ms） [4] 行业应用 - 华为联手中国银联在金融典型场景开展UCM技术试点应用联合发布智慧金融AI推理加速方案 [1] - 金融行业因数字化属性强且对速度效率安全要求高成为验证技术的标杆场景 [5] - 中国银联将依托国家人工智能应用中试基地联合华为等生态伙伴共建AI+金融示范应用推动技术成果规模化应用 [6] 技术优势 - UCM将专业存储能力引入分级缓存管理在软硬件协同与卸载方面做了大量工作包括直通加速 KV检索索引与底层文件系统元数据融合 [8] - UCM具备KV Cache生命周期管理的完整机制包括预热分级淘汰等功能 [8] - 相比业界仅停留在Prefix Cache层面 UCM将稀疏全流程算法后缀检索算法等投入商用提供更丰富可靠的算法库 [8] 生态建设 - UCM通过开放统一的南北向接口可适配多类型推理引擎框架算力及存储系统 [9] - 计划于今年9月正式开源后续逐步贡献给业界主流推理引擎社区 [9] - 华为在AI布局上持续进行产业链各环节升级实现从单点算力模组转向系统性优化的趋势 [9]

UCM（推理记忆数据管理器）

智慧金融AI推理加速方案

UCM（推理记忆数据管理器）

智慧金融AI推理加速方案

降低传统路径依赖，华为推出AI推理新技术

第一财经· 2025-08-12 12:43

华为UCM技术发布 - 华为推出AI推理新技术UCM 以KV Cache和记忆管理为中心通过推理框架、算力和存储三层协同优化Tokens流转效率 [1] - UCM可将首Token时延最高降低90% 系统吞吐最大提升22倍实现10倍级上下文窗口扩展 [2] - 华为计划在9月正式开源UCM 希望联合产业界推进AI推理生态建设 [3] 国内外推理效率对比 - 国外主流模型单用户输出速度达200 Tokens/s（时延5ms）中国普遍小于60 Tokens/s（时延50-100ms） [1] - 中国头部互联网公司在推理Token数上与海外头部公司存在差距 [1] - 国内在KV Cache软件体系构建上尚未形成完整解决方案国外已有成熟推理加速软件框架能与各类硬件平台适配 [2] 技术架构创新 - UCM不再单纯依赖HBM高带宽内存而是在存储层面构建多层级可灵活调配的资源体系 [2] - 系统级推理架构优化需要从芯片级、软件级到框架级协同考虑形成完整推理架构 [3] - 业界缺乏普适适用的框架与加速机制需通过产业协同解决AI落地效率与成本问题 [3]

UCM（推理记忆数据管理器

Unified Cache Manager）

UCM（推理记忆数据管理器

Unified Cache Manager）

华为在沪发布AI推理创新技术UCM 9月将正式开源

搜狐财经· 2025-08-12 11:53

产品发布与技术特点 - 华为发布UCM推理记忆数据管理器作为以KV Cache为中心的推理加速套件融合多类型缓存加速算法工具分级管理推理过程中产生的KV Cache记忆数据扩大推理上下文窗口实现高吞吐低时延的推理体验降低每Token推理成本 [2] - UCM包含三大组件推理引擎插件Connector对接不同引擎与算力功能库Accelerator支持多级KV Cache管理及加速算法高性能KV Cache存取适配器Adapter 通过推理框架算力存储三层协同实现更优体验更低成本 [3] - UCM通过层级化自适应的全局前缀缓存技术使系统直接调用KV缓存数据避免重复计算首Token时延最大降低90% 同时将超长序列Cache分层卸载至外置专业存储实现推理上下文窗口10倍级扩展 [3] - UCM具备智能分级缓存能力根据记忆热度在HBM DRAM SSD等存储介质中实现按需流动融合多种稀疏注意力算法实现存算深度协同使长序列场景下TPS每秒处理token数提升2-22倍显著降低每Token推理成本 [3] 应用场景与合作伙伴 - 华为携手中国银联率先在金融典型场景开展UCM技术试点应用联合发布智慧金融AI推理加速方案应用成果 [2] - 在中国银联客户之声业务场景下 UCM技术使大模型推理速度提升125倍仅需10秒即可精准识别客户高频问题 [4] - 中国银联将依托国家人工智能应用中试基地联合华为等生态伙伴共建AI+金融示范应用推动技术成果从实验室验证走向规模化应用 [4] 开源计划与生态建设 - 华为正式公布UCM开源计划通过开放统一的南北向接口适配多类型推理引擎框架算力及存储系统 [4] - UCM将于今年9月正式开源后续逐步贡献给业界主流推理引擎社区携手全产业共同推动AI推理生态的繁荣发展 [4] 行业背景与发展趋势 - 人工智能已步入发展深水区 AI推理正成为下一个爆发式增长的关键阶段 [2] - AI时代模型训练推理效率与体验的量纲都以Token数为表征 Token经济已经到来 [2] - 为保障流畅的推理体验企业需持续加大算力投入在推理效率与成本之间找到最佳平衡点成为全行业亟待解决的重要课题 [2]

UCM推理记忆数据管理器

UCM推理记忆数据管理器

华为：AI推理创新技术UCM将于今年9月正式开源

新浪科技· 2025-08-12 11:21

产品发布 - 华为发布AI推理创新技术UCM推理记忆数据管理器包括推理引擎插件Connector 功能库Accelerator 高性能KV Cache存取适配器Adapter三大组件 [2] - UCM技术通过推理框架算力存储三层协同实现AI推理更优体验和更低成本 [2] 技术应用 - 华为与中国银联在金融典型场景开展UCM技术试点应用联合发布智慧金融AI推理加速方案应用成果 [2] - 在中国银联客户之声业务场景下 UCM技术使大模型推理速度提升125倍仅需10秒即可精准识别客户高频问题 [3] 行业观点 - AI时代模型训练和推理效率的量纲以Token数为表征 Token经济已经到来 [2] - 企业需持续加大算力投入保障推理体验但需在推理效率与成本之间找到最佳平衡点 [2] 生态发展 - 华为公布UCM开源计划通过开放统一南北向接口适配多类型推理引擎框架算力及存储系统 [3] - UCM将于今年9月正式开源后续逐步贡献给业界主流推理引擎社区 [3] - 中国银联将联合华为等生态伙伴共建AI+金融示范应用推动技术成果从实验室验证走向规模化应用 [3]

UCM推理记忆数据管理器

UCM推理记忆数据管理器