Workflow
AI推理
icon
搜索文档
即将开源!华为发布AI推理黑科技,已在中国银联落地
钛媒体APP· 2025-08-13 03:44
华为UCM推理记忆数据管理器发布 - 华为发布AI推理创新技术UCM推理记忆数据管理器,旨在提升推理性价比并加速AI商业正循环 [2] - UCM包含推理引擎插件、功能库和高性能KV Cache存取适配器三大组件,通过三层协同实现更优体验和更低成本 [2] - 公司携手中国银联在金融场景开展UCM技术试点,联合发布智慧金融AI推理加速方案应用成果 [2] AI推理行业现状与挑战 - 大模型行业重心从训练转向推理,推理算力需求占比已达58.5% [2] - GPT-5开放首周请求量达20亿次/分钟,70%为复杂任务推理 [2] - 国内火山引擎日均token调用量16.4万亿,70%以上来自线上推理 [2] - 中国互联网AI基础设施投资仅为美国十分之一,面临算力卡阉割、涨价等多重挑战 [3] - 国内大模型首Token时延普遍50-100ms,远慢于海外5ms水平 [4] - 国内模型上下文窗口最大50万Token,长文本分析遗漏关键信息概率超50% [4] UCM技术原理与优势 - 采用"以存代算"思路,通过三级存储协同将首token延迟降低90% [6] - 将PB级历史数据缓存至外置共享存储,避免重复推理 [8] - 通过智能算法对长序列内容切片,使上下文窗口扩大10倍 [9] - 采用注意力稀疏技术分层管理数据,提升整体吞吐量 [9] - 长序列场景下TPS提升2-22倍,显著降低每Token推理成本 [9] 金融行业应用案例 - 中国银联应用UCM技术后,标签分类推理时间从600秒降至10秒内,提升50倍以上 [10] - 标签分类准确率从不到10%提升至80%,达到生产预期 [11] - 解决了金融行业面临的高成本、高延迟、高依赖等核心瓶颈 [10] 开源计划与行业影响 - UCM将于今年9月正式开源,后续贡献给主流推理引擎社区 [11] - 通过开放统一接口适配多类型推理框架、算力及存储系统 [11] - 旨在推动行业标准落地,解决推理体验和成本问题 [11]
AI推理爆发前夜,英伟达打出另一张“王牌”
半导体行业观察· 2025-08-13 01:38
核心观点 - AI网络成为数据中心转型的核心驱动力,推动"AI工厂"和"AI云"的崛起,将原始数据转化为实时智能与解决方案 [1] - 英伟达凭借Spectrum-X以太网平台和InfiniBand技术,在AI网络市场占据领导地位,数据中心以太网交换机收入季度环比增长183.7%,市场份额达12.5%(整体)和21.1%(数据中心细分) [2] - 公司市值飙升至4万亿美元的核心支撑来自GPU互连技术(AI网络),而非单一GPU硬件 [4][5] - 行业正从AI训练时代转向推理时代,推理市场对网络延迟、带宽和同步机制的要求更高,英伟达通过InfiniBand、Spectrum-X、BlueField SuperNIC/DPU等技术构建全栈解决方案 [10][11][12][13][14] - 未来竞争焦点转向系统级协同效率,英伟达通过AI Fabric、CPO光电封装等技术优化推理集群的能耗与扩展性 [13][14][17] AI工厂与AI云 - AI工厂是处理海量数据并生成智能的超级计算机/数据中心,类比工业制造流程,将数据转化为解决方案 [1] - AI云提供弹性可扩展的AI服务,用户无需自建基础设施即可调用模型与算力 [1] - 传统数据中心升级为"制造智能"的核心设施,老旧网络架构难以满足需求 [1] 英伟达网络技术优势 - **InfiniBand技术**:专为高性能计算设计,支持800Gb/s带宽、RDMA和网络计算卸载,显著降低延迟与拥塞,被微软Azure、OpenAI等用于大模型训练 [5][6][9] - **Spectrum-X以太网平台**:针对AI优化传统以太网,集成RDMA、动态路由和性能隔离技术,实现端到端低延迟与多租户互不干扰 [7][8] - **市场表现**:Spectrum-X推动英伟达数据中心以太网收入季度增长183.7%,市场份额跃居全球前三 [2] 战略布局与收购 - 2020年以69亿美元收购Mellanox,获得InfiniBand和Spectrum以太网技术,补齐GPU互连能力 [4] - 创始人黄仁勋与以太网发明者梅特卡夫达成共识:GPU互连技术(而非单一GPU)是公司核心竞争力 [4][16] 推理时代的技术突破 - **分布式推理**:InfiniBand与Spectrum-X提供RDMA和智能拥塞控制,满足多节点并行推理需求 [11] - **P-D分离优化**:NVLink/NVSwitch实现GPU间高速互连,Grace CPU降低CPU-GPU数据搬运延迟 [12] - **KVCache挑战**:BlueField SuperNIC加速GPU间KV共享,DPU优化CPU-GPU数据调度 [12] - **大型推理集群**:AI Fabric架构支持动态路径选择与GPU级资源调度,CPO光电封装降低30%-50%网络能耗 [13][14] 未来趋势 - 推理市场潜力远超训练,但需解决多节点扩展、能耗和稳定性问题 [10][13] - 系统级竞争成为关键,英伟达通过全栈网络技术(硬件+软件)构建生态壁垒 [16][17] - 网络价值遵循梅特卡夫定律,连接规模决定平台上限 [16]
贴息政策来了!事关个人消费贷款、服务业经营主体贷款丨盘前情报
21世纪经济报道· 2025-08-13 00:43
昨日A股 8月12日,市场全天震荡走高,三大指数均再创年内新高。截至收盘,沪指涨0.5%,深成指涨0.53%, 创业板指涨1.24%。沪深两市全天成交额1.88万亿,较上个交易日放量545亿。盘面上,市场热点较为杂 乱,个股跌多涨少,全市场超3100只个股下跌。从板块来看,芯片股午后爆发,A硬件股震荡走强,新 疆本地股维持强势。板块方面,半导体、港口、CPO、新疆等板块涨幅居前,PEEK材料、稀土永磁、 锂矿等板块跌幅居前。 | 名称 | 最新点位 | 涨跌幅 | | --- | --- | --- | | 上证指数 | 3665.92 | +18.37 (0.5%) | | 深证指数 | 11351.63 | +60.2 (0.53%) | | 创业板指 | 2409.4 | +29.58(1.24%) | | | 日期: 8月12日 制图: 21投资通 | | 隔夜外盘 纽约股市三大股指8月12日上涨。截至当天收盘,道琼斯工业平均指数比前一交易日上涨483.52点,收 于44458.61点,涨幅为1.10%;标准普尔500种股票指数上涨72.31点,收于6445.76点,涨幅为1.13%;纳 斯达克综合指 ...
车企承诺60天支付账期兑现情况曝光!官方:有三家车企实现;苹果手机 iPhone 17 Pro长得像充电宝引热议;罗马仕重启招聘
雷峰网· 2025-08-13 00:42
苹果iPhone 17 Pro设计引发热议 - iPhone 17 Pro系列采用横向大矩阵Deco设计,左侧三摄右侧集成闪光灯与LiDAR扫描仪,金属+玻璃拼接材质引发"背贴充电宝"吐槽 [4] - 提供5款配色(黑/白/紫/浅蓝/绿),Pro系列独占橙色 [5] - 该机型被官方确认为苹果史上外观变化最大的旗舰手机,距离发布仅剩1个月 [4] 车企60天账期承诺进展 - 中国汽车工业协会确认已有三家车企(一汽/广汽/赛力斯)实现60天内支付供应商货款 [7] - 一汽建立跨部门专项工作组,广汽将60天支付列为铁律,赛力斯采用"厂中厂"模式保障执行 [7] - 该承诺响应2025年施行的《保障中小企业款项支付条例》,涉及17家主流车企包括央企/国企/新势力 [7][8] 华为技术动态 - 发布AI推理创新技术UCM,通过分级管理KV Cache记忆数据实现高吞吐低时延推理,已在中国银联三大业务场景试点 [8][9] - 计划2025年9月开源UCM技术,将贡献给主流推理引擎社区 [9] - 问界M7新车首搭华为ADS 4智驾系统,提供舱内激光与车顶激光雷达双方案,增程版综合续航超1600公里 [20] 电商与本地生活竞争 - 淘宝闪购8月8-9日订单量份额首超美团,7月补贴超100亿元(美团同期补贴约33-50亿) [12] - 京东CEO许冉明确不参与"恶性补贴",称外卖业务入局为解决行业痛点而非反制美团 [15] - 淘宝闪购非餐品牌表现亮眼:66个品牌月成交破千万,小米门店日均订单较5月增长4倍 [37] 自动驾驶与汽车行业 - 理想i8与乘龙卡车100km/h对撞测试引发争议,长城汽车董事长魏建军直言"不敢撞卡车" [9][10] - 特斯拉Robotaxi将于下月开放公众使用权限,2025年全面普及,目前已在德州/加州试点 [49][50] - 小米SU7/YU7采用动态电池热管理策略,雷军强调"十倍投入"造车理念,YU7实测高温续航600km+ [16] 半导体与硬件 - 美光全球停止移动NAND产品开发(含UFS5),但继续开发SSD/汽车NAND及移动DRAM [50][51] - 寒武纪否认"预定大量载板订单"传闻,定增募资额从49.8亿下调至39.9亿元 [32][33] - 三星Galaxy A07 4G曝光:搭载Helio G99芯片,承诺6年系统更新,5000mAh电池+15W快充 [46][47] 企业组织变动 - GitHub CEO宣布卸任,平台结束独立运营并入微软CoreAI组织,75亿美元收购后首次失去子公司身份 [39][40] - 前荣耀CEO赵明否认加盟智界汽车,奇瑞与华为已组建5000人研发团队投入超100亿元 [31][32] - 哪吒汽车被列为失信被执行人,正通过阿里资产平台招募重整投资人 [27][28] 消费电子新品 - 魅族22系列入网:挑战1.2mm全球最窄四等边,首搭潜望长焦定位Pro级小屏旗舰 [35] - 追觅成立智显事业群进军电视/投影仪市场,首款双机械臂洗地机器人月底发布 [16] - 罗马仕重启招聘:礼品销售岗月薪1.2-3万,此前因充电宝自燃事件仅剩20多人在岗 [13]
华尔街见闻早餐FM-Radio | 2025年8月13日
搜狐财经· 2025-08-12 23:21
市场表现 - 全球贸易乐观情绪提振投资者信心 纳指与标普500均涨超1% 齐创历史新高 罗素小盘股指数飙升3% [1] - Meta涨超3% 收创历史新高 [1] - 创业板涨超1% 芯片股午后爆发 寒武纪涨停创新高 恒指涨0.25% [3] - 标普500指数涨幅1.13% 报6445.76点 道指涨幅1.10% 报44458.61点 纳指涨幅1.39% 报21681.90点 [12] - 沪指涨0.5% 报3665.92点 深成指上涨0.53% 创业板指上涨1.24% [12] 加密货币与区块链 - 以太坊大涨近9% 时隔近四年重回4500美元上方 [2] - 美国以太坊现货ETF周一单日净流入超10亿美元 创历史记录 [8] - Circle二季度收入同比大增53% USDC流通量同比激增90% [8] - Bitmine持有超过30万枚以太坊 价值约11.3亿美元 成为最大企业持有者 [22] 科技与AI - 华为发布AI推理创新技术UCM 破解HBM依赖 实现高吞吐、低时延体验 [9] - CoreWeave Q2营收增两倍 上调全年指引 但利润端逊色 盘后跌超10% [8] - 特斯拉解散Dojo超级计算机团队 核心成员加入DensityAI [30] - OpenAI联合创办人奥特曼支持Merge Labs进军脑机接口领域 估值8.5亿美元 [31] 消费与零售 - 贵州茅台上半年净利润同比增长8.89% 现金流大跌64% [10] - 腾讯音乐在线音乐服务收入达68.5亿元 同比增长26.4% SVIP用户突破1500万 [28] 政策与贸易 - 三部门对单笔5万元以上的消费以5万元为上限进行贴息 服务业经营主体贷款可享1%贴息 贴息贷款规模最高达100万元 [3] - 中美暂停实施24%的关税90天 保留10%的关税 [19] - 美国7月关税收入280亿美元 创历史新高 同比飙升273% [21] 能源与大宗商品 - 原油收跌 美油较日高下挫近2% 内盘夜市菜油收涨3.79% 菜粕涨3.57% [2] - WTI 9月原油期货收跌1.23% 报63.17美元/桶 布伦特10月原油期货收跌0.76% 报66.12美元/桶 [14] - OPEC将2026年全球石油需求增长预期上调10万桶/日至140万桶/日 [29] 行业趋势 - 液冷成为AI基础设施散热刚需 渗透斜率加速向上 [32] - 高端电子布长期成长叠加短期供不应求 有望打造周期成长共振行情 [32] - 废纸系成本价格稳步抬升 木浆系浆价首涨开启浆纸提价通道 [32] - AI4S将对化工行业竞争格局产生重大影响 生物发酵和农业创新领域有望率先突破 [32]
上证早知道|个人消费贷财政贴息来了!下月开源 华为AI大动作!中国恒大 被取消上市地位
上海证券报· 2025-08-12 23:06
财政与金融政策 - 财政部、中国人民银行、金融监管总局印发《个人消费贷款财政贴息政策实施方案》,明确在2025年9月1日至2026年8月31日期间对符合条件的个人消费贷款给予财政贴息 [1][3] - 九部门印发《服务业经营主体贷款贴息政策实施方案》,财政部门对服务业经营主体贷款按本金进行贴息,贴息期限不超过1年,年贴息比例1个百分点,中央和省级财政分别承担90%和10%,单户贴息贷款规模最高达100万元 [2] - 国务院批准自2025年8月12日12时01分起,在90天内继续暂停实施24%的对美加征关税税率,保留10%的税率 [2] 科技与创新 - 华为发布AI推理创新技术UCM(推理记忆数据管理器),计划于2025年9月正式开源,旨在扩大推理上下文窗口并降低每Token推理成本 [1][8] - 昆仑万维在中国发布并开源自研世界模型Matrix系列升级版Matrix-Game 2.0,支持生成跨场景长时视频并保持动作和视觉时序一致性 [6] - 中国移动四川公司携手华为完成全国首个1120MHz频谱带宽下的5G-A多载波聚合性能测试,单用户下载速率达到11.13Gbps [6] - 广立微通过全资子公司收购LUCEDA NV 100%股权,LUCEDA是硅光芯片设计自动化软件领域的全球领军企业 [21] 产业发展与规划 - 工业和信息化部等七部门印发《关于推动脑机接口产业创新发展的实施意见》,目标到2027年关键技术取得突破,产业规模壮大,打造2至3个产业发展集聚区;到2030年培育2至3家有全球影响力的领军企业 [10][11] - 福建省通信管理局印发《福建省信息通信行业推动新型信息基础设施高质量发展行动计划(2025-2027年)》,目标到2027年推动"双千兆"网络普及,5G积极演进,万兆光网创新 [4] - 广州市人民政府等印发实施方案,鼓励国内保险机构在南沙设立私募股权投资基金,推动"险资入穗",支持保险机构通过债券、股票等方式投资科创企业 [4] 市场动态与数据 - 2025年上半年全球智能眼镜市场出货量同比增长110%,主要受Ray-Ban Meta智能眼镜强劲需求及小米、雷鸟科技等新进入者推动 [6] - 浙商证券测算显示,2025年至2027年液冷市场规模预计分别为354亿元、716亿元和1082亿元,2027年有望突破千亿元 [12] - IDC预计2025年至2029年中国液冷服务器市场年复合增长率达48%,2028年市场规模约162亿美元 [12] - 2025年全球存储市场预计维持双位数增长,突破2300亿美元 [9] 公司公告与业绩 - 中国恒大将被联交所取消上市地位,最后上市日为2025年8月22日,8月25日上午九时起取消上市地位 [1][7] - 特斯拉Model 3长续航后轮驱动版正式上线,续航830公里(CLTC),5.2秒百公里加速 [6] - 臻镭科技上半年营业收入2.05亿元,同比增长73.64%,净利润6231.97万元,同比增长1006.99% [17] - 国盾量子拟与中电信量子信息科技集团签订销售合同,金额7654.18万元,另提供技术服务合同金额1400万元 [15] - 海思科收到国家药监局批准,同意HSK47977片开展临床试验,该药品为口服BCL6 PROTAC小分子制剂,用于治疗非霍奇金淋巴瘤 [18][19] 投资与资金流动 - 全市场新基金启动募集连续三周单周不低于30只,权益基金占比超八成,指数基金为主力军 [22] - 今年以来公募净申购权益类基金总额超26亿元,南方基金运用固有资金投资旗下权益基金不少于2.3亿元 [23] 行业倡议与合作 - 中国有色金属工业协会锂业分会倡议锂产业链企业加强上下游协同,维护产业安全,抵制无序竞争,合理布局产能 [5][6]
晚报 | 8月13日主题前瞻
选股宝· 2025-08-12 14:37
养鸡 - 7月初白羽鸡毛鸡价格跌破3元/斤,8月最高飙升至3.7元/斤,鸡苗价格从1.5元/只涨至4.2元/只,山东鸡苗价格一个多月上涨300% [1] - 上半年祖代肉种鸡更新量同比下降36.72%,将影响7个月后父母代肉种鸡和14个月后商品代白羽肉鸡供给 [1] - 高温导致雏鸡存活率下降15%,40-60日龄在栏鸡数量环比减少8%,8月补栏对应国庆前出栏 [1] 华为产业链 - 华为发布AI推理创新技术UCM,可扩大推理上下文窗口,降低每Token推理成本,计划2025年9月开源 [2] - UCM技术通过优化KV Cache记忆数据管理解决HBM资源不足导致的推理体验下降问题 [2] - 该技术发布正值AI产业从追求模型能力转向追求推理体验最优化的关键节点 [2] 消费金融 - 财政部等部门实施个人消费贷款贴息政策与服务业经营主体贷款贴息政策 [3] - 政策覆盖餐饮住宿、健康、养老等8类消费领域,通过1%贷款贴息有望增加百亿级消费动力 [3] - 政策从供需两端发力提振消费,餐饮住宿、消费金融公司和信贷金融机构将受益 [3] 量子通信 - 中国科学技术大学团队利用AI技术在60毫秒内构建2024个原子的无缺陷二维和三维原子阵列 [4] - 该方法刷新了中性原子体系无缺陷原子阵列规模的世界纪录 [4] - 研究成果为大规模中性原子量子计算奠定关键技术基础 [4] 宏观行业新闻 - 九部门印发《服务业经营主体贷款贴息政策实施方案》 [5] - 三部门印发《个人消费贷款财政贴息政策实施方案》 [6] - 商务部对加拿大进口豌豆淀粉进行反倾销调查 [6] - 发改委举办推进低空经济高质量发展专题培训 [6] - 中国信通院发布《脑机接口技术与应用研究报告(2025年)》 [6] - 干法锂电池隔膜企业就行业反内卷达成共识 [6] - 广州加强区块链、人工智能等数字服务机构招商引资 [6] 行情回顾 - 国产芯片、AI芯片、液冷服务器、新疆概念、脑科学、光通信、机器人、东数西算/算力、雅江电站、房地产、大消费、军工、RWA、医药、资产重组、ST股等板块表现活跃 [8][9][10][11][12]
华为AI推理新技术犀利!中国银联大模型效率提高了125倍
21世纪经济报道· 2025-08-12 14:11
技术发布 - 华为发布AI推理创新技术UCM 专门优化大模型推理过程的缓存管理技术 旨在提升推理速度 效率和成本效益 [1] - UCM是以KV Cache为中心的推理加速套件 融合多类型缓存加速算法工具 分级管理推理过程中产生的KV Cache记忆数据 扩大推理上下文窗口 [1] - 技术通过推理框架 算力 存储三层协同 实现高吞吐 低时延的推理体验 降低每Token推理成本 [1][5] 技术原理 - KV Cache是一种优化Transformer模型推理速度的技术 通过缓存历史token的Key和Value矩阵 避免重复计算 提升推理速度并降低计算成本 [3] - KV Cache采用用内存换计算的工程优化手段 作为模型推理过程中的记忆本临时保存计算中间结果 [3] - UCM包含三大组件:推理引擎插件Connector 支持多级KV Cache管理及加速算法的功能库Accelerator 高性能KV Cache存取适配器Adapter [5] 性能提升 - 依托UCM层级化自适应的全局前缀缓存技术 系统可直接调用KV缓存数据 使首Token时延最大降低90% [5] - 在中国银联客户之声业务场景试点中 大模型推理速度提升125倍 仅需10秒即可精准识别客户高频问题 [5] - 国外主流模型单用户输出速度达200 Tokens/s(时延5ms) 而国内普遍小于60 Tokens/s(时延50-100ms) [4] 行业应用 - 华为联手中国银联在金融典型场景开展UCM技术试点应用 联合发布智慧金融AI推理加速方案 [1] - 金融行业因数字化属性强且对速度 效率 安全要求高 成为验证技术的标杆场景 [5] - 中国银联将依托国家人工智能应用中试基地 联合华为等生态伙伴共建AI+金融示范应用 推动技术成果规模化应用 [6] 技术优势 - UCM将专业存储能力引入分级缓存管理 在软硬件协同与卸载方面做了大量工作 包括直通加速 KV检索索引与底层文件系统元数据融合 [8] - UCM具备KV Cache生命周期管理的完整机制 包括预热 分级 淘汰等功能 [8] - 相比业界仅停留在Prefix Cache层面 UCM将稀疏全流程算法 后缀检索算法等投入商用 提供更丰富可靠的算法库 [8] 生态建设 - UCM通过开放统一的南北向接口 可适配多类型推理引擎框架 算力及存储系统 [9] - 计划于今年9月正式开源 后续逐步贡献给业界主流推理引擎社区 [9] - 华为在AI布局上持续进行产业链各环节升级 实现从单点算力模组转向系统性优化的趋势 [9]
降低传统路径依赖,华为推出AI推理新技术
第一财经· 2025-08-12 12:43
华为UCM技术发布 - 华为推出AI推理新技术UCM 以KV Cache和记忆管理为中心 通过推理框架、算力和存储三层协同优化Tokens流转效率 [1] - UCM可将首Token时延最高降低90% 系统吞吐最大提升22倍 实现10倍级上下文窗口扩展 [2] - 华为计划在9月正式开源UCM 希望联合产业界推进AI推理生态建设 [3] 国内外推理效率对比 - 国外主流模型单用户输出速度达200 Tokens/s(时延5ms) 中国普遍小于60 Tokens/s(时延50-100ms) [1] - 中国头部互联网公司在推理Token数上与海外头部公司存在差距 [1] - 国内在KV Cache软件体系构建上尚未形成完整解决方案 国外已有成熟推理加速软件框架能与各类硬件平台适配 [2] 技术架构创新 - UCM不再单纯依赖HBM高带宽内存 而是在存储层面构建多层级可灵活调配的资源体系 [2] - 系统级推理架构优化需要从芯片级、软件级到框架级协同考虑 形成完整推理架构 [3] - 业界缺乏普适适用的框架与加速机制 需通过产业协同解决AI落地效率与成本问题 [3]
华为在沪发布AI推理创新技术UCM 9月将正式开源
搜狐财经· 2025-08-12 11:53
产品发布与技术特点 - 华为发布UCM推理记忆数据管理器 作为以KV Cache为中心的推理加速套件 融合多类型缓存加速算法工具 分级管理推理过程中产生的KV Cache记忆数据 扩大推理上下文窗口 实现高吞吐低时延的推理体验 降低每Token推理成本 [2] - UCM包含三大组件 推理引擎插件Connector对接不同引擎与算力 功能库Accelerator支持多级KV Cache管理及加速算法 高性能KV Cache存取适配器Adapter 通过推理框架算力存储三层协同实现更优体验更低成本 [3] - UCM通过层级化自适应的全局前缀缓存技术 使系统直接调用KV缓存数据避免重复计算 首Token时延最大降低90% 同时将超长序列Cache分层卸载至外置专业存储 实现推理上下文窗口10倍级扩展 [3] - UCM具备智能分级缓存能力 根据记忆热度在HBM DRAM SSD等存储介质中实现按需流动 融合多种稀疏注意力算法实现存算深度协同 使长序列场景下TPS每秒处理token数提升2-22倍 显著降低每Token推理成本 [3] 应用场景与合作伙伴 - 华为携手中国银联率先在金融典型场景开展UCM技术试点应用 联合发布智慧金融AI推理加速方案应用成果 [2] - 在中国银联客户之声业务场景下 UCM技术使大模型推理速度提升125倍 仅需10秒即可精准识别客户高频问题 [4] - 中国银联将依托国家人工智能应用中试基地 联合华为等生态伙伴共建AI+金融示范应用 推动技术成果从实验室验证走向规模化应用 [4] 开源计划与生态建设 - 华为正式公布UCM开源计划 通过开放统一的南北向接口适配多类型推理引擎框架算力及存储系统 [4] - UCM将于今年9月正式开源 后续逐步贡献给业界主流推理引擎社区 携手全产业共同推动AI推理生态的繁荣发展 [4] 行业背景与发展趋势 - 人工智能已步入发展深水区 AI推理正成为下一个爆发式增长的关键阶段 [2] - AI时代模型训练推理效率与体验的量纲都以Token数为表征 Token经济已经到来 [2] - 为保障流畅的推理体验企业需持续加大算力投入 在推理效率与成本之间找到最佳平衡点成为全行业亟待解决的重要课题 [2]