Scaling Law（尺度定律） - 财报，业绩电话会，研报，新闻

Scaling Law（尺度定律）

搜索文档

观察者网· 2025-08-15 04:06

AI推理性能瓶颈 - 传统Scaling Law遇到明显瓶颈企业开始关注模型推理性能体验以推动商业落地和变现 [1] - AI推理算力需求已超过训练 GPT-5开放首周API调用量超20亿次/分钟 70%请求为复杂推理任务火山引擎日均token调用量达16.4万亿 70%以上来自线上推理 [4] - 长文本处理多轮对话以及复杂业务流程的推理需求日益增长对推理性能要求愈发严苛 [4] 中国AI推理困境 - 基础设施投资仅为美国十分之一面临算力卡阉割 HBM涨价禁运等困境 [1][6] - 国外主流大模型输出速度达200 tokens/s（时延5ms）国内普遍小于60 tokens/s（时延50-100ms）最大差距达10倍 [7] - 海外模型支持100万级Token上下文窗口国内头部模型仅50万长文本分析中遗漏关键信息概率超50% [7] 键值缓存技术挑战 - KV Cache需占用GPU显存存储历史Key/Value向量长文本生成会挤爆HBM和DRAM [6] - Agentic AI时代到来导致KV Cache容量增长超出HBM承载能力频繁内存溢出造成推理"失忆"和卡顿 [6] - 中国企业无法无限制堆卡面临出口管制无法获得最先进算力卡和HBM [6] 华为UCM技术突破 - 通过分级缓存管理在HBM DRAM SSD等存储介质中按数据热度缓存扩大推理上下文窗口10倍 [10][15] - 采用注意力稀疏技术识别KV Cache数据重要程度分层分级缓存并流动降低向量数量提升吞吐量 [17] - 将历史已处理结果缓存至外置共享存储首token延迟降低90% 节省token by token时间 [13] 性能提升与成本优化 - 长序列场景下TPS提升2-22倍降低每Token推理成本为企业减负增效 [17] - 维持算力投入不变仅增加小部分外置存储投资改善推理效率并摊薄成本 [18] - 推动形成"用户体验提升-用户增长-企业加大投资-技术迭代"的正循环 [18] 金融场景应用验证 - 与中国银联合作解决长序列输入并发时延和算力耗费三大核心难题 [19] - 在"客户之声"业务场景推理速度提升125倍 10秒精准识别客户高频问题 [21] - "营销策划"场景生成时间从数分钟缩短至10秒内单台服务器支持超5人同时在线协作 [21] 技术开源与生态建设 - 华为宣布9月开源UCM 包含推理引擎插件功能库和高性能存取适配器三大组件 [26] - 开放统一接口适配多类型推理引擎框架算力及存储系统推动生态繁荣 [28] - 差异化在于将专业存储纳入通过软硬协同和算法库贡献丰富可靠的加速算法 [26] 行业意义与发展前景 - 降低对HBM依赖将HBM优势发挥在更合适地方填补中国AI推理生态关键环节 [18][26] - 解决Agentic AI时代显存不足和推理Token成本问题可应用于千行百业 [23] - 推动中国AI产业进入良性商业正循环为长远发展注入更强动力 [28]

AI推理

键值缓存（KV Cache）

Scaling Law（尺度定律）

Artificial Intelligence

UCM（推理记忆数据管理器

Unified Cache Manager）

AI推理

键值缓存（KV Cache）

Scaling Law（尺度定律）

Artificial Intelligence

UCM（推理记忆数据管理器

Unified Cache Manager）

一文了解DeepSeek和OpenAI：企业家为什么需要认知型创新？

混沌学园· 2025-06-10 11:07

核心观点 - AI技术正在重新定义商业创新模式，企业需转变思路以保持竞争力 [1][2] - OpenAI和DeepSeek分别通过不同路径实现AI技术突破，为行业提供创新范式 [3][4] - AI能力的"涌现"现象成为技术跃迁的关键特征 [19][20][21] - 人机交互范式因ChatGPT发生根本性变革 [22][23][24] - 中国公司DeepSeek打破"美国原创、中国应用"的思维定式，展现基础研究实力 [75][77][78] OpenAI的创新路径创立背景 - 2015年由马斯克和奥特曼创立，初衷是防止AI技术被巨头垄断 [9] - 从谷歌挖来核心科学家伊利亚·苏茨克维尔，坚持开源、安全、普惠理念 [10][12] 技术突破 - 基于Transformer架构的"自注意力机制"大幅提升语言理解能力 [13] - Scaling Law揭示模型规模与性能的线性关系，指导大规模投入 [15][16] - GPT系列模型通过"涌现"现象实现能力跃升，参数量临界点触发智能爆发 [19][20] 产品里程碑 - ChatGPT通过自然语言交互降低使用门槛，引发全球现象级应用 [22][23] - 推理模型o1实现从直觉思维（系统1）到理性推理（系统2）的认知跃迁 [26][30] DeepSeek的逆袭战略技术路线 - 提出"有限Scaling Law"，在资源受限下追求高性能 [32][33] - MLA技术优化内存效率，MoE架构实现计算资源动态分配 [38][39][42] - V3模型6710亿参数仅激活37亿，训练成本5557万美元（行业1/10） [44] 核心突破 - R1模型采用纯强化学习（类似AlphaGo Zero），展示完整推理过程 [45][47][49] - 在奥数竞赛中与OpenAI o1准确率相当，登顶美国应用榜单 [50][51] 组织创新 - 动态团队构成和自组织管理激发"涌现"式创新 [55][56][57] - 研究员自主提出MLA架构和训练公式，体现扁平化协作 [59][60] - 150人论文署名包含数据标注员，打破传统KPI束缚 [61][62] 行业启示技术趋势 - AI从专用工具向通用智能演进，"涌现"成为能力突破关键指标 [20][21] - 对话式交互（ChatGPT）和推理能力（o1/R1）定义下一代AI标准 [23][26][45] 创新生态 - 中国公司首次在基础研究领域实现全球领先，打破技术跟随惯性 [75][77] - 资源效率（DeepSeek）与规模投入（OpenAI）并存，拓宽行业可能性 [32][44] 组织变革 - 传统金字塔管理让位于开放协作和资源自由调配的新型研发模式 [55][63][68] - "非标准人才"和纯粹技术热情成为创新核心驱动力 [66][67]