Workflow
Scaling Law
icon
搜索文档
自变量王潜:具身智能是物理世界的独立基础模型|MEET2026
量子位· 2025-12-21 05:45
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 具身智能模型是物理世界的基础模型,独立于、平行于语言模型、多模态模型等虚拟世界的模型。 这一判断背后,首先是对物理世界与虚拟世界本质差异的重新认识。 语言模型和多模态模型所面对的,是高度可复现、低随机性的符号世界;而机器人所处的物理世界,则充满连续性、随机性、不完全可观测性 以及大量与力、接触和时序强相关的过程。 沿用以语言和视觉为中心建立起来的建模范式,本身就存在结构性的错位。 也正因为如此,自变量机器人在实践中选择了一条更长期的路线:不把具身智能当作应用层问题,而是从模型架构、数据范式、推理方式乃至 硬件形态上,系统性地重做一套"物理世界的智能底座"。 为了完整体现王潜的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。 过去一年,具身智能领域反复被问到一个问题:它到底只是多模态模型的一个应用,还是一种全新的基础模型? 对此, 自变量机器人创始人兼CEO王潜 表示: MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主 ...
清华孙茂松:对工业界而言,大厂可以Scaling,其他玩家重在垂直应用 | MEET2026
量子位· 2025-12-21 02:00
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 涌现,AI沙场如今兵家争锋所期待出现的「境界」。 自从Scaling Law为模型带来惊人的能力增长后,几乎所有模型厂商都被卷入了一场无止境的FOMO,没人敢停下来。 我觉得大模型最有魅力的地方,在于它是非线性变化,代表着极大的不确定性,但一旦出现性能涌现就将远超想象。 在量子位MEET2026智能未来大会上,清华大学人工智能研究院常务副院长,欧洲科学院外籍院士 孙茂松 如此感慨。 只要算力还能堆、参数还能涨,就不能停止烧钱。 然而,在Scaling的边际成本越来越高的背景下, 万一最后发现这是条死胡同,投入全打水漂了怎么办? 孙茂松的建议是,可以「致广大」,但更要「尽精微」。 就企业界而言,少数实力极其雄厚的团队,可以尝试在「致广大」方向上继续跟随国际前沿;但绝大多数AI公司,都应该把主要精力放在「尽 精微」上。 为了完整呈现孙茂松的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能提供新的视角与洞察。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众35 ...
刘煜辉:当AI Scaling撞上天花板,谁在真正兑现技术红利?
新浪财经· 2025-12-18 09:31
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:刘煜辉的高维宏观 中国资本市场应当承担起为"东大治权时代"进行全球资产定价的新使命——这意味着我们要逐步淡出 对"西大"估值体系的被动映射,转而建立一套自己的独立资产定价体系。全球产业格局正在发生根本性 位移:过去由西大主导的技术叙事和金融定价,越来越难以反映我们在工业制造、系统集成上的压倒性 优势。 东大在落地能力和完整产业生态上的优势无以伦比。在AI领域,全球绝大多数端侧设备(手机、PC等 等)的硬件制造和供应链整合集中于中国;在新能源车领域,从电池材料、电芯到整车,中国已形成闭 环产能,占据全球60%以上份额; 在光伏、风电、特高压电网等绿色能源基础设施上,东大也输出全球;从新能源到废塑化学循环,都是 刨西大王朝能源基的祖坟,挑战传统石化能源路径。这就是东大的超级工业Power,它的"超级"在于不 依赖于资源的能源产能、电网等等。 这些凝聚着工匠精神和大国重器的产业,未来理应享有全球资产溢价。反观西大,其定位已经越来越接 近于一个纯粹的技术蓝图输出者。而支撑其AI叙事的Scaling Law("模型性能随算力、数据和参数规模 ...
AGI为什么不会到来?这位研究员把AI的“物理极限”讲透了
36氪· 2025-12-17 11:43
这意味着,智能的提升并不是"想象空间"问题,而是绕不开能量、带宽、存储、制造和成本的物理限 制。 AGI 会不会到来? 这是AI 行业里反复被讨论、却一直始终缺乏清晰论证的问题。 最近,西雅图艾伦人工智能研究所(AI2)的研究员蒂姆·德特默斯(Tim Dettmers)在一篇文章,题目很 直接——《为什么 AGI 不会实现?》。 蒂姆·德特默斯 在这篇文章中,他提出了一个被长期忽视、却至关重要的前提: 计算并不是抽象概念,而是一件彻底受物理规律约束的事情。 德特默斯认为,当下市场对AGI 的判断普遍偏乐观,一个关键原因在于: 很多讨论只停留在模型、参数和算法层面,却忽视了支撑这些能力的物理基础正在逼近极限。 在文章中,德特默斯第一次从物理约束的角度,系统性地解释了为什么AGI 面临一系列难以回避的现 实。这些判断,也有助于我们更好地理解当前的AI行业。 他在文章中总结了几条关键判断: 1)Transformer 的成功并非偶然,而是在当前物理约束下接近最优的工程选择,继续通过架构改进获得 的边际收益正在快速下降。 2)当下大量所谓"创新",本质仍是既有框架上的渐进改进,很难带来结构性跃迁。 3)AI 过去的 ...
具身智能的数据困境?简智正以闭环飞轮推进解决
具身智能之心· 2025-12-17 10:00
点击下方 卡片 ,关注" 具身智能 之心 "公众号 "模仿学习(如看视频)必要,但真正掌握技能,真机数据是关键。" 香港大学李弘扬近期在多场具身智能行 业论坛上的发言,精准戳中了赛道发展的核心痛点。这一观点在行业内已形成广泛共识——智源研究院院长 王仲远就曾直言, "数据,尤其是高质量的数据,决定模型能力的上限" ,而当前具身智能最突出的困境正是 高质量真机数据的极度匮乏。2025年,具身智能融资热度飙升、政策持续加码,可数据基建的滞后却成了行 业规模化落地的"绊脚石"。做过具身智能研究的人都清楚, 真机数据稀缺、采集效率低下、处理链路冗长 , 这些问题足以让多数企业陷入"巧妇难为无米之炊"的困境。 这片蓝海市场中, 简智机器人 在赛道中逐渐崭露头角。作为专注于 具身智能全链路解决方案 的科技企业, 其核心理念是"具身智能源于人、回归人",并凭借全栈自研的"产品+产线"双轨战略,搭建起 "人类技能数字 化 - 云端AI数据治理 - 机器人应用"的完整闭环。 行业痛点如何破解?简智给出了自己的答案 自变量机器人 CTO 王昊曾直言,具身智能领域正面临显著的"数据困境"。在行业内,Aloha设备已是常见的真 机采 ...
大模型的进化方向:Words to Worlds | 对话商汤林达华
量子位· 2025-12-17 09:07
文章核心观点 - 商汤科技发布的原生多模态空间智能模型SenseNova-SI,在多项基准测试中超越了李飞飞团队的Cambrian-S等模型,标志着公司在空间智能领域达到世界前列水平 [2][3][4][5][6] - 行业单纯依赖参数规模扩展的AI发展范式面临瓶颈,边际效应递减,未来需要回归科研本质,发展能够理解物理世界的原生多模态模型 [8][9][12][13][14][15][16] - 商汤科技通过底层架构创新(NEO架构)和极致工程优化(如算法蒸馏),实现了技术突破与商业落地成本的大幅降低,践行“原始创新”与“击穿工业红线”的双轮驱动战略 [39][49][58][61][63][67] 模型性能与突破 - SenseNova-SI模型在多个空间智能基准测试(vsi, MMSI, MindCube-Tiny, ViewSpatial, SITE)中均取得了SOTA成绩,超越了包括Cambrian-S在内的开源及闭源模型 [4][5] - 具体数据:SenseNova-SI的1.1-InternVL3-2B版本在vsi基准得分为63.7,高于Cambrian-S-3B的57.3;其1.1-InternVL3-8B版本在vsi基准得分为68.7,高于Cambrian-S-7B的67.5,并在MindCube-Tiny基准上以85.6分大幅领先 [5] - 该模型基于商汤科技开源的NEO架构,仅用同类模型10%的训练数据就达到了SOTA水平,数据效率提升了10倍 [39][49] 行业范式转变 - AI行业过去三年奉行Scaling Law,依赖算力、GPU和数据堆叠,但自2024年下半年起,风向转变,模型分数提升带来的惊艳感边际递减 [12][13][14] - 纯语言模型红利将尽,顶尖模型在数学、编程上接近奥赛金牌水平,但在理解物理世界、处理三维空间关系上能力薄弱 [20] - 未来的AGI必须是能够理解物理世界、具有多感官能力的世界模型,AI需要从“读万卷书”(语言模型)进化到“行万里路”(空间与世界交互) [20][21] - OpenAI前首席科学家Ilya Sutskever提出“Back to Research”的呼吁,与商汤科技首席科学家林达华的思考不谋而合 [17][19] 技术架构创新 - 传统多模态模型采用“视觉编码器+大语言模型”的拼接式架构,视觉信号在转化为语言Token过程中丢失大量空间细节和三维结构信息,导致模型出现“幻觉”(如数不清手指) [32][33][36][37] - 商汤科技提出的NEO架构是原生多模态架构,从最底层的Transformer Block开始,每个单元都能同时处理视觉和语言信号 [42] - NEO架构采用混合注意力机制,让视觉Token和文本Token一同进入模型的每一层进行推理计算,并引入“跨视角预测”等训练方法,让模型真正理解三维空间关系 [44][46][47][48] 商业化落地与成本优化 - 大模型行业当前痛点包括不够聪明、成本太高、速度太慢,商汤科技内部设定“工业红线”标准:技术使用成本必须低于其创造的价值 [53][54][55] - 以视频生成为例,商汤科技通过“算法蒸馏”技术,将扩散模型的推理步数从100步压缩到4步,实现了64倍的速度提升,使得在消费级显卡上实时生成高质量数字人视频成为可能 [59][61][63][64] - 实时语音驱动数字人产品SekoTalk展示了算法与系统协同的极致优化,将20秒视频生成时间从一小时缩短到实时,为直播、短视频等领域的规模化落地打通路径 [58][65][66] 对中国AI产业的启示 - 在从“语言”到“世界”的AI范式迁徙中,中国科技公司已经抢到了一张船票 [11][73] - 中国拥有全世界最丰富的应用场景和最完整的工业体系,这片土壤天生适合培育能与物理世界深度交互的AI [72] - 建议年轻研究者和创业者不要只拥挤在大语言模型赛道,应拓宽视野至具身智能、AI for Science、工业制造、生命科学等领域 [68][69][70]
从「密度法则」来看Scaling Law撞墙、模型密度的上限、豆包手机之后端侧想象力......|DeepTalk回顾
锦秋集· 2025-12-15 04:09
「Jinqiu DeepTalk」 用一场深度分享带你找到下一个 buzz 信号。 " Scaling Law 撞墙了。 " 当 Ilya Sutskever 提出这一判断时,它提示着我们,要开始思考模型的"可持续发展"问题了。 过去几年,模型能力几乎与规模同步增长,"更大"似乎就是"更强"。但这种依赖海量数据和算力投入的演进方 式,已逐渐逼近可持续性发展的边界。 这也引出一个更基础的问题: 在数据增速放缓、 算力 成本攀升的背景下,下一阶段的模型突破将从何而来? 如果「 摩尔定律」 曾定义信息时代的技术演进节奏,那么在智能时代,我们或许需要一个反映"知识压缩效 率"与"智能密度"的新衡量方式。 发 表 于 Nature Machine Intelligence 的 《 Densing Law of LLMs 》 提 出 了 新 的 答 案 —— " 密 度 法 则"(Densing Law) 。 上周六的 DeepTalk线上闭门交流活动 ,我们很高兴邀请到该 论文一作、清华大学计算机系博士后、面壁 MiniCPM(小钢炮)文本模型研发负责人 肖朝军博士 ,首次公开解读他和团队的最新工作: 《密度法则: 大 ...
错过GPT时刻后,闫俊杰和中国“草根”们准备赢回来
观察者网· 2025-12-12 06:58
文章核心观点 - 中美AI竞争格局发生深刻变化,以MiniMax、DeepSeek为代表的中国开源AI企业,凭借技术实力、极致效率和独特的商业模式,正在全球舞台上与美国闭源巨头(如OpenAI、Anthropic)展开正面竞争并取得显著成果,中国AI从过去的“追随者”转变为“应用落地的引领者” [5][12][14] 行业竞争格局与历史脉络 - 中美AI领军人物(Anthropic的Dario Amodei与MiniMax的闫俊杰)有共同起点,均曾为百度北美实验室实习生,但后续发展路径不同,分别在美国和中国引领了大模型的发展 [1] - 十年前,中国团队虽洞察到AI趋势(如Scaling Law),但因特定产业环境未能率先突破,与美国在通用大模型发展上存在时间差 [1][4] - 当前,以DeepSeek、MiniMax为代表的中国开源模型企业,正与美国OpenAI、Anthropic等闭源模型生态进行全方位正面对决 [5] 中国AI企业的技术实力与突破 - **模型性能**:DeepSeek最新发布的V3.2模型在关键推理和数学能力上刷新了SOTA纪录,多项核心基准测试中足以比肩甚至部分超越谷歌Gemini 3 [7] - **实战应用认可**:MiniMax M2模型上线OpenRouter后,日Token消耗量一度突破500亿,是首个达到此成绩的中国模型,其份额与xAI、Google、Anthropic和OpenAI等美国闭源模型并驾齐驱 [9] - **架构与性价比**:MiniMax M2利用稀疏混合专家(MoE)架构将激活参数压至100亿,以仅为Claude 4.5 Sonnet 8%的极致性价比获得大量好评 [9] 中国AI企业的核心竞争力与组织模式 - **人才观与组织**:不迷信硅谷的“天价雇佣兵”或“天才光环”,认为中国年轻人蕴藏巨大潜力,关键在于有效组织;MiniMax内部技术大牛多从团队内部成长,靠钱并非留住创新者的核心 [6][7] - **战略定力与第一性原理**:在公司成立之初,坚定选择“技术驱动”之路,认为大模型时代真正的产品是模型本身,传统APP更像渠道 [10] - **极致效率与成本控制**:MiniMax-M1的强化学习过程仅使用512块英伟达H800 GPU训练三周,租赁成本为53.74万美元(约380万人民币),仅为OpenAI同等模型训练成本的零头 [11] - **人机协同**:公司内部使用AI Agent辅助工作(如自动修改代码),提升组织效率,实现了“实习生也有实习生”的人机协同奇景 [11] 商业模式与市场表现 - **商业闭环**:MiniMax今年年度经常性收入(ARR)已达1亿美元,在视频赛道率先实现正向现金流 [14] - **市场策略**:创新主阵地在Web端,因其能够不依赖买量而自然增长;拒绝“烧钱买量”的务实导向 [14] - **产品差异化**:在AI陪伴领域,产品Talkie不追求所有人喜欢,而是为目标用户提供独特价值,从而在强手如林的美国市场撕开口子 [15] - **全球化与用户导向**:公司坚持直接服务用户、坚持全球化、坚持技术驱动三条原则 [10] 行业影响与未来展望 - **资本效率对比**:全球投行Jefferies报告指出,中国头部AI公司的资本支出仅为美国的18%,但模型性能紧追不舍 [12] - **应用落地引领**:中国“开源军团”在全球应用市场全面开花,例如DeepSeek被诺贝尔奖得主保罗·罗默每日使用,海螺AI、可灵(Kling)等视频生成应用在美国创作者社区口碑炸裂 [14] - **生态冲击**:中国开源生态在性能与成本上对美国高投入闭源模式形成冲击,若OpenAI遭遇危机,可能引发美国整个相关生态的集体失败 [15] - **行业信心**:中国AI创业者自信未来三年内,即使不是自家公司,也会有其他中国团队能够做到引领世界 [15]
大模型的第一性原理:(一)统计物理篇
机器之心· 2025-12-11 10:00
机器之心发布 作者: 白铂 博士 白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家 2022 年底,ChatGPT 横空出世,其能力震惊了整个世界。2024 年底,DeepSeek 以极低的训练成本和极高的性能再次震惊了世界。短短几年间,大模型疯狂迭代, 能力不断提升,仅在美国,AI 领域的投资规模便超过了许多国家全年的 GDP!2025 年底,Google 强势推出 Gemini 3,模型能力突飞猛进,TPU 训练范式也对英 伟达的生态发起了颠覆式挑战。 业界普遍认为 Gemini 3 是迈向通用人工智能(Artificial General Intelligence,AGI) 和超级人工智能(ASI,Artificial Super Intelligence,ASI)的关键突破,是人类 和机器合作的惊人之作。然而,正如 Ilya Sutskever 于 11 月 26 日的访谈中指出:大模型 Scaling Law 和摩尔定律一样,迟早会因为物理限制而失效。因此,如何打 开大模型训练的炼丹炉,看清黑盒子背后的基本原理,回答大模型是否已逼近其能力极限就成为迫在眉睫的问题了。但是,前人对大模 ...
MiniMax 闫俊杰和罗永浩四小时访谈:走出中国AI的第三条路,大山并非不可翻越
36氪· 2025-12-11 08:11
当整个 AI 圈都在为 DAU(日活跃用户数)和融资额焦虑时,MiniMax 创始人闫俊杰却表现出一种近乎冷酷的淡漠。 坐在罗永浩对面的闫俊杰,并不像一位掌管着 AI 独角兽企业的技术新贵。 他拒绝谈论改变世界,反而坦承恐惧。那种恐惧不是来自商业竞争,而是来自技术本身——当模型的能力开始超越人类时,创造者反而成了最先感到不安 的人。 用 1/50 的筹码通往 AGI 在巨头环伺、算力短缺、热钱褪去的 2025 年,MiniMax 正在进行一场关于认知的修正:不再沿用移动互联网的逻辑,即通过大规模投放换取增长、通过 堆砌功能留住用户,而是回归本质: 把模型当作最重要的产品 。 在大模型时代,真正的产品其实是模型本身,传统意义上的产品更像是一个渠道。如果模型不够聪明,产品做得再好也没有用。 在罗永浩和闫俊杰这期对谈里,我发现 MiniMax 这家 AI 公司从创业第一天就选择了注定与主流背道而驰的技术路径。 当所有人都试图寻找中国的 OpenAI 和 Sam Altman 时,闫俊杰却在试图证明「非天才」的价值。MiniMax 的故事不是关于天才的灵光乍现,而是一场关 于如何在资源受限的缝隙中,通过极度理性地计算 ...