为Token付费是一件很愚蠢的事情,用户应该为智能付费丨RockAI刘凡平@MEET2026
量子位·2025-12-13 08:30

文章核心观点 - 人工智能发展的下一个阶段需要突破Transformer架构和反向传播算法这两大技术瓶颈,其方向并非追求模型的无限扩大,而是让模型在端侧设备上具备原生记忆和自主学习能力,从而“活起来”,最终通过无数此类智能体的协作形成能够产生知识的群体智能,这被视为迈向通用人工智能(AGI)的一条新路径 [1][2][7][21][77] 对当前AI发展范式的批判 - 为Token付费的模式被批评为“很愚蠢”,用户应为智能本身付费,而非为处理信息的数量付费 [15][16][17][18][19] - 当前基于Transformer架构的大模型本质上是静态函数,在部署时参数即固定,模型随之“死亡”,无法持续进化,需要依赖重新训练或RAG等临时方案来更新知识 [37][45][51][53] - 过度依赖Scaling Law(规模定律)被认为是错误的,行业陷入比拼算力和数据的“死亡螺旋”,而忽视了架构创新的重要性 [33][35][36] - 长上下文技术被视为一种退而求其次的临时方案,而非真正的智能解决方案,因为它无法形成参数化的长期记忆和价值观积累 [42][43][46] 下一代AI的核心特征:硬件觉醒 - “硬件觉醒”指端侧设备具备像大脑一样的稀疏激活、实时形成记忆并在物理世界中持续更新的能力,使设备从工具转变为“活”的智能体 [4][11] - 端侧模型的关键定义在于自主学习原生记忆,而不仅仅是云端大模型的小参数版本 [20][21][29][30] - 实现“硬件觉醒”需要改变模型架构,使训练和推理能够同步进行,从而实现模型的自主进化,摆脱静态函数的桎梏 [48][52][53][54] 新架构路径与技术创新 - 需要突破的两座技术大山是:1) Transformer架构;2) 反向传播算法 [1][7][53] - 新架构(如RockAI的Yan架构)模仿人脑机制,特点是极端稀疏化(比MoE更稀疏),以极低的功耗(如人脑约20+瓦)实现高效运算 [55][56] - 在新架构中加入了记忆模块,使得在推理过程中记忆能够动态改变,从而实现真正的个性化和长期记忆 [58] - 新模型架构使得在手机、CPU等端侧设备上直接运行成为可能,无需依赖云端GPU,并保证了用户隐私和安全 [60][68] 端侧智能的价值与影响 - 端侧智能的优势在于离用户更近,并能利用无处不在的、完全属于用户个人的数据,无需将所有数据采集至云端 [24][25][27] - 智能将重新定义硬件的价值,硬件价值将随着用户与其共同创造价值而增长,购买时是其价值最小的时候,而非仅为功能付费 [64][65][66][67] - 具备原生记忆和自主学习能力的端侧设备(如手机、具身智能机器人)能够适应个性化环境(如家庭布局),这是当前Transformer架构难以实现的 [62][63][68] 未来方向:群体智能 - 当每一台设备都拥有智能并能向物理世界学习时,将产生群体智能,类似于人类社会个体通过合作产生知识 [5][21][70][72] - 现有大模型(尤其是Transformer架构)主要进行知识传播,而群体智能的核心在于能够产生知识 [21][74][75][76] - 群体智能被认为是迈向通用人工智能的最佳途径,区别于OpenAI等追求的打造单一全能模型的“造神”路径 [71][77]