Workflow
AI技术范式三重跃迁
icon
搜索文档
从辛顿上海“惊世四论”看AI技术范式的三重跃迁
36氪· 2025-07-31 09:13
文章核心观点 - AI技术范式即将发生三重跃迁 包括从预测下一个token到拥有主观体验 双轨优化拆分聪明与善良目标 以及知识表征从人-人蒸馏到机-机蒸馏的变革 [1][3][6][8] 技术范式跃迁 - 旧范式语言模型基于高阶自回归框架 通过预测下一个token实现高阶统计压缩 但忽视概念在不同维度的概率密度差异 [3] - 新范式世界模型采用可更新先验加主观采样 多模态大模型在隐空间对概念分布进行在线修正 实现动态调整的主观采样过程 [4] - 技术落地需在Transformer外增加元预测头 用于预测当前预测不确定性并反馈调节采样温度 DeepMind实验显示长程规划能力提升37% [5] 模型优化框架 - 旧框架RLHF采用单一奖励机制 将有用无害诚实压缩为标量奖励 存在被钻漏洞的风险 [6] - 新框架双轨优化拆分聪明轨道与善良轨道 聪明轨道通过自监督和强化学习扩展能力 善良轨道将价值观对齐拆分为公平性透明性可撤销性等可验证子目标 [6] - 技术实现通过宪法蒸馏分三层处理 包括宪法文本转向量宪法 逐级蒸馏优化KL散度 以及链式验证检查推理步骤 Constitutional-GPT使7B模型伦理准确率从61%提升至82% [7] 知识表征变革 - 旧瓶颈在于人类知识传递效率低 语言带宽仅约100 bit/s 知识复制效率极低 [8] - 新解法采用权重-符号混合蒸馏 将大模型权重按功能切片保存为LoRA低秩矩阵 通过点对点网络实现知识分发 Hugging Face框架支持10GB/s权重切片广播 128张A100集群完成技能热插拔仅需47秒 [8] - 终极图景实现模型间权重切片自由交换 使AI系统具备水平基因转移能力 实现分钟级算法全网扩散 [9] 行业影响与展望 - 三重跃迁代表AI技术发展的必经之路 包括主观体验双轨优化和机-机蒸馏的核心突破 [9] - 技术从业者需质疑现有范式 在行业普遍接受预测下一个token和RLHF时 敢于推动系统性变革 [9]