文章核心观点 - 文章系统阐述了人工智能大模型发展的八个关键方向与趋势 核心观点认为 通过持续扩大数据、参数和计算来扩展基座模型仍是最高效的路径 而模型能力的真正提升和价值的实现 依赖于对齐、推理增强、Agent化、记忆、在线学习等关键技术的发展 最终目标是让AI替代人类工作、创造增量价值 而非仅仅创造新的应用 [4][5][6][10][17][32] 关于基座模型扩展 - 预训练使大模型掌握了世界常识并具备简单推理能力 [4] - 获取更多数据、使用更大参数和更饱和的计算 仍然是扩展基座模型最高效的办法 [5] - 基座模型继续扩展规模仍然高效 [6] 关于激活对齐与增强推理能力 - 真实使用体验的进一步提升 绕不过对长尾能力的对齐和推理能力的增强 [6] - 激活对齐和增强推理能力 尤其是激活更全面的长尾能力 是保证模型效果的另一关键 [7] - 通用基准测试的出现评测了模型通用效果 但也可能导致模型过拟合 [7] - 真实场景下的关键是如何让模型更快、更好地对齐长尾场景 增强实际体验 [8] - 训练中期和后期的技术使得更多场景的快速对齐和强推理能力成为可能 [9] 关于智能体 - 智能体是模型能力扩展的里程碑 体现了AI模型进入人类真实世界的关键 [10] - 没有智能体能力 大模型将停留在理论学习阶段 无法转化为生产力 [11] - 原先智能体通过模型应用实现 现在模型已可直接将智能体数据集成到训练过程 增强了通用性 [11] - 不同智能体环境的泛化和迁移是难题 最简单的办法是增加不同环境的数据并进行针对性的强化学习 [11] - 智能体代表模型开始进入环境、开始形成生产力 [6] 关于模型记忆 - 实现模型记忆是模型应用到真实环境必须具备的能力 [12] - 大模型实现类似人类短期、中期、长期和历史记忆的不同阶段是关键 [13] - 上下文、检索增强生成和模型参数可能分别对应人类的不同记忆阶段 [13] - 一种方法是压缩记忆并存储在上下文中 如果大模型支持足够长的上下文 则有可能实现短中长期记忆 [13] - 如何迭代模型知识、更改模型参数仍是个难题 [14] 关于在线学习与自我评估 - 有了记忆机制 在线学习成为重点 目前大模型定时重新训练的方式存在浪费和丢失交互数据的问题 [14][20] - 实现在线学习是关键 自我评估是在线学习的关键点 模型需要知道对错才能自我改进 [14] - 构建模型的自我评价机制是个难题 [15] - 这可能成为下一个扩展范式 [15] - 模型的自学习自迭代将是下一阶段的必然能力 [20] 关于模型研发与应用结合 - 大模型发展越来越端到端 需将模型研发与模型应用结合 [16] - AI模型应用的第一性原理不应该是创造新的应用 其本质是通用人工智能替代人类工作 [17] - 研发替代不同工种的AI是应用的关键 [17] - 聊天部分替代了搜索 并融合了情感交互 [18] - 明年将是AI替代不同工种的爆发年 [19] - 大模型应用需要帮助人、创造新的价值 [34] - 如果AI软件没人用、不能产生价值 则没有生命力 [35] 关于多模态与具身智能 - 多模态是未来且有前景 但当下多模态不大能帮助提升通用人工智能的智能上界 [21][22] - 最有效的方式可能是文本、多模态、多模态生成分开发展 适度探索三者结合需要勇气和雄厚资本 [23] - 具身智能的痛点在于太难通用 少样本激活通用具身能力基本不可能 [23] - 解决方案是采集或合成数据 但这都不容易且昂贵 [23] - 一旦数据规模上去 通用能力出来自然会形成门槛 [24] - 机器人本身的不稳定和故障频繁也限制了具身智能的发展 [25] - 预计2026年这些领域将取得长足进步 [26] 关于领域大模型与大模型应用 - 领域大模型是个伪命题 通用人工智能实现后不应有领域特定的通用人工智能 [27][28] - 但在通用人工智能实现前 领域模型会长时间存在 [28] - 领域模型的存在本质上是应用企业希望构建领域知识的护城河 不希望AI入侵 希望把AI驯化为工具 [29] - AI的本质是海啸 将卷走一切 一定有一些领域公司会走出护城河 卷进通用人工智能的世界 [30] - 领域的数据、流程、智能体数据会慢慢进入主模型 [31] - AI的应用有两种路径:一种是将原有需要人参与的软件AI化 另一种是创造能替代人类某个工种的全新AI软件 [33]
清华唐杰:领域大模型,伪命题
量子位·2025-12-26 08:52