强化学习增强型大语言模型

搜索文档
复旦、同济和港中文等重磅发布:强化学习在大语言模型全周期的全面综述
机器之心· 2025-09-30 23:49
近年来,以强化学习为核心的训练方法显著提升了大语言模型(Large Language Models, LLMs)的推理能力与对齐性能,尤其在理解人类意图、遵循用户指令以及 增强推理能力方面效果突出。尽管现有综述对强化学习增强型 LLMs 进行了概述,但其涵盖范围较为有限,未能全面总结强化学习在 LLMs 全生命周期中的作用机 制。 对此, 来自复旦大学、同济大学、兰卡斯特大学以及香港中文大学 MM Lab 等顶尖科研机构 的研究者们全面总结了大语言模型全生命周期的最新强化学习研究, 完成题为 "Reinforcement Learning Meets Large Language Models: A Survey of Advancements and Applications Across the LLM Lifecycle" 的长文综述,系统性回顾了领域 最新进展,深入探讨研究挑战并展望未来发展方向。 论文标题: Reinforcement Learning Meets Large Language Models: A Survey of Advancements and Applications Acr ...