【固收】基于堆叠LSTM模型的十年期国债收益率预测——量化学习笔记之一(张旭)
光大证券研究·2025-12-15 23:07

金融时序预测模型发展 - 金融时间序列预测经历了从传统计量模型、传统机器学习模型到深度学习模型三个主要发展阶段[4] - 深度学习模型能较好适应金融时间序列的非平稳、非线性、高噪声和长记忆性等复杂特征,是当前主流方法之一[4] 神经网络模型在金融时序中的应用 - 神经网络是模仿人脑神经元连接结构设计的机器学习模型,也是深度学习的基础结构[4] - 循环神经网络及其变种如长短期记忆神经网络专为处理序列数据设计,具备记忆性和参数共享优势[4] - LSTM模型通过引入“门控机制”和记忆单元,有效缓解了传统RNN的梯度消失/爆炸问题,并能过滤序列噪声,增强对不规则数据的鲁棒性[4] - LSTM的优势使其能够有效处理长时期时间序列,过滤噪声,精准捕捉如债券收益率等金融数据的动态变化规律[4] 基于堆叠LSTM的国债收益率预测模型 - 报告采用三层堆叠LSTM加Dropout正则化的经典稳健架构构建十年期国债收益率预测模型[5] - 模型数据标的为2021年初至2025年12月12日的十年期国债收益率,以过去60个交易日的收益率一阶差分作为输入特征,未来一周的收益率一阶差分作为预测目标[5] - 最终构建的模型包含约13万个可调参数,于第27轮训练迭代出最优模型,针对测试集预测的平均绝对误差为1.43BP[5] - 最优模型预测2025年12月15日至19日当周十年期国债收益率整体呈下行趋势,2025年12月19日的预测值为1.8330%,相比2025年12月12日的1.8396%有小幅下降[5] 模型后续优化方向 - 模型设计优化:针对时间窗口、数据处理、网络架构和训练策略等相关设计进行调整优化[6] - 输入多维度变量:将输入变量从单一的收益率序列扩展至宏观、市场、情绪等多维度变量,使模型预测更符合经济逻辑,捕捉信息更全面[6] - 构建混合模型:将LSTM模型与传统计量模型或其他机器学习模型相结合,构建如ARIMAX-LSTM、CNN-LSTM-ATT等混合模型,以发挥不同模型优势,弥补单一LSTM模型缺陷,提升预测精度[7] - 引入滚动回测机制:采用滚动时间窗口回测机制,固定样本时间窗口并随时间推移实现模型的动态更新和持续预测,使模型能更好适应市场变化,提升其稳健性[7]