Workflow
深度学习模型
icon
搜索文档
——量化学习笔记之一:基于堆叠LSTM模型的十年期国债收益率预测
光大证券· 2025-12-15 07:56
报告行业投资评级 未提及 报告的核心观点 报告系统梳理金融时间序列预测模型的演进,基于LSTM神经网络构建中国十年期国债收益率预测模型,初步探索其在固收量化领域的应用,模型预测本周十年期国债收益率呈下行趋势,后续可从多方面优化模型 [10][2][3] 根据相关目录分别进行总结 金融时序预测和神经网络模型 - 金融时间序列预测模型经历传统计量模型、传统机器学习模型、深度学习模型三个发展阶段,深度学习模型能适应金融时间序列复杂特征,RNN及其变种是主流方法之一 [11][12] - 神经网络模型模仿人脑神经元连接结构,是深度学习基础结构,LSTM为解决传统RNN长期依赖问题而设计,在债券收益率预测上有优势 [13][18][22] 基于堆叠LSTM模型的国债收益率预测 - 堆叠LSTM将多个LSTM层连接,在长序列处理和多维特征提取上更具优势,适配金融场景复杂时序预测 [23] - 采用三层堆叠LSTM+Dropout正则化架构构建十年期国债收益率预测模型,仅用收益率历史序列作单一变量,可输入更多变量提升效果 [24] - 数据标的为中债十年期国债到期收益率,对数据进行一阶差分和标准化处理,以过去60个交易日差分作输入特征,未来一周差分作预测目标构建样本,按时间顺序划分训练集、验证集、测试集 [27] - 模型架构由LSTM、Dropout和Dense层组成,迭代200轮,设早停机制优化,以MSE、MAE、RMSE评估模型 [28][29] - 构建含约13万个可调参数的模型,第27轮迭代出最优模型,第77轮触发早停机制,测试集平均绝对误差1.43BP,本周十年期国债收益率呈下行趋势 [30] 后续优化方向 - 对现有模型的时间窗口、数据处理、网络架构和训练策略等设计进行调整优化 [3] - 将输入变量从单一收益率序列扩展至宏观、市场、情绪等多维度变量 [3] - 将LSTM模型与传统计量模型或其他机器学习模型结合构建混合模型 [3] - 采用滚动时间窗口回测机制,实现模型动态更新和持续预测 [3]
量化学习笔记之一:基于堆叠LSTM模型的十年期国债收益率预测
光大证券· 2025-12-15 06:53
报告行业投资评级 未提及 报告的核心观点 - 对金融时间序列预测模型的演进进行系统梳理,基于LSTM神经网络,构建以历史时间序列为单一输入变量的中国十年期国债收益率预测模型,初步探索深度学习模型在固收量化领域的应用[10] 根据相关目录分别进行总结 金融时序预测和神经网络模型 - 金融时间序列预测经历传统计量模型、传统机器学习模型、深度学习模型三个阶段,深度学习模型能适应金融时间序列复杂特征,是主流预测方法之一[1][11][12] - 神经网络模型是深度学习的基础结构,RNN及其变种模型如LSTM是处理序列数据的网络,LSTM解决了传统RNN的长期依赖问题,能过滤噪声,增强对不规则数据的鲁棒性,适合债券收益率预测[1][12][18] 基于堆叠LSTM模型的国债收益率预测 - 堆叠LSTM是多个LSTM层连接形成的深度神经网络结构,在长序列处理、多维特征提取上更具优势,适配金融场景的复杂时序预测[23] - 采用三层堆叠LSTM+Dropout正则化架构构建十年期国债收益率预测模型,仅使用十年期国债收益率自身历史时间序列作为单一变量,后续可输入更多相关变量提升预测效果[2][24] - 数据标的为中债十年期国债到期收益率,样本时间区间为2021年初至2025年12月12日,对收益率数据进行一阶差分和标准化处理,以过去60个交易日的收益率一阶差分作为输入特征,以未来一周的收益率一阶差分作为预测目标构建时间序列样本,按时间顺序划分为训练集、验证集、测试集[27] - 模型架构由LSTM、Dropout和Dense层组成,训练策略为迭代200轮,以降低验证集损失为优化目标,设置早停机制,以最优模型针对测试集的第一天收益率预测结果的均方误差、平均绝对误差和均方根误差作为模型评估指标[28][29] - 最终构建出包含约13万个可调参数的中等复杂度LSTM神经网络模型,第27轮训练迭代出最优模型,第77轮触发早停机制,针对测试集预测的平均绝对误差为1.43BP,本周(2025年12月15日 - 2025年12月19日)10年期国债收益率呈现下行趋势,2025年12月19日的预测值为1.8330%,相比2025年12月12日的1.8396%有小幅下降[2][30] 后续优化方向 - 对现有模型的时间窗口、数据处理、网络架构和训练策略等相关设计进行调整优化[3][36] - 将输入变量从单一收益率序列扩展至宏观、市场、情绪等多维度变量,使模型预测更符合经济逻辑,捕捉信息更全面[3][36] - 将LSTM模型与传统计量模型或其他机器学习模型相结合,构建混合模型,发挥不同模型优势,提升预测精度[3][36] - 引入滚动回测机制,固定样本时间窗口并随时间推移实现模型的动态更新和持续预测,提升模型稳健性[3][36]
AI文章仿写工具哪个好?深度评测帮你选
搜狐财经· 2025-12-14 16:14
行业技术发展现状 - AI生成文章仿写的本质是利用人工智能技术对已有文本进行语义理解、结构分析和语言重组以生成新文本[2] - 文本生成技术已从早期的模板填充和简单替换发展到深度语义理解和创造性仿写阶段[2] - 现代大型语言模型在文本仿写任务上能在保留原文事实性信息的同时实现高达70%以上的词汇和句式变化[2] 评测工具综合排名 - 第一名:优采云AI内容工厂,综合评分9.8/10分[4] - 第二名:智写工坊,综合评分8.5/10分[7] - 第三名:迅采通,综合评分7.9/10分[8] - 第四名:易稿精灵,综合评分7.0/10分[11] 优采云AI内容工厂核心优势 - 定位为集文章采集、智能过滤、深度原创/改写、多维度优化、全自动发布于一体的内容生产流水线[4] - 核心优势在于无与伦比的自动化与集成度,可实现7x24小时云端自动运行[4] - 支持从百度、搜狗、头条等六大搜索引擎入口进行全网采集,每小时采集量可达300-500篇[4] - 提供“智能AI版”和“深度改写版”两种改写模式,其中深度改写可使原文相似度低至25%[6] - 具备细致的SEO支持功能,包括自定义标题格式、关键词与描述设置、自动内链等[6] - 拥有多媒体处理能力,支持图片本地化/云存储/AI生成配图,并具备文生视频功能[6] 智写工坊产品特点 - 在创意写作和深度仿写方面表现突出,特别擅长处理文学性较强或需要特定风格模仿的文本[7] - 在诗歌仿写、小说风格延续、营销文案语气模仿等方面生成文本的流畅度和风格一致性较高[7] - 主要专注于“写”这一环节,缺乏内置的大规模内容采集和自动化发布能力[7] 迅采通产品特点 - 核心优势在于强大的网络信息抓取和聚合能力,配备高效的爬虫引擎[8] - 能够根据用户设定规则从指定来源快速抓取最新内容,数据清洗和结构化提取能力较强[8] - 在仿写方面提供基础的“伪原创”重写功能,主要通过同义词替换、句式调整等方式降低文本重复率[10] 易稿精灵产品特点 - 是一款轻量级、入门门槛较低的AI仿写工具,界面简洁,操作直观[11] - 主打“一键生成”和“批量处理”,适合需要快速生产大量初稿内容的场景[11] - 算法相对简单,生成内容的随机性较大,缺乏高级的过滤、优化和定制选项[11] 市场定位与总结 - 优采云AI内容工厂服务于企业级用户和重度内容运营者,解决内容运营全流程难题[12] - 智写工坊、迅采通、易稿精灵则分别在创意深度、采集能力和简易快捷上各有侧重[12] - 选择能够融入并优化完整工作流的平台比选择功能孤立的产品更为重要[12]
中邮因子周报:深度学习模型回撤显著,高波占优-20250901
中邮证券· 2025-09-01 05:47
量化因子与构建方式 1. 因子名称:Barra风格因子[15] 因子构建思路:采用Barra框架下的多个风格维度,包括市场相关、估值、盈利、成长、流动性等,通过线性组合或直接计算方式构建[15] 因子具体构建过程: * Beta因子:直接使用历史beta值[15] * 市值因子:对总市值取自然对数[15] * 动量因子:计算历史超额收益率序列的均值[15] * 波动因子:由历史超额收益率序列波动率、累积超额收益率离差、历史残差收益率序列波动率三部分按权重组合而成,公式为 $$0.74 * 历史超额收益率序列波动率 + 0.16 * 累积超额收益率离差 + 0.1 * 历史残差收益率序列波动率$$[15] * 非线性市值因子:对市值风格值取三次方[15] * 估值因子:使用市净率的倒数[15] * 流动性因子:由月换手率、季换手率、年换手率按权重组合而成,公式为 $$0.35 * 月换手率 + 0.35 * 季换手率 + 0.3 * 年换手率$$[15] * 盈利因子:由分析师预测盈利价格比、市现率倒数、市盈率ttm倒数按权重组合而成,公式为 $$0.68 * 分析师预测盈利价格比 + 0.21 * 市现率倒数 + 0.11 * 市盈率ttm倒数$$[15] * 成长因子:由分析师预测长期盈利增长率、分析师预测短期利率增长率、盈利增长率、营业收入增长率按权重组合而成,公式为 $$0.18 * 分析师预测长期盈利增长率 + 0.11 * 分析师预测短期利率增长率 + 0.24 * 盈利增长率 + 0.47 * 营业收入增长率$$[15] * 杠杆因子:由市场杠杆率、账面杠杆、资产负债率按权重组合而成,公式为 $$0.38 * 市场杠杆率 + 0.35 * 账面杠杆 + 0.27 * 资产负债率$$[15] 2. 因子名称:基本面因子[18][20][22][24][26] 因子构建思路:基于公司财务数据,从盈利能力、成长性、估值等多个维度构建因子,涉及的财务指标均为ttm方式计算[17] 因子具体构建过程:报告中提及的具体基本面因子包括营业利润超预期增长、营业周转率、市盈率、roe、roc超预期增长、市销率、roa超预期增长、roa增长、roc增长、营业利润率、净利润超预期增长、营业利润率增长、roa等[20][24][26] 3. 因子名称:技术类因子[18][20][22][24][26] 因子构建思路:基于市场交易数据,从动量、波动等维度构建因子[18][20][22][24][26] 因子具体构建过程:报告中提及的具体技术类因子包括120日动量、20日波动、20日动量、120日波动、中位数离差、60日波动、60日动量等[24][26] 4. 因子名称:GRU因子[18][20][22][24][26] 因子构建思路:基于GRU深度学习模型构建的因子[18][20][22][24][26] 因子具体构建过程:报告中提及的具体GRU因子模型包括barra5d、open1d、close1d、barra1d等[18][20][22][24][26] 5. 因子名称:多因子组合[8][29] 因子构建思路:将多个因子组合成一个综合性的多因子模型[8][29] 因子的回测效果 1. Barra风格因子,近一周多空收益表现:市值因子多头表现较好,非线性市值因子多头表现较好,成长因子多头表现较好,流动性因子多头表现较好,盈利因子多头表现较好,估值因子空头表现强势[3][16] 2. 基本面因子(全市场),近一周多空收益表现:均为正向,营业相关因子多空收益最强,权益类收益相关因子多空表现次之[4] 基本面因子(沪深300),近一周多空收益表现:均为正向,营业相关因子多空收益最强,权益类收益相关因子多空表现次之[5][20] 基本面因子(中证500),近一周多空收益表现:多数为正,估值因子多空收益显著为正,超预期增长类因子多空表现次之[6][22] 基本面因子(中证1000),近一周多空收益表现:多数为正,增长类和超预期增长类因子多空表现显著为正,静态财务因子多空收益表现不显著[7][26] 3. 技术类因子(全市场),近一周多空收益表现:均为正向,波动因子多空收益较为显著[4] 技术类因子(沪深300),近一周多空收益表现:均为正向,波动因子多空收益较为显著[5][20] 技术类因子(中证500),近一周多空收益表现:均为正向[6][22][24] 技术类因子(中证1000),近一周多空收益表现:均为正向[7][26] 4. GRU因子(全市场),近一周多空收益表现:barra1d模型多空收益表现较好,其余模型均有所回撤[18] GRU因子(沪深300),近一周多空收益表现:barra5d和open1d模型多空表现有所回撤,close1d和barra1d模型多空收益表现较好[5][20] GRU因子(中证500),近一周多空收益表现:barra5d模型多空收益回撤较大,barra1d模型多空收益强势[6][22] GRU因子(中证1000),近一周多空收益表现:barra5d模型多空收益表现较差,barra1d模型多空表现较好[7][26] 5. 多头组合策略(比较基准:中证1000指数),近一周超额收益:open1d模型 -0.97%,close1d模型 -1.68%,barra1d模型 0.57%,barra5d模型 -2.17%,多因子组合 -0.29%[29] 多头组合策略(比较基准:中证1000指数),近一月超额收益:open1d模型 -2.85%,close1d模型 -4.50%,barra1d模型 0.75%,barra5d模型 -3.76%,多因子组合 -2.43%[29] 多头组合策略(比较基准:中证1000指数),近三月超额收益:open1d模型 -2.74%,close1d模型 -3.80%,barra1d模型 0.48%,barra5d模型 -2.91%,多因子组合 -2.79%[29] 多头组合策略(比较基准:中证1000指数),近六月超额收益:open1d模型 3.10%,close1d模型 0.92%,barra1d模型 1.61%,barra5d模型 3.17%,多因子组合 1.69%[29] 多头组合策略(比较基准:中证1000指数),今年以来超额收益:open1d模型 4.20%,close1d模型 1.90%,barra1d模型 4.38%,barra5d模型 4.13%,多因子组合 0.01%[29]
国债期货系列报告:多通道深度学习模型在国债期货因子择时上的应用
国泰君安期货· 2025-08-28 08:42
报告行业投资评级 未提及 报告的核心观点 - 提出融合日频与分钟频数据的深度学习双通道模型,能提升策略在样本外尤其是市场下行期的预测准确性与稳定性,为重构债市量化择时体系提供新思路 [2] - 双通道模型在样本外测试表现优于单一日频模型,空头行情中胜率高,有双向预测能力 [3] - 在多因子择时框架中,应约束深度学习因子权重,结合逻辑型因子决策,实现可解释性与绩效提升统一 [43][44] 根据相关目录分别进行总结 深度学习模型介绍 - 传统量化债市择时体系中因子挖掘体系难以覆盖有价值信息,深度学习技术可从数据中寻找复杂关系,补充增强传统因子挖掘体系 [7][8] - RNN能处理时间序列数据,但处理长序列时会出现梯度消失问题 [9] - LSTM通过细胞状态和三个门控单元解决梯度消失问题,能有效传递长序列信息 [15] - GRU是对LSTM的参数化近似,减少可学习参数数量,在多数序列建模任务中不牺牲性能 [19] - 设计双通道模型,处理日频和分钟频数据,融合二者输出,反映市场长期趋势和短期波动 [22][23] 国债期货择时检验 回测设置 - 目标变量为10年期国债期货open to open的收益率,回测时间区间为2016年1月 - 2025年8月,日频调仓,保证金100%,1倍杠杆,手续费双边万1 [25][26][27] 日频通道模型 - 输入80个日频特征,RNN回看周期10日,LSTM和GRU回看周期20日 [28] - 单一日频通道模型样本内表现理想,样本外表现差,有过拟合情况 [33] 双通道模型 - 融合多频率时序信息,用GRU和LSTM结构设计,样本外稳定性强,能提升模型泛化能力 [34][41] - 双通道模型空头胜率在样本内外均较高,加入低权重因子可增强多因子择时框架在市场下行中的准确度 [42] 多因子框架中的深度学习配比 - 采用约束性配置策略,控制深度学习因子权重,结合逻辑型因子,实现可解释性与绩效提升统一 [43][44] 结论 - 提出的双通道深度学习框架能提高多因子策略性能,但市场底层逻辑转变或极端市场环境下有风险,建议结合逻辑型因子决策 [45][46]
Cell子刊:舒妮/黄伟杰团队综述AI赋能多模态成像,用于神经精神疾病精准医疗
生物世界· 2025-05-26 23:57
神经精神疾病精准医疗 - 神经精神疾病具有复杂病理机制和临床异质性,传统诊疗方法面临挑战 [2][6] - 多模态神经影像与AI技术结合成为早期发现和个性化治疗的关键途径 [2][6] - 多模态AI模型在阿尔茨海默病早期诊断中准确率达92.7%,比单模态提高15%以上 [13] 多模态神经影像技术 - 多模态神经影像从结构、功能、分子三个维度全面解码大脑 [8][9] - 结构影像(如MRI)检测脑组织体积和皮层厚度变化,发现自闭症儿童出生后的皮层过度生长 [8][9] - 功能影像(如fMRI、脑电图)捕捉神经元活动信号,绘制脑网络通信图 [9] - 分子影像(如PET)追踪病理标志物,提前10-20年预警阿尔茨海默病 [9] AI技术应用 - AI通过特征融合术整合多模态数据,包括早期融合、中期融合和晚期融合 [12] - 深度学习模型(CNN、GNN、Transformer)识别脑结构变化、解析脑网络连接模式和处理跨模态关联 [17] - 多模态AI在临床预测中表现优异,如区分阿尔茨海默病与路易体痴呆准确率达87%,癫痫发作预测准确率超98% [14] 临床实践成果 - 精准诊断:融合脑电图与功能影像对癫痫发作预测准确率超98% [14] - 预后预测:AI预测抑郁症药物疗效准确率达89%,并能评估认知衰退速度 [15] - 患者分型:AI在2000+例双相情感障碍患者中发现3种亚型,指导个性化治疗 [16] 未来研究方向 - Transformer类跨模态模型或统一处理影像、基因和临床数据 [23] - 动态监测网络实时追踪脑网络变化,捕捉疾病转折点 [23] - 开发轻量化模型嵌入MRI/PET设备,快速输出辅助报告 [23]