深度学习因子

搜索文档
高频选股因子周报:高频因子表现分化,深度学习因子依然强势。AI 增强组合分化,500 增强依然大幅回撤,1000 增强回撤收窄。-20250928
国泰海通证券· 2025-09-28 12:37
高频选股因子周报(20250922- 20250926) 高频因子表现分化,深度学习因子依然强势。AI 增强组合 分化,500 增强依然大幅回撤,1000 增强回撤收窄。 本报告导读: 上周(特指 20250922-20250926,下同)高频因子表现分化,深度学习因子依然强势。 AI 增强组合分化,500 增强依然大幅回撤,1000 增强回撤收窄。 投资要点: 金融工程 /[Table_Date] 2025.09.28 金 | [Table_Authors] | 郑雅斌(分析师) | | --- | --- | | | 021-23219395 | | | zhengyabin@gtht.com | | 登记编号 | S0880525040105 | | | 余浩淼(分析师) | | | 021-23185650 | | | yuhaomiao@gtht.com | | 登记编号 | S0880525040013 | [Table_Report] 相关报告 国内权益资产震荡,资产配置策略整体回调 2025.09.26 绝对收益产品及策略周报(250915-250919) 2025.09.24 大额买入与资金 ...
深度学习因子月报:Meta因子今年已实现超额收益36.8%-20250818
民生证券· 2025-08-18 08:55
量化模型与因子总结 量化因子与构建方式 1. **因子名称:DL_EM_Dynamic因子** * **因子构建思路**:采用矩阵分解算法从基金选股网络中提取股票的内在属性,并将其与LSTM生成的因子表示结合,构建动态市场状态因子以增强模型表现[19]。 * **因子具体构建过程**: 1. 利用基金年报、半年报的持仓数据,采用矩阵分解方法,将基金-股票的投资网络矩阵分解为基金内在属性矩阵和股票内在属性矩阵。 2. 使用LSTM模型处理量价等时序数据,生成股票的动态因子表示。 3. 将矩阵分解得到的静态股票内在属性,通过计算其与当日市场热度风格的相似度,转化为动态市场状态因子。 4. 将LSTM生成的动态因子表示与动态市场状态因子进行拼接。 5. 将拼接后的特征共同输入到多层感知机(MLP)中进行训练,最终输出因子预测值[19]。 2. **因子名称:Meta_RiskControl因子** * **因子构建思路**:在深度学习模型中引入风格暴露控制,通过修改损失函数加入风格偏离惩罚,并结合元增量学习框架使模型快速适应市场变化,以控制策略回撤风险[26]。 * **因子具体构建过程**: 1. 模型基础架构为加入了风格因子输入的ALSTM(Attention LSTM)模型。 2. 将模型的预测输出乘以对应股票的因子暴露(即风格暴露)。 3. 设计新的损失函数,在RankIC的基础上,添加对于风格偏离与风格动量的惩罚项。具体地,用预测标签的多头部分风格暴露减去空头部分风格暴露,作为惩罚项的一部分。 4. 在外层训练框架上,沿用元增量学习(Meta Incremental Learning)框架,根据近期市场数据分布对模型进行快速调整和更新[26]。 3. **因子名称:Meta_Master因子** * **因子构建思路**:改进MASTER模型,通过引入由深度风险模型计算的新市场状态特征,并替换损失函数和采用元增量学习训练框架,以提升模型对市场状态的自适应能力和预测准确性[36]。 * **因子具体构建过程**: 1. 市场状态构建:利用深度风险模型(相比Barra风格因子对收益解释度提升5%)计算市场状态;利用近期上涨最好股票的风格来衡量近期市场偏好,共计构建120个新特征来代表市场状态。 2. 模型基础:基于改进的MASTER(Market-Guided Stock Transformer)模型,该模型旨在捕获股票间瞬时和跨时间的相关性,并利用市场信息进行自动特征选择。 3. 损失函数:将损失函数替换为加权均方误差(Weighted MSE),通过放大多头端的预测误差来提高模型在多头端预测的准确率。 4. 训练框架:利用在线的元增量学习(Online Meta Incremental Learning)对模型进行定期更新,使模型能快速适应动态变化的市场[36]。 4. **因子名称:深度学习可转债因子** * **因子构建思路**:针对可转债特性,利用GRU神经网络学习其非线性定价逻辑,通过引入可转债特有的时序因子并与截面属性因子结合,以提升传统可转债投资策略的效果[50]。 * **因子具体构建过程**: 1. 使用门控循环单元(GRU)神经网络作为基础模型,处理可转债的时序数据。 2. 将可转债特有的时序因子(如溢价率、波动率等)引入到GRU模型中。 3. 将GRU模型的输出与可转债的截面属性因子(如转债规模、评级、行业等)进行拼接。 4. 将拼接后的综合特征输入到预测层,用于预测可转债的未来收益[50]。 因子回测效果 1. **DL_EM_Dynamic因子** * 最近一月(4周)表现(中证1000):RankIC 11.3%, 多空收益 1.4%, 多头超额收益 0.4%[7] * 最近一季(12周)表现(中证1000):RankIC 9.5%, 多空收益 0.1%, 多头超额收益 -0.9%[7] * 今年表现(中证1000):RankIC 10.6%, 多空收益 22.3%, 多头超额收益 4.9%[9] * 全历史表现(2019年至今,中证1000):RankIC 8.3%, 多空收益 65.8%, 多头超额收益 12.2%[9] * 指数增强组合(中证1000,2019年以来):年化收益 29.7%, 年化超额收益 23.4%, 信息比率(IR) 2.03, 超额收益累计最大回撤 -10.1%[23] 2. **Meta_RiskControl因子** * **全A域表现**: * 最近一月(4周):RankIC 15.5%, 多空收益 5.2%, 多头超额收益(vs中证800)2.7%[7] * 最近一季(12周):RankIC 12.2%, 多空收益 9.1%, 多头超额收益(vs中证800)8.9%[7] * 今年表现:RankIC 12.3%, 多空收益 41.0%, 多头超额收益(vs中证800)29.0%[9] * 全历史表现(2019年至今):RankIC 10.6%, 多空收益 90.3%, 多头超额收益(vs中证800)25.0%[9] * **沪深300增强组合**(2019年以来):年化收益 20.1%, 年化超额收益 15.0%, 信息比率(IR) 1.58, 超额收益累计最大回撤 -5.8%[31] * **中证500增强组合**(2019年以来):年化收益 26.1%, 年化超额收益 19.2%, 信息比率(IR) 1.97, 超额收益累计最大回撤 -9.3%[33] * **中证1000增强组合**(2019年以来):年化收益 34.1%, 年化超额收益 27.0%, 信息比率(IR) 2.36, 超额收益累计最大回撤 -10.2%[35] 3. **Meta_Master因子** * **全A域表现**: * 最近一月(4周):RankIC 18.9%, 多空收益 5.4%, 多头超额收益(vs中证800)5.1%[7] * 最近一季(12周):RankIC 14.6%, 多空收益 20.3%, 多头超额收益(vs中证800)19.0%[7] * 今年表现:RankIC 13.5%, 多空收益 64.0%, 多头超额收益(vs中证800)36.8%[9] * 全历史表现(2019年至今):RankIC 11.7%, 多空收益 90.4%, 多头超额收益(vs中证800)35.6%[9] * **沪深300增强组合**(2019年以来):年化收益 22.0%, 年化超额收益 17.5%, 信息比率(IR) 2.09, 超额收益累计最大回撤 -7.2%[39] * **中证500增强组合**(2019年以来):年化收益 23.8%, 年化超额收益 18.2%, 信息比率(IR) 1.9, 超额收益累计最大回撤 -5.8%[45] * **中证1000增强组合**(2019年以来):年化收益 30.7%, 年化超额收益 25.2%, 信息比率(IR) 2.33, 超额收益累计最大回撤 -8.8%[47] 4. **深度学习可转债因子** * **中证转债域**: * 最近一月(4周):RankIC 10.1%, 多头超额收益(vs中证转债)0.9%[7] * 最近一季(12周):RankIC 7.5%, 多头超额收益(vs中证转债)1.2%[7] * 今年表现:RankIC 7.1%, 多头超额收益(vs中证转债)0.3%[9] * 全历史表现(2021年至今):RankIC 12.0%, 多头超额收益(vs中证转债)9.9%[9] * **分类型表现(2021年以来Top50组合年化超额收益)**: * 偏债型:4.4%[55] * 平衡型:4.0%[55] * 偏股型:5.8%[55] * 偏债+平衡混合策略:10.9%[55]
市场情绪监控周报(20250728-20250801):深度学习因子7月超额1.59%,本周热度变化最大行业为建筑材料、建筑装饰-20250804
华创证券· 2025-08-04 11:44
根据研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:DecompGRU模型 - **模型构建思路**:基于趋势分解的时序+截面端到端模型,通过改进GRU基线模型实现时序和截面信息交互[8] - **模型具体构建过程**: 1. 使用两个去均值模块处理时序和截面数据 2. 基于IC和加权MSE损失函数分别训练两个子模型(DecompGRU_IC、DecompGRU_MSE)[14] 3. 输出个股得分并构建组合: - 选股范围:中证全指 - 调仓频率:周频(每周首个交易日调仓) - 组合构建:等权持有得分TOP200股票,剔除涨跌停/停牌股[8] - **模型评价**:通过分解模块增强模型对市场趋势的捕捉能力,实现端到端预测[14] 2. **ETF轮动模型** - **构建思路**:将DecompGRU个股得分聚合至行业/主题ETF[10] - **具体构建**: 1. ETF池筛选标准: - 行业/主题型ETF - 5日成交额均值>2000万,20日日均成交额>1000万 - 同指数ETF保留成交额最大者 2. 持仓规则:每期持有3-6只ETF,周度不定期调仓[10] --- 量化因子与构建方式 1. **情绪热度因子** - **构建思路**:通过同花顺用户行为数据(浏览/自选/点击)构建市场情绪代理指标[18] - **具体构建**: 1. 个股热度计算: $$总热度 = \frac{浏览+自选+点击次数}{全市场总和} \times 10000$$ 取值区间[0,10000][18] 2. 聚合方法: - 宽基热度:按成分股分组(沪深300/中证500/中证1000/中证2000/其他)求和[19] - 行业热度:按申万一级/二级行业分组求和[30] - 概念热度:按概念成分股分组求和[39] - **因子评价**:有效捕捉市场有限注意力导致的定价偏差[17] 2. **热度变化率因子** - **构建过程**: 1. 计算周度热度变化率: $$\Delta H_t = \frac{H_t - H_{t-1}}{H_{t-1}}$$ 2. 取MA2平滑处理[22] 3. 应用场景: - 宽基轮动:买入变化率最大的宽基(排除"其他"组)[24] - 概念组合:筛选变化率TOP5概念中的低热度个股[42] 3. **估值分位数因子** - **构建方法**: 1. 计算滚动5年PE/PB历史分位数[50] 2. 行业分位数回溯至2015年[53] 3. 输出: - 宽基分位数(沪深300/中证500/中证1000)[52] - 申万一级/二级行业分位数[54] --- 模型回测效果 | 模型/组合 | 累计收益 | 超额收益 | 最大回撤 | 周胜率 | 月胜率 | 测试周期 | |---------------------|----------|----------|----------|--------|--------|----------------| | DecompGRU TOP200 | 24.54% | 9.80% | 10.08% | 72.22% | 100% | 2025/3/31-8/1 [10] | | ETF轮动组合 | 12.97% | 8.65% | 6.16% | 68.42% | 75% | 2025/3/18-8/1 [12] | | 宽基热度轮动策略 | 18.8%* | 1.7%* | 23.5% | - | - | 2017-2025 [27] | | 概念BOTTOM组合 | 27%** | - | 28.89% | - | - | 2025年内 [44] | (*相对宽基等权基准 **年化15.71%) --- 因子回测效果 1. **宽基热度变化率**(2025/8/1): - 中证500:+10.21% - 中证2000:-6.02% [29] 2. **行业热度变化率**(2025/8/1): - 正向TOP5:建筑材料(+83.5%)、建筑装饰、社会服务、钢铁、食品饮料 - 负向TOP5:公用事业(-32.5%)、轻工制造、纺织服饰、汽车、房地产 [38] 3. **估值分位数**: - 宽基:中证500(95%) > 中证1000(84%) > 沪深300(70%) [52] - 一级行业高估:电力设备/计算机/银行(>80%) - 一级行业低估:农林牧渔/家电(<20%) [53]
高频选股因子周报:高频因子上周表现分化,日内收益与尾盘占比因子强势。深度学习因子依然稳健, AI 增强组合上周表现有所分化。-20250629
国泰海通证券· 2025-06-29 11:24
量化因子与构建方式 1. **因子名称:日内高频偏度因子** - 构建思路:衡量股票日内收益分布的偏度特征[4] - 具体构建过程:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[10] 2. **因子名称:日内下行波动占比因子** - 构建思路:分解已实现波动中的下行波动部分占比[4] - 具体构建过程:参考《选股因子系列研究(二十五)——高频因子之已实现波动分解》[14] 3. **因子名称:开盘后买入意愿占比因子** - 构建思路:捕捉开盘后市场买入意愿的占比特征[4] - 具体构建过程:基于高频数据低频化方法,参考《选股因子系列研究(六十四)》[17] 4. **因子名称:开盘后买入意愿强度因子** - 构建思路:量化开盘后买入意愿的强度[4] - 具体构建过程:同开盘后买入意愿占比因子,但侧重强度计算[21] 5. **因子名称:开盘后大单净买入占比因子** - 构建思路:分析开盘后大单净买入的占比[4] - 具体构建过程:未披露详细公式,但需正交化处理[25] 6. **因子名称:改进反转因子** - 构建思路:优化传统反转因子的计算逻辑[4] - 具体构建过程:未披露具体公式[36] 7. **因子名称:尾盘成交占比因子** - 构建思路:衡量尾盘成交量在总成交中的占比[4] - 具体构建过程:未披露详细公式[37] 8. **因子名称:深度学习因子(改进GRU(50,2)+NN(10))** - 构建思路:结合GRU神经网络与全连接层预测收益[4] - 具体构建过程:使用GRU(50,2)提取时序特征,NN(10)输出预测值[52] 9. **因子名称:多颗粒度模型(5日标签)** - 构建思路:基于双向AGRU训练多时间颗粒度标签[57] - 具体构建过程:采用5日收益标签训练模型[60] 10. **因子名称:多颗粒度模型(10日标签)** - 构建思路:同5日标签模型,但标签周期延长至10日[60] 因子回测效果 1. **日内高频偏度因子** - 上周多空收益:-0.51% - 6月多空收益:1.48% - 2025年多空收益:14.73%[4] 2. **日内下行波动占比因子** - 上周多空收益:-0.04% - 6月多空收益:1.86% - 2025年多空收益:12.84%[4] 3. **开盘后买入意愿占比因子** - 上周多空收益:0.77% - 6月多空收益:1.85% - 2025年多空收益:11.44%[4] 4. **改进GRU(50,2)+NN(10)因子** - 上周多空收益:0.70% - 6月多空收益:3.58% - 2025年多空收益:19.78%[4] 5. **多颗粒度模型(5日标签)** - 上周多空收益:1.56% - 6月多空收益:5.97% - 2025年多空收益:35.45%[4] 量化模型与构建方式 1. **模型名称:中证500 AI增强宽约束组合** - 构建思路:基于多颗粒度模型因子,最大化预期收益[61] - 具体构建过程:目标函数为$$ \max \sum w_i \mu_i $$,其中$w_i$为权重,$\mu_i$为预期超额收益[67] - 约束条件:个股权重≤1%,行业偏离≤1%,市值暴露≤0.3[62] 2. **模型名称:中证1000 AI增强严约束组合** - 构建思路:同中证500模型,但约束更严格[61] - 具体构建过程:增加ROE、SUE等基本面约束[62] 模型回测效果 1. **中证500 AI增强宽约束组合** - 上周超额收益:-0.25% - 6月超额收益:-0.36% - 2025年超额收益:7.95%[10] 2. **中证1000 AI增强严约束组合** - 上周超额收益:-0.21% - 6月超额收益:0.60% - 2025年超额收益:12.99%[10]
高频选股因子周报(20250519- 20250523):高频因子表现有所分化,大单与买入意愿因子明显反弹, AI 增强组合继续强势表现-20250525
国泰海通证券· 2025-05-25 11:37
量化模型与构建方式 1. 高频因子 1. **因子名称**:日内高频偏度因子 **因子构建思路**:通过分析股票日内收益的偏度特征来捕捉市场情绪和价格波动异常[3][6] **因子具体构建过程**:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[11] **因子评价**:长期多空收益稳定,但5月表现较弱[3][6] 2. **因子名称**:日内下行波动占比因子 **因子构建思路**:衡量股票下跌波动在总波动中的占比,反映风险特征[3][6] **因子具体构建过程**:基于专题报告《选股因子系列研究(二十五)——高频因子之已实现波动分解》方法构建[17] 3. **因子名称**:开盘后买入意愿占比因子 **因子构建思路**:通过开盘后买入交易量占比捕捉资金流向[3][6] **因子具体构建过程**:采用《选股因子系列研究(六十四)——基于直观逻辑和机器学习的高频数据低频化应用》方法[21] 4. **因子名称**:开盘后大单净买入占比因子 **因子构建思路**:分析大单资金在开盘后的净流入情况[3][6] **因子评价**:2025年月胜率达100%,稳定性突出[7] 2. 深度学习因子 1. **因子名称**:改进GRU(50,2)+NN(10)因子 **因子构建思路**:结合门控循环单元和神经网络提取高频数据时序特征[3][14] **因子评价**:多空收益持续为正但多头超额收益为负[10] 2. **因子名称**:多颗粒度模型(5日标签) **因子构建思路**:基于双向AGRU训练,融合不同时间颗粒度的市场信息[15][66] **因子评价**:2025年多空收益达28.86%,表现最佳[10] 3. AI增强组合模型 **模型名称**:中证500/1000 AI增强组合 **模型构建思路**:以多颗粒度模型因子为核心,通过优化约束条件构建增强组合[69] **模型具体构建过程**: - 目标函数:$$max\sum\mu_{i}w_{i}$$,其中μi为股票预期超额收益[70] - 风险控制模块包含个股/行业约束、市值约束、财务指标约束等[70] - 交易成本假设为双边3‰[71] 回测效果 1. 高频因子 | 因子名称 | 上周多空收益 | 5月多空收益 | 2025年多空收益 | IC(2025) | RankMAE(2025) | |--------------------------|--------------|-------------|-----------------|----------|---------------| | 日内高频偏度因子 | 0.18% | -1.42% | 14.35% | 0.057 | 0.331 | | 开盘后大单净买入占比因子 | 0.31% | -0.33% | 12.32% | 0.039 | 0.324 | | 大单推动涨幅因子 | 0.36% | -0.53% | 4.26% | 0.005 | 0.322 | 2. 深度学习因子 | 因子名称 | 上周多空收益 | 5月多空收益 | 2025年多空收益 | 多头超额(2025) | |--------------------------|--------------|-------------|-----------------|----------------| | GRU(50,2)+NN(10) | 0.09% | 0.11% | 16.01% | -1.81% | | 多颗粒度模型(5日标签) | 0.56% | 0.81% | 28.86% | 9.83% | 3. AI增强组合 | 组合名称 | 上周超额收益 | 5月超额收益 | 2025年超额收益 | |------------------------------|--------------|-------------|----------------| | 中证500 AI增强宽约束组合 | 1.19% | 3.50% | 7.44% | | 中证1000 AI增强严约束组合 | 0.98% | 3.33% | 11.98% |