Workflow
因子挖掘
icon
搜索文档
海量Level2数据因子挖掘系列(六):用逐笔订单数据改进分钟频因子
广发证券· 2025-12-04 14:05
根据提供的研报内容,以下是关于量化因子与模型的总结。 量化因子与构建方式 1. **因子名称**:涨跌类因子 (KeyPeriod_ret) [7][25][26] - **因子构建思路**:基于分钟频因子构建逻辑的改进,采用逐笔订单数据,通过识别日内不同涨跌幅表现的重点时段(如横盘、下跌、上涨时段),并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:首先,根据分钟线的涨跌幅对交易日内的分钟时段进行分类,例如,将涨跌幅接近于零的时段定义为横盘时段 (ret_zero),将涨跌幅处于最低5%的时段定义为下跌时段 (ret_low5pct),将涨跌幅处于最高5%的时段定义为上涨时段 (ret_top5pct)。然后,在这些定义出的关键时段内,使用Level 2逐笔订单数据计算特定的量价指标。构建过程还包含了主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_ret_low5pct_buy 和 KeyPeriod_ret_low5pct_sell,分别代表在下跌时段内的主买和主卖相关特征[26][27][30] 2. **因子名称**:价格类因子 (KeyPeriod_price) [7][25][31] - **因子构建思路**:通过识别日内股价相对高低的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:根据分钟线的价格水平对交易日内的分钟时段进行分类,例如,将价格处于最低5%的时段定义为低价时段 (price_low5pct),将价格处于最高5%的时段定义为高价时段 (price_top5pct)。然后,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。同样包含主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_price_low5pct_buy 和 KeyPeriod_price_low5pct_sell[32] 3. **因子名称**:成交金额类因子 (KeyPeriod_amount) [7][25][34] - **因子构建思路**:通过识别日内成交金额相对大小的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:根据分钟线的成交金额对交易日内的分钟时段进行分类,例如,将成交金额处于最高30%的时段定义为大成交金额时段 (amount_top30pct),将成交金额处于最低50%的时段定义为小成交金额时段 (amount_low50pct)。然后,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。构建过程也包含了主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_amount_top30pct_buy 和 KeyPeriod_amount_top30pct_sell[35] 4. **因子名称**:量价协同类因子 (KeyPeriod_sync) [7][25][37] - **因子构建思路**:通过识别日内量价关系(协同或背离)的关键时段,并统计这些时段内的量价特征来构建因子[7][25] - **因子具体构建过程**:首先需要定义一个量价协同指标(具体公式未在提供内容中明确给出,但逻辑是衡量价格变动与成交量变动的一致性),然后根据该指标对交易日内的分钟时段进行分类,例如,将量价协同度处于最低50%的时段定义为量价背离时段 (sync_low50pct),将量价协同度处于最高5%的时段定义为量价协同时段 (sync_top5pct)。接着,在这些关键时段内使用Level 2逐笔订单数据计算量价指标。构建过程同样包含主买 (buy) 和主卖 (sell) 的区分,例如 KeyPeriod_sync_low50pct_buy 和 KeyPeriod_sync_low50pct_sell[38] 因子的回测效果 1. **KeyPeriod_ret_zero 因子** (20日换仓,5日平滑因子),RankIC均值: -5.36%,胜率: 85.1% [7][27] 2. **KeyPeriod_ret_low5pct 因子** (20日换仓,5日平滑因子),RankIC均值: 5.47%,胜率: 84.1% [7][27] 3. **KeyPeriod_price_low5pct 因子** (20日换仓,5日平滑因子),RankIC均值: 5.59%,胜率: 85.3% [7][32] 4. **KeyPeriod_amount_top30pct 因子** (20日换仓,5日平滑因子),RankIC均值: 11.23%,胜率: 84.8% [7][35] 5. **KeyPeriod_amount_low50pct 因子** (20日换仓,5日平滑因子),RankIC均值: -10.50%,胜率: 75.0% [7][35] 6. **KeyPeriod_sync_low50pct 因子** (20日换仓,5日平滑因子),RankIC均值: 6.00%,胜率: 81.5% [7][38]
开源量化评论(109):深度学习赋能技术分析
开源证券· 2025-06-25 13:22
量化模型与构建方式 1. **模型名称:LSTMtech** - **模型构建思路**:直接使用LSTM模型对股价数据(开、高、低、收、成交量)及技术指标进行因子挖掘[15] - **模型具体构建过程**:输入层为原始量价数据及talib生成的技术指标,采用6年训练集+2年验证集的滚动训练方式,每年更新模型参数[15] - **模型评价**:多头分组效果不够单调,但整体选股能力稳定[15] 2. **模型名称:LSTMdeap_tech** - **模型构建思路**:先通过遗传算法挖掘有效技术因子,再与原始数据共同输入LSTM模型[24][26] - **模型具体构建过程**: 1. 使用遗传算法在2010-2016年数据中挖掘有效因子(框架见图4)[20][22] 2. 将遗传算法因子与原始技术指标合并作为LSTM输入[26] 3. 保持相同的滚动训练机制(6年训练+2年验证)[26] - **模型评价**:绩效显著优于纯LSTM模型,且能覆盖原始LSTM因子的alpha信息[26] 3. **模型名称:LSTMgraph** - **模型构建思路**:将技术指标转化为人为定义的状态变量后输入LSTM[33][41] - **模型具体构建过程**: 1. 对K线形态(实体/影线)和技术指标(如均线相对位置)进行状态编码[33] 2. 合成1-20日K线状态变量作为输入[41] 3. 采用相同LSTM框架训练[41] - **模型评价**:解决了CNN图形识别耗时耗资源的问题,同时保留形态特征[32][41] 4. **复合模型名称:LSTMdeap_tech_graph** - **模型构建思路**:等权合成LSTMdeap_tech与LSTMgraph因子[47][49] - **模型具体构建过程**: 1. 验证两因子相关性(51.48%)及残差选股效果(见图16)[47][49] 2. 直接等权加权合成[49] - **模型评价**:多维度技术信号互补,绩效进一步提升[49] 5. **复合模型名称:LSTMdeap_tech_graph_pro** - **模型构建思路**:将LSTMdeap_tech_graph与交易行为因子LSTMpro等权合成[54] - **模型具体构建过程**:基于38.61%的低相关性直接合成[54] - **模型评价**:多头超额收益显著提升,收益波动比优化[54] --- 量化因子与构建方式 1. **因子名称:Tech_similarity** - **构建思路**:基于技术指标状态匹配历史相似形态[35] - **具体构建过程**: 1. 按月回看5个交易日,匹配股价/MACD/涨跌停/成交量状态[35] 2. 计算匹配日后续20天超额收益均值[35] $$因子值=\frac{1}{5}\sum_{i=1}^{5} (匹配日_i未来20天超额收益)$$ 2. **因子名称:K_similarity** - **构建思路**:基于K线形态匹配历史相似模式[39] - **具体构建过程**: 1. 对日/周/月K线及成交量状态编码[39] 2. 采用与Tech_similarity相同的计算逻辑[39] 3. **复合因子名称:Tech_K_similarity** - **构建思路**:等权合成Tech_similarity与K_similarity[40] - **具体构建过程**:验证两因子25.49%相关性后直接合成[40] --- 模型的回测效果 | 模型名称 | RankIC(2019-) | RankICIR | 多空年化收益 | 多头超额年化 | |------------------------|---------------|----------|--------------|--------------| | LSTMtech | 7.42% | 4.25 | 24.02% | - | [15] | LSTMdeap_tech | 9.27% | 4.54 | 32.44% | - | [26] | LSTMgraph | 9.01% | 4.70 | 32.25% | - | [41][44] | LSTMdeap_tech_graph | 10.89% | 4.99 | 37.28% | 9.40% | [49] | LSTMdeap_tech_graph_pro | 11.93% | - | 39.85% | 11.34% | [54] --- 因子的回测效果 | 因子名称 | RankIC(2013-) | RankICIR | 多空年化收益 | |-------------------|---------------|----------|--------------| | Tech_similarity | 4.97% | 3.05 | 20.22% | [35][37] | K_similarity | 5.10% | 3.09 | 19.25% | [39][42] | Tech_K_similarity | 5.89% | 3.25 | 25.97% | [40][43]