因子切割论
搜索文档
市场微观结构系列(31):分钟资金流因子的构建方法
开源证券· 2025-12-21 09:14
量化因子总结 量化因子与构建方式 1. **因子名称**:分钟资金流切割残差因子[1][3] * **因子构建思路**:参考“因子切割论”,对分钟资金流信息(大单/小单净流入金额)按照不同的切割指标(分钟价格、分钟涨跌幅、分钟振幅)进行切割,选取特定部分(如较高价格、较高涨跌幅、较高振幅)的资金流,再进行标准化和动量中性化处理,以构造残差因子[13]。 * **因子具体构建过程**: 1. **数据准备**:基于逐笔成交数据合成过去20日的分钟大单净流入金额和分钟小单净流入金额[13]。 2. **切割处理**:分别以分钟价格、分钟涨跌幅、分钟振幅作为切割指标,将每分钟的资金流数据按指标值排序。例如,选取价格较高的50%分钟对应的资金流数据[14]。 3. **残差因子构造**:对切割后得到的特定分钟资金流序列,参考日度资金流残差因子的构造方法,进行标准化和动量中性化两步处理,得到最终的切割残差因子[2][12]。 * **因子评价**:通过切割可以剖析市场内部精细结构,不同股价位置、涨跌幅、振幅下的资金流蕴含信息不同[13]。对比三种切割方案,分钟振幅切割得到的因子绩效最优[27]。 2. **因子名称**:分钟资金流时段残差因子[1][4] * **因子构建思路**:考虑到不同类型投资者对日内交易时段的偏好存在差异,将日内交易时段划分为不同区间(如第1小时、前半小时等),筛选出特定时段的分钟资金流信息,再构造残差因子[31]。 * **因子具体构建过程**: 1. **时段划分**:将日内交易时段划分为第1小时、第2小时、第3小时、第4小时、前半小时和整点时段(整点时刻后5分钟合并)[31]。 2. **数据筛选**:筛选出过去20日中,属于特定时段(如前半小时)的所有分钟资金流信息(大单/小单净流入金额)[31]。 3. **残差因子构造**:对筛选出的特定时段分钟资金流序列,进行标准化和动量中性化处理,构造得到时段残差因子[31]。 * **因子评价**:不同时段资金流蕴含信息不同,前半小时资金流信息构造的因子选股效果最优[31]。 3. **因子名称**:分钟资金流情景残差因子[1][5] * **因子构建思路**:根据市场情景状态(如上证指数的分钟指标)进行划分,选取在相同市场情景下的交易时刻,使用这些时刻对应的个股分钟资金流信息来构造残差因子[42]。 * **因子具体构建过程**: 1. **市场情景划分**:使用过去20日第1小时的数据,计算上证指数的分钟指标(振幅、1min涨跌幅、5min涨跌幅、符号成交额)。选取指标值靠前的50%交易分钟,定义为特定的市场情景[42]。 2. **数据匹配**:对于所有股票,选取其在上一步定义的特定市场情景时刻所对应的分钟资金流信息(大单/小单净流入金额)[42]。 3. **残差因子构造**:对匹配得到的特定情景分钟资金流序列,进行标准化和动量中性化处理,构造得到情景残差因子[42]。 * **因子评价**:5min涨跌幅指标能有效衡量市场趋势上涨情景,以此构造的情景残差因子选股效果最优[43]。 因子的回测效果 (数据区间:20130426-20250530[21][24][30][42]) 1. **分钟资金流切割残差因子(振幅方案)**[3][27] * **大单切割残差因子**:IC均值0.041,ICIR 3.23,RankIC均值0.045,RankICIR 3.34,多空对冲年化收益率15.9%,信息比率3.39[27]。 * **小单切割残差因子**:IC均值-0.047,ICIR -2.96,RankIC均值-0.054,RankICIR -3.32,多空对冲年化收益率17.7%,信息比率3.02[27]。 2. **分钟资金流时段残差因子(前半小时方案)**[4][36] * **大单时段残差因子**:IC均值0.043,ICIR 3.41,RankIC均值0.049,RankICIR 3.47,多空对冲年化收益率16.8%,信息比率3.64[36]。 * **小单时段残差因子**:IC均值-0.061,ICIR -3.47,RankIC均值-0.07,RankICIR -3.82,多空对冲年化收益率23.3%,信息比率3.65[36]。 3. **分钟资金流情景残差因子(5min涨跌幅方案)**[5][45] * **大单情景残差因子**:IC均值0.037,ICIR 3.88,RankIC均值0.04,RankICIR 3.86,多空对冲年化收益率14.1%,信息比率4.04[45]。 * **小单情景残差因子**:IC均值-0.054,ICIR -3.99,RankIC均值-0.059,RankICIR -4.15,多空对冲年化收益率21.2%,信息比率4.22[45]。 4. **分钟资金流情景残差因子(不同样本空间)**[55][60] * **大单情景残差-沪深300**:信息比率1.14[55][60]。 * **大单情景残差-中证500**:信息比率1.83[55][60]。 * **小单情景残差-沪深300**:信息比率1.63[55][60]。 * **小单情景残差-中证500**:信息比率2.48[55][60]。
市场微观结构研究系列(28):因子切割论与深度学习的结合应用
开源证券· 2025-07-26 11:38
量化模型与构建方式 1. **模型名称:DBD-GRU模型** - **模型构建思路**:将因子切割论与深度学习(GRU网络)结合,通过双分支差异网络处理切割后的数据,提取时序信息差异[4][28] - **模型具体构建过程**: 1. 输入数据包含特征A(切割指标)和特征B(切割对象) 2. 以特征A的时序中位数为阈值,生成掩码`mask_Ahigh`和`mask_Alow` 3. 掩码处理后数据分别输入两个GRU分支(`GRU_high`和`GRU_low`) 4. 取两个分支最后一个时间步输出的差异作为最终结果 公式: $$ \text{DBD-GRU输出} = \text{GRU\_high}(x \odot \text{mask\_Ahigh}) - \text{GRU\_low}(x \odot \text{mask\_Alow}) $$ - **模型评价**:有效融合切割论逻辑与深度学习,提供显著信息增量[5][12] 2. **模型名称:GRU基线模型** - **模型构建思路**:作为对比基准,直接处理未切割的原始特征[34] - **模型具体构建过程**:输入特征A和B,通过标准GRU网络输出预测结果 --- 量化因子与构建方式 1. **因子名称:理想反转因子** - **因子构建思路**:通过切割日度涨跌幅,分离大单成交驱动的反转效应[14][18] - **因子具体构建过程**: 1. 取股票过去20日数据,计算每日涨跌幅和平均单笔成交金额 2. 按单笔成交金额中位数分为高/低两组 3. 分别加总高组(`M_high`)和低组(`M_low`)的涨跌幅 4. 计算差异: $$ M = M\_high - M\_low $$ - **因子评价**:稳定性优于传统反转因子,多空IR达2.59[24][40] 2. **因子名称:理想振幅因子** - **因子构建过程**: 1. 取股票过去20日数据,计算每日振幅(最高价/最低价-1) 2. 按收盘价分为高/低价态两组(前25%和后25%) 3. 计算高价态振幅均值(`A_high`)和低价态振幅均值(`A_low`) 4. 输出差异: $$ A = A\_high - A\_low $$ - **因子评价**:多空年化收益21.02%,但分组单调性较弱[35][40] 3. **因子名称:主动买卖因子(小单)** - **因子构建过程**: 1. 计算每日小单主动买卖比率: $$ \frac{\text{主动买入金额(小单)} - \text{主动卖出金额(小单)}}{\text{主动买入金额(小单)} + \text{主动卖出金额(小单)}} $$ 2. 选取收盘价最低的25%交易日计算均值[79] 4. **衍生因子:DBD-GRU改进因子** - 包括理想振幅-DBD、理想反转-DBD、主动买卖-DBD,通过DBD-GRU模型重构原始因子[5][34] 5. **复合因子:DBD-Combine因子** - 对三个DBD-GRU因子对称正交后等权合成[6][61] --- 模型与因子的回测效果 DBD-GRU模型因子(测试区间:201412~202505) | 因子 | RankIC | RankICIR | 多空年化收益 | 多空波动率 | |--------------------|----------|----------|--------------|------------| | 理想振幅-DBD | -10.33% | -3.68 | 34.31% | 15.17% | | 理想反转-DBD | -10.31% | -3.57 | 37.62% | 12.55% | | 主动买卖-DBD | -9.81% | -3.63 | 33.33% | 13.32% | [48][52] 原始切割论因子 | 因子 | RankIC | 多空年化收益 | |--------------------|----------|--------------| | 理想振幅因子 | -7.00% | 21.02% | | 理想反转因子 | -6.06% | 24.26% | | 主动买卖因子 | -3.39% | 10.20% | [40] DBD-Combine因子(宽基指数表现) | 指数 | RankIC | 多空年化收益 | 指增超额IR | |------------|----------|--------------|------------| | 沪深300 | -5.76% | 14.9% | 1.84 | | 中证500 | -7.40% | 17.5% | 1.37 | | 中证1000 | -9.84% | 30.8% | 2.21 | [61][71]