逐笔羊群效应因子
搜索文档
“量价淘金”选股因子系列研究(十四):基于流动性冲击事件的逐笔羊群效应因子
国盛证券· 2025-11-13 07:47
量化模型与构建方式 1. 分钟羊群效应因子簇 **因子构建思路**:将事件研究的想法融入选股因子构建,在分钟数据维度上挖掘羊群效应因子,关注市场中的重要资金(趋势资金)行动后其跟随者的交易行为[13] **因子具体构建过程**:围绕三个关键因素构建因子: 1. 事件识别:通过观测成交量、价格涨跌幅、价格波动率、量价相关性是否发生异常变化,对趋势资金是否行动进行判断,得到上千种不同的识别方式[13] 2. 因子定义:考察趋势资金行动的时间点后紧跟着的量价特征,包括价格、成交量、价量相关性、大小单资金流、主买单、主卖单等指标,这些指标可以是本身数值、与趋势资金对应时间点相比的变化或与趋势资金事件发生之前相比的变化,提出上千种不同的因子构造方式[14] 3. 数据频率:在1分钟数据集上讨论羊群效应[14] **因子评价**:通过体系化思路批量生产选股因子[13] 2. 逐笔羊群效应因子簇 **因子构建思路**:将离散化的因子定义应用在原始的逐笔数据上,基于羊群效应研究思路,在逐笔委托、逐笔成交数据层面构建因子簇[11][20] **因子具体构建过程**:围绕事件识别、因子定义、数据频率三个关键因素展开: 1. 事件识别:通过观测逐笔委托、逐笔成交数据的流动性冲击事件识别趋势资金行动[21] - 基于逐笔委托数据:引入"激进程度"概念,将委托单划分为10种类型[22][23][25][27] - 类型1买单:挂单价≥卖一价且挂单量≥卖一挂单量[22] - 类型2买单:挂单价≥卖一价但挂单量<卖一挂单量[23] - 类型3买单:挂单价>买一价但<卖一价[23] - 类型4买单:挂单价=买一价[25] - 类型5买单:挂单价<买一价[25] - 类型6-10卖单划分方式类似[27] - 基于逐笔成交数据:关注成交量较大或引起价格变动较大的成交单[27] - 共得到10种事件识别方法[29] 2. 因子定义:在事件发生后考察未来窗口内的量价特征[30] - 各种维度的委托量:通过未来窗口选取、订单类型、订单方向、订单指标等维度构建1680种因子[32][36][38] - 各种维度的成交量:逻辑与委托量类似,用"超大单"、"大单"、"中单"、"小单"替换激进程度,得到1200种因子[41][44] - 关键量价数据发生的间隔:通过未来窗口选取、量价数据类型、关键定义、间隔定义等维度构建432种因子[45][48][50] - 各种维度的不平衡指标:通过未来窗口选取、订单类型、不平衡定义等维度构建360种因子[51][52] - 量价相关性:通过逐笔量价指标的相关性计算构建2862种因子[55][56] - 共得到6000多种不同的因子构造方式[61] **因子评价**:展示了如何将离散化的因子定义应用在原始的逐笔数据层面挖掘有效因子[11] 3. 逐笔羊群效应综合因子 **因子构建思路**:在逐笔羊群效应因子簇中选取效果最优的因子合成综合因子[3] **因子具体构建过程**:在逐笔羊群效应因子簇中选取样本内(2016-2021年)信息比率最高的10个因子等权合成[3][67] **因子评价**:选股效果不错的综合因子[70] 4. 纯净逐笔羊群效应综合因子 **因子构建思路**:剔除市场常用风格和行业影响的纯净因子[71] **因子具体构建过程**:每月月底将逐笔羊群效应综合因子对Barra风格因子和中信一级行业虚拟变量进行回归,取残差作为纯净因子[71] 模型的回测效果 1. 分钟羊群效应因子簇 - 50个因子的年化ICIR绝对值都能达到2以上[18] - 分钟羊群效应综合因子(2016/01/01-2025/10/31): - 月度IC均值:0.085 - 年化ICIR:3.18 - 月度RankIC均值:0.116 - 年化RankICIR:4.10 - 10分组多空对冲年化收益:41.59% - 年化波动:12.56% - 信息比率:3.31 - 月度胜率:82.91% - 最大回撤:10.06%[18] 2. 逐笔羊群效应因子簇 - 50个因子的年化ICIR绝对值都能达到2以上[2][65] - 因子16具体构建示例: - 根据逐笔成交数据,将"成交量大于当日所有主卖成交量90%分位数"的主卖成交视为趋势资金事件点 - 提取标准化后的主买成交量序列 - 计算未来20笔成交中的标准化主买成交量的偏度 - 以事件强度为权重对跟随行为强度求加权平均值 - 滚动回看过去20个交易日求算术平均值[66] 3. 逐笔羊群效应综合因子 - 月度IC均值:0.080[67] - 年化ICIR:3.49[67] - 月度RankIC均值:0.101[3][67] - 年化RankICIR:3.74[3][67] - 10分组多空对冲年化收益:44.26%[3][67] - 年化波动:10.90%[67] - 信息比率:4.06[3][67] - 月度胜率:89.74%[3][67] - 最大回撤:10.66%[3][67] 4. 纯净逐笔羊群效应综合因子 - 月度IC均值:0.044[71] - 年化ICIR:3.33[71] - 月度RankIC均值:0.046[71] - 年化RankICIR:3.03[71] - 10分组多空对冲年化收益:19.53%[71] - 年化波动:6.36%[71] - 信息比率:3.07[71] - 月度胜率:78.63%[71] - 最大回撤:5.13%[71] 5. 指数增强组合表现 **沪深300指数增强组合**: - 超额年化收益:8.89%[4][75] - 跟踪误差:3.50%[4][75] - 信息比率:2.54[4][75] - 月度胜率:77.78%[4][75] - 最大回撤:2.96%[4][75] **中证500指数增强组合**: - 超额年化收益:13.46%[4][78] - 跟踪误差:5.31%[4][78] - 信息比率:2.54[4][78] - 月度胜率:79.49%[4][78] - 最大回撤:5.15%[4][78] **中证1000指数增强组合**: - 超额年化收益:17.23%[4][80] - 跟踪误差:4.78%[4][80] - 信息比率:3.61[4][80] - 月度胜率:84.62%[4][80] - 最大回撤:4.14%[4][80]