Workflow
热点追踪周报:由创新高个股看市场投资热点(第225 期)-20251226
国信证券· 2025-12-26 13:35
量化模型与因子总结 量化因子与构建方式 1. **因子名称:250日新高距离**[11] * **因子构建思路**:该因子用于衡量当前价格相对于过去一段时间内最高价格的回落幅度,是趋势跟踪和动量策略的核心指标。当价格创出新高时,该因子值为0;价格从高点回落时,该值为正,表示回落的百分比[11]。 * **因子具体构建过程**:对于每个交易日t,计算股票或指数的收盘价Closet与过去250个交易日收盘价最大值ts_max(Close, 250)的比值,并用1减去该比值,得到“250日新高距离”[11]。 具体公式为: $$250日新高距离 = 1 - \frac{Closet}{ts\_max(Close, 250)}$$ 其中,Closet为最新收盘价,ts_max(Close, 250)为过去250个交易日收盘价的最大值[11]。 2. **模型名称:平稳创新高股票筛选模型**[24][27] * **模型构建思路**:该模型旨在从近期创出新高的股票中,进一步筛选出具有更强趋势延续潜力的“平稳创新高”股票。其理论基础在于,遵循平滑价格路径的高动量股票,其未来收益可能优于价格路径跳跃的股票[24]。模型从分析师关注度、股价相对强弱、趋势延续性、股价路径平稳性和创新高持续性等多个角度进行综合筛选[24][27]。 * **模型具体构建过程**:该模型是一个多步骤的筛选流程,具体步骤如下[24][27]: 1. **初选股票池**:筛选出上市满15个月,且在过去20个交易日内创出过250日新高的股票[19]。 2. **分析师关注度筛选**:要求过去3个月内,获得“买入”或“增持”评级的分析师研报数量不少于5份[27]。 3. **股价相对强弱筛选**:要求过去250日涨跌幅位于全市场所有股票的前20%[27]。 4. **股价平稳性与创新高持续性综合打分**:在满足上述条件的股票池内,使用以下两个指标进行综合打分,并选取排名在前50%的股票[27]。 * **价格路径平滑性**:使用“股价位移路程比”指标。该指标的计算方法在报告中以图表形式展示,其公式为:过去120日涨跌幅的绝对值 / 过去120日日涨跌幅绝对值加总[24]。该值越接近1,表明价格路径越平滑。 * **创新高持续性**:使用过去120日的“250日新高距离”在时间序列上的均值。该值越小,表明在近期内股价持续接近或创出新高的状态保持得越好[27]。 5. **趋势延续性筛选**:对经过第4步筛选后的股票,计算其过去5日的“250日新高距离”在时间序列上的均值,并选取该值排序最靠前的50只股票作为最终输出[27]。 模型与因子的回测效果 > **注**:本报告主要为市场状态跟踪与股票筛选,未提供量化模型或因子在历史回测中的具体绩效指标(如年化收益率、夏普比率、信息比率IR、最大回撤等)。报告展示了截至特定日期(2025年12月26日)的截面数据结果[2][12][19][28]。 1. **250日新高距离因子** * **市场指数取值**:截至2025年12月26日,主要宽基指数的250日新高距离分别为:上证指数1.63%、深证成指0.89%、沪深300指数1.91%、中证500指数1.19%、中证1000指数0.56%、中证2000指数0.05%、创业板指2.42%、科创50指数12.56%[2][12]。 * **行业指数取值**:国防军工、有色金属、建材、机械、轻工制造行业指数距离250日新高较近(例如前四个行业距离为0.00%);食品饮料、银行、医药、综合金融、房地产行业指数距离250日新高较远[13]。 * **概念指数取值**:林木、航天军工、万得风电、十大军工集团、HJT电池、金属非金属、黄金等概念指数距离250日新高较近[15]。 2. **平稳创新高股票筛选模型** * **筛选结果数量**:截至2025年12月26日,初选股票池(过去20日创250日新高)共有726只股票[19]。经过模型多步骤筛选后,最终得到50只“平稳创新高”股票,例如中际旭创、英维克、新易盛等[3][28]。 * **板块分布**:这50只股票中,周期板块有21只入选,科技板块有15只入选。周期板块中创新高最多的是有色金属行业;科技板块中创新高最多的是电力设备及新能源行业[28]。
热点追踪周报:由创新高个股看市场投资热点(第225期)-20251226
国信证券· 2025-12-26 11:49
量化模型与因子总结 量化因子与构建方式 1. **因子名称:250日新高距离**[11] * **因子构建思路**:该因子用于衡量当前价格相对于过去一段时间内最高价格的回落幅度,是趋势跟踪和动量策略的核心指标。当价格创出新高时,该因子值为0;价格从高点回落时,该因子值为正,值越大表示回落幅度越大[11]。 * **因子具体构建过程**:对于每个交易日t,计算最新收盘价与过去250个交易日(约一年)最高收盘价的相对距离。具体公式如下: $$250日新高距离 = 1 - \frac{Close_t}{ts\_max(Close, 250)}$$ 其中,$Close_t$为股票在交易日t的最新收盘价,$ts\_max(Close, 250)$为过去250个交易日收盘价的最大值[11]。 2. **模型名称:平稳创新高股票筛选模型**[24][27] * **模型构建思路**:该模型旨在从近期创出250日新高的股票中,进一步筛选出具有分析师关注、股价走势强劲且路径平稳、趋势有望延续的股票。其理论基础在于,遵循平滑价格路径的高动量股票未来收益可能优于价格路径跳跃的股票[24]。 * **模型具体构建过程**:模型采用多步骤条件筛选法,具体流程如下: 1. **初选股票池**:筛选出上市满15个月,且在过去20个交易日内创出过250日新高的所有股票[19]。 2. **分析师关注度筛选**:要求过去3个月内,获得“买入”或“增持”评级的分析师研报数量不少于5份[27]。 3. **股价相对强弱筛选**:要求过去250日涨跌幅位于全市场所有股票的前20%[27]。 4. **股价平稳性与创新高持续性综合打分**:在满足上述条件的股票池内,使用以下两个指标进行综合打分,并选取排名在前50%的股票[27]。 * **价格路径平滑性(股价位移路程比)**:该指标衡量股价走势的平稳程度。计算公式为过去120日涨跌幅的绝对值除以过去120日日涨跌幅绝对值的加总。比值越高,表明价格路径越平滑(趋势性越强,波动越小)[24][27]。 * **创新高持续性**:计算过去120个交易日的“250日新高距离”在时间序列上的均值。该值越小,表明股票在近期持续接近或创出新高[27]。 5. **趋势延续性筛选**:对经过上一步筛选的股票,计算其过去5个交易日的“250日新高距离”在时间序列上的均值,并选取该值排序最靠前的50只股票作为最终输出[27]。 模型的回测效果 *本报告为市场状态跟踪与股票筛选周报,未提供量化模型或因子在历史数据上的系统性回测绩效指标(如年化收益率、夏普比率、信息比率IR、最大回撤等)。报告主要展示了截至特定日期(2025年12月26日)的截面筛选结果和部分市场统计数据[12][13][19][28]。* 因子的回测效果 *本报告为市场状态跟踪与股票筛选周报,未提供量化因子在历史数据上的系统性回测绩效指标(如IC值、ICIR、多空收益、分组收益等)。报告主要展示了截至特定日期(2025年12月26日)的因子截面取值和市场应用情况[12][13][19]。*
金融工程日报:A 股延续上涨,商业航天、机器人题材双线爆发-20251225
国信证券· 2025-12-25 15:25
量化模型与构建方式 1. **模型名称**:无 **模型构建思路**:无 **模型具体构建过程**:无 **模型评价**:无 量化因子与构建方式 1. **因子名称**:封板率因子 **因子构建思路**:通过计算最高价涨停且收盘涨停的股票比例,来衡量市场涨停股的封板强度和市场情绪[16] **因子具体构建过程**: 1. 筛选上市满3个月以上的股票[16] 2. 在每个交易日,统计满足“最高价涨停”条件的股票数量[16] 3. 在步骤2的股票中,进一步统计“收盘涨停”的股票数量[16] 4. 计算封板率,公式为: $$封板率=\frac{最高价涨停且收盘涨停的股票数}{最高价涨停的股票数}$$[16] 2. **因子名称**:连板率因子 **因子构建思路**:通过计算连续两日收盘涨停的股票比例,来衡量市场涨停股的持续性和赚钱效应[16] **因子具体构建过程**: 1. 筛选上市满3个月以上的股票[16] 2. 在每个交易日,统计前一日(T-1日)收盘涨停的股票数量[16] 3. 在步骤2的股票中,统计当日(T日)同样收盘涨停的股票数量[16] 4. 计算连板率,公式为: $$连板率=\frac{连续两日收盘涨停的股票数}{昨日收盘涨停的股票数}$$[16] 3. **因子名称**:大宗交易折价率因子 **因子构建思路**:通过计算大宗交易成交价相对于市价的折价幅度,来反映大资金的交易情绪和偏好[26] **因子具体构建过程**: 1. 获取当日所有大宗交易的成交总金额[26] 2. 获取当日大宗交易成交份额对应的总市值(按当日市价计算)[26] 3. 计算折价率,公式为: $$折价率=\frac{大宗交易总成交金额}{当日成交份额的总市值}-1$$[26] 4. **因子名称**:股指期货年化贴水率因子 **因子构建思路**:通过计算股指期货主力合约相对于现货指数的年化基差,来反映市场对未来预期、对冲成本及情绪[28] **因子具体构建过程**: 1. 计算基差:基差 = 股指期货价格 - 现货指数价格[28] 2. 计算年化贴水率,公式为: $$年化贴水率=\frac{基差}{指数价格} \times \frac{250}{合约剩余交易日数}$$[28] 其中,当股指期货价格高于现货指数价格时,年化贴水率为正,表示升水;反之为负,表示贴水[28] 模型的回测效果 1. **无相关模型回测结果** 因子的回测效果 1. **封板率因子**,2025年12月25日指标值:79%[16] 2. **连板率因子**,2025年12月25日指标值:32%[16] 3. **大宗交易折价率因子**,近半年平均指标值:6.58%[26];2025年12月24日指标值:7.12%[26] 4. **股指期货年化贴水率因子** **上证50股指期货**,近一年中位数:0.85%[28];2025年12月25日指标值:0.18%(升水)[28] **沪深300股指期货**,近一年中位数:3.79%[28];2025年12月25日指标值:3.24%(贴水)[28] **中证500股指期货**,近一年中位数:11.22%[28];2025年12月25日指标值:5.74%(贴水)[28] **中证1000股指期货**,近一年中位数:13.61%[28];2025年12月25日指标值:9.98%(贴水)[28]
金工ETF点评:宽基ETF单日净流入175.51亿元,建筑装饰、房地产拥挤变幅较大
太平洋证券· 2025-12-25 15:23
量化模型与构建方式 1. **模型名称:行业拥挤度监测模型**[3] * **模型构建思路**:通过构建一个量化模型,对申万一级行业指数的拥挤度进行每日监测,以识别市场热度或交易过度的行业[3]。 * **模型具体构建过程**:报告未详细说明该模型的具体构建步骤、使用的底层指标或计算公式。 2. **模型名称:溢价率 Z-score 模型**[4] * **模型构建思路**:通过计算ETF溢价率的Z-score值,搭建ETF产品筛选信号模型,以识别存在潜在套利机会的标的[4]。 * **模型具体构建过程**:报告未详细说明该模型的具体构建步骤,例如Z-score计算所基于的滚动窗口期长度、均值和标准差的计算方法。但根据金融工程常规做法,该模型的核心是计算当前溢价率相对于其近期历史分布的标准化偏离度。其核心公式可推断为: $$Z_t = \frac{PremiumRate_t - \mu_{t-n, t-1}}{\sigma_{t-n, t-1}}$$ 其中,$Z_t$ 为t日的溢价率Z-score值,$PremiumRate_t$ 为t日的IOPV溢价率,$\mu_{t-n, t-1}$ 为过去n个交易日(滚动窗口)溢价率的均值,$\sigma_{t-n, t-1}$ 为过去n个交易日溢价率的标准差[4]。 量化因子与构建方式 1. **因子名称:行业拥挤度**[3] * **因子构建思路**:综合多个维度指标,合成一个用于衡量某个申万一级行业交易是否过度拥挤、风险是否积聚的综合性指标[3]。 * **因子具体构建过程**:报告未披露行业拥挤度因子的具体合成方法、所包含的子因子(如换手率、估值分位数、资金流入强度等)及其权重。 2. **因子名称:ETF溢价率**[4][6] * **因子构建思路**:计算ETF二级市场交易价格与其参考净值(IOPV)的偏离百分比,反映市场供需导致的定价偏差[4][6]。 * **因子具体构建过程**:报告未给出公式,但该因子为市场通用计算方式。具体构建过程为:使用ETF的实时成交价格与其单位基金份额参考净值(IOPV)进行计算。 $$溢价率 = \frac{ETF市价 - IOPV}{IOPV} \times 100\%$$ 其中,IOPV(Indicative Optimized Portfolio Value)是由交易所根据ETF申购赎回清单和实时证券价格计算并发布的基金份额参考净值[6]。 3. **因子名称:主力资金净流入额**[10] * **因子构建思路**:统计特定时间段内(如单日)流入某行业板块的主力资金净额,用于观察大资金的动向[10]。 * **因子具体构建过程**:报告直接使用了Wind等数据提供商计算的主力资金净流入额数据,未说明其具体算法。通常该因子基于逐笔成交数据,结合成交价格、订单大小和买卖方向等信息估算得出。 模型的回测效果 (报告中未提供任何量化模型的回测效果指标,如年化收益率、夏普比率、最大回撤、信息比率(IR)等。) 因子的回测效果 (报告中未提供任何量化因子的回测效果指标,如因子IC值、IR、多空收益等。仅展示了因子在特定时点的截面数据。)
量化掘基系列之四十一:从智选到量化:细分Beta指增策略的矩阵搭建
国金证券· 2025-12-25 13:14
量化模型与构建方式 1. **模型名称**:永赢量化指增多策略体系[30] **模型构建思路**:针对不同基准指数的特性,构建差异化的增强路径与策略重心,通过整合逻辑互补、周期各异的Alpha来源,以抵御单一策略的阶段性失效,追求持续稳定的超额收益[30]。 **模型具体构建过程**:该体系是一个分层、分类的框架,而非单一模型。 * **产品分类与策略重心**: * **常规宽基指增**(如跟踪沪深300、中证500):采用“核心+卫星”策略。核心策略整合多因子模型,卫星策略通过基本面量化方法深度捕捉并强化指数内生的风格特征[30]。 * **特殊基准指增**(如跟踪中证A50、科创100):采取定制化增强思路。聚焦于在基准自身风格占优的市场阶段,通过与之高度契合的因子与策略放大收益特征。例如,中证A50侧重质量、分红与估值;科创100侧重景气度与创新动能[31]。 * **量化主题指增**(如量化红利、量化成长):首先依据透明规则构建具备特定风格暴露的主题组合,然后在此基础上进行增强,并严格维护组合的风格纯度[31]。 * **核心能力支撑**: * **机器学习全流程应用**:涵盖信号预测、特征处理、市场状态识别与交易成本建模等多个环节[32]。 * **多策略融合与动态配置**:整合低相关性的多元收益来源[32]。 * **严格风控**:依托组合优化工具与风险模型,对跟踪误差、风格暴露、行业偏离及流动性实施多维度硬约束[32]。 2. **模型名称**:三维量化投资框架(朱晨歌)[53] **模型构建思路**:在指数增强产品中,构建“指数锚定+量化增强+基本面校准”的三维框架,将量化模型与基本面研究相结合[53]。 **模型具体构建过程**:该框架是一个投资方法论。 * **指数锚定**:以跟踪的基准指数(如中证A50)作为投资组合的基准和约束,控制跟踪误差[53]。 * **量化增强**:运用量化模型(如多因子模型)在全市场或指数成分股内进行选股和权重优化,以获取超越基准的超额收益[53]。 * **基本面校准**:结合对行业景气度、公司基本面的深入研究,对量化模型生成的信号或组合进行校验和调整,以提高策略的稳健性和逻辑有效性[53]。 量化因子与构建方式 1. **因子类别**:基本面因子[23] **因子的构建思路**:在监管政策压缩高频交易Alpha空间的背景下,转向挖掘中低频、基于公司基本面和内在价值的因子[23]。 **因子具体构建过程**:报告未提供具体的基本面因子公式,但指明了因子的逻辑方向。 * **质量因子**:用于超大盘蓝筹风格(如中证A50)的增强[31]。 * **分红因子**:用于超大盘蓝筹风格(如中证A50)的增强,也与监管提升上市公司分红比例的政策导向相符[23][31]。 * **估值因子**:用于超大盘蓝筹风格(如中证A50)的增强,侧重安全边际[31]。 * **景气度因子**:用于科技成长风格(如科创100)的增强[31]。 * **创新动能因子**:用于科技成长风格(如科创100)的增强[31]。 模型的回测效果 *注:报告主要展示了两只具体基金产品的业绩表现,可视为其背后量化模型或策略体系的部分产出结果。* 1. **永赢上证科创板100指数增强A (021278.OF)**,近1年年化收益率48.16%[35],近1年夏普比率1.56[36],近1年最大回撤-19.22%[36],年化波动率25.67%[36],近1年下行标准差20.78%[36] 2. **永赢中证A50指数增强A (022204.OF)**,近1年年化收益率19.99%[54],近1年夏普比率1.52[55],Sortino比率2.26[54],近1年最大回撤-11.01%[55],年化波动率11.92%[55],近1年下行标准差12.01%[55] 因子的回测效果 *报告未提供单独因子的测试结果取值。*
机器学习应用系列:强化学习驱动下的解耦时序对比选股模型
西南证券· 2025-12-25 11:40
量化模型与构建方式 1. 模型名称:DTLC_RL (解耦时序对比学习强化学习模型) **模型构建思路**:构建一个兼具深度学习非线性预测能力与良好可解释性的选股框架。通过特征空间解耦,分别构建面向市场系统风险(β空间)、个股特异特征(α空间)和个股基本面信息(θ空间)的编码器,并通过对比学习与正交约束提升各空间表征的区分度与互补性,最后引入强化学习近端策略优化(PPO)算法以实现自适应调整各空间权重进行动态融合[2][11][12]。 **模型具体构建过程**: 1. **多层次因子解耦与表征学习**:构建三个在数学上正交的潜在表征空间[11]。 * **Beta空间(市场系统风险)**:使用时间卷积网络(TCN)作为编码器,输入为5个市场相关特征的60个交易日时序数据[67][68]。TCN采用因果卷积和扩张卷积来捕捉时序依赖关系[13][17][19]。因果卷积确保输出只依赖于当前及历史输入,其约束为: $$y_{t}=f(x_{t},x_{t-1},\dots,x_{t-k+1})$$ 其中$y_t$为t时刻输出,$x_{t-j}$为历史输入,$k$为卷积核大小[17]。扩张因果卷积操作定义为: $$H_{l}=\mathrm{ReLU}\left(\mathrm{BatchNorm}\left(\mathrm{CausalConv1d}(X_{l},k,d_{l})\right)\right)$$ 完整残差块为: $$B l o c k(X)=A c t i v a t i o n\left(X+F(X)\right)$$ $$F(X)=W_{2}*\sigma(W_{1}*X)$$ * **Alpha空间(个股特异特征)**:使用多尺度Transformer模型作为编码器,输入为13个日频量价时序特征[76][77]。模型区分20日、40日、60日三个尺度,分别用Transformer层编码后进行上采样和门控融合[78][80]。Transformer核心的自注意力机制计算如下: $$Q\;=\;X W_{Q}\;,\;\;K\;=\;X W_{K}\;,\;\;V\;=\;X W_{V}\;,$$ $$Z=A t t e n t i o n(Q,K,V)=s o f t m a x\left({\frac{Q K^{T}}{\sqrt{d_{k}}}}\right)V$$ 多头注意力机制为: $$M u l t i h e a d\left(Q\ ,\ K\ ,\ V\right)=C o n c a t\left(h e a d_{1}\ ,\ \ldots\ \ ,\ h e a d_{h}\right)W_{o}$$ * **Theta空间(个股基本面信息)**:使用门控残差多层感知机(GRN)作为编码器,输入为8个核心财务指标[88][92]。GRN包含特征变换、门控机制和残差连接[38][39][43][45]。其计算过程包括: $$\tilde{x}=\;W_{1}x\;+\;b_{1}$$ $$s\;=\;E L U(W_{2}\tilde{x}+\;b_{2})$$ $$g\;=\;\sigma\bigl(W_{g}\,x\;+\;b_{g}\bigr)$$ $$\tilde{x}=s\odot g\,+\,x$$ 最终输出为层归一化结果:$G R N\left(x\right)=\ L a y e r N o r m\left({\tilde{x}}\right)$[47]。 2. **对比学习增强表征稳健性**:在每个子空间内部引入对比学习机制,通过构建基于未来收益率相似性的正负样本对,驱使编码器学习到的表征能够拉近同类样本、推远异类样本[12][52]。使用InfoNCE损失函数: $$L_{\mathrm{InfotNCE}}=-E\left[l o g~\frac{e x p\left(f(x)^{\top}f(x^{+})/\tau\right)}{e x p\left(f(x)^{\top}f(x^{+})/\tau\right)+\sum_{i=1}^{N-1}~e x p\left(f(x)^{\top}f(x_{i}^{-})/\tau\right)}\right]$$ 其中相似度计算采用余弦相似度:$\sin(\mathbf{u},\mathbf{v})={\frac{\mathbf{u}^{\mathrm{{T}}}\mathbf{v}}{|\mathbf{u}||\mathbf{v}|}}$[55]。正样本为未来20日收益率相关系数大于80%的样本,负样本为相关系数小于0%的样本[104]。 3. **正交约束保障因子独立性**:设置正交化损失函数,强制要求三个子空间输出的表征向量在统计上接近相互独立,缓解多重共线性问题[12]。损失函数为三空间输出编码信息的协方差矩阵非对角线元素平方和[104]。 4. **强化学习驱动空间融合**:在三个编码器后引入强化学习动态复权的空间融合机制[116]。将三个子空间编码与市场环境特征拼接成状态$s_t$,输入策略网络(Actor)生成三维空间权重[120]。策略网络采用PPO算法进行优化,其目标是最大化期望累积回报: $$J(\theta)=E_{\tau^{-\pi_{\theta}}}[R(\tau)]=E_{\tau^{-\pi_{\theta}}}\left[\sum_{t=0}^{T}\gamma^{t}r_{t}\right]$$ PPO通过裁剪目标函数稳定策略更新: $$\mathrm{CLIP}\left(\theta\right)=E_{t}\left[mi\ n(r_{t}\left(\theta\right)\overline{A_{t}},\mathrm{clip}(r_{t}\left(\theta\right),1-\epsilon,1+\epsilon)\overline{A_{t}}\right]$$ 其中$r_t(\theta)$为新旧策略概率比:$r_{t}\left(\theta\right)=\frac{\pi_{\theta}\left(a_{t}\left|s_{t}\right.\right)}{\pi_{\theta_{\mathrm{old}}}\left(a_{t}\left|s_{t}\right.\right)}$[61][63]。优势函数$\hat{A_t}$通过广义优势估计(GAE)计算: $$A_{t}^{\widehat{\mathrm{GAE}\,(\gamma,\lambda)}}=\sum_{l=0}^{\infty}(\gamma\lambda)^{l}\delta_{t+l}$$ $$\delta_{t}=r_{t}+\gamma V(s_{t+1})-V(s_{t})$$ $$\widehat{A_{t}}=\delta_{t}+\gamma\lambda\widehat{A_{t+1}}$$ 奖励函数$r_t$由预测收益与实际收益的相关系数奖励$R_t^{IC}$、权重稳定性奖励$R_t^{stable}$和权重分散性奖励$R_t^{div}$组成: $$r_{t}=R_{t}^{I C}\big(\widehat{y_{t}},y_{y}\big)+\lambda_{s}R_{t}^{s t a b l e}+\lambda_{d}R_{t}^{d i v}$$ 加权融合后的特征通过预测头网络输出个股未来收益率预测$\hat{y_t}$[120][121]。 **模型评价**:该模型为深度学习在量化选股中的应用提供了一条兼具“非线性能力”与“可解释性”的路径[159]。 2. 模型名称:DTLC_Linear (线性融合模型) **模型构建思路**:作为强化学习融合版本的基准模型,将三个空间的编码信息进行合并,并通过单层线性层进行处理并接入预测头进行收益率预测[2][98]。 **模型具体构建过程**:将Beta、Alpha、Theta三个空间经过对比学习优化后的高维编码直接进行拼接,输入一个包含线性层和Softmax激活的轻量网络,动态生成空间权重,进而对编码进行加权融合,最终通过预测头输出收益率预测[98]。训练过程采用以信息系数(IC)最大化为核心目标的多任务损失函数,并同样引入了对比学习损失和正交约束损失[98][102]。 **模型评价**:为科学评估强化学习融合机制的实际贡献提供了可对比的基准[98]。 3. 模型名称:DTLC_Equal (等权融合模型) **模型构建思路**:作为简单的融合对照组,直接对三个空间独立训练出的因子进行等权求和[2][98]。 **模型具体构建过程**:分别训练Beta_TCN、Alpha_Transformer、Theta-ResMLP三个因子,然后将每个因子的值进行等权相加,得到最终的合成因子[98][103]。 4. 因子名称:Beta_TCN **因子构建思路**:捕捉市场系统性风险,量化个股对市场风险因素的不同敏感度[67]。 **因子具体构建过程**:选取5个市场相关特征:收益率暴露(beta_mkt)、波动率敏感度(beta_vol)、流动性beta(beta_liq)、大小盘暴露(beta_size)、市场情绪敏感度(beta_sent)[67][72]。将这5个特征的60个交易日时序数据输入TCN编码器(结构如DTLC_RL模型中的Beta空间编码器),输出一个32维向量作为Beta空间编码,并进一步通过预测头输出收益率预测,形成因子[68][73]。 **因子评价**:可以挖掘出个股暴露在beta中的相关信息,具备一定的选股效果[73]。 5. 因子名称:Alpha_Transformer **因子构建思路**:挖掘个股特异性信息(Alpha)[76][81]。 **因子具体构建过程**:选取13个日频量价时序特征,如量价背离度(pvo)、压力支撑效率(sse)、波动率偏度(skew)等[77]。将这些特征的时序数据输入多尺度Transformer编码器(结构如DTLC_RL模型中的Alpha空间编码器),输出收益率预测,形成因子[78][80]。 **因子评价**:可以学习到一定程度的个股特异性信息,且与beta空间编码器学习的信息重合度相对适中[82]。 6. 因子名称:Theta-ResMLP **因子构建思路**:系统性地挖掘个股的财务安全边际与抗风险能力,基于价值投资理论中的安全边际原则[88][95]。 **因子具体构建过程**:选取8个核心财务指标特征:市盈率(pe)、市净率(pb)、ROE均值比标准差(roemeantostd)、股息率(dividendyield)、ROE环比(roemom)、EPS同比(epsyoy)、营业利润率(operatingprofit)、ROIC(roic)[88]。将这些截面特征输入门控残差MLP编码器(结构如DTLC_RL模型中的Theta空间编码器),输出收益率预测,形成因子[92][94]。 **因子评价**:可以学习到一定程度的个股基本面信息,且与beta、alpha空间编码器学习的信息重合度较低,边际信息提供量较大[96]。 模型的回测效果 (回测区间:2019年1月至2025年11月,全A范围,Top10%多头组合) 1. **DTLC_RL模型**,IC: 0.1250,ICIR: 4.38,年化收益率: 34.77%,年化波动率: 25.41%,信息比率: 1.37,最大回撤率: 40.65%,单边月均换手率: 0.71X[122][123]。 2. **DTLC_Linear模型**,IC: 0.1239,ICIR: 4.25,年化收益率: 32.95%,年化波动率: 24.39%,信息比率: 1.35,最大回撤率: 35.94%,单边月均换手率: 0.76[103][105]。 3. **DTLC_Equal模型**,IC: 0.1202,ICIR: 4.06,年化收益率: 32.46%,年化波动率: 25.29%,信息比率: 1.28,最大回撤率: 40.65%,单边月均换手率: 0.71[103][105]。 因子的回测效果 (回测区间:2019年1月至2025年11月,全A范围,Top10%多头组合) 1. **Beta_TCN因子**,IC: 0.0969,ICIR: 3.73,年化收益率: 27.73%,年化波动率: 27.19%,信息比率: 1.02,最大回撤率: 45.80%,单边月均换手率: 0.79X[2][73]。 2. **Alpha_Transformer因子**,IC: 0.1137,ICIR: 4.19,年化收益率: 32.66%,年化波动率: 23.04%,信息比率: 1.42,最大回撤率: 27.59%,单边月均换手率: 0.83X[2][80][81]。 3. **Theta-ResMLP因子**,IC: 0.0485,ICIR: 1.87,年化收益率: 23.88%,年化波动率: 23.96%,信息比率: 0.99,最大回撤率: 37.41%,单边月均换手率: 0.41X[2][94][95]。
A股市场快照:宽基指数每日投资动态-20251225
江海证券· 2025-12-25 07:07
量化模型与因子总结 量化模型与构建方式 本报告为市场数据跟踪报告,未涉及具体的量化选股或预测模型,因此无量化模型部分。 量化因子与构建方式 报告在跟踪分析中计算并使用了多个市场指标,这些指标可作为量化因子或用于构建因子。具体如下: 1. **因子名称:风险溢价** * **因子构建思路:** 以十年期国债即期收益率为无风险利率参考,计算各宽基指数相对于无风险利率的风险溢价,用于衡量其相对投资价值和偏离情况[27]。 * **因子具体构建过程:** 风险溢价的计算公式为宽基指数的收益率减去十年期国债即期收益率。报告中的“当前风险溢价”应为指数近期收益率(如日度或滚动收益率)与当前十年期国债即期收益率的差值[31]。具体公式可表示为: $$风险溢价 = R_{index} - R_{f}$$ 其中,$R_{index}$ 代表宽基指数的收益率,$R_{f}$ 代表十年期国债即期收益率。 2. **因子名称:股债性价比** * **因子构建思路:** 以各指数市盈率(PE-TTM)的倒数代表股票的潜在收益率,计算其与十年期国债即期收益率之差,作为衡量股票与债券相对吸引力的指标[46]。 * **因子具体构建过程:** 股债性价比的计算公式为指数市盈率(PE-TTM)的倒数减去十年期国债即期收益率[46]。具体公式可表示为: $$股债性价比 = \frac{1}{PE_{TTM}} - R_{f}$$ 其中,$PE_{TTM}$ 代表指数滚动市盈率,$R_{f}$ 代表十年期国债即期收益率。 3. **因子名称:股息率** * **因子构建思路:** 跟踪各指数的股息率,反映现金分红回报率,是红利投资风格的重要观察指标[48]。 * **因子具体构建过程:** 股息率通常计算为成分股过去12个月现金分红总额除以指数的总市值。报告中的“当前值”即为该计算结果[53]。 4. **因子名称:破净率** * **因子构建思路:** 计算指数中市净率小于1的个股占比,反映市场整体的估值态度和悲观程度[54][56]。 * **因子具体构建过程:** 破净率计算公式为指数成分股中破净(市净率PB < 1)的个股数量除以指数成分股总数量[57]。具体公式可表示为: $$破净率 = \frac{Count(PB_i < 1)}{N}$$ 其中,$PB_i$ 代表成分股i的市净率,$N$ 代表指数成分股总数。 5. **因子名称:指数换手率** * **因子构建思路:** 衡量指数的整体交易活跃度[17]。 * **因子具体构建过程:** 报告采用流通市值加权的方式计算指数换手率,公式为各成分股换手率按其流通股本加权的平均值[17]。具体公式为: $$指数换手率 = \frac{\sum (成分股流通股本 \times 成分股换手率)}{\sum (成分股流通股本)}$$ 6. **因子名称:收益分布形态指标(偏度与峰度)** * **因子构建思路:** 通过计算指数日收益率序列的偏度和峰度,分析其收益分布的特征和形态变化[23][25]。 * **因子具体构建过程:** * **偏度:** 衡量收益率分布的不对称性。正偏态表示极端正收益情形增加[23]。报告计算了当前偏度并与近5年历史偏度进行比较[25]。 * **峰度:** 衡量收益率分布的尖锐或平坦程度。报告中的峰度计算减去了3(正态分布的峰度值),因此“峰度负偏离”表示当前分布比历史分布更平坦[25]。峰度越大,说明收益率分布更集中[23]。 因子的回测效果 报告未提供基于历史数据的因子分层测试、多空组合收益等传统因子回测结果,而是展示了各因子在特定截止日(2025年12月24日)的截面取值或状态。各宽基指数在不同因子下的具体数值如下: 1. **风险溢价因子**[31] * 上证50:-0.08% * 沪深300:0.28% * 中证500:1.30% * 中证1000:1.53% * 中证2000:1.55% * 中证全指:0.89% * 创业板指:0.76% 2. **PE-TTM分位值因子(近5年)**[42][43] * 上证50:84.05% * 沪深300:85.62% * 中证500:96.94% * 中证1000:94.63% * 中证2000:84.30% * 中证全指:94.46% * 创业板指:59.17% 3. **股息率因子**[53] * 上证50:3.13% * 沪深300:2.73% * 中证500:1.41% * 中证1000:1.11% * 中证2000:0.77% * 中证全指:2.02% * 创业板指:0.96% 4. **破净率因子**[3][57] * 上证50:22.0% * 沪深300:16.0% * 中证500:10.8% * 中证1000:8.0% * 中证2000:3.25% * 中证全指:6.14% * 创业板指:未提供 5. **指数换手率因子**[2][17] * 上证50:0.19 * 沪深300:0.47 * 中证500:1.51 * 中证1000:2.2 * 中证2000:3.7 * 中证全指:1.55 * 创业板指:2.18 6. **收益分布峰度偏离因子(当前 vs. 近5年)**[25] * 上证50:-2.10 * 沪深300:-1.84 * 中证500:-2.28 * 中证1000:-1.35 * 中证2000:-1.44 * 中证全指:-1.87 * 创业板指:-2.63 7. **收益分布偏度偏离因子(当前 vs. 近5年)**[25] * 上证50:-0.58 * 沪深300:-0.46 * 中证500:-0.58 * 中证1000:-0.35 * 中证2000:-0.34 * 中证全指:-0.46 * 创业板指:-0.65
金工ETF点评:宽基ETF单日净流入51.19亿元,家电、环保拥挤变幅较大
太平洋证券· 2025-12-24 15:29
量化模型与构建方式 1. **模型名称:行业拥挤度监测模型**[3] * **模型构建思路**:通过构建一个量化模型,对申万一级行业指数的拥挤度进行每日监测,以识别市场过热或过冷的行业[3]。 * **模型具体构建过程**:报告未详细说明该模型的具体构建步骤、所使用的因子或计算公式。 2. **模型名称:溢价率 Z-score 模型**[4] * **模型构建思路**:通过计算ETF溢价率的Z-score值,搭建ETF产品筛选信号模型,以识别存在潜在套利机会的标的[4]。 * **模型具体构建过程**:报告未详细说明该模型的具体构建步骤和计算公式,仅提及核心思想是计算溢价率的Z-score。 量化因子与构建方式 1. **因子名称:行业拥挤度**[3] * **因子构建思路**:用于衡量某个行业交易过热或过冷的程度,数值越高可能表明该行业交易越拥挤[3]。 * **因子具体构建过程**:报告未详细说明该因子的具体计算方法和构成指标。 2. **因子名称:溢价率 Z-score**[4] * **因子构建思路**:基于ETF的IOPV溢价率,通过标准化处理(计算Z-score)来度量当前溢价率在历史序列中的相对位置,用于发现异常溢价[4]。 * **因子具体构建过程**:报告未给出具体的计算公式。通常,Z-score的计算公式为: $$Z = \frac{X - \mu}{\sigma}$$ 其中,$X$代表当前交易日的ETF溢价率,$\mu$代表滚动窗口期内的历史溢价率均值,$\sigma$代表滚动窗口期内的历史溢价率标准差。 模型的回测效果 (报告未提供相关量化模型的回测效果指标数据) 因子的回测效果 (报告未提供相关量化因子的回测效果指标数据)
金融工程日报:指震荡攀升录得六连阳,商业航天概念再度爆发-20251224
国信证券· 2025-12-24 15:25
量化模型与因子总结 量化因子与构建方式 1. **因子名称:封板率** [16] * **因子构建思路**:通过计算当日最高价触及涨停且收盘价维持涨停的股票比例,来衡量市场涨停股的封板强度与资金追涨意愿。[16] * **因子具体构建过程**: 1. 选定股票池:上市满3个月以上的股票。[16] 2. 识别股票:找出当日盘中最高价达到涨停价的股票。[16] 3. 进一步筛选:从步骤2的股票中,找出当日收盘价也维持在涨停价的股票。[16] 4. 计算因子值:将步骤3的股票数量除以步骤2的股票数量,得到封板率。[16] * **公式**: $$封板率 = \frac{最高价涨停且收盘涨停的股票数}{最高价涨停的股票数}$$ [16] 2. **因子名称:连板率** [16] * **因子构建思路**:通过计算连续两日收盘涨停的股票占昨日所有涨停股票的比例,来衡量市场涨停效应的持续性及短线炒作热度。[16] * **因子具体构建过程**: 1. 选定股票池:上市满3个月以上的股票。[16] 2. 识别基准股票:找出前一交易日(昨日)收盘涨停的股票。[16] 3. 筛选连板股票:从步骤2的股票中,找出在当日(今日)收盘也维持涨停的股票。[16] 4. 计算因子值:将步骤3的股票数量除以步骤2的股票数量,得到连板率。[16] * **公式**: $$连板率 = \frac{连续两日收盘涨停的股票数}{昨日收盘涨停的股票数}$$ [16] 3. **因子名称:大宗交易折价率** [25] * **因子构建思路**:通过计算大宗交易成交总额相对于其对应股份当日市值的折价幅度,来反映大资金交易的流动性折价或特定偏好,可作为市场情绪或资金面压力的观测指标。[25] * **因子具体构建过程**: 1. 数据获取:获取当日所有大宗交易的成交金额及对应的成交股份数量。[25] 2. 计算理论市值:用当日该股票的收盘价乘以大宗交易的成交股份数量,得到该笔交易对应股份的当日总市值。对所有大宗交易重复此步骤并求和,得到“当日成交份额的总市值”。[25] 3. 计算因子值:将当日大宗交易总成交金额除以“当日成交份额的总市值”,然后减去1,得到整体折价率。[25] * **公式**: $$折价率 = \frac{大宗交易总成交金额}{当日成交份额的总市值} - 1$$ [25] 4. **因子名称:股指期货年化贴水率** [27] * **因子构建思路**:将股指期货价格与现货指数价格之间的基差进行年化处理,以标准化衡量股指期货的升贴水程度,用于反映市场对未来走势的预期、对冲成本以及市场情绪。[27] * **因子具体构建过程**: 1. 计算基差:基差 = 股指期货价格 - 现货指数价格。[27] 2. 计算年化因子:将基差除以现货指数价格,再乘以(250天除以合约剩余交易日数),得到年化贴水率。结果为正值表示升水,负值表示贴水。[27] * **公式**: $$年化贴水率 = \frac{基差}{指数价格} \times \frac{250}{合约剩余交易日数}$$ [27] 因子的回测效果 *本报告为市场监测日报,主要展示因子的构建方法和当日市场数据,未提供基于历史数据的因子回测绩效指标(如IC、IR、多空收益、夏普比率等)。* [1][2][3][4][5][6][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39]
股指分红点位监控周报:股指期货主力合约贴水幅度收窄-20251224
国信证券· 2025-12-24 15:25
量化模型与构建方式 1. **模型名称:股指分红点位测算模型**[11][41] * **模型构建思路**:为准确计算股指期货的升贴水,需要预测从当前时刻到期货合约到期日之间,指数成分股分红除息导致价格指数点位自然下滑的总点数[11][41]。该模型通过对成分股权重、分红金额、除息日等核心要素进行精细化预测来实现[11][42]。 * **模型具体构建过程**: 1. **核心公式**:假设当前日期为t,期货合约到期日为T,指数有N个成分股。第n个成分股的除权除息日为τ_n (t < τ_n ≤ T),则期间的分红点数计算公式为: $$分红点数 = \sum_{n=1}^{N} \frac{成分股分红金额}{成分股总市值} \times 成分股权重 \times 指数收盘价$$[41] 2. **数据处理流程**:首先获取指数成分股及其日度权重[46]。然后对每只成分股进行判断与预测[42]: * 若公司已公布分红金额,则直接采用;若同时公布除息日,则直接采用,否则预测除息日[42]。 * 若公司未公布分红金额,则需预测。分红金额 = 净利润 × 股息支付率[47]。对净利润的预测采用“基于历史净利润分布的动态预测法”:根据公司季度盈利分布稳定性分类,对稳定公司按历史规律预测,对不稳定公司使用上年同期值[50]。对股息支付率的预测规则为:若去年分红则用去年支付率;若去年不分红则用最近3年平均;若从未分红则默认不分红;预测值大于100%时进行截尾处理[53]。 * 对除息日的预测采用“基于历史间隔天数稳定性的线性外推法”:若已公布则直接采用;若未公布,则根据公司是否已公布预案、所处阶段(预案或决案),判断历史从公告日到除息日的间隔天数是否稳定,若稳定则用该平均间隔天数进行线性外推,若不稳定则参考去年或前年的历史分红日期;若无合理历史日期参考,则根据预测时间点设置默认日期(如7月31日、8月31日或9月30日)[56]。 * **模型评价**:模型对于上证50指数和沪深300指数全年的预测准确度较高,对于中证500指数的预测误差稍大但基本稳定[61]。在股指期货预测上,对三类合约都具有较好的预测准确性,其中上证50和沪深300股指期货的预测效果最好,中证500股指期货的偏离度稍大[61]。 量化因子与构建方式 1. **因子名称:已实现股息率**[16] * **因子构建思路**:计算指数成分股中,在当年已经完成现金分红的公司,其分红金额相对于其市值的比率,并按权重加总,用以衡量指数已兑现的分红收益[16]。 * **因子具体构建过程**:设指数成分股中今年已现金分红的公司数量为N1。对于其中第i家公司,其已分红金额为Div_i,总市值为Cap_i,在指数中的权重为w_i。则指数的全年已实现股息率计算公式为: $$全年已实现股息率 = \sum_{i=1}^{N1} \frac{Div_i}{Cap_i} \times w_i$$[16] 2. **因子名称:剩余股息率**[16] * **因子构建思路**:计算指数成分股中,在当年尚未进行现金分红的公司,其预测分红金额相对于其市值的比率,并按权重加总,用以衡量指数未来潜在的分红收益[16]。 * **因子具体构建过程**:设指数成分股中今年尚未现金分红的公司数量为N2。对于其中第j家公司,其预测分红金额为EstDiv_j,总市值为Cap_j,在指数中的权重为w_j。则指数的剩余股息率计算公式为: $$剩余股息率 = \sum_{j=1}^{N2} \frac{EstDiv_j}{Cap_j} \times w_j$$[16] 3. **因子名称:年化升贴水率**[12] * **因子构建思路**:计算股指期货合约价格相对于其标的指数价格(已考虑分红影响)的偏离程度,并进行年化处理,以衡量期货合约的交易情绪和定价水平[11][12]。 * **因子具体构建过程**: 1. 首先计算“含分红价差”:合约收盘价 - (指数收盘价 - 预测的从当前日次日到合约到期日的总分红点数)[12]。 2. 计算升贴水幅度:含分红价差 / 指数收盘价[12]。 3. 进行年化:年化升贴水 = 升贴水幅度 × (365 / 合约到期天数)[12]。 模型的回测效果 *注:报告未提供该分红点位测算模型在回测期间的统一量化指标(如年化收益率、夏普比率、最大回撤等)。报告主要通过图表展示了预测值与实际值的偏差来评估准确性[61]。* 因子的回测效果 *注:报告未提供上述股息率因子及年化升贴水因子在选股或定价模型中的历史回测表现指标(如IC值、IR、多空收益等)。报告主要展示了截至报告日的截面数据或近期时序走势[3][4][12]。* 1. **已实现股息率因子,截至2025年12月24日取值**:上证50指数为2.70%,沪深300指数为2.19%,中证500指数为1.23%,中证1000指数为0.97%[3][16]。 2. **剩余股息率因子,截至2025年12月24日取值**:上证50指数为0.15%,沪深300指数为0.08%,中证500指数为0.02%,中证1000指数为0.01%[3][16]。 3. **年化升贴水率因子,截至2025年12月24日取值(主力合约)**:IH为2.65%(升水),IF为-4.05%(贴水),IC为-5.50%(贴水),IM为-8.67%(贴水)[4][12]。