Workflow
量化研究系列报告之二十三:让情绪“有结构”:大模型如何挖掘研报新价值
华安证券· 2025-08-11 14:58
量化模型与构建方式 1. **模型名称**:DeepSeek-V3-671B - **模型构建思路**:依托DeepSeek大模型实现研报摘要的结构化情感分析,从黑箱评分转向可解释的评分体系,通过拆解摘要结构(业务发展、财务表现、其他因素)引入四维量化分析(类别识别、情绪倾向、出现顺序、字数占比)[4][5] - **模型具体构建过程**: 1. **输入处理**:清洗研报摘要文本,剔除盈利预测和风险提示部分[22] 2. **分类规则**:预定义10类研报要素(如战略布局、技术创新等),要求模型严格遵循类别、情绪(1/-1/0)、出现顺序、字数占比四要素输出JSON格式结果[45][46] 3. **权重分配**:跨类别文本按优先级拆分(公司行为>外部因素>财务表现),字数占比计算公式为: $$ \text{字数占比} = \frac{\text{类别字数}}{\text{摘要总字数}} $$ [47] 4. **批量调用**:支持15条摘要批量处理,输入格式为system提示+user摘要内容[65] - **模型评价**:输出格式符合率100%,结果稳定性优于R1版本,支持高效批量任务[63][65] 2. **模型名称**:研报情绪密度策略模型 - **模型构建思路**:基于情绪密度(利好字数占比)构建选股策略,重点捕捉"业绩超预期"和"盈利改善"等有效信号[5][6] - **模型具体构建过程**: 1. **信号提取**:计算每篇研报中各类别的利好密度(如盈利改善密度=正面情绪字数/总字数)[5] 2. **组合构建**:按月频或不定期调仓,选取利好密度最高的股票构建多头组合[26][27] 3. **非线性优化**:引入指数衰减加权调整近期研报权重[40] --- 量化因子与构建方式 1. **因子名称**:简单加权评分因子(score_sum) - **构建思路**:对研报中所有利好类别进行等权加总[6] - **具体构建过程**: 1. 单篇研报评分公式: $$ \text{score\_sum} = \sum_{i=1}^{n} (\text{情绪值}_i \times \text{字数占比}_i) $$ 2. 个股评分=近期所有相关研报评分的均值[35] 2. **因子名称**:篇幅加权评分因子(score_by_len) - **构建思路**:按类别字数占比加权情绪值,反映信息篇幅权重[6] - **具体构建过程**: $$ \text{score\_by\_len} = \sum_{i=1}^{n} \left( \text{情绪值}_i \times \frac{\text{类别字数}_i}{\sum \text{类别字数}} \right) $$ [36] 3. **因子名称**:类别重要性加权因子(score_by_cat) - **构建思路**:根据类别对股价的解释力(通过历史CAR回归确定)分配权重[37] - **具体构建过程**: 1. 计算每类情绪对20日累计超额收益(CAR)的回归系数[38] 2. 权重公式: $$ w_i = \frac{|\beta_i|}{\sum |\beta|} $$ 3. 加权评分: $$ \text{score\_by\_cat} = \sum_{i=1}^{n} (w_i \times \text{情绪值}_i) $$ 4. **因子名称**:复合因子(score_report_llm) - **构建思路**:等权合成上述四类因子,兼顾多样性与稳定性[6] - **具体构建过程**: $$ \text{score\_report\_llm} = \frac{1}{4} (\text{score\_sum} + \text{score\_by\_len} + \text{score\_by\_cat} + \text{score\_by\_LenCat}) $$ --- 模型回测效果 1. **复合因子(score_report_llm)**: - 年化收益12.8%,相对中证800超额13.5%[6] - 月胜率100%(2025年1-5月),最大回撤<4%[6] - 五分位收益单调性显著[47] 2. **情绪密度策略**: - 盈利改善密度组合年化超额18.7%(月频调仓)[26] - 业绩超预期密度组合年化超额21.3%(不定期调仓)[29] --- 因子回测效果 1. **score_sum因子**: - IC均值0.082,IR 1.52[35] - 多头组合年化超额9.4%[43] 2. **score_by_len因子**: - IC均值0.096,IR 1.78[36] - 多头组合年化超额11.2%[44] 3. **score_by_cat因子**: - IC均值0.105,IR 1.91[38] - 多头组合年化超额12.0%[45] 4. **score_by_LenCat因子**: - IC均值0.112,IR 2.03[39] - 多头组合年化超额13.1%[46] (注:所有测试窗口均为报告发布后20-40日,基准为中证800)[6][35]
港股通大消费择时跟踪:8月推荐再次抬升港股通大消费仓位
国金证券· 2025-08-11 14:46
量化模型与构建方式 1. 模型名称:基于动态宏观事件因子的中证港股通大消费指数择时策略 模型构建思路:通过经济、通胀、货币和信用四维度的20余个宏观数据指标构建事件因子,筛选出对指数择时效果较好的5个宏观因子,根据因子信号确定仓位[4][21] 模型具体构建过程: - 宏观数据预处理: - 对齐数据频率至月频 - 缺失值填充公式:$$X_{t}=X_{t-1}+Median_{diff12}$$[28] - 滤波处理使用单向HP滤波公式:$${\hat{t}}_{t|t,\lambda}=\sum\nolimits_{s=1}^{t}\omega_{t|t,s,\lambda}\cdot y_{s}=W_{t|t,\lambda}(L)\cdot y_{t}$$[29] - 衍生数据结构(同比/环比/移动平均)[30] - 事件因子构建: - 确定突破方向(与收益率相关性)[31] - 确定领先滞后性(测试0-4期)[31] - 生成三类事件因子(突破均线/中位数/同向变化)[31][33] - 筛选标准:t检验显著、收益率胜率>55%、发生次数>窗口期/6[33] - 因子叠加优化(相关系数<0.85)[34] - 动态确定最优滚动窗口(48-96个月)[34] - 仓位确定规则: - 看多信号>2/3则仓位100% - 看多信号<1/3则仓位0% - 中间比例则按比例确定仓位[36] 模型评价:在基准回撤阶段能有效控制下行风险,多数年份取得正超额收益[12] 量化因子与构建方式 1. 因子名称:PMI原材料价格因子 因子构建思路:使用原始PMI原材料价格数据,构建突破类事件因子[36] 因子具体构建过程: - 数据处理:原始数据直接使用 - 滚动窗口:96个月 - 事件类型:突破均线/中位数/同向变化[33] 2. 因子名称:中美国债利差10Y因子 因子构建思路:利用中美10年期国债利差原始数据构建事件因子[36] 因子具体构建过程: - 数据处理:原始数据直接使用 - 滚动窗口:72个月 3. 因子名称:金融机构中长期贷款余额因子 因子构建思路:基于12个月滚动求和同比数据构建信用类事件因子[36] 因子具体构建过程: - 数据处理:原始数据直接使用 - 滚动窗口:48个月 4. 因子名称:M1同比因子 因子构建思路:利用货币供应量M1同比数据构建货币类事件因子[36] 因子具体构建过程: - 数据处理:原始数据直接使用 - 滚动窗口:48个月 5. 因子名称:新增社融滚动求和同比因子 因子构建思路:基于12个月滚动求和同比数据构建信用类事件因子[36] 因子具体构建过程: - 数据处理:原始数据直接使用 - 滚动窗口:96个月 模型的回测效果 1. 基于动态宏观事件因子的择时策略(2018/11-2025/7): - 年化收益率:9.31% - 最大回撤:-29.72% - 夏普比率:0.54 - 收益回撤比:0.31[3][11] - 2025年7月收益率:2.79%(基准2.48%)[11] - 平均仓位:约43%[11] 2. 细分因子信号表现(2025年2-7月): - PMI原材料价格因子:连续6个月发出信号(5次看多)[14] - 新增社融因子:2025年6月看多信号[14] 因子的回测效果 1. 最终筛选的5个宏观因子(2014/11起测试): - PMI原材料价格因子:开仓波动调整收益率最优(96个月窗口)[36] - 中美国债利差10Y因子:开仓波动调整收益率次优(72个月窗口)[36] - 其他三个因子均通过55%胜率筛选标准[34]
“打新定期跟踪”系列之二百二十五:近期北交所待上市新股较多
华安证券· 2025-08-11 14:35
根据提供的研报内容,以下是关于量化模型和因子的总结: 量化模型与构建方式 1. **模型名称**:网下打新收益测算模型 **模型构建思路**:通过假设所有主板、科创板、创业板的股票都打中,并在上市首日以市场均价卖出,忽略锁定期的卖出限制,来测算不同规模账户的打新收益率[2] **模型具体构建过程**: - 计算满中数量: $$可申购上限额度 \times 网下类平均中签率$$ - 计算满中收益: $$(首次开板价 - 首发价格) \times 满中数量$$ **模型评价**:该模型简单直观,能够快速估算不同规模账户的打新收益,但忽略了锁定期和市场波动的影响[2] 2. **模型名称**:逐月打新收益模型 **模型构建思路**:通过将每个月网下打新可获得的收益相加,测算理想情况下逐月打新收益和打新收益率[47] **模型具体构建过程**: - 假设所有股票报价均入围 - 在90%的资金使用效率下,计算不同规模账户的逐月打新收益 - 以新股卖出日为统计时间,计算累计打新收益率[47] **模型评价**:该模型能够反映不同时间段内的打新收益变化,但依赖于假设条件,实际效果可能有所偏差[47] 模型的回测效果 1. **网下打新收益测算模型**: - A类2亿规模账户打新收益率:1.99%[2] - B类2亿规模账户打新收益率:1.79%[2] - A类10亿规模账户打新收益率:0.63%[2] - B类10亿规模账户打新收益率:0.57%[2] 2. **逐月打新收益模型**: - A类2亿规模账户2024年至今打新收益率:5.72%[47] - B类2亿规模账户2024年至今打新收益率:4.71%[52] - A类2亿规模账户2025年至今打新收益率:1.99%[47] - B类2亿规模账户2025年至今打新收益率:1.79%[52] 量化因子与构建方式 1. **因子名称**:有效报价账户数量因子 **因子构建思路**:通过统计近期新股的有效报价账户中位数,反映市场参与打新的热度[23] **因子具体构建过程**: - 统计科创板、创业板、主板新股A类和B类有效报价账户数量的中位数[23] **因子评价**:该因子能够反映市场对打新的参与程度,但受市场情绪影响较大[23] 2. **因子名称**:新股上市首日涨幅因子 **因子构建思路**:通过计算新股上市首日的平均涨幅,反映打新收益的短期表现[20] **因子具体构建过程**: - 统计近期20只新股上市首日的平均涨幅[20] **因子评价**:该因子能够反映打新的短期收益,但受市场波动影响较大[20] 因子的回测效果 1. **有效报价账户数量因子**: - 科创板A类有效报价账户数量中位数:3062[23] - 科创板B类有效报价账户数量中位数:1602[23] - 创业板A类有效报价账户数量中位数:3664[23] - 创业板B类有效报价账户数量中位数:2086[23] - 主板A类有效报价账户数量中位数:3866[23] - 主板B类有效报价账户数量中位数:2290[23] 2. **新股上市首日涨幅因子**: - 科创板个股上市首日平均涨幅:218.45%[20] - 创业板个股上市首日平均涨幅:221.02%[20]
宽基类指增产品规模持续上升,中证2000相关指增产品超额表现较强
长江证券· 2025-08-11 14:31
根据提供的研报内容,以下是量化模型与因子的总结: 量化模型与构建方式 1. **多因子策略模型** - 模型构建思路:通过结合基本面选股、量化模型、打新、衍生工具等多种增强手段,在控制跟踪误差的前提下获取超额收益[11] - 模型具体构建过程: 1. 大部分资产配置于标的指数成分股,确保基础收益与市场同步 2. 剩余部分通过以下方式优化组合: - 基本面选股:基于财务指标、估值等基本面数据筛选优质股票 - 量化模型:采用多因子模型,综合考量价值、成长、动量等因子 - 打新:参与新股申购获取收益 - 衍生工具:如股指期货等用于对冲或增强收益 - 模型评价:该模型风险收益特征介于被动指数基金与主动权益基金之间,适合追求市场平均收益基础上寻求增强的长期投资者[11] 量化因子与构建方式 (报告中未明确提及具体因子构建细节,故跳过该部分) 模型的回测效果 1. **中证2000指数增强基金** - 今年以来超额收益中位数:11.94%[31] - 年化跟踪误差中位数:5.72%[31] 2. **国证2000指数增强基金** - 今年以来超额收益中位数:8.23%[31] - 年化跟踪误差中位数:5.30%[31] 3. **中证1000指数增强基金** - 今年以来超额收益中位数:6.62%[31] - 年化跟踪误差中位数:5.04%[31] 4. **中证500指数增强基金** - 今年以来超额收益中位数:3.85%[31] - 年化跟踪误差中位数:4.95%[31] 5. **沪深300指数增强基金** - 今年以来超额收益中位数:2.79%[31] - 年化跟踪误差中位数:3.30%[31] 其他宽基指数增强基金表现 1. **创业板指增强基金** - 今年以来超额收益中位数:4.63%[31] - 年化跟踪误差中位数:4.97%[31] 2. **科创50增强基金** - 今年以来超额收益中位数:1.96%[31] - 年化跟踪误差中位数:4.29%[31] (注:报告中未提供多因子策略模型的具体回测指标,故未列出其IR等数据)
基金市场与ESG产品周报:周期主题基金表现占优,被动资金加仓金融地产、周期ETF-20250811
光大证券· 2025-08-11 14:27
根据提供的研报内容,以下是量化模型和因子的总结: 量化模型与构建方式 1. **主动偏股基金仓位高频估测模型** - 模型构建思路:通过基金每日披露的净值序列,利用带约束条件的多元回归模型,估算主动偏股基金的股票仓位变动趋势[61] - 模型具体构建过程: 1. 以基金净值序列为因变量 2. 选择基准或构建的资产序列作为自变量 3. 采用带约束的多元回归模型求解最优仓位估计 4. 构建各基金的模拟组合提升估算准确性 5. 测算行业配置动向[61] - 模型评价:能够相对高频跟踪仓位变化,但存在与实际仓位的偏差风险[61] 2. **REITs指数系列模型** - 模型构建思路:构建综合反映REITs市场表现的指数体系,包括底层资产和细分项目指数[49] - 模型具体构建过程: 1. 采用分级靠档方法保持份额稳定 2. 对非交易因素变动采用除数修正法保证连续性 3. 提供价格指数和全收益指数两种计算方式[49] - 模型评价:为REITs资产配置提供指数化投资工具,考虑高分红特性[49] 量化因子与构建方式 1. **行业主题基金标签因子** - 因子构建思路:通过基金持仓信息判断其长期行业主题特征[38] - 因子具体构建过程: 1. 分析近四期中报/年报持仓 2. 划分为行业主题、行业轮动和行业均衡三类 3. 构建对应主题基金指数[38] - 因子评价:能有效反映基金行业配置特征和轮动表现[38] 2. **ESG投资因子** - 因子构建思路:综合环境、社会和治理三方面因素筛选标的[72] - 因子具体构建过程: 1. ESG主题基金采用整合、负面/正面筛选策略 2. 泛ESG基金按主题细分(如低碳、乡村振兴等)[72] - 因子评价:覆盖不同责任投资维度,环境主题占主导[73] 模型的回测效果 1. **主动偏股基金仓位模型** - 本周仓位变动:+0.20pcts[61] - 行业配置:增配国防军工/机械设备/计算机,减持汽车/电子/美容护理[61] 2. **REITs指数模型** - REITs综合指数:本周-0.30%,年化波动11.01%[51] - 产权类指数:本周-0.54%,最大回撤-42.30%[51] - 特许经营权类指数:本周+0.05%,夏普比率-0.10[51] 因子的回测效果 1. **行业主题因子** - 周期主题:本周+4.42%,7月+4.65%[40] - 医药主题:本周-1.48%,7月+17.83%[40] 2. **ESG因子** - 主动权益型ESG基金:本周收益中位数1.65%[75] - 碳中和主题基金:本周最佳表现+8.42%[76] 注:所有数据截至2025年8月8日[1][2][3][4]
电子增强组合周度收益跑至主动型科技基金产品前列-20250811
长江证券· 2025-08-11 13:37
根据提供的研报内容,以下是量化模型与因子的总结: 量化模型与构建方式 1. **模型名称:电子均衡配置增强组合** - 模型构建思路:通过均衡配置电子行业内的个股,旨在跑赢电子行业指数[7][14] - 模型具体构建过程:未详细说明构建过程,但提到策略聚焦电子板块,通过月度调仓和财报数据筛选标的[14][37] - 模型评价:策略表现稳定,周度超额收益显著[7][31] 2. **模型名称:电子板块优选增强组合** - 模型构建思路:聚焦迈入成熟期的电子细分赛道龙头企业,优选高潜力标的[14] - 模型具体构建过程:未详细说明构建过程,但提到策略通过行业逻辑和量化筛选结合[14] - 模型评价:超额收益稳定,但受政策变化影响较大[37] 3. **模型名称:攻守兼备红利50组合** - 模型构建思路:结合“稳健+成长”风格,筛选央国企高分红标的[14] - 模型具体构建过程:未详细说明构建过程,但提到策略通过红利因子和成长性因子结合[14][21] - 模型评价:长期超额显著,但短期表现疲软[21] 4. **模型名称:央国企高分红30组合** - 模型构建思路:精选央国企高分红个股,强调分红稳定性[14] - 模型具体构建过程:未详细说明构建过程[14] - 模型评价:短期未能跑赢基准,长期需观察[15][21] 模型的回测效果 1. **电子均衡配置增强组合** - 周度超额收益:0.59%[7] - 科技基金分位:15%[7] 2. **电子板块优选增强组合** - 周度超额收益:0.47%[7] - 科技基金分位:17%[7] 3. **攻守兼备红利50组合** - 年初以来超额收益:2.93%(相对中证红利全收益)[21] - 红利基金分位:41%[21] 4. **央国企高分红30组合** - 周度收益:未跑赢中证红利全收益[15] 量化因子与构建方式 (报告中未提及具体因子构建细节,故跳过) 因子的回测效果 (报告中未提及因子测试结果,故跳过) --- 注:以上总结严格基于研报中明确提到的模型名称、构建逻辑及测试结果[7][14][15][21][31][37]
行业轮动周报:融资余额新高,创新药光通信调整,指数预期仍将震荡上行挑战前高-20250811
中邮证券· 2025-08-11 11:16
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称:扩散指数行业轮动模型** - **模型构建思路**:基于价格动量原理,通过行业扩散指数捕捉行业趋势,选择趋势向上的行业进行配置[27] - **模型具体构建过程**: 1. 计算各中信一级行业的扩散指数,反映行业价格趋势强度 2. 选择扩散指数排名靠前的行业作为配置标的 3. 每月进行轮动调仓,动态调整行业配置[27] - **模型评价**:在趋势行情中表现优异,但在市场反转时可能失效[27][37] 2. **模型名称:GRU因子行业轮动模型** - **模型构建思路**:基于GRU深度学习网络,利用分钟频量价数据生成行业因子,捕捉短期交易信号[33][38] - **模型具体构建过程**: 1. 使用GRU网络处理高频量价数据,提取行业特征 2. 生成GRU行业因子,反映行业短期动量 3. 选择因子排名靠前的行业进行配置,每周调仓[33][36] - **模型评价**:擅长把握短期交易机会,但长周期表现一般,极端行情下可能失效[33][38] 量化因子与构建方式 1. **因子名称:行业扩散指数** - **因子构建思路**:衡量行业价格趋势的强度,用于识别动量较强的行业[27][28] - **因子具体构建过程**: 1. 计算行业价格序列的扩散指标 2. 标准化处理得到扩散指数,范围在0到1之间 3. 指数越接近1,表示行业趋势越强[28][29] 2. **因子名称:GRU行业因子** - **因子构建思路**:通过GRU网络提取行业量价特征,生成因子得分[33][34] - **因子具体构建过程**: 1. 输入行业分钟频量价数据到GRU网络 2. 输出行业因子得分,正得分表示看涨,负得分表示看跌[34][36] 模型的回测效果 1. **扩散指数行业轮动模型** - 2025年以来超额收益:-0.41%[26][31] - 2024年超额收益:-5.82%[27] - 2023年超额收益:-4.58%[27] - 2022年超额收益:6.12%[27] 2. **GRU因子行业轮动模型** - 2025年以来超额收益:-4.35%[33][36] - 本周超额收益:0.65%[36] - 8月以来超额收益:0.32%[36] 因子的回测效果 1. **行业扩散指数** - 最新排名靠前的行业:综合金融(1.0)、钢铁(1.0)、建材(1.0)[28][29] - 环比提升较大的行业:煤炭(+0.683)、石油石化(+0.396)[29][30] 2. **GRU行业因子** - 最新排名靠前的行业:钢铁(2.82)、建材(1.72)、交通运输(1.3)[34][36] - 环比提升较大的行业:钢铁、建材、交通运输[34][36]
微盘股指数周报:大盘资金流出,中小盘资金回流-20250811
中邮证券· 2025-08-11 10:18
根据研报内容,以下是量化模型与因子的详细总结: --- 量化模型与构建方式 1. **扩散指数模型** - **模型构建思路**:通过监测微盘股成分股价格变动的扩散程度,判断市场趋势由头部股票驱动还是底部轮动[6][18] - **具体构建过程**: - 横轴为未来N天股价涨跌幅(1.1=涨10%,0.9=跌10%),纵轴为回顾窗口期T(T=20-N) - 扩散指数值计算示例:横轴0.95与纵轴15天值为0.51,表示若成分股均跌5%,扩散指数为0.51[18] - 当前扩散指数值为0.87(横轴20,纵轴1.0)[18] - **模型评价**:扩散指数下降反映趋势由头部股票驱动,反转因子近期表现较差[6][18] 2. **首次阈值法(左侧交易)** - 触发条件:扩散指数≤0.9850时发出空仓信号,2025年5月8日触发[6][18] 3. **延迟阈值法(右侧交易)** - 触发条件:扩散指数≤0.8975时发出空仓信号,2025年5月15日触发[6][18] 4. **双均线法(自适应交易)** - 触发条件:2025年8月4日收盘发出空仓信号[6][18] --- 量化因子与构建方式 1. **动量因子** - **构建思路**:捕捉股票价格延续趋势的能力 - **测试结果**:本周rankIC为0.224(历史平均-0.005)[5][16] 2. **贝塔因子** - **测试结果**:本周rankIC为0.146(历史平均0.006)[5][16] 3. **非流动性因子** - **测试结果**:本周rankIC为0.14(历史平均0.041)[5][16] 4. **成交额因子** - **测试结果**:本周rankIC为-0.172(历史平均-0.083)[5][16] 5. **小市值低波50策略** - **构建思路**:在微盘股成分股中筛选市值最小且波动率最低的50只股票,双周调仓 - **测试结果**:2025年YTD收益76.74%,本周超额-0.40%(基准万得微盘股指数)[8][16] --- 模型的回测效果 1. **扩散指数模型** - 当前扩散指数值:0.87[18] - 首次阈值法空仓信号触发日期:2025年5月8日[6][18] - 双均线法空仓信号触发日期:2025年8月4日[6][18] 2. **小市值低波50策略** - 2024年收益:7.07%(超额-2.93%)[8][16] - 2025年YTD收益:76.74%[8][16] --- 因子的回测效果 1. **动量因子** - 本周rankIC:0.224[5][16] - 历史平均rankIC:-0.005[5][16] 2. **贝塔因子** - 本周rankIC:0.146[5][16] - 历史平均rankIC:0.006[5][16] 3. **非流动性因子** - 本周rankIC:0.14[5][16] - 历史平均rankIC:0.041[5][16] 4. **成交额因子** - 本周rankIC:-0.172[5][16] - 历史平均rankIC:-0.083[5][16] --- 以上总结覆盖了研报中所有关键模型、因子及其测试结果,未包含风险提示等非核心内容。
金融工程研究报告:多元时序预测在行业轮动中的应用
浙商证券· 2025-08-11 10:16
量化模型与构建方式 1. **模型名称**:多元CNN-LSTM预测模型 - **模型构建思路**:结合卷积神经网络(CNN)和长短期记忆网络(LSTM)的优势,通过多元时间序列分析技术对并行金融时间序列(如行业指数)进行联合预测,考虑序列间的动态相关性[11][12] - **模型具体构建过程**: 1. **输入层**:对齐多个时间序列数据并按时间顺序排列[14] 2. **卷积层**:使用64个过滤器(卷积核大小=2)提取特征,激活函数为ReLU[20] 3. **池化层**:窗口大小为(2,2)[20] 4. **LSTM层**:两层隐含单元(各128个),处理时序依赖关系[20] 5. **全连接层**:输出预测值,损失函数为均方根误差(RMSE): $$R M S E={\sqrt{\frac{1}{n}\sum_{i}({\hat{y_{i}}}-y_{i}\,)^{2}}}$$ [20] - **模型评价**:对TMT行业预测精度较高,消费类行业误差较大;分组训练后预测效果提升[25][32] 2. **模型名称**:分组多元CNN-LSTM - **模型构建思路**:将申万一级行业按投资属性分为6组(如消费及医药、大科技等),每组独立训练子模型以降低复杂度[26][27] - **模型具体构建过程**: 1. **行业分组**:消费及医药(9行业)、上游资源及材料(5行业)、高端制造(6行业)、地产及基建(4行业)、大科技(4行业)、大金融(2行业)[27] 2. **子模型结构**:每组采用与主模型相同的CNN-LSTM架构,但参数独立训练[28] 3. **预测整合**:各子模型输出组内行业预测值,最终合并为全行业预测结果[28] --- 量化因子与构建方式 1. **因子名称**:T+5行业收益率预测因子 - **因子构建思路**:基于多元CNN-LSTM模型对行业指数未来5日收益率的预测值,作为行业轮动信号的输入[35] - **因子具体构建过程**: 1. 调整模型超参数:时序回看窗口扩展至20天,LSTM隐含单元增至256个[34] 2. 使用扩展窗口训练(2014年3月至调仓时点前数据),每季度重新训练[35] 3. 对T+5预测值排序,选取前5名行业作为多头组合[35] --- 模型的回测效果 1. **多元CNN-LSTM(全行业)**: - 测试集预测误差范围:1.56%~3.30%(T+1)[23] - TMT行业误差最低(如电子1.56%),消费类较高(如食品饮料3.25%)[23] 2. **分组多元CNN-LSTM**: - 分组后测试误差改善:电子从1.56%降至1.78%,食品饮料从3.25%降至2.68%[32][33] - T+5预测误差较T+1显著上升,但仍在可接受范围[37] 3. **行业轮动策略**: - 年化收益:15.6%(基准3.6%),年化超额收益11.6%[38] - 最大回撤:-27.1%(基准-36.3%),夏普比率0.7(基准0.27)[38] --- 因子的回测效果 1. **T+5收益率预测因子**: - 行业轮动组合IR:1.01,最长回撤修复时间248天[38] - 分组后因子稳定性提升,但T+5预测误差波动增大[37]
中邮因子周报:动量表现强势,小盘成长占优-20250811
中邮证券· 2025-08-11 10:10
量化模型与构建方式 1 模型名称:GRU模型 模型构建思路:基于门控循环单元(GRU)神经网络构建的时序预测模型,结合基本面和量价特征进行股票收益预测[10][30] 模型具体构建过程: - 输入层:包含close1d(日收盘价)、open1d(日开盘价)、barra1d(Barra风格因子日频数据)等特征[31] - 隐藏层:GRU神经网络结构,捕捉时序依赖关系 - 输出层:预测股票未来收益 - 训练方式:使用历史滚动窗口数据训练,优化损失函数 2 模型名称:多因子组合模型 模型构建思路:通过线性加权方式整合多个有效因子构建综合评分模型[31] 模型具体构建过程: - 因子筛选:选取基本面因子(如ROE增长、净利润超预期增长)和技术因子(如60日动量、120日波动)[19][24][29] - 因子标准化:进行行业中性化处理和标准化处理[17] - 权重分配:等权或基于IC-IR动态加权 - 组合构建:每月末按综合评分选股[17] 量化因子与构建方式 1 因子名称:Barra风格因子体系 因子构建思路:基于MSCI Barra多因子模型框架构建的系统化风险因子[15] 因子具体构建过程: - Beta因子:计算股票历史beta值 - 市值因子:$$ \ln(总市值) $$ - 动量因子:历史超额收益率序列均值 - 波动因子:$$ 0.74 \times \sigma_{超额收益} + 0.16 \times 累积超额收益离差 + 0.1 \times \sigma_{残差收益} $$ - 流动性因子:$$ 0.35 \times 月换手 + 0.35 \times 季换手 + 0.3 \times 年换手 $$ - 盈利因子:$$ 0.68 \times 预测盈利价格比 + 0.21 \times 市现率倒数 + 0.11 \times 市盈率ttm倒数 $$ - 成长因子:$$ 0.18 \times 预测长期盈利增长 + 0.11 \times 预测短期增长 + 0.24 \times 盈利增长 + 0.47 \times 营收增长 $$[15] 2 因子名称:超预期增长因子 因子构建思路:捕捉财务指标超出市场预期的增长信号[19] 因子具体构建过程: - 计算ROA/ROC/净利润等指标的同比变化 - 与分析师一致预期比较计算超预期幅度 - 标准化处理并行业中性化[17] 3 因子名称:技术动量因子 因子构建思路:捕捉股票价格趋势特征[19][24][29] 因子具体构建过程: - 20日动量:过去20日收益率 - 60日动量:过去60日收益率 - 120日动量:过去120日收益率 - 波动率:20日/60日/120日收益率标准差 模型的回测效果 1 GRU模型: - barra1d模型:近一周超额0.38%,今年以来超额3.78%[31] - barra5d模型:今年以来超额8.37%[31] - close1d模型:近六月超额6.80%[31] 2 多因子组合模型: - 近一月超额-0.30%,今年以来超额2.54%[31] 因子的回测效果 1 Barra风格因子: - 动量因子:全市场近一周多空收益1.01%(120日动量)[19] - 波动因子:全市场近一周多空收益1.45%(60日波动)[19] - 流动性因子:本周多头表现强势[16] 2 超预期增长因子: - 净利润超预期增长:全市场近一周多空收益0.74%[19] - ROA超预期增长:全市场近一周多空收益0.49%[19] 3 技术动量因子: - 60日动量:中证500近一周多空收益1.75%[24] - 120日波动:中证1000近一周多空收益1.68%[29]