AI选股模型
搜索文档
量化漫谈系列之十九:AI 选股模型失效的三种应对方法
国金证券· 2025-12-30 08:53
核心观点 - 2024至2025年A股市场微观结构发生剧烈变迁,主流AI量化策略因对历史数据路径依赖过强,未能适应罕见的风格漂移,在关键回撤期表现甚至不如传统线性策略[2] - 策略失效的深层内因在于行业模型架构趋同导致的策略同质化,以及训练样本与极端行情特征的错配[3] - 为应对AI模型在系统性风险下的脆弱性,报告构建了一套独立的外围开放式择时风控框架,实证表明该框架能有效识别模型失效时段并平滑净值波动[4] - 针对核心AI模型(LightGBM与GRU)的缺陷,报告提出了从预测端到架构端的深度优化方案,显著提升了模型的收益风险比[5] 市场微观结构变迁与AI策略的适应性危机 - 2024年市场主线从“价值/低波”切换至“小盘/动量”,2025年进一步向“一致预期/成长”收敛,2025年8月至9月因市值因子过度拥挤触发剧烈均值回归与反转效应[2][13] - 在2025年8月至9月的风格切换窗口期,AI策略的净值回撤与小市值因子反转周期高度同步,其受损程度普遍高于传统线性策略[2][17] - 实证数据显示,在沪深300、中证500及中证1000指数增强产品均出现回撤时,AI策略(如GBDTNN)的超额净值回撤幅度大于传统线性策略[17][19][21][23] 策略同质化困局与失效的深层统计学归因 - 行业普遍采用GRU和LightGBM作为基座模型,导致不同机构生成的因子与公募指增基金净值的相关性持续走高,底层持仓逻辑高度趋同[3][24] - 这种同质化在流动性相对敏感的中证1000、中证500等赛道极易引发共振和“拥挤交易”,在市场风格逆转时放大尾部风险[24] - AI模型训练依赖历史常态数据,缺乏对2024年初流动性枯竭、2025年“二八分化”抱团行情等极端“长尾样本”的学习,导致预测信号与实际走势出现严重偏差[3][35] 外围风控体系:多种类、多周期事件化的开放式择时框架 - 该风控体系独立于选股模型,通过数据清洗、指标预处理、事件化处理三层标准化流程,将量价、宏观等连续指标转化为明确的多空信号[4][40] - 回测显示,该择时策略应用于中证A500指数时,年化收益率提升至10.61%,最大回撤从基准的44.30%大幅降低至11.82%,夏普比率提升至0.813[45][48] - 应用于中证1000指数时,该策略实现了15.89%的年化超额收益[50] - 将27个细分指标应用于GRU选股模型风控后,策略成功识别了模型在2024年初及2025年下半年的失效时段并触发空仓,使AI策略年化超额收益稳定在4.15%,夏普比率高达4.12,卡玛比率大幅提升至7.21[4][50][58] AI核心模型的针对性优化:LGBM与GRU的迭代升级 - 对LightGBM模型,通过“高质量样本加权”机制聚焦抗跌因子,并将损失函数切换为Huber Loss,使多头超额最大回撤从8.84%压降至5.88%,卡玛比率从2.88提升至4.07[5][61][65] - 对GRU模型,引入Attention Pooling模块以提升长序列信息利用率,并创新构建“Memory模块+CVaR Loss”闭环,强制模型学习存储历史上的极端行情特征[5][66][67] - 优化后的GRU模型多头超额收益提升至25.84%,最大回撤大幅压降至8.54%,卡玛比率跃升超30%至3.02[67][68]