Workflow
流动性调整推重比
icon
搜索文档
高维时空嵌入的视角:物理增强型样本熵择时模型
中泰证券· 2025-12-07 13:15
量化模型与构建方式 1. 模型名称:物理增强型样本熵择时模型 (Phys-Enhanced SampEn) * **模型构建思路**:将非线性动力学的样本熵理论与物理学的推重比概念深度融合,构建一个一体化择时模型。其核心创新在于将“流动性调整推重比序列”作为样本熵的输入,使得计算出的熵值能够同时量化“价格波动的随机性”与“驱动力-风险平衡的规律性”,从而输出择时信号[4][78]。 * **模型具体构建过程**: 1. **构建输入序列**:首先计算流动性调整推重比序列 $$Z_{t}=[T W R_{t}]$$,该序列融合了价格、成交量、波动率和流动性信息,作为后续样本熵计算的输入[79][80]。 2. **设定模型参数**:嵌入维度 $$m = 2$$,延迟时间 $$\tau = 1$$,相似性阈值 $$r = ETF_{std} \times \sigma_{std}$$,其中 $$\sigma_{std}$$ 为序列的标准差[82]。 3. **重构嵌入向量**:在序列 $$Z_t$$ 上构建延迟坐标嵌入,形成 $$m$$ 维嵌入向量序列:$$V_{i}^{(m)}=\left[Z_{i},Z_{i+\tau},\cdots,Z_{i+(m-1)\tau}\right],i=1,2,\cdots,N$$,其中 $$N = T - \tau + 1$$ 为有效样本数[83][84]。 4. **计算向量间相似性**:采用最大范数(Chebyshev距离)计算两个嵌入向量间的距离:$$d\left(V_{i}^{(m)},V_{j}^{(m)}\right)=\operatorname*{max}_{0\leq k\leq m-1,1\leq s\leq2}\left|Z_{i+k\tau(s)},Z_{j+k\tau(s)}\right|$$[86]。 5. **计算条件概率**:对每个嵌入向量 $$V_i^{(m)}$$,统计其与其他向量(排除自身)的相似性比例:$$C_{i}^{m}(r)=\frac{1}{N-1}\times\\left\{j\!:\!d\left(V_{i}^{(m)},V_{j}^{(m)}\right)<r,j\neq i\right\}$$[87]。进而计算全局平均相似概率:$$B^{m}(r)=\frac{1}{N}\sum_{i=1}^{N}C_{i}^{m}(r)$$[88]。 6. **计算物理增强型样本熵**:类似地构建 $$B^{m+1}(r)$$,最终定义物理增强型样本熵为:$$P h y s-S a m p E n(m,r,\tau)=-l n\left(\frac{B^{m+1}(r)}{B^{m}(r)}\right)$$。当 $$B^m(r)=0$$ 或 $$B^{m+1}(r)=0$$ 时,加正则化常数 $$10^{-6}$$ 避免对数发散[91][92]。 7. **生成择时信号**: * 基于滚动窗口 $$W$$ 个交易日的融合熵序列,定义经验分位数阈值:低熵阈值 $$S_{low}=Q_{0.4}(Phys-SampEn_t)$$,高熵阈值 $$S_{high}=Q_{0.6}(Phys-SampEn_t)$$[94][95]。 * 结合当前熵值 $$Phys-SampEn_t$$ 和推重比 $$TWR_t$$ 的方向,应用一套规则判断输出上涨、下跌或平盘信号。核心逻辑是:低熵态下系统规律性强,推重比数值指示趋势方向;高熵态下系统失序,规避方向性暴露或抓住反转趋势[95][97]。 2. 因子名称:流动性调整推重比 (TWR) * **因子构建思路**:在传统推重比(累计收益率/波动率)的基础上进行优化,将驱动力项从“累计收益”升级为“量价共振收益”,并将风险项从“单一波动率”扩展为“波动率×流动性阻力”,从而构建一个同时评估趋势有效性和交易可操作性的综合指标[54][72]。 * **因子具体构建过程**: 1. **计算驱动力 (Thrust)**:驱动力项定义为量价共振动量:$$T h r u s t_{v o l p,t}=\left(\sum_{k=t-L+1}^{t}r_{k}\right)\times\left(\frac{V o l_{t}}{V o l_{a v g,t}}\right)$$。其中,$$\sum r_k$$ 为过去 $$L$$ 日累计收益率,$$Vol_t$$ 为当日成交量,$$Vol_{avg,t}$$ 为过去 $$L$$ 日平均成交量[56][58]。 2. **计算风险项 (Weight)**:风险项综合了价格波动风险和流动性阻力:$$W e i g h t_{l i q\ ,t}=\sigma_{t}\times\left(\frac{V o l_{a v g,t}}{V o l_{t}}\right)+10^{-6}$$[64]。 * 价格波动风险 $$\sigma_t$$ 为过去 $$L$$ 日的年化波动率:$$\sigma_{t}=\sqrt{\frac{252}{L-1}\sum_{k=t-L+1}^{t}\left(r_{k}-\bar{r}_{t,L}\right)^{2}}$$,其中 $$\bar{r}_{t,L}$$ 为过去 $$L$$ 日的平均收益率[65][66]。 * 流动性阻力通过比较当日成交量与近期平均成交量的比值来构建,比值大于1表示流动性差、阻力放大[68]。 3. **计算原始推重比**:原始推重比为驱动力与风险项的比值:$$R a w T W R_{l i q,t}=\frac{T h r u s t_{v o l p,t}}{W e i g h t_{l i q,t}}$$[69]。 4. **标准化**:为消除跨ETF的量纲差异,对原始推重比进行Z-Score标准化:$$T W R_{l i q,t}=\frac{R a w T W R_{i i q,t}-\mu_{R a w T W R},\;\;W}{\sigma_{R a w T W R},\;\;w+10^{-6}}$$。其中,$$\mu_{RawTWR,W}$$ 和 $$\sigma_{RawTWR,W}$$ 分别为过去 $$W$$ 个交易日原始推重比的均值与标准差,$$10^{-6}$$ 为平滑项[70][71][72]。 3. 因子名称:样本熵 (SampEn) * **因子构建思路**:样本熵是用于量化时间序列复杂性和规律性的指标。它通过计算“数据片段延长后,还能保持相似”的概率,来衡量序列的“混乱度”或不确定性。相比近似熵,样本熵通过排除自匹配,提高了在短序列下的无偏性和统计一致性[20][21][44]。 * **因子具体构建过程**: 1. **重构嵌入向量**:对长度为 $$N$$ 的序列 $$x$$,设定嵌入维度 $$m$$ 和延迟时间 $$\tau$$,为每个时间点 $$i$$ 构造 $$m$$ 维嵌入向量:$$X_{i}^{m}=[x(i),x(i+\tau),x(i+2\tau),\cdots,x(i+(m-1)\tau)],\mathrm{i=1,2,\cdots,N_{m}}$$[25][26]。 2. **定义相似性度量**:采用Chebyshev距离(最大范数)计算两个嵌入向量间的距离:$$d\left(X_{i}^{m},X_{j}^{m}\right)=m a x_{k=0,1,\cdots,m-1}|x(i+k\tau)-x(j+k\tau)|$$。若距离小于阈值 $$r$$,则判定两个向量相似[28][29]。 3. **计算相似概率**: * 对于每个嵌入向量 $$X_i^m$$,计算其与其他向量($$j \neq i$$)相似的比例:$$B_{i}^{m}(r)=\;\frac{1}{N_{m}-1}\sum_{j=1,j\neq i}^{N_{m}}I\big(d\big(X_{i}^{m},X_{j}^{m}\big)<r\big)\;.$$,其中 $$I(\cdot)$$ 为指示函数[31][33]。 * 对所有向量求平均,得到 $$m$$ 维整体相似概率:$$B^{m}(r)=\ \frac{1}{N_{m}}\sum_{i=1}^{N_{m}}B_{i}^{m}(r)$$[32]。 4. **计算样本熵**:将嵌入维度增加到 $$m+1$$,重复上述步骤得到 $$B^{m+1}(r)$$。样本熵最终定义为:$$S a m p E n(m,r,N)=-l n\left(\frac{B^{m+1}(r)}{B^{m}(r)}\right)$$[36]。概率衰减越慢(序列越规律),熵值越低;概率衰减越快(序列越随机),熵值越高[37]。 模型的回测效果 * **物理增强型样本熵择时模型 (单标的)**:回测期2017年1月至2025年11月,覆盖38只不同板块的ETF[7][101]。 * **宽基指数 (8只)**:策略年化收益率16.19%-41.67%,夏普比率1.04-1.69,最大回撤-14.32%至-25.48%,显著优于买入持有策略[106][108]。 * **周期资源型ETF (示例4只)**:策略年化收益率15.85%-44.81%,夏普比率0.77-1.89,最大回撤-13.25%至-29.61%,较买入持有大幅改善[116][118]。 * **新能源与科技型ETF (示例4只)**:策略年化收益率27.52%-33.45%,夏普比率1.27-1.51,最大回撤-21.14%至-31.31%,表现卓越[124][125]。 * **消费、医疗与金融型ETF (示例4只)**:策略年化收益率18.83%-30.28%,夏普比率0.98-1.37,最大回撤-14.43%至-29.45%,实现显著超额收益[130][132]。 * **物理增强型样本熵择时模型 (等权组合)**:基于38只ETF的择时信号动态构建等权组合。回测期内年化收益率37.20%,夏普比率1.76,索提诺比率251.62%,最大回撤-20.72%[137][140]。