Workflow
“学海拾珠”系列之二百四十七:分散化投资是否驱动大盘股需求?
华安证券· 2025-08-28 11:06
量化模型与因子构建方式 1. 再平衡需求模型 - **模型名称**:再平衡需求(Rebalancing Demand)[82] - **模型构建思路**:通过量化主动型共同基金为满足内部风险管理和监管要求(如5%的持仓集中度阈值)而进行的分散化再平衡操作,捕捉其对大盘股产生的可预测交易需求[3][18][50] - **模型具体构建过程**: 1. 首先计算基金j中股票i在季度t的预测权重: $$\widehat{w}_{i,j,t}=\frac{\left(1+r_{i,t}\right)\,w_{i,j,t-1}}{\sum\left(1+r_{i,t}\right)\,w_{i,j,t-1}}$$[40] 其中,$w_{i,j,t-1}$是上一季度观测权重,$r_{i,t}$是股票i的季度回报率 2. 计算被动变化(Passive): $$Passive_{i,j,t} = \widehat{w}_{i,j,t} - w_{i,j,t-1}$$[40] 3. 计算主动变化(Active): $$Active_{i,j,t} = w_{i,j,t} - \widehat{w}_{i,j,t}$$[40] 4. 汇总所有主动型共同基金的再平衡需求: $$Rebalancing\,Demand_{i,t}=\frac{\sum_{j}\left(\widehat{w}_{i,j,t}-w_{i,j,t-1}\right)\cdot Shares_{i,j,t-1}}{\sum_{j}Shares_{i,j,t-1}}$$[82] 该指标反映了股票i因回报驱动而在共同基金投资组合中权重增加的平均程度 2. 阈值需求模型 - **模型名称**:阈值需求(Threshold Demand)[82] - **模型构建思路**:聚焦于那些超过基金总AUM 2%的头寸,这些头寸更可能受到集中度风险管理的影响[82] - **模型具体构建过程**: $$Threshold\,Demand_{i,t}=\frac{\sum_{j}\left(\widehat{w}_{i,j,t}-w_{i,j,t-1}\right)\cdot I(w_{i,j,t-1}>2\%)\cdot Shares_{i,j,t-1}}{\sum_{j}Shares_{i,j,t-1}}$$[82] 其中$I(w_{i,j,t-1}>2\%)$是指示函数,当权重超过2%时取值为1 3. 拟合需求模型 - **模型名称**:拟合需求(Fitted Demand)[83] - **模型构建思路**:使用不同持有规模下基金对被动变化表现出的再平衡程度无条件系数,来构建需求指标[83] - **模型具体构建过程**: $$Fitted\,Demand_{i,t}=\frac{\sum_{j}\left(\widehat{w}_{i,j,t}-w_{i,j,t-1}\right)\cdot\beta_{weight}\cdot Shares_{i,j,t-1}}{\sum_{j}Shares_{i,j,t-1}}$$[83] 其中$\beta_{weight}$是图表6中每个权重区间对应的回归系数[54] 4. 分散化驱动需求因子 - **因子名称**:分散化驱动需求因子[5][20] - **因子构建思路**:基于再平衡需求等指标,捕捉机构投资者为控制头寸集中度而产生的协调一致的逆向交易需求[3][16] - **因子具体构建过程**: 1. 使用再平衡需求、阈值需求或拟合需求作为基础指标[82][83] 2. 计算这些指标的百分位排名,即每只股票在每季度全体股票中的百分位数[83] 3. 这些排名值作为因子值,值越高表示基金的分散化再平衡需求越强 模型与因子的回测效果 1. 再平衡需求模型 - 再平衡需求一个标准差(0.22%)预测前35个交易日内-0.44%的回报(t=-3.21)[20] - 再平衡需求一个标准差预测该季度剩余时间内0.27%的正回报(t=2.60)[20] - 在控制过去动量和极端负收益后,一个标准差变化预测一个季度内-0.56%的回报(t=-3.71)[20] - 一个标准差变化预测随后一年内0.67%的反转(t=2.16)[20] 2. 分散化驱动需求因子 - 再平衡需求一个标准差(0.22%)使共同基金卖出概率增加3.15%[85] - 阈值需求一个标准差(0.15%)使共同基金卖出概率增加1.28%-2.20%[85] - 拟合需求一个标准差(0.03%)使共同基金卖出概率增加1.28%-2.20%[85] 3. 定价效应测试结果 - 分散化驱动的交易需求转化为真实的净卖出压力,导致再平衡需求高的股票经历显著的短期价格下跌[5] - 这种可预测的收益反转模式集中体现在大盘股中(市值超过NYSE公司80%分位数的股票)[5][20] - 在控制了过去一个季度的回报后,预测变量一个标准差的变化预测了一个季度内-0.56%的回报(t=-3.71)[20] - 随后一年内0.67%的反转(t=2.16)[20]
A股中报进度跟踪:哪些行业净利润在修复
长江证券· 2025-08-28 05:22
量化模型与构建方式 无相关内容 模型的回测效果 无相关内容 量化因子与构建方式 1 因子名称:已披露净利润同比增速[5][17];因子构建思路:依据已披露中报业绩的个股净利润同比增速,汇总统计各行业的整体净利润增长情况[5][17];因子具体构建过程:首先筛选截至指定日期(2025年8月27日)已披露中报的A股上市公司[1][3],然后按长江行业分类标准(一级或二级行业)对个股进行分组[5][17],接着计算每个行业内已披露个股的净利润同比增速,最后通过汇总(例如简单平均或加权平均)得到各行业的整体已披露净利润同比增速[5][17];因子评价:该因子能及时反映行业中报业绩修复情况,但受披露进度影响存在偏差,需随披露推进更新[6][23] 2 因子名称:已披露营业收入同比增速[5][17];因子构建思路:依据已披露中报业绩的个股营业收入同比增速,汇总统计各行业的整体营业收入增长情况[5][17];因子具体构建过程:首先筛选截至指定日期(2025年8月27日)已披露中报的A股上市公司[1][3],然后按长江行业分类标准(一级或二级行业)对个股进行分组[5][17],接着计算每个行业内已披露个股的营业收入同比增速,最后通过汇总(例如简单平均或加权平均)得到各行业的整体已披露营业收入同比增速[5][17];因子评价:该因子能及时反映行业中报收入端表现,但受披露进度影响存在偏差,需随披露推进更新[6][23] 因子的回测效果 1 已披露净利润同比增速因子,在长江一级行业中的应用取值:农产品行业较高、传媒互联网行业较高、金属材料及矿业行业较高、综合金融行业较高、电子行业较高[5][17];在长江二级行业中的应用取值:畜禽养殖行业较高、玻纤及制品行业较高、多元消费品贸易行业较高、娱乐行业较高、稀土磁材行业较高[5][17] 2 已披露营业收入同比增速因子,在长江一级行业中的应用取值:参见图3[18];在长江二级行业中的应用取值:参见图3[18]
南向交易资金关注了哪些行业?
长江证券· 2025-08-28 04:43
量化因子与构建方式 1. 因子名称:南向资金净流入估算因子[11] 因子构建思路:基于港股通每日收市后披露的单只证券投资者合计持有数量,估算单只证券每日的资金净流入情况[11] 因子具体构建过程:具体计算方式为:T日单只证券资金净流入 = T日持股量变动 × T日成交均价[11]。由于联交所实行T+2交收安排,联交所网站提供的"持股纪录按日查询"服务中T日的港股通投资者合计持股量实际为T-2日收市后的交易结果,因此对持股明细进行平移处理以匹配实际的交易结果,即T日实际持股量为T+2日收市后披露的持股量[12]。得到单只证券每日净流入后,汇总每日所有证券净流入即可得到自下而上估算的每日净流入 2. 因子名称:南向资金市场参与度因子[36] 因子构建思路:用"净买入占比"来衡量南向资金的市场参与度,体现南向资金在港股日度净增量资金中的话语权[36] 因子具体构建过程:计算公式为: $$南向资金市场参与度 = \frac{|南向资金净买入额|}{总成交额}$$[36] 每日以恒生二级行业分类汇总计算南向资金在各个行业中的净买入额和相应的成交额,由此计算出南向资金在各个行业中的参与度,并按年度计算均值[36] 因子的回测效果 1. 南向资金净流入估算因子,估算的每日净流入与实际每日净流入之间的相关系数达到0.976[11] 2. 南向资金市场参与度因子,电讯行业净买入占比均值达到16.18%[39],煤炭行业净买入占比均值为15.08%[39],农业产品行业净买入占比均值为11.16%[39],消费者主要零售商行业净买入占比均值为10.36%[39],工用支援行业净买入占比均值为10.34%[39]
稀土概念仍活跃,半导体、电力抗跌,香港恒生指数收盘跌1.27%报
新永安国际证券· 2025-08-28 03:29
根据提供的研报内容,经过全面梳理,未发现涉及量化模型或量化因子的构建思路、具体过程、评价及测试结果。报告内容主要为市场行情数据、公司财报信息、宏观经济指标及个股涨跌幅等[1][5][6][7][9][10][12][14][15][16][17][18][19][20][22][23][24][27][28][29][30][31][32][34][36][38],属于市场资讯与数据汇总,而非量化投资研究。 因此,本次总结无相关量化模型或因子内容可进行输出。
股指分红点位监控周报:IH及IF主力合约升水,IC及IM合约贴水收窄-20250828
国信证券· 2025-08-28 01:32
根据提供的研报内容,以下是关于量化模型和因子的总结: 量化模型与构建方式 1. 股指分红点位测算模型 - **模型名称**:股指分红点位测算模型[12][40] - **模型构建思路**:精确预测指数成分股分红对指数点位的影啊,以更准确计算股指期货的升贴水幅度[12][40] - **模型具体构建过程**: 1. **获取核心数据**:指数成分股、个股权重、成分股总市值、指数收盘价[43] 2. **计算分红点数**:对于从当前时刻 `t` 到期货合约到期日 `T` 期间的指数分红点数,计算公式为: $$分红点数 = \sum_{n=1}^{N} \left( \frac{成分股分红金额}{成分股总市值} \times 成分股权重 \times 指数收盘价 \right)$$ [40] 其中,求和需满足条件:个股除权除息日 `τ` 满足 `t < τ ≤ T`[40] 3. **数据处理流程**(详见流程图[41][42]): - 若公司已公布分红金额,则直接采用;若未公布,则需进行估计[41] - 分红金额的估计转化为对**净利润**和**股息支付率**的估计:`分红金额 = 净利润 × 股息支付率`[46] - **净利润预测**:采用基于历史净利润分布的动态预测法[49] - 若公司已公布年报、快报或业绩预告,则直接采用(业绩预告取上下限均值)[49] - 若未披露,则将公司分为盈利分布稳定和不稳定两类:稳定者按历史规律预测;不稳定者使用上年同期值[49] - **股息支付率预测**:采用历史股息率代替[50] - 若去年分红,则以去年股息支付率作为今年预测值[52] - 若去年不分红,则以最近3年股息支付率平均作为预测值[52] - 若从未分红,则默认今年不分红[52] - 对大于100%的预测值进行截尾处理[52] - **除息日预测**:基于历史间隔天数稳定性的线性外推法[50][54] - 若已公布除息日,则直接采用[55] - 若未公布,则根据公司所处分红阶段(预案或决案),判断历史从公告日到除息日的间隔天数的稳定性[55] - 若稳定,则用该间隔天数平均值与今年公告日进行线性外推;若不稳定,则采用历史分红日期判断[55] - 若无参考意义,则采用默认日期(7月31日、8月31日或9月30日)[55] 4. **成分股权重修正**:为获得日度精确权重,采用中证指数公司每日披露的收盘权重数据,替代传统的估算方法($$W_{n,t}={\frac{w_{i0}\times(1+r_{n})}{\sum_{i=1}^{N}w_{i0}\times(1+r_{n})}}$$)[44][45] - **模型评价**:该模型通过精细化处理各预测环节,对上证50和沪深300指数的预测准确度较高,对中证500指数的预测误差稍大但在可接受范围内[60] 2. 年化升贴水计算模型 - **模型名称**:年化升贴水计算模型[13] - **模型构建思路**:在扣除指数成分股分红影响后,计算股指期货合约的升贴水幅度,并将其年化以方便比较[12][13] - **模型具体构建过程**: 1. 计算合约的**含分红价差**:`含分红价差 = 合约收盘价 - 指数收盘价`[13] 2. 计算合约的**当前价差**:`当前价差 = 含分红价差 - 分红`[13] (注:此处的“分红”字段代表从当前至到期日的预测分红点数[13]) 3. 计算**升贴水率**:`升贴水 = 当前价差 / 指数收盘价`[13] 4. 计算**年化升贴水率**:将升贴水率根据到期天数进行年化[13] 公式为:`年化升贴水 = (1 + 升贴水)^(365/到期天数) - 1` (公式虽未明文写出,但根据其名称和上下文含义推导得出) - **模型评价**:该模型是衡量股指期货市场情绪和风险偏好的重要工具[12] 模型的回测效果 1. **股指分红点位测算模型**[60] - **预测误差(2023年)**:上证50和沪深300指数误差基本在5点以内,中证500指数误差基本在10点以内[60] - **预测误差(2024年)**:上证50和沪深300指数误差基本在5点以内,中证500指数误差基本在10点以内[60] - **预测vs实际股息点(股指期货)**:对上证50、沪深300、中证500股指期货主力合约的预测值与实际值贴合度较高,其中中证500偏离稍大[60] 2. **年化升贴水计算模型**(截至2025年8月27日)[13] - **IH2509合约**:年化升水2.56%[13] - **IF2509合约**:年化升水0.59%[13] - **IC2509合约**:年化贴水5.51%[13] - **IM2509合约**:年化贴水10.35%[13] 量化因子与构建方式 1. 股息率因子 - **因子名称**:股息率(Dividend Yield)[2][15] - **因子构建思路**:衡量上市公司现金分红相对于其市值的比率,是价值投资的重要参考指标[2][15] - **因子具体构建过程**: - 对于已披露分红预案的个股,其股息率计算公式为: $$股息率 = \frac{预案分红金额}{当前总市值}$$ [15] - 对于指数整体的**已实现股息率**和**剩余股息率**,计算如下[17]: - **已实现股息率** = `∑(已分红公司其个股分红金额 / 个股总市值 × 个股权重)` - **剩余股息率** = `∑(待分红公司其个股待分红金额 / 个股总市值 × 个股权重)` 因子的回测效果 1. **股息率因子**(截至2025年8月27日)[3][17] - **上证50指数**:已实现股息率2.13%,剩余股息率0.34%[3][17] - **沪深300指数**:已实现股息率1.70%,剩余股息率0.28%[3][17] - **中证500指数**:已实现股息率1.13%,剩余股息率0.14%[3][17] - **中证1000指数**:已实现股息率0.87%,剩余股息率0.11%[3][17] - **行业排名**:煤炭、银行、钢铁行业的股息率中位数排名前三[2][15]
9月风格轮动观点:成长红利均衡配置,关注大盘补涨机会-20250827
华鑫证券· 2025-08-27 15:06
量化模型与构建方式 1. 高景气成长与红利策略轮动择时模型 - **模型名称**:高景气成长与红利策略轮动择时模型 - **模型构建思路**:通过宏观和市场指标判断高景气成长风格与红利风格的轮动机会,每月进行配置选择[9] - **模型具体构建过程**: 1. 选取五个有效信号指标:期限利差、社融增速、CPI与PPI四象限、美债利率、资金博弈(ETF、险资、外资)[9] 2. 每个指标分别给出买入高景气或买入红利的配置信号[9] 3. 各期信号取均值作为最终打分,根据打分结果决定配置方向[9] 2. 大小盘风格轮动模型 - **模型名称**:大小盘风格轮动模型 - **模型构建思路**:从货币周期、交易拥挤度、修正货币活化指数、大小盘相对强度四个角度对大小盘风格轮动进行建模[24] - **模型具体构建过程**: 1. 使用货币周期、修正货币活化指数、大小盘相对强度信号等权复合生成复合因子打分[24] 2. 当复合因子看多但拥挤度触发看空信号时,改为大小盘等权配置[24] 2.1 货币周期因子 - **因子名称**:货币周期因子 - **因子构建思路**:使用短端利率划分货币松紧,货币宽松时配置小盘,收紧时配置大盘[29] - **因子具体构建过程**: 1. 使用Shibor3M和1年期国债利率作为短端利率[29] 2. 若利率高于近3月均值,则为货币紧,否则为宽货币[29] 3. 货币宽松时买入中证2000(小盘),货币收紧时买入沪深300(大盘)[29] 2.2 修正货币活化指数因子 - **因子名称**:修正货币活化指数因子 - **因子构建思路**:综合考虑M1-M2剪刀差与M2同比增速,将市场划分为四象限并构建配置策略[32] - **因子具体构建过程**: 1. 使用M1和M2同比增速剪刀差与M2同比增速两个指标[32] 2. 将市场划分为四象限,每个象限对应不同的大小盘配置策略[32] 2.3 大小盘相对强度因子 - **因子名称**:大小盘相对强度因子 - **因子构建思路**:利用大小盘风格的动量效应,通过相对强度均线捕捉波段行情[35] - **因子具体构建过程**: 1. 每月调仓日,计算小盘超额净值曲线[35] 2. 当近1月均线上穿过去9月均线时,认为小盘强势,下期配置中证2000;否则配置沪深300[35] 模型的回测效果 1. 高景气成长与红利策略轮动模型 - 累计收益:348.20%[6] - 年化收益:17.35%[6] - 最大回撤:27.08%[6] - 年化波动率:23.14%[6] - 年化Sharpe:0.75[6] - Calmar:0.64[6] 2. 大小盘风格轮动模型 - 累计收益:158.61%[22] - 年化收益:10.67%[22] - 最大回撤:32.46%[22] - 年化波动率:21.01%[22] - 年化Sharpe:0.51[22] - Calmar:0.33[22] 3. 货币周期因子 - 年化收益:8.98%[29] - 超额年化收益:9.52%[29] - 胜率:62.77%[29] 4. 大小盘相对强度因子 - 年化收益:4.71%[35] - 超额年化收益:5.64%[35] - 胜率:56.38%[35]
金融工程日报:A股冲高回落,两市成交额再度放大至3.2万亿-20250827
国信证券· 2025-08-27 14:21
根据提供的金融工程日报内容,报告主要描述了市场表现、情绪、资金流向及各类指标,但并未涉及具体的量化模型或量化因子的构建、测试及评价。报告内容集中于市场数据的统计展示(如指数表现、行业表现、概念主题表现、市场情绪指标、资金流向数据、折溢价情况等),并未详细阐述任何量化模型或因子的构建思路、具体过程、公式或回测效果[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41]。 因此,本次总结无法提供“量化模型与构建方式”及“模型的回测效果”或“量化因子与构建方式”及“因子的回测效果”的具体内容。
金融工程研究报告:资金面的接力:“量化牛”转“全面牛”
浙商证券· 2025-08-27 06:12
量化模型与构建方式 1 **模型名称**:量价类阿尔法因子打分模型[13][18] **模型构建思路**:通过量价和高频类阿尔法因子计算各指数整体得分,以判断市场风格偏好[13][18] **模型具体构建过程**: - 使用量价、高频类阿尔法因子作为信号,包括增量资金入场因子(amt_mustd3m/turn_utd)、日内搏杀因子(tcv_intra)、日间平稳-交易深度提升因子(mom_mdr3m)[17] - 计算各指数(沪深300、中证500、中证1000、中证2000、微盘)的整体得分[13][18] - 模型内生性指向微盘,2024年9月起微盘得分持续领先,2025年7月微盘得分下降至55%,但仍高于其他指数[13][17] 2 **模型名称**:私募量化规模估算模型[35][37] **模型构建思路**:基于私募新发产品数据、存量产品资金流入及市场收益,估算私募量化总规模[35][37] **模型具体构建过程**: - 以2024年末私募量化规模约9000亿元为基准[35] - 每月新发量化产品规模按占比折算:2025年上半年量化产品数量占比44.83%,假设每只基金发行规模相近[35] - 存量产品新增资金流入估算:参考新发基金单基金平均规模变化(2024年0.22亿元→2025年0.33亿元,涨幅49%),假设存量产品获得类似增幅[37] - 叠加权益市场涨跌带来的规模变动:基于500指增、1000指增、量化选股、市场中性四大类产品的平均收益率折算[37] - 最终估算公式: $$总规模 = 基准规模 + \sum(月新发量化规模) + 存量产品资金流入 + 市场收益调整$$[35][37] 3 **因子名称**:非线性市值风格暴露因子[20][28] **因子构建思路**:衡量私募量化产品在非线性市值风格大幅波动时的超额收益偏差,以评估风格暴露程度[20][28] **因子具体构建过程**: - 选取中证1000指增产品作为样本[20][23] - 计算非线性市值组合涨幅>0.5%时的平均周超额收益,以及涨幅<-0.5%时的平均周超额收益[20][23] - 计算所有管理人超额散点距原点的平均距离,公式: $$D_{非线性} = \frac{1}{N}\sum_{i=1}^{N}\sqrt{(E_{i,up})^2 + (E_{i,down})^2}$$[20][30] 其中 $E_{i,up}$ 和 $E_{i,down}$ 分别表示第i个管理人在风格上行和下行时的周超额收益 - 2023年、2024年、2025年的平均距离分别为0.84、1.49、1.19[20][30] 4 **因子名称**:线性市值风格暴露因子[26][28] **因子构建思路**:衡量私募量化产品在线性市值风格大幅波动时的超额收益偏差[26][28] **因子具体构建过程**: - 同样选取中证1000指增产品样本[26][27] - 计算线性市值组合涨幅>0.5%时的平均周超额收益,以及涨幅<-0.5%时的平均周超额收益[26][27] - 计算散点距原点的平均距离,公式: $$D_{线性} = \frac{1}{N}\sum_{i=1}^{N}\sqrt{(E_{i,up}^L)^2 + (E_{i,down}^L)^2}$$[26][32] - 2023年、2024年、2025年的平均距离分别为0.69、1.05、0.96[26][32] 5 **因子名称**:游资活跃度指标[45][48] **因子构建思路**:通过融资余额增长和龙虎榜数据构建,衡量游资定价权提升程度[45][48] **因子具体构建过程**: - 融资余额加速增长:截至2025年8月18日达2.09万亿元[45] - 龙虎榜数据剔除机构专用、沪股通等机构席位,将剩余股票视为个人投资者主导[48] - 统计上榜股票的市值分布,中证2000占比最高,微盘占比约10%[48][51] - 游资活跃度指标与国证2000指数相对净值的滚动1年相关系数自2025年7月起接近1[45][50] 6 **因子名称**:居民资金偏好因子[49][52] **因子构建思路**:通过股东户数变化统计居民资金偏好市值分位[49][52] **因子具体构建过程**: - 统计每个季度股东户数环比增速最高的前10%股票的截面市值分位数均值[49][52] - 历史数据显示均值在40%-60%分位区间波动,对应中证2000市值域[49][52] - 2024Q4以来,中证2000成分股平均股东户数显著上行,微盘股基本不变[52][56] 模型的回测效果 1 **量价类阿尔法因子打分模型**: - 2024年9月起微盘得分持续领先,2025年7月微盘得分55%[13][17] - 其他指数得分均低于微盘[13][18] 2 **私募量化规模估算模型**: - 截至2025年7月末,私募量化总规模约1.8万亿元[39][43] 3 **非线性市值风格暴露因子**: - 2023年平均距离0.84,2024年1.49,2025年1.19[20][30] - 风格上行与下行时周超额偏差平均1.9%[28] 4 **线性市值风格暴露因子**: - 2023年平均距离0.69,2024年1.05,2025年0.96[26][32] - 风格上行与下行时周超额偏差平均0.08%[28] 5 **游资活跃度指标**: - 与国证2000相对净值的滚动1年相关系数接近1[45][50] - 融资余额达2.09万亿元[45] 6 **居民资金偏好因子**: - 股东户数增速最高股票的市值分位数均值40%-60%[49][52] - 中证2000成分股股东户数显著上行,微盘股基本不变[52][56]
金融工程专题研究:广发中证港股通非银行金融主题ETF投资价值分析:险资牌与交投回暖共振下的港股非银布局
国信证券· 2025-08-26 14:05
量化模型与构建方式 1. 中证港股通非银行金融主题指数 - **模型名称**:中证港股通非银行金融主题指数[4][26][27] - **模型构建思路**:从港股通合资格股票中选取非银行金融主题的股票,采用自由流通市值加权,反映非银金融主题上市公司的整体表现[4][26][27] - **模型具体构建过程**: 1. **样本空间**:中证港股通综合指数样本,剔除过去12个月或过去3个月平均月换手率不足0.1%的证券(除非该证券过去一年日均成交金额大于5000万港元)[27] 2. **选样方法**: - 选取保险、资本市场、抵押信贷机构、其它综合性金融服务、特殊金融服务、消费信贷等行业公司作为待选样本[27] - 按过去一年日均总市值由高到低排名,选取前50名作为指数样本(不足50只则全部纳入)[27] 3. **权重计算**: - 采用自由流通市值加权[4][27] - 单个样本权重不超过15%,前五大样本权重合计不超过60%(在保持各二级行业合计权重不变的前提下)[4][27] 4. **定期调整**:每半年调整一次(每年6月和12月的第二个星期五的下一交易日)[27] 模型的回测效果 1. 中证港股通非银行金融主题指数 - **年化收益率**:8.52%[47][50] - **年化波动率**:27.07%[47][50] - **年化夏普比**:0.41[47][50] - **最大回撤**:-45.92%[50] 量化因子与构建方式 (本报告中未涉及量化因子的具体构建) 因子的回测效果 (本报告中未涉及量化因子的测试结果)
AI动态汇总:DeepSeek线上模型升级至V3.1,字节开源360亿参数Seed-OSS系列模型
中邮证券· 2025-08-26 13:00
量化模型与构建方式 1 **模型名称**:DeepSeek-V3.1混合推理架构[12] **模型构建思路**:通过单一模型支持“思考模式”与“非思考模式”两种推理方式,以适应不同复杂度的任务需求,提升计算资源分配效率[12] **模型具体构建过程**:模型基于Transformer结构进行深度改造,通过动态激活不同的注意力头来实现模式切换,并采用了思维链压缩训练技术以减少推理过程中的冗余token输出[12] 在非思考模式下,模型针对简单任务提供快速响应;在思考模式下,模型启动深度推理机制,适用于代码生成、复杂决策和多步逻辑推理等任务[12] 模型还将上下文长度从64K扩展至128K,采用了“两阶段长上下文扩展方法”,在原始V3模型检查点基础上新增了8400亿tokens的训练数据,其中32K上下文扩展阶段的训练量增加了10倍,128K扩展阶段增加了3.3倍[15] 2 **模型名称**:Seed-OSS-36B[22] **模型构建思路**:以360亿参数规模和原生512K超长上下文窗口为核心,旨在实现参数效率与性能的平衡,特别优化数学推理、代码生成和智能体任务[22] **模型具体构建过程**:采用稠密模型架构,参数分布于64层网络中,隐藏层维度为5120,词汇表扩展至155K以支持多语言与专业术语处理[22] 集成分组查询注意力(GQA)机制,通过80个查询头分组共享键值对,结合旋转位置编码(RoPE)技术原生支持512K上下文窗口[22] 训练阶段采用RMSNorm归一化与SwiGLU激活函数,使用12万亿tokens的训练数据[23] 引入“思考预算”机制,允许用户动态控制模型推理深度,开发者可设定512的整数倍token预算(如512、4K、16K),模型会实时反馈剩余计算资源并调整输出策略[24] 3 **模型名称**:WebWatcher[26] **模型构建思路**:构建一个能够同步解析图像与文本信息,并自主调用多种工具链完成多步骤任务的多模态深度研究智能体[26] **模型具体构建过程**:开发团队设计了一套完整的四阶段训练框架[27] 首先通过CRAWLQA模拟人类浏览权威网站如arXiv和Wiki来构建数据,随后进行轨迹采样以构建网页操作链,接着通过监督微调学习基础工具调用与决策逻辑,最后利用强化学习在动态环境中优化长期推理能力[27] 其关键突破在于E2HQA数据合成技术,通过由简到难的策略自动生成带验证的多步推理问答对[27] 4 **模型名称**:AutoGLM 2.0[32] **模型构建思路**:通过创新的云端架构和“云手机+云电脑”技术范式,构建一个能在手机端运行的通用智能体,实现人工智能从信息交互向行动执行的关键跨越[32] **模型具体构建过程**:其核心架构建立在“终端指令-云端执行-结果反馈”的闭环系统之上,为每位用户配备专属的云端虚拟设备(基于安卓环境的云手机和Ubuntu系统的云电脑),使任务执行与用户本地设备完全解耦[33] 由智谱最新开源模型GLM-4.5与GLM-4.5V协同驱动,GLM-4.5作为“决策大脑”负责任务规划与逻辑推理,GLM-4.5V作为“视觉执行器”通过计算机视觉识别GUI界面元素并精准映射操作动作[34] 两者通过端到端异步强化学习框架协同工作:模型在数千个并行云环境中自主试错,仅依赖最终任务完成的奖励信号优化策略[34] 5 **模型名称**:WeChat-YATT(gCore)[39] **模型构建思路**:专注于强化学习(RL)和多模态模型训练,旨在提供一套易扩展、简洁、高效且可靠的大模型训练解决方案,以应对大尺寸模型、长序列输入以及大规模数据集带来的挑战[39] **模型具体构建过程**:针对大模型分布式训练中的两大核心瓶颈提出解决方案[39] 首先是多模态场景下的可扩展性瓶颈,通过引入并行控制器(Parallel Controller)机制,由多个控制器协同管理数据任务,有效分散系统压力[39] 其次是动态采样与生成式奖励计算下的效率短板,通过部分共存策略(Partial Colocation)和异步交互机制,大幅减轻模型切换损耗和长尾任务的影响[40] 支持两种资源放置模式:全员共存(Full Colocation)与部分共存(Partial Colocation)[43] 全员共存模式采用串行调度机制,Actor Rollouts、生成式奖励模型(GenRM)与训练(Train)依次串行执行,每个角色完成后主动释放计算资源;部分共存模式则适用于Rollouts与GenRM需要高频交互、动态采样的复杂任务场景,Actor Rollouts与GenRM独立部署并通过异步方式进行高效交互[43] 6 **模型名称**:Qwen-Image-Edit[47] **模型构建思路**:基于Qwen-Image基础模型,通过创新的双重编码机制与多模态扩散Transformer架构(MMDiT),实现语义与外观双重编辑能力的深度融合[47] **模型具体构建过程**:采用双路径输入设计,将原始图像同时送入Qwen2.5-VL模型和VAE编码器[47] 前者负责提取高层语义特征,实现对场景、对象关系的理解;后者则专注于保留底层视觉细节如纹理与色彩[47] 引入链式编辑机制,用户可通过多次框选指定区域逐步调整,如修正书法作品[49] 7 **模型名称**:PROMPTQUINE框架[58] **模型构建思路**:提出一种颠覆传统大语言模型提示设计范式的新方法,通过将自然语言提示修剪成看似不连贯的“乱码”来提升模型在多样化任务中的表现[58] **模型具体构建过程**:该框架采用进化搜索算法,仅利用上下文中的token资源,自主发现有效的修剪策略[58] 将提示优化重构为引导式搜索问题,将搜索空间定义为原始提示的所有可能子序列,通过动态调整子序列长度来优化不可微的任务目标函数[59] 设计了基于遗传算法的搜索机制,其中二进制token掩码作为基因型,生成的ICL提示作为表现型,通过位翻转实现变异操作,基于精英选择指导后代生存[59] 模型的回测效果 (报告中未提供相关模型的量化回测性能指标,如年化收益率、夏普比率、信息比率(IR)、最大回撤等,因此此部分省略) 量化因子与构建方式 (报告中未涉及量化因子的构建与测试,因此此部分省略) 因子的回测效果 (报告中未涉及量化因子的构建与测试,因此此部分省略)