Kronos模型
搜索文档
AI 赋能资产配置(二十二):大模型如何征服 K 线图?
国信证券· 2025-11-10 09:44
核心观点 - Kronos模型是首个专为金融K线数据设计的基础模型,成功将金融时序分析从传统的数值回归范式转向语言建模范式,解决了通用时间序列模型在金融市场中的适应性难题[1] - 该模型通过在大规模金融语料基础上预训练,实现了对市场动态的精准解读,在价格预测任务中的RankIC较领先的通用时序模型提升了93%,波动率预测的平均绝对误差降低了9%[2] - 在策略回测中,由Kronos信号驱动的投资组合实现了21.9%的年化超额收益和1.42的信息比率,证明了其预测信号能够有效转化为优秀的投资绩效[2] - 该模型确立了“领域专用”路径,为金融大模型的发展指明了方向,标志着从“通用智能”到“领域智能”转型的必要性[2] 通用时间序列模型在金融市场的困境 - 通用时间序列基础模型(TSFM)试图通过“一个模型解决所有时序问题”的思路,在涵盖多领域的庞大数据集上训练,但在应用于金融市场时面临显著挑战,表现甚至不及针对单一金融任务设计的传统模型[9] - 金融时间序列数据具有极低的信噪比与尖锐的非平稳性,其数据生成机制不断漂移甚至突变,通用TSFM从平稳数据中学到的“归纳偏置”难以适应金融市场动态本质[10] - 主流时间序列模型的训练语料中,金融序列数据的占比普遍低于1%,导致模型参数体系中仅有微不足道的部分用于理解金融市场特征,分析能力与模型设计难以应对K线数据的典型特征[10][11] Kronos模型的技术架构与创新 - 模型的核心创新在于其专有的“金融分词器”与“分层自回归建模”机制,分词器利用BSQ算法将连续的K线数据离散化为离散的Token,如同将市场波动转化为可被模型理解的“金融单词”[1][18][22] - 模型采用分层预测机制,首先预测代表市场大势的“粗粒度”标记,再在此框架下预测捕捉细节波动的“细粒度”标记,模仿了“先战略、后战术”的专业投资决策流程,显著提升了计算效率与模型鲁棒性[1][24][29] - BSQ算法通过判断特征向量相对于一组最优超平面的方位来生成二进制编码,对异常值具有更强鲁棒性,能更稳健地处理闪崩、流动性瞬间枯竭等极端行情,提升模型在真实交易环境中的可靠性[23] - 分层标记化机制将一个完整的20位代码拆解为10位的“粗粒度”代码和10位的“细粒度”代码,使模型先后进行两次“1024选1”的预测,大幅降低了自回归模型的计算复杂度,使构建超大词汇表以精确捕捉市场细微模式成为可能[24] 训练数据体系与模型配置 - Kronos模型构建了横跨45家全球主流交易所的庞大数据体系,覆盖股票、加密货币、外汇及期货等多类资产,包含超过120亿条K线记录,时间粒度从1分钟到周线共7个频点[30] - 模型提供了多种规模的配置以满足不同应用场景需求,参数规模从24.7M的Kronos-small到499.2M的Kronos-large,用户可根据实际需求在预测精度和计算成本之间取得平衡[31][32] - 在实战推理环节,模型引入了“多情景推演”机制,通过温度调节与核采样技术生成多样化的未来路径,对关键决策点可通过蒙特卡洛模拟产生大量情景并进行集成平均,显著提升预测稳定性[32] 实战应用性能与表现 - 在资产配置与组合优化方面,Kronos模型在所有基准模型中表现最为突出,实现了最高的年化超额回报率和最优的信息比率,其分层预测机制使配置策略兼具稳健性和灵活性[36] - 在风险管理与波动率控制方面,模型通过自回归预测未来已实现波动率,其波动率预测的MAE较最佳基线降低9%,R²指标提升至0.262,能帮助投资者识别市场风险突变点[37][40] - 在交易策略与信号生成方面,模型的多频率预测能力支持各类交易策略,在价格预测任务中RankIC平均提升93%,且在不同资产类别中保持稳定,通过温度缩放和蒙特卡洛滚动,信号稳定性可进一步提升5-10%[41] - 模型在A股实战回测中实现21.9%的年化超额收益和1.42的信息比率,验证了从预测信号到投资绩效的有效转化,标志着专用化基础模型在复杂金融场景中的显著优势[42] 未来发展方向 - 下一代模型有望突破单一价格序列的分析局限,构建融合K线数据、文本舆情、基本面指标和宏观因子的统一认知框架,实现价格走势、文本情绪、基本面的联合推理[43] - 模型未来可能与强化学习、自动决策技术深度结合,构建“感知-决策-执行-优化”的完整智能链路,形成具备持续进化能力的投资智能体,不仅能准确预测市场状态,还能自主制定配置方案、动态调整头寸、实时监控风险[43]
AI赋能资产配置(二十二):大模型如何征服K线?
国信证券· 2025-11-10 08:51
核心观点 - Kronos模型是首个专为金融K线数据设计的基础模型,通过将金融时序分析从数值回归范式转向语言建模范式,解决了通用时间序列模型在金融市场中的适应性难题[1] - 该模型在价格预测任务中的RankIC较领先的通用时序模型提升93%,波动率预测的平均绝对误差降低9%,其信号驱动的投资组合实现了21.9%的年化超额收益和1.42的信息比率[2] - 模型的成功标志着从"通用智能"到"领域智能"转型的必要性,为金融大模型的发展指明了方向[2] 通用时间序列模型在金融市场的困境 - 通用时间序列基础模型在金融市场价格预测、波动率估算等核心任务中的表现不及针对单一金融任务设计的传统模型[9] - 金融时间序列数据具有极低的信噪比和尖锐的非平稳性,其数据生成机制不断漂移甚至突变,导致通用模型学到的"归纳偏置"难以适应金融市场的动态本质[10] - 主流时间序列模型的训练语料中金融序列数据的占比普遍低于1%,存在对金融领域的"结构性歧视",导致模型参数体系难以有效理解和建模金融市场特征[10][11] Kronos模型的技术架构创新 - 模型核心创新在于专有的"金融分词器"与"分层自回归建模"机制,分词器利用BSQ算法将连续K线数据离散化为离散的Token,如同将市场波动转化为"金融单词"[1][18][22] - 分层标记化机制采用"先粗后细"的两步法决策流程,先预测代表市场大势的"粗粒度"标记,再预测捕捉细节波动的"细粒度"标记,大幅降低了计算复杂度[24] - 通过设计复合损失函数训练分词器,强制模型学习符合金融逻辑的信息解耦,确保粗粒度标记承载核心战略信息,细粒度标记补充战术细节[25][26] 模型训练体系与配置 - Kronos构建了覆盖45家全球主流交易所的庞大数据体系,包含超过120亿条K线记录,时间粒度从1分钟到周线共7个频点[30] - 模型提供了多种规模的配置,参数规模从24.7M的Kronos-small到499.2M的Kronos-large,用户可根据实际需求在预测精度和计算成本之间取得平衡[31][32] - 在实战推理中引入了"多情景推演"机制,通过温度调节与核采样技术生成多样化的未来路径,并通过蒙特卡洛模拟提升预测稳定性[32] 实战应用性能与表现 - 在资产配置与组合优化中,由Kronos信号驱动的投资组合在所有基准模型中表现最为突出,实现了最高的年化超额回报率和最优的信息比率[36] - 在风险管理方面,模型波动率预测的MAE较最佳基线降低9%,R²指标提升至0.262,能有效识别市场风险突变点并为动态调整止损阈值或仓位规模提供支持[37][39] - 在交易策略与信号生成中,模型的多频率预测能力支持从高频交易到中长期投资,其价格预测的RankIC平均提升93%,且在不同资产类别中保持稳定[41] 未来展望 - 下一代模型有望突破单一价格序列的分析局限,构建融合K线数据、文本舆情、基本面指标和宏观因子的统一认知框架[43] - 模型未来可能与强化学习、自动决策技术深度结合,构建"感知-决策-执行-优化"的完整智能链路,形成具备持续进化能力的投资智能体[43] - Kronos所确立的"领域专用"路径为金融大模型的发展指明了方向,其突破性表现验证了专用化基础模型在复杂金融场景中的显著优势[2][43]
中金 | 大模型系列(5):大语言时序模型Kronos的A股择时应用
中金点睛· 2025-10-14 23:40
时序基础模型(TSFM)概述 - 时序基础模型(TSFM)核心理念是通过在规模庞大、领域多样的时序数据语料库上进行预训练,构建通用的、与任务无关的模型,能够以少量甚至无需额外训练的方式适应各种下游任务 [2][6] - TSFM的根本优势在于其泛化能力和迁移学习能力,通过在上万亿个时间点上学习,能够捕捉普适性的时间模式、趋势和季节性规律 [2][6] - 这种零样本学习的新模式对于金融领域尤为重要,当面对新上市的金融工具或数据记录有限的新兴市场时,传统模型因数据稀疏而难以获得较好的训练效果 [2][6] - 时序基础模型的演化将简化金融领域时序预测任务的推理流程,节省预训练阶段的时间、计算资源以及人力成本,加速从数据到决策端的转化过程 [7] Kronos模型核心方法与架构 - Kronos是清华大学团队开发的专为金融K线数据设计的统一、可扩展的预训练框架,采用“领域预训练+微调”的范式,深度挖掘并理解金融市场的数据特征 [3][9] - 模型框架包含两个核心阶段:K线分词(K-line Tokenization)和自回归预训练(Autoregressive Pre-training) [9][12][13] - K线分词阶段通过特化分词器、分层量化和由粗到精的令牌结构,将连续、多维的金融市场数据转化为离散的、结构化的“语言” [12] - 自回归预训练阶段采用仅解码器的Transformer架构,进行分层预测目标训练,首先生成对市场主要趋势的预测,然后在此基础上进行精细化调整 [13][15] - 模型专门构建了高质量的金融数据库进行预训练,覆盖股票、加密货币、期货、外汇等多种资产类别和从1分钟到周线等7种不同时间频率 [16] Kronos模型性能表现 - 在价格序列预测任务中,Kronos的RankIC指标比领先的通用TSFM高出93%,比表现最好的非预训练专用模型高出87% [17] - 在波动率预测任务中,平均绝对误差(MAE)降低了9% [17] - 在合成K线数据生成任务中,生成数据的保真度和实用性方面提升了22% [17] - 在中国A股市场的回测中,由Kronos预测信号驱动的投资组合取得了最高的年化超额回报和信息比率 [17] - 官方公布了四个模型版本,参数量从4.1M到499.2M不等,其中前三个模型已开源 [16] Kronos在A股指数的预测表现 - 在2025年1月至9月的测试区间内,Kronos标准版对未来5个交易日收盘价的预测与真实序列保持较高一致性,平均斯皮尔曼相关系数为0.78,绝对误差均值为6.17 [4][20] - 模型在大市值指数中的表现优于小市值指数,沪深300指数未来5条预测序列的平均相关性为0.92,绝对误差均值为90.28,而中证1000指数平均相关性为0.85,绝对误差均值为306.03 [21] - 在价值指数上的预测表现优于成长指数,价值指数未来5条预测序列的平均相关性为0.92,收益率序列的平均相关性为0.20 [21] - 预测性能随预测期限延长而递减,但对第5个交易日的预测仍保持较高准确性 [20][22] 标准版Kronos择时策略效果 - 利用Kronos预测中证1000指数第5日收盘价构建择时策略,当预测收益率超过0.5%时产生做多信号 [30][31] - 策略采用T-1日收盘后生成信号,T日开盘建仓,固定持仓5个交易日,满仓操作 [31] - 标准版Kronos择时总体获得正收益,但错过了2025年7月以来的大部分涨幅,原因为模型较为依赖前期的指数反转逻辑 [4][33] 微调版Kronos滚动择时系统 - 采用模型参数微调和滚动调整推理参数并行的方案,引导Kronos适应指数的价格分布和变化特性 [4][34] - 参数微调使用中证1000指数成分股2010年至2022年的日度价量数据集,验证集为2023年至2024年 [37] - 滚动搜参方案以1个月为滚动测试集区间,对温度参数T、核采样概率top_p和回看窗口lookback_window进行网格搜索 [37][38] - 优化后模型在中证1000指数上的预测性能显著提升,未来5日收盘价预测序列与真实序列间的斯皮尔曼相关系数由0.732提升至0.856,绝对误差均值由435.2下调至275.5 [4][39] - 使用优化后的Kronos模型构建择时策略,2025年收益率达33.9%,相对于指数本身的年化超额收益达到9%,较原方法收益率提升20个百分点以上 [5][42]