Workflow
时序基础模型
icon
搜索文档
时序大模型重大突破!羚羊能源3.0唤醒“沉睡数据”,电力交易与设备运维双场景落地
中国能源网· 2025-11-10 10:40
产品发布与战略升级 - 羚羊公司于第八届世界声博会暨2025科大讯飞全球1024开发者节上发布羚羊能源大模型3.0,并同步推出电力交易、设备运维两大垂直场景模型 [1] - 此次发布标志着公司在“AI+能源”领域实现从行业到场景深度渗透的战略升级,旨在为能源行业智能化转型探索可复制的解决方案 [1] 核心技术突破 - 羚羊能源大模型3.0的三大升级方向包括基础能力升级、AI与业务场景深度融合以及构建完善的全流程工具链 [3] - 模型重点提升了时序能力,基于Transformer架构构建统一时序基础框架,解决了传统模型碎片化问题,并借助千亿级时序数据的自监督学习实现长周期建模和少样本快速泛化 [4] 电力交易大模型应用成效 - 羚羊电力交易大模型融合语言、时序、气象与交易策略模型,形成专业化多模态技术体系,构建电力交易智慧决策中枢 [5] - 在功率预测场景中,安徽蒙城风电场10月考核电量减少超50%,江浙皖地区风电、光伏短期及超短期功率预测准确率提升5%以上 [6] - 在负荷预测场景中,10月安徽省电力负荷预测准确率达94.8%,某交易主体用户级负荷预测准确率达93.1% [6] - 在电价预测场景中,10月某交易主体日前及实时电价预测准确率达85% [6] 设备运维大模型应用成效 - 羚羊设备运维大模型通过融合语言与时序基础模型的“双擎驱动”架构,构建覆盖运行监控、消缺管理、定修管理等全流程智能化体系 [7] - 模型生成的故障图谱初始准确率可达85%,通过持续优化可实现故障排查时间缩短73%,误报排除率提升85% [7] - 在检修环节,检维修工单规范度提升50%以上,检修方案编写效率提升5倍 [7] - 在某风电场应用中,异常诊断效率提升62%,检维修效率提升33%;某动设备密集型企业误报排除率达80%,工单处理效率提升52% [7] 技术自主与产业生态 - 羚羊能源大模型3.0依托全国产算力平台上的科大讯飞星火X1.5大模型,实现从算力、训练到应用的全链条自主可控 [8] - 公司工业互联网平台连续三年(2022-2024)入选工信部“双跨”平台,并与国家能源集团、中国石油、华能集团、国家电投等央企合作,助力其构建行业大模型并推进关键场景技术落地 [8]
大模型技术加快能源行业智能化转型
中国经济网· 2025-11-10 06:15
产品发布与核心升级 - 羚羊公司在第八届世界声博会上发布羚羊能源大模型3 0以及电力交易、设备运维两大垂直场景模型,标志着公司在“AI+能源”领域实现升级[1] - 大模型3 0的升级方向包括基础能力持续升级(重点提升时序能力)、将AI深度融入业务场景解决实际问题、构建完善的全流程工具链[1] - 公司构建起统一时序基础框架,完成时序信号统一表征与多任务统一建模,借助千亿级时序数据的自监督学习能力,使模型能自主挖掘深层特征并建立长周期建模能力[2] 技术能力与行业价值 - 时序基础模型是解析负荷动态规律、支撑能源系统前瞻性决策的关键技术,其重要性在于精准把控电力系统的动态平衡,以化解电源侧波动风险并适配负荷侧复杂变化[1] - 时序建模需应对多源异构、非线性、非平稳性及高质量数据稀缺等行业痛点,传统方法导致检测精度偏低、泛化能力较弱、模型碎片化严重[1] - 新模型即便在新场景数据稀缺的情况下也能快速泛化,旨在让“沉睡”数据产生价值[2] 垂直应用与落地成效 - 羚羊设备运维大模型采用融合语言与时序基础模型的“双擎驱动”架构,结合数据与知识的时空对齐机制,构建覆盖运行监控、消缺管理、定修管理、检修质量管理、智能分析的全流程智能化体系[2] - 该模型已在石化、风电、火电等领域落地应用,在某风电场实现异常诊断效率提升62%,检维修效率提升33%[2] - 在某动设备密集型企业应用后,模型实现误报排除率达80%,工单处理效率提升52%,达成运维降本增效[2]
中金 | 大模型系列(5):大语言时序模型Kronos的A股择时应用
中金点睛· 2025-10-14 23:40
时序基础模型(TSFM)概述 - 时序基础模型(TSFM)核心理念是通过在规模庞大、领域多样的时序数据语料库上进行预训练,构建通用的、与任务无关的模型,能够以少量甚至无需额外训练的方式适应各种下游任务 [2][6] - TSFM的根本优势在于其泛化能力和迁移学习能力,通过在上万亿个时间点上学习,能够捕捉普适性的时间模式、趋势和季节性规律 [2][6] - 这种零样本学习的新模式对于金融领域尤为重要,当面对新上市的金融工具或数据记录有限的新兴市场时,传统模型因数据稀疏而难以获得较好的训练效果 [2][6] - 时序基础模型的演化将简化金融领域时序预测任务的推理流程,节省预训练阶段的时间、计算资源以及人力成本,加速从数据到决策端的转化过程 [7] Kronos模型核心方法与架构 - Kronos是清华大学团队开发的专为金融K线数据设计的统一、可扩展的预训练框架,采用“领域预训练+微调”的范式,深度挖掘并理解金融市场的数据特征 [3][9] - 模型框架包含两个核心阶段:K线分词(K-line Tokenization)和自回归预训练(Autoregressive Pre-training) [9][12][13] - K线分词阶段通过特化分词器、分层量化和由粗到精的令牌结构,将连续、多维的金融市场数据转化为离散的、结构化的“语言” [12] - 自回归预训练阶段采用仅解码器的Transformer架构,进行分层预测目标训练,首先生成对市场主要趋势的预测,然后在此基础上进行精细化调整 [13][15] - 模型专门构建了高质量的金融数据库进行预训练,覆盖股票、加密货币、期货、外汇等多种资产类别和从1分钟到周线等7种不同时间频率 [16] Kronos模型性能表现 - 在价格序列预测任务中,Kronos的RankIC指标比领先的通用TSFM高出93%,比表现最好的非预训练专用模型高出87% [17] - 在波动率预测任务中,平均绝对误差(MAE)降低了9% [17] - 在合成K线数据生成任务中,生成数据的保真度和实用性方面提升了22% [17] - 在中国A股市场的回测中,由Kronos预测信号驱动的投资组合取得了最高的年化超额回报和信息比率 [17] - 官方公布了四个模型版本,参数量从4.1M到499.2M不等,其中前三个模型已开源 [16] Kronos在A股指数的预测表现 - 在2025年1月至9月的测试区间内,Kronos标准版对未来5个交易日收盘价的预测与真实序列保持较高一致性,平均斯皮尔曼相关系数为0.78,绝对误差均值为6.17 [4][20] - 模型在大市值指数中的表现优于小市值指数,沪深300指数未来5条预测序列的平均相关性为0.92,绝对误差均值为90.28,而中证1000指数平均相关性为0.85,绝对误差均值为306.03 [21] - 在价值指数上的预测表现优于成长指数,价值指数未来5条预测序列的平均相关性为0.92,收益率序列的平均相关性为0.20 [21] - 预测性能随预测期限延长而递减,但对第5个交易日的预测仍保持较高准确性 [20][22] 标准版Kronos择时策略效果 - 利用Kronos预测中证1000指数第5日收盘价构建择时策略,当预测收益率超过0.5%时产生做多信号 [30][31] - 策略采用T-1日收盘后生成信号,T日开盘建仓,固定持仓5个交易日,满仓操作 [31] - 标准版Kronos择时总体获得正收益,但错过了2025年7月以来的大部分涨幅,原因为模型较为依赖前期的指数反转逻辑 [4][33] 微调版Kronos滚动择时系统 - 采用模型参数微调和滚动调整推理参数并行的方案,引导Kronos适应指数的价格分布和变化特性 [4][34] - 参数微调使用中证1000指数成分股2010年至2022年的日度价量数据集,验证集为2023年至2024年 [37] - 滚动搜参方案以1个月为滚动测试集区间,对温度参数T、核采样概率top_p和回看窗口lookback_window进行网格搜索 [37][38] - 优化后模型在中证1000指数上的预测性能显著提升,未来5日收盘价预测序列与真实序列间的斯皮尔曼相关系数由0.732提升至0.856,绝对误差均值由435.2下调至275.5 [4][39] - 使用优化后的Kronos模型构建择时策略,2025年收益率达33.9%,相对于指数本身的年化超额收益达到9%,较原方法收益率提升20个百分点以上 [5][42]