机器学习

搜索文档
机器学习因子选股月报(2025年8月)-20250730
西南证券· 2025-07-30 05:43
量化模型与构建方式 1. **模型名称:GAN_GRU模型** - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,用于挖掘量价时序特征并生成选股因子[4][13] - **模型具体构建过程**: 1. **数据输入**:使用18个量价特征(如收盘价、成交量、换手率等),采样形状为40*18(过去40天的特征)[17][18] 2. **GAN部分**: - 生成器(G):采用LSTM结构,输入原始量价时序特征(40×18),输出生成的特征(40×18)[33][37] - 判别器(D):采用CNN结构,通过卷积层处理二维量价时序特征,输出真假概率[33][35] - 损失函数: - 生成器损失:$$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$[24] - 判别器损失:$$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$[27] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[22] 4. **训练方式**:半年滚动训练,每半年更新模型参数,训练集与验证集比例80%:20%[18] - **模型评价**:通过对抗训练提升特征生成能力,保留时序特性,适配金融数据的高噪声和非线性特点[33][37] 2. **因子名称:GAN_GRU因子** - **因子构建思路**:利用GAN_GRU模型输出的预测收益pRet作为选股因子,经行业市值中性化+标准化处理[22][41] - **因子具体构建过程**: 1. 模型输出的pRet截面排序,取前10%股票构成多头组合[46] 2. 因子值计算:$$Factor_{GAN\_GRU} = pRet_{标准化} + 行业市值中性化残差$$[22] --- 模型的回测效果 1. **GAN_GRU模型** - IC均值:11.43% | ICIR:0.89 | 年化超额收益率:24.86%[41][42] - 年化收益率:38.52% | 最大回撤率:27.29% | 信息比率(IR):1.62[42] 2. **GAN_GRU因子(行业表现)** - 当期IC最高行业:家用电器(27.00%)、非银金融(23.08%)[42] - 近一年IC均值最高行业:公用事业(14.43%)、商贸零售(13.33%)[42] - 多头组合超额收益:纺织服饰(5.19%)、公用事业(3.62%)[2][43] --- 量化因子与构建方式 1. **因子名称:GAN_GRU衍生行业因子** - **构建思路**:在申万一级行业内部分层测试GAN_GRU因子表现,生成行业特异性选股信号[42][43] - **具体构建过程**: 1. 按行业分组计算因子IC和多头组合超额收益[42] 2. 行业中性化处理:$$Factor_{行业} = Factor_{原始} - \beta_{行业} \times Industry_{哑变量}$$[22] --- 因子的回测效果 1. **GAN_GRU衍生行业因子** - 全A股多头组合年化超额收益:24.86% | 换手率:0.82[42] - 近一年IC均值:10.97% | 最新一期IC:9.27%[41][42] 2. **行业多头组合** - 近一年月均超额收益:家用电器(5.44%)、建筑材料(4.70%)[2][43] - 全行业跑赢基准比例:30个行业中21个跑赢(70%)[43] --- 其他关键点 - **数据预处理**:量价特征在时序上去极值+标准化,个股截面标准化[18] - **超参数**:batch_size=截面股票数,优化器Adam,学习率1e-4,损失函数IC[18] - **最新多头组合**:裕同科技、青山纸业等(2025年8月前十个股)[5][48]
全新岚图知音标配800V+5C启动第二工厂保产能;小米汽车公布通勤提醒专利丨汽车交通日报
创业邦· 2025-07-29 10:14
哈弗M6俄罗斯本土化生产 - 哈弗M6在俄罗斯卡卢加州PSMA Rus工厂启动全流程本土化生产 租赁协议于2024年底签署 散件组装工作已于2024年2月开始 [1] - 工厂完成焊接和喷涂车间现代化升级 改造流水线系统 配备15台机器人、40台焊钳、10台弧焊设备、30套焊接夹具和2台起重机器人 [1] 岚图知音产能提升 - 全新岚图知音全系标配5C超充和全域800V平台 FREE+车型大定订单突破2万台 交付速度成为关注重点 [2] - 岚图将启动第二工厂以提升产能 新工厂规模大于第一工厂 [2] 长安汽车驾驶行为预测技术 - 长安汽车公开"驾驶行为预测方法"专利 通过机器学习技术精准预测驾驶行为 为ADAS和智能驾驶提供关键技术支撑 [3] 小米汽车通勤提醒专利 - 小米汽车公布"通勤提醒方法"专利 根据通勤路线交通状态分层输出提醒信息 帮助用户选择合适出发时间 [4]
金工周报-20250729
中邮证券· 2025-07-29 07:29
根据提供的研报内容,以下是量化模型与因子的详细总结: 量化模型与构建方式 1. **模型名称**:OpenReasoning-Nemotron推理模型 **模型构建思路**:基于Qwen2.5架构,通过从6710亿参数的DeepSeek R1 0528模型中蒸馏提炼而成,旨在为数学、科学及代码生成等结构化任务提供高效推理支持[12] **模型具体构建过程**: - 利用NeMo Skills框架生成500万个涵盖数学证明、科学推导和编程解决方案的高质量数据轨迹 - 通过纯监督微调(SFT)而非强化学习进行训练,确保逻辑一致性和符号推理精准度 - 采用GenSelect算法实现"重型推理模式",通过并行启动多个智能体生成候选解并筛选最优答案 - 公式:GenSelect@64技术,在32B模型上将HMMT数学竞赛成绩从73.8提升至96.7[13] **模型评价**:在GPQA、MMLU-PRO和AIME24等基准测试中刷新同参数规模纪录,32B版本在AIME24获得89.2分,超越OpenAI的o3-high模型[15] 2. **模型名称**:Qwen3-Coder **模型构建思路**:以4800亿参数规模、原生支持256K上下文窗口的混合专家架构(MoE)为核心,实现开源编程模型的性能突破[19] **模型具体构建过程**: - 采用稀疏化MoE设计,总参数4800亿但每次推理仅激活350亿参数,包含160个专家网络并动态选择8个参与计算 - 使用7.5万亿token的语料库,其中70%为代码数据,覆盖80余种编程语言及20多种标记语言 - 通过Qwen2.5-Coder对低质量数据清洗改写,生成高质量合成数据 - 引入代码强化学习与长程强化学习,构建分布式系统并行运行2万个独立环境[19] **模型评价**:HumanEval pass@1正确率达93.7%,超越Claude 3.5的92.4%;在SWE-Bench Verified上以31.4%任务成功率首次超过GPT-4的30.9%[20] 3. **模型名称**:AI评审框架 **模型构建思路**:通过赋予AI评审员自主调用外部工具的能力,构建兼具效率与严谨性的混合评审体系[25] **模型具体构建过程**: - 采用三级决策机制:初始领域评估、工具调用环节(事实核查/代码执行/数学核查)、综合评审结论生成 - 工具优先策略,仅在无适用工具时回退至基线模型评审 - 模块化设计实现领域适配,数学核查工具可灵活替换为Wolfram Alpha等专业引擎[26] **模型评价**:将数学问题评审错误率从纯模型评估的28%降至6%,代码评审误判率下降逾40%[29] 模型的回测效果 1. **OpenReasoning-Nemotron模型** - AIME24得分:32B版本89.2分,7B模型78.2分,1.5B模型45.6分[15] - LiveCodeBench得分:从70.2提升至75.3[13] - HMMT数学竞赛成绩:GenSelect@64技术下从73.8提升至96.7[13] 2. **Qwen3-Coder模型** - HumanEval pass@1正确率:93.7%[20] - SWE-Bench Verified任务成功率:31.4%[20] - 上下文处理能力:原生256K扩展至1M token[20] 3. **AI评审框架** - 数学问题评审错误率:从28%降至6%[29] - 代码评审误判率:下降逾40%[29] - MMLU基准测试指标一致性:提升约15%[29] 量化因子与构建方式 (注:研报中未明确提及量化因子的构建内容,故本部分暂缺) 因子的回测效果 (注:研报中未提及量化因子的测试结果,故本部分暂缺) 以上总结严格基于研报中涉及的量化模型相关内容,未包含风险提示、免责声明等非核心信息。模型构建细节引用自原文技术描述部分,测试结果数据均来自基准测试报告[12][13][15][19][20][25][26][29]
西南交通大学最新论文登上Cell头条
生物世界· 2025-07-29 00:00
研究背景与意义 - 阻塞性睡眠呼吸暂停(OSA)是一种全球范围内影响上千万人的常见疾病,需要实时监测和干预解决方案 [6] - 多导睡眠图(PSG)是诊断OSA的金标准,但存在临床局限性,促使便携式睡眠管理电子设备的研发 [6] 技术突破与创新 - 研究团队开发了一种可穿戴闭环感知刺激系统(AMS),集成了柔性压电监测和软磁弹性刺激功能 [4][7] - AMS采用定制的压电复合传感器持续监测生理信号,并配备软磁弹性致动器提供非侵入式机械刺激 [7] - 利用机器学习算法分析数据,实现了92.7%的实时睡眠呼吸暂停检测准确率 [8] 临床验证与效果 - AMS在识别呼吸暂停事件方面与临床金标准PSG相当,并行对比信号证实了反馈刺激的有效性 [9] - 该系统解决了传统PSG在追踪心血管反应方面的局限性 [11] 应用前景 - AMS为家庭中的个性化睡眠健康护理提供了一个可扩展且用户友好的平台 [11] - 实现了睡眠呼吸暂停管理的闭环诊断治疗一体化 [12]
2024年美国投资公司白皮书(重点摘要)
搜狐财经· 2025-07-27 09:22
行业综述 - 资产管理行业在全球金融体系中扮演关键角色,核心任务是为个人和机构投资者管理与投资资金,通过多元策略实现回报最大化 [1] - 服务对象涵盖个人、企业、养老基金、保险公司及政府,产品包括股票、债券、共同基金、ETF及另类投资(私募股权、房地产等) [1] - 管理模式分为主动管理(依赖市场研究调整组合)和被动管理(跟踪指数),收入主要基于管理资产规模(AUM)比例或业绩表现收费 [1] - 行业受SEC、FCA等严格监管,保障投资者权益与市场公平 [1] 主要参与者 - 参与者包括大型跨国银行旗下部门、独立资产管理公司及新兴金融科技公司,后者通过技术优势带来新竞争 [2] - 大型机构凭借客户基础与资金实力占据主导,精品公司则以特色策略和服务吸引投资者 [2] 投资策略与产品 - 传统产品包括股票(资本增值)、债券(固定收益)、共同基金(分散风险),另类投资涵盖私募股权、房地产及对冲基金 [2] - 策略差异显著:价值投资聚焦低估资产,成长投资关注企业潜力,分散投资通过多资产配置降低风险 [2] 市场动态 - 全球财富增长推动行业规模扩张,2023年全球受监管开放式基金资产达68.9万亿美元,美国占比49%(33.6万亿美元) [7][16] - 技术革新(AI、大数据)提升投资决策与客户服务效率,但面临收费压力、被动产品竞争及监管变化挑战 [3] - 投资者偏好转向可持续投资,促使行业开发相关产品 [3] 美国市场数据 - 美国注册投资公司管理净资产33.9万亿美元,其中共同基金占25.5万亿美元,ETF占8.1万亿美元 [8][27] - 美国家庭54.4%持有基金,中位投资金额12.5万美元,74%家庭参与税收优惠退休计划(如401(k)和IRA) [8][30] - 美国基金持有国内公司股票33%、债券22%、国债15%,为金融市场重要资金来源 [8][35] 产品趋势 - 指数型产品需求增长,美国国内股票ETF净发行份额显著上升,主动管理共同基金资金流出 [41] - 401(k)计划中集合投资信托(CIT)占比提升至32%(2022年),成为共同基金替代选择 [43] 未来展望 - 技术驱动智能化与个性化服务,可持续投资发展空间扩大,行业整合加速(大型公司并购 vs 精品公司细分市场深耕) [3] - 共同基金与IRA成为美国养老体系核心,过去30年相关投资占家庭金融资产比例从7%升至23% [30][38]
餐饮配送→智能家居→工业制造,突破!国产机器人加速“出海”收获众多海外“粉丝”
央视网· 2025-07-26 05:55
中国工业机器人出口表现 - 2024年中国工业机器人出口市场份额跃居全球第二 2025年上半年出口继续增长61.5% [1] - 出口目的地从东南亚、非洲扩展到欧洲、北美等高端市场 欧洲市场份额占比近三成 [1] - 2025年第一季度智能割草机器人出口额达10.1亿美元 同比增长近六成 德国和英国为主要出口国 [13] 行业应用场景拓展 - 应用场景覆盖餐饮配送、智能家居、工业制造、医疗辅助等多个领域 国产机器人已进入全球60多个国家和地区 [9] - 工业机器人出口中汽车制造领域占比34% 电子行业占28% [15] - 公司重点突破汽车产业链 为宝马等欧洲企业提供零配件及白车身焊接解决方案 [17] 技术创新与市场地位 - 中国成为全球最大机器人市场和生产国 相关有效专利超19万项 占全球比重约三分之二 [20] - 在伺服电机、减速器、控制器等关键零部件领域实现进口替代 [20] - 工业机器人行业2025-2030年复合增长率预计不低于10% 发展重点包括人工智能、协作机器人、数字孪生等领域 [26] 国际竞争力展示 - 60多家中国公司参加德国慕尼黑世界自动化展会 展示先进智能机器人装备与技术 [15] - 中国机器人产品竞争力全面提升 有望从最大市场转变为最具创新力的技术发展地 [22][26]
BCEIA 2025即将盛大启幕,四十年辉煌历史,业界共襄全球分析科学与仪器盛会
仪器信息网· 2025-07-25 03:02
BCEIA 2025大会概况 - BCEIA 2025将于2025年9月10-12日在北京中国国际展览中心顺义馆举办 主题为"辉煌四十载 再谱新篇章" 纪念创办四十周年 [1][2] - 预计吸引4000+位国内外专家学者参会 包含近千场学术报告和千余篇论文投稿 [1][5] - 大会由中国科学院江桂斌院士担任主席 将发表主旨报告回顾四十年发展历程并展望未来方向 [2][5] 学术活动亮点 - 设置18个专业学术分会 涵盖质谱 色谱 电镜 光谱 磁共振 纳米分析 环境毒物分析 化学计量学与AI等关键领域 [5] - 聚焦基因组学 单细胞测序 人工智能等前沿话题 邀请国际知名科学家作大会报告 [5] - 同期举办青年科学家论坛 知名期刊主编见面会 企业新技术分享等交流活动 推动跨领域融合创新 [6] 展览会规模与内容 - 展览面积达53400㎡ 预计700+家海内外企业参展 展示近万件产品 吸引30000+专业观众 [10][12] - 展品范围覆盖分析仪器 生命科学设备 样品前处理 环境监测 物性测试 实验室配套等全产业链 [13] - 同步举办新产品发布 解决方案推介 产学研对接活动 促进科技成果转化 [14] 行业影响与趋势 - BCEIA自1985年创办以来 已成为分析测试仪器与技术应用的"行业发展风向标" [15] - 推动分析检测与智能制造 生物医药 绿色环保等领域的深度融合 [15] - 2025年将更加关注机器学习和人工智能技术 开启分析检测新时代 [15] 参展企业与合作伙伴 - 参展品牌包括安捷伦 日立 赛默飞世尔 珀金埃尔默 布鲁克 天美 禾信质谱等国际知名企业 [19] - 学术合作伙伴涵盖美国化学会 英国皇家化学会 施普林格·自然 清华大学出版社等权威机构 [21]
德勤阿里云:2025年金融行业数字化转型白皮书(英文版)
搜狐财经· 2025-07-24 08:45
行业趋势与需求分析 - 全球经济增长呈现区域分化 亚太新兴市场增速达37% 成熟经济体仅14% 推动金融机构数字化路径分化 亚洲侧重移动支付和嵌入式金融 欧美深耕财富管理自动化 [17][18][20] - 金融科技进入成熟期 AI驱动的信贷评估缩短审核时间60% 区块链提升跨境支付结算效率 [17][38] - 亚太地区是数字化转型核心引擎 预计2032年Fintech市场规模突破32595亿美元 新加坡香港通过监管沙盒平衡创新与风险 [17][22] - 中东非洲及拉美市场依托移动支付实现弯道超车 非洲移动金融交易量全球领先 拉美数字支付渗透率达50% [17] 技术应用与风险合规 - AI实时监控系统可提前3个月预测供应链风险 准确率达89% 区块链与零信任架构构建数字金融安全新范式 [2][29][30] - 全球监管框架聚焦AI透明度和数据隐私 欧盟DORA法案 香港金管局"Fintech 2025"战略提供合规指引 [2][32] - 机器学习在欺诈检测中实现毫秒级响应 错误率接近零 动态定价系统显著超越行业基准收益率 [39] 区域市场数字化特征 - 印尼经济预计2025年增长51% QRIS年交易量将达980亿美元 数字基础设施转型催生移动银行和微贷平台机遇 [21][23] - 新加坡150家金融机构参与API Exchange(APIX) 区块链项目Ubin重塑跨境支付 亚洲某机构API平台年处理15亿次调用 [43] - 日本大型银行采用区块链追踪供应链碳足迹 实时影响贷款决策 新加坡银行绿色融资组合年增45% [44] 数字化转型解决方案 - 阿里云金融数字化原生方案提供五大核心能力 涵盖AI客服 数字人 反深度伪造技术 容器技术和云原生数据库支撑系统弹性扩展 [2][8] - 某亚洲银行云原生架构使交易处理时间减少80% 实现跨司法管辖区实时合规监控 [31] - 领先机构通过"战略规划-小规模试点-快速执行"路径构建数据核心能力 在开放银行和绿色金融领域抢占先机 [2][50] 未来创新方向 - 生成式AI实现超个性化财富建议 嵌入式金融平台年交易量超500亿美元 马来西亚银行AI贷款平台缩短信审60%同时提升准确率35% [38][42] - 可持续金融成为创新重点 亚洲ESG基金规模自2019年增长3倍 新加坡银行ESG风险评估平台月处理10万家企业数据 [44] - 数字转型成功机构客户获取成本降低40% 交叉销售成功率提升65% 产品上市周期从数月缩短至数周 [46][50]
2025-2031年实验室自动化设备行业全景深度分析及投资战略可行性评估预测报告-中金企信发布
搜狐财经· 2025-07-24 03:42
实验室自动化设备行业现状 - 实验室自动化是指通过自动进行样本制备、操作控制、检测、信息处理等实验流程,减少人工干预,广泛应用于多领域实验室操作环节 [2] - 根据自动化程度和规模可分为四个阶段:单一设备形式自动化、工作站形式自动化、流水线形式自动化和智能化形式自动化 [2] - 海外市场主要参与者包括Tecan、Hamilton、BeckmanCoulter等成熟领先企业,国内企业受益于政策支持、公共卫生防控意识升级和国产化替代处于快速发展阶段 [7] 行业发展趋势 - 流程标准化程度高的实验室将向高通量、自动化、信息化方向发展 [7] - 结合机器学习、计算机视觉、数字孪生等技术推动系统向方案自适应调整、流程智能决策等更高智能化方向发展 [7] - 推动检验检测、精准医疗等多应用场景整合和多组学分析更快发展 [7] 技术门槛 - 设备仪器技术门槛:基因测序仪涉及光学、机械、电子、流体、软件、算法等多学科交叉,对硬件设计、系统集成和生产制造工艺要求高 [8] - 试剂耗材技术门槛:涉及文库制备试剂、阵列芯片、关键酶等,需高效控制核酸片段提取、断裂、扩增和富集过程,阵列芯片制作需半导体加工工艺 [9] - 数据分析和软件开发门槛:需处理庞大测序数据并进行基因组装、比对、变异检测等生物信息学分析,是精准医疗应用的基础 [10] 行业发展状况 - 2019-2024年中国实验室自动化设备行业经营效益分析显示盈利能力、运营能力、偿债能力和发展能力等指标均有详细数据 [11] - 行业经济指标分析包括不同规模企业、不同性质企业和不同地区企业的工业总产值、销售产值等 [12] - 2019-2024年全国及各地区供给情况、需求情况和产销率分析显示行业供需平衡状况 [12] 全球市场竞争 - 全球市场主要参与者集中在欧洲、北美、日本和韩国等地区,海外企业占据主导地位 [13][14] - 2019-2024年欧洲、北美、日本和韩国市场规模及2025-2031年预测数据显示各地区发展前景 [16] - 全球市场规模现状、需求结构分析和市场前景展望显示行业整体增长趋势 [16] 中国市场运行 - 2019-2024年中国实验室自动化设备行业总体规模分析包括企业数量、人员规模、资产规模和市场规模 [17] - 行业产销情况分析显示总产值、销售产值和产销率等指标 [17] - 区域细分市场调研显示东北、华北、华东、华南、华中和西南地区市场规模差异 [18] 产业链分析 - 行业产业链包括上游产业供给和下游产业需求,上游涉及原材料和技术供给,下游涉及检验检测、精准医疗等应用领域 [19] - 上游产业发展现状、供给分析和供给价格分析显示产业链上游状况 [19] - 下游产业发展现状和需求分析显示应用领域对行业的影响 [20] 行业发展趋势与前景 - 2025-2031年中国实验室自动化设备市场趋势预测显示产量、市场规模和销量增长预期 [21] - 细分市场发展趋势预测显示不同应用领域的发展潜力 [21] - 行业供需预测显示供给量、需求量和供需平衡状况 [21] 行业投资分析 - 2019-2024年行业投资规模、资金来源构成和投资主体构成显示投资活跃度 [22] - 行业进入壁垒、盈利模式和盈利因素分析显示投资特性 [23] - 投资机会和风险分析显示行业发展潜力和潜在挑战 [23]
90%的企业AI转型失败,问题在这4点
搜狐财经· 2025-07-23 12:23
最终落脚点,在于解答AI时代最核心的问题——如何构建与培养支撑AI时代需要的人才队伍。 他们强调:正如登顶珠峰不仅需要远见的领导者(CEO)和指引方向的董事会,更离不开登山者(转型 中的中层管理者)与技术专家(熟练运用AI的职工)的紧密合作。 一、第一营地:数据即新石油 历经25年时间,投资数万亿美元的IT基础设施建设[尤其在企业资源计划(ERP)与客户关系管理(CRM)系 统等领域],让全球企业置身于数据的海洋之中。 然而,我们反复听到的一个问题是,企业数据难以转化为具有可操作性的洞见。基于我们的实践经验, 企业在数据价值转化过程中,普遍存在三大认知误区。 《AI繁荣》 拉维·巴普钠、艾宁德亚·高斯 著 责编| 柒排版| 拾零 第 9073 篇深度好文:5610字 | 15 分钟阅读 随着AI技术在全球的快速发展,众多企业正积极投入智能化转型,期望抢占先机。但技术更新快、战 略方向不清晰以及人才不足等问题,让一个核心挑战更加突出:企业要如何规划和有效推进AI商业化 战略,才能降低失败风险,实现真正的商业价值? 美国知名的商学院教授拉维·巴普纳与艾宁德亚·高斯在《AI繁荣》中用攀登珠穆朗玛峰的路线作比喻, 详 ...