深度学习

搜索文档
机器学习因子选股月报(2025年6月)-20250529
西南证券· 2025-05-29 05:15
量化模型与构建方式 1. **模型名称**:GAN_GRU模型 - **模型构建思路**:结合生成式对抗网络(GAN)和门控循环单元(GRU)的深度学习模型,通过GAN处理量价时序特征后,利用GRU进行时序编码生成选股因子[9][10] - **模型具体构建过程**: 1. **数据输入**:18个量价特征(如收盘价、成交量等),过去400天的数据,每5天采样一次,形成40×18的特征矩阵[13][14] 2. **GAN部分**: - **生成器(G)**:LSTM结构,输入噪声生成模拟量价特征,损失函数为: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ - **判别器(D)**:CNN结构,区分真实与生成特征,损失函数为: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ - 交替训练G和D直至收敛[20][23][26] 3. **GRU部分**:两层GRU(128,128)提取时序特征,后接MLP(256,64,64)输出预测收益pRet作为因子[18] 4. **数据处理**:时序去极值+标准化,截面标准化[14] - **模型评价**:通过对抗训练提升特征生成质量,保留时序特性,适配金融数据的高噪声环境[29][33] --- 量化因子与构建方式 1. **因子名称**:GAN_GRU因子 - **因子构建思路**:基于GAN_GRU模型输出的预测收益pRet,经行业市值中性化+标准化处理后作为选股因子[18][37] - **因子具体构建过程**: 1. 模型每半年滚动训练(6月30日/12月31日),预测未来半年收益[14] 2. 剔除ST股及上市不足半年的股票,保留有效样本[14] 3. 因子值=模型输出的pRet,截面排序后取前10%作为多头组合[37][44] --- 模型的回测效果 1. **GAN_GRU模型**: - **IC均值**:11.57%(全A股,2019/01-2025/05)[37] - **ICIR**:0.89[38] - **年化超额收益率**:25.01%[37] - **信息比率(IR)**:1.66[38] - **最大回撤**:27.29%[38] --- 因子的回测效果 1. **GAN_GRU因子**: - **近期IC(2025/05)**:-0.28%,近一年IC均值11.54%[37][38] - **行业表现**: - 当期IC前五行业:社会服务(30.15%)、国防军工(28.07%)、银行(25.31%)[39] - 近一年IC均值前五行业:建筑装饰(18.54%)、公用事业(18.14%)[39] - **多头组合超额收益**: - 当期最高行业:商贸零售(8.22%)、国防军工(7.15%)[42] - 近一年月均最高行业:石油石化(5.60%)、建筑材料(5.29%)[42] --- 多头组合示例(2025/05) - **前十个股**:顺威股份(家用电器)、博深股份(机械设备)、九典制药(医药生物)等[44][48] - **行业排名第一个股**:如顺威股份(家用电器)、盛剑科技(环保)等[44]
南开大学郑伟等开发蛋白结构预测新模型:AI+物理模拟,超越AlphaFold2/3
生物世界· 2025-05-26 08:38
蛋白质结构预测技术突破 - 南开大学郑伟教授团队开发了新型蛋白质结构预测工具D-I-TASSER,在CASP15比赛中表现优于AlphaFold2和AlphaFold3 [2][3] - D-I-TASSER成功预测了人类蛋白质组中19512个蛋白质,覆盖率达95%,能够折叠81%的蛋白质结构域和73%的全长序列 [3][12] - 该技术融合深度学习和物理模拟,实现了高精度的蛋白质结构和功能预测 [3] AlphaFold的局限性 - AlphaFold在多结构域预测方面存在短板,80%的人类蛋白质含多个结构域,传统方法常忽略域间相互作用 [6] - AlphaFold是静态模型,难以捕捉蛋白质动态变化,对缺乏同源序列的蛋白质预测能力骤降 [6] - 纯数据驱动方法可能丢失蛋白质折叠的底层物理规律 [6] D-I-TASSER技术创新 - 深度融合深度学习与物理模拟,整合多源信息并利用物理引擎迭代优化结构 [8] - 首创自动切割-独立预测-动态组装的流程,域内精度达0.858,较AlphaFold2提升2.8%,域间取向误差降低17% [8] - 采用升级版DeepMSA2搜索宏基因组数据库,多序列比对信息量提升6.75倍 [11] 技术性能表现 - 在CASP15盲测中,对困难靶标的预测精度比AlphaFold2高29.2% [11] - 成功解析超过3000个氨基酸残基的超大蛋白质,如新冠病毒刺突蛋白,捕捉开放/闭合双构象 [11] - 无序区域构象多样性比AlphaFold高59%,系统注释了ATP结合、铁硫簇组装等关键功能位点 [14][15] 当前挑战 - 对孤儿蛋白(同源序列<1%)预测精度降至0.67 TM-score [20] - 尚未涉及蛋白质复合体的结构预测 [20] - 计算耗时仍高于纯深度学习模型 [20]
四位图灵奖掌舵,2025智源大会揭示AI进化新路径
量子位· 2025-05-23 06:14
智源大会概况 - 第七届北京智源大会将于2025年6月6日至7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖AI研究者[3] - 大会自2019年创办以来已吸引12位图灵奖得主参与,每年有200余位专家参会,联动全球30多个国家和地区的50万从业者[3] - 2025年大会将迎来四位图灵奖获得者,云集MIT、斯坦福、清华、北大等20+顶尖科研院所及DeepMind、华为、阿里等企业专家[4] AI技术发展趋势 - 深度学习和强化学习的技术交叉成为下一代通用人工智能基石,2016年AlphaGo成功推动两者融合[2] - 2025年AI发展关键词包括推理大模型兴起、开源生态加速(如DeepSeek)、具身智能百花齐放(VLA等开源模型推动)[2] - 基础理论领域聚焦深度推理模型、多模态模型、类脑大模型、NeuroAl等20个前沿议题[6][8] 大会核心议程 - 设立基础理论、应用探索、产业创新、可持续发展四大主题,包含近20场专题论坛[4] - 专题涵盖自主智能体、AI for Science、智能驾驶、AI安全等方向,特别设置"大模型产业CEO论坛"(智谱AI、面壁智能等参与)[5][11] - 新增"InnoVibe共创场"为青年学者提供成果分享平台,同步开设AI互动展区展示前沿科技[5] 产业生态与创新 - 开源生态加速演进,PyTorch Day China和AI开源项目Tech Tutorial系列活动推动技术落地[11] - 具身智能与人形机器人、AI+理工/医学等应用探索成为产业焦点[8][11] - 企业创新路径涵盖从AI for Science到AI for Industry的完整链条[11]
四位图灵奖掌舵:2025智源大会揭示AI进化新路径
机器之心· 2025-05-23 04:17
智源大会概况 - 2025年第七届北京智源大会将于6月6-7日在中关村国家自主创新示范区展示中心举行,汇聚全球顶尖AI研究者与产业领袖 [3][4] - 大会自2019年创办以来已吸引12位图灵奖得主参与,每年有200+专家参会,覆盖全球30+国家/地区的50万从业者 [3] - 2025年大会将迎来四位图灵奖得主,以及来自MIT、斯坦福、清华、北大等20+顶尖科研院所的科学家 [4][5] AI技术发展趋势 - 深度学习和强化学习的技术交叉成为下一代通用人工智能基石,如2013年DeepMind的DQN和2016年AlphaGo的突破 [2] - 2025年AI发展关键词包括推理大模型兴起、开源生态加速(如DeepSeek和VLA模型推动具身智能演进)、创新企业涌现 [3] - 基础理论领域聚焦深度推理模型、多模态模型、类脑大模型、NeuroAl等方向 [7][10] 产业应用与创新 - 应用探索涵盖具身智能与人形机器人、自主智能体、AI for Science(AI4S)、AI+理工/医学等方向 [8][10] - 产业创新板块设置大模型产业CEO论坛,邀请智谱AI、面壁智能、生数科技、爱诗科技等企业探讨演进路径 [5][10] - 智能驾驶、具身技术产业应用、从AI for Science到AI for Industry成为重点议题 [10] 特色活动与生态建设 - 首次推出"InnoVibe共创场",邀请热门论文作者分享成果,为Z世代AI青年提供展示平台 [5] - 设置AI互动展区展示前沿科技,同期举办PyTorch Day China、AI开源项目Tech Tutorial等系列活动 [5][12] - 可持续发展议题关注AI安全、青年科学家发展、开源生态建设等方向 [11][12]
吴恩达:如何在人工智能领域打造你的职业生涯?
36氪· 2025-05-22 11:00
人工智能编码能力 - 编码人工智能将成为未来社会的基础技能,类似于现在的读写能力 [1] - 人工智能和数据科学的应用范围远超传统软件工程,可在任何产生数据的场景中使用 [2] - 线性回归等AI模型可帮助小型企业优化运营,如披萨店的人员配备和供应链管理 [2] 人工智能职业发展路径 - 职业发展三步骤:学习基础技能、从事项目工作、找到工作 [3] - 人工智能领域需要持续学习,技术更新速度比成熟领域更快 [3] - AI项目具有高度迭代性,项目管理面临特殊挑战 [4][5] 人工智能技术技能 - 机器学习基础技能包括理解各类模型和核心概念 [7] - 深度学习是机器学习的重要组成部分,需要掌握神经网络等知识 [7] - 关键数学领域包括线性代数、概率统计和微积分 [8] - 软件开发技能可显著增加就业机会 [8] 人工智能项目执行 - 识别业务问题而非AI问题是项目成功的第一步 [14] - 评估AI解决方案需考虑技术可行性和业务价值 [16] - 项目里程碑应包括机器学习指标和业务指标 [17] - 资源预算需涵盖数据、人员和集成支持等要素 [18] 人工智能求职策略 - 角色转换或行业转换可采取分步策略降低难度 [27] - 创业公司比大公司更易于实现角色转换 [28] - 信息面试是了解目标公司和角色的有效方式 [31][33] - 简历和项目组合是求职过程中的关键要素 [36] 人工智能职业成功要素 - 团队合作和沟通技巧对大型项目至关重要 [43] - 建立职业网络和社区比单纯社交更有价值 [43] - 良好习惯和纪律性是长期成功的保障 [45] - 利他主义态度有助于个人职业发展 [46]
吴恩达:如何在人工智能领域打造你的职业生涯?
腾讯研究院· 2025-05-22 09:35
人工智能职业发展路径 - 编码人工智能被视为新时代的基础读写能力,类似于历史上语言读写能力的普及过程 [7][8] - 人工智能技术为编码提供了新范式,使计算机能从数据中提取知识,相比传统软件工程更具普适性 [8] - 线性回归等基础AI模型可应用于披萨店需求预测等实际场景,展示AI在各行业的广泛应用潜力 [9] 职业发展三阶段框架 - 学习基础技能:包括机器学习、深度学习、数学和软件开发等核心领域 [12][16] - 从事项目工作:与缺乏AI专业知识的利益相关者合作,面临项目管理和迭代挑战 [13] - 找到合适工作:需适应公司对AI角色认知不一致的情况,建立支持性社区 [14] 核心技术技能体系 - 基础机器学习:线性回归、逻辑回归、神经网络等模型及核心概念如偏差/方差 [17] - 深度学习:神经网络基础知识、超参数调整、卷积网络和序列模型 [17] - 相关数学:线性代数、概率统计、微积分,用于算法调试和优化 [18][23] - 软件开发:Python编程、数据结构算法、TensorFlow/PyTorch等库的使用 [18] AI项目管理方法论 - 五步项目确定法:从业务问题识别到资源预算的系统化流程 [26][32] - 项目选择策略:技术挑战性、团队合作、影响力及作为垫脚石的潜力 [36] - 执行方法论:根据成本选择"准备-瞄准-开火"或"准备-开火-瞄准"策略 [38][39] 求职策略与职业转换 - 角色转换优先于行业转换:建议先在同一行业转换AI角色,再考虑跨行业 [48] - 信息面试价值:了解目标公司AI岗位实际工作内容和所需技能的有效方式 [53][54] - 求职流程优化:研究角色和公司、准备面试、选择团队和谈判薪资的系统方法 [58] 职业长期发展要素 - 团队合作能力:处理大型项目时影响他人和被影响的关键技能 [65] - 社区建设:比单纯社交更有效的职业网络发展方式 [65] - 习惯养成:在学习、工作等方面保持长期纪律性的重要性 [67]
高频选股因子周报(20250512- 20250516):深度学习因子空头端失效,多头端强势,AI增强组合继续维持正收益-20250520
国泰海通证券· 2025-05-20 11:07
量化因子与构建方式 1. **因子名称**:日内高频偏度因子 - **构建思路**:通过捕捉股票日内收益分布的偏度特征来选股[4][10] - **具体构建过程**:计算日内收益率的三阶矩,公式为: $$Skew = \frac{E[(r-\mu)^3]}{\sigma^3}$$ 其中,\( r \)为日内收益率,\( \mu \)为均值,\( \sigma \)为标准差[10] - **评价**:历史IC为0.027,2025年IC提升至0.057,多头端稳定性较好[6] 2. **因子名称**:日内下行波动占比因子 - **构建思路**:衡量下行波动在总波动中的占比,反映风险不对称性[4][13] - **具体构建过程**:计算下行波动与总波动的比值: $$DownVolRatio = \frac{\sum_{r_t<0}(r_t-\mu)^2}{\sum(r_t-\mu)^2}$$[13] - **评价**:2025年多空收益达11.63%,但近期表现较弱[6] 3. **因子名称**:开盘后买入意愿占比因子 - **构建思路**:统计开盘后买方主动成交占比,捕捉资金流向[4][19] - **具体构建过程**:计算开盘30分钟内买方成交额占比: $$BuyRatio = \frac{V_{buy}}{V_{total}}$$[19] - **评价**:2025年周胜率达15/20,多头超额收益显著[7] 4. **因子名称**:改进GRU(50,2)+NN(10)因子 - **构建思路**:结合门控循环单元(GRU)和神经网络(NN)的深度学习模型[4][59] - **具体构建过程**:使用50天历史数据输入GRU层,2层隐藏层后接10层全连接NN[59] - **评价**:2025年多空收益17.68%,但多头超额收益为负[9] 5. **因子名称**:多颗粒度模型-5日标签因子 - **构建思路**:基于双向AGRU训练的多时间颗粒度预测模型[61][64] - **具体构建过程**:融合5日收益率标签数据训练,输出股票排序[64] - **评价**:2025年多空收益28.3%,表现最优[9] 因子回测效果 | 因子名称 | IC(2025) | 多空收益(2025YTD) | 多头超额收益(2025YTD) | 周胜率(2025) | |------------------------------|----------|-------------------|-----------------------|--------------| | 日内高频偏度因子 | 0.057 | 14.17% | 3.26% | 13/20 | | 开盘后大单净买入占比因子 | 0.034 | 12.01% | 6.26% | 16/20 | | 改进GRU(50,2)+NN(10)因子 | 0.039 | 17.68% | -2.08% | 18/20 | | 多颗粒度模型-10日标签因子 | 0.067 | 26.67% | 9.41% | 16/20 | 量化模型与构建方式 1. **模型名称**:中证500 AI增强宽约束组合 - **构建思路**:基于多颗粒度模型因子,叠加宽泛风险约束[67][68] - **具体构建过程**:目标函数为: $$max\sum\mu_{i}w_{i}$$ 约束条件包括个股权重≤1%、行业偏离≤1%、换手率约束等[68] - **评价**:严约束组合2025年超额收益3.53%,回撤控制更优[74][79] 模型回测效果 | 模型名称 | 上周收益 | 5月收益 | 2025YTD收益 | 周胜率 | |------------------------------|----------|---------|-------------|--------| | 中证1000 AI增强严约束组合 | 1.16% | 2.33% | 10.89% | 14/20 | | 中证500 AI增强宽约束组合 | 1.17% | 2.29% | 6.18% | 13/20 |
国泰海通|金工:深度学习如何提升手工量价因子表现
国泰海通证券研究· 2025-05-15 14:33
深度学习因子与手工收益因子的结合 - 通过将收益因子加入深度学习模型的正交层,可以生成与现有收益因子低相关但选股效果良好的深度学习因子,便于后续人工调整因子权重 [1] - 深度学习模型的黑盒特性在市场剧烈风格转换时难以人工干预,正交层的设计可降低深度因子与手工收益因子的多重共线性问题 [1] 正交层设计的效果验证 - 无论使用Rank MAE还是IC作为损失函数,加入高频/低频量价收益因子的正交层后,深度因子仍保持0.02以上的IC和6以上的IC IR,全市场选股效果显著 [2] - 深度因子与手工收益因子结合构建的多因子组合在全市场多头组合中表现明显改善,但指数增强组合的提升效果存在波动 [2] 多粒度因子与深度因子的协同作用 - 正交层加入收益因子后,深度因子与多粒度因子的相关性低于0.01(高频数据输入),两者结合可显著提升全市场纯多头组合表现 [2] - 深度学习因子对中、大市值股票收益预测能力有限,导致其在指数增强组合中的改善效果不明显 [2]
杭州ai图像识别的重点技术
搜狐财经· 2025-05-13 12:54
核心技术优势 - 深度学习和神经网络构成AI图像识别技术核心 通过多层网络实现图像逐层抽象和特征提取 [3] - 卷积神经网络(CNN)通过卷积层 池化层和全连接层组合有效提取图像空间特征和层次结构信息 [4] - 生成对抗网络(GAN)通过生成器与判别器对抗训练生成逼真图像数据 应用于数据增强和图像修复领域 [5] 技术应用成效 - CNN技术广泛应用于人脸识别和物体检测领域并取得优异表现 [4] - GAN技术显著提升模型泛化能力和鲁棒性 [5] - 迁移学习利用已有知识迁移至新任务 弱监督学习通过少量标签数据训练模型 共同解决数据不足和标签稀缺问题 [6] 产学研协同创新 - 浙江大学与阿里安全联合研发基于深度学习的AI细粒度图像识别技术 [3] - 研究机构与企业在深度学习领域取得显著成果 [3] - 技术创新应用为杭州AI图像识别领域未来发展奠定坚实基础 [7]
抓住阿尔茨海默病干预黄金窗口期:中国专家成功构建MCI预测模型
环球网资讯· 2025-05-07 13:13
阿尔茨海默病早期预测模型研究 - 中国医学专家成功构建轻度认知损害(MCI)预测模型,为认知障碍早期识别提供新方法 [1] - 该模型基于结构磁共振图像(MRI)数据,建立深度学习训练框架,筛选整合10个高区分度脑区特征 [2] - 研究团队开发进展指数(PI),通过分析脑部MRI生成[0,1]区间风险评分,动态反映神经退行性病变进展状态 [2] 模型技术细节 - 模型整合海马体、杏仁核、小脑等关键脑区特征,突破传统二元诊断局限 [2] - 将人口统计学信息、神经心理量表和MRI扫描PI评分结合,建立MCI预测模型 [2] - 模型可有效预测相关队列中7年后向MCI的转化 [2] 研究意义与未来发展 - 研究成果在《阿尔茨海默病预防杂志》发表,获得科技创新2030-"脑科学与类脑研究"重大项目资助 [2] - 研究有助于识别潜在患者,为及时实施有效治疗提供可能,延缓疾病进展 [1] - 未来将探索更多前沿深度学习范式在阿尔茨海默病临床诊疗领域的应用 [2]