Workflow
机器学习
icon
搜索文档
中山大学发表最新Science论文
生物世界· 2025-09-01 00:00
全球森林恢复固碳潜力研究 - 森林作为天然吸碳器 是调节气候不可或缺的绿色空调 植树造林被视为极具成本效益的自然气候解决方案[3] - 研究团队开发机器学习模型量化造林后土壤碳变化 首次整合生态气候和政策三大因素重新定义造林缓解气候变化潜力[4][6] - 森林化会导致表层土0-30厘米碳增加与流失共存现象 若限定避免反照率变化且保障水资源与生物多样性的区域全球约3.89亿公顷土地[6] 土地可用性与政策约束 - 在限定土地条件下到2050年可封存39.9 Pg碳约合399亿吨 显著低于既往估算值[6] - 若进一步限制于现有政策承诺的1.2亿公顷土地 固碳量将降至12.5 Pg约合125亿吨[6] - 需扩大专用造林区域并增强国家承诺力度以实现更大规模气候缓解[6] 区域分布与实施路径 - 全球和区域尺度造林固碳潜力因情景而异 研究绘制了全球生态系统碳封存率土壤和生物量图谱[6][8] - 研究结果为优化土地利用政策和造林策略提供新见解 可实现最大气候效益[8]
机器学习因子选股月报(2025年9月)-20250831
西南证券· 2025-08-31 04:12
量化模型与构建方式 1 GAN_GRU 模型 - **模型名称**:GAN_GRU 模型[4][13] - **模型构建思路**:利用生成式对抗神经网络(GAN)进行量价时序特征处理,再通过 GRU 模型进行时序特征编码,最终输出选股因子[4][13] - **模型具体构建过程**: (1)**输入特征**:包括收盘价、开盘价、成交量、换手率等 18 个量价特征,频次包括日频和月频特征[14][17][19] (2)**训练数据设定**:使用所有个股过去 400 天内的 18 个量价特征,每 5 个交易日做一次特征采样,采样形状为 40×18(过去 40 天的量价特征),预测未来 20 个交易日的累计收益[18] (3)**数据处理**:每个特征在时序上去极值+标准化,每个特征在个股层面上截面标准化[18] (4)**训练方式**:半年滚动训练(每年 6 月 30 日和 12 月 31 日),训练集与验证集比例 80%:20%,batch_size 为截面股票数量,优化器为 Adam,学习速率 1e-4,损失函数为 IC,早停轮数 10,最大训练轮数 50[18] (5)**GAN 部分构建**: - 生成器(G):使用 LSTM 模型,输入原始量价时序特征(形状 40×18),输出处理后的量价时序特征(形状 40×18)[33][37] 生成器损失函数: $$L_{G}\,=\,-\mathbb{E}_{z\sim P_{z}(z)}[\log(D(G(z)))]$$ 其中 z 为随机噪声(高斯分布),G(z) 为生成数据,D(G(z)) 为判别器对生成数据的输出概率[24][25] - 判别器(D):使用 CNN 模型,输入真实数据或生成数据,输出为真实数据的概率[33] 判别器损失函数: $$L_{D}=-\mathbb{E}_{x\sim P_{d a t a}(x)}[\log\!D(x)]-\mathbb{E}_{z\sim P_{z}(z)}[\log(1-D(G(z)))]$$ 其中 x 为真实数据,D(x) 为判别器对真实数据的输出概率[27] - 训练过程:生成器和判别器交替训练,首先生成噪声数据并生成假数据,计算损失并更新生成器参数;然后采样真实数据,计算判别器损失并更新判别器参数[28][29][34] (6)**GRU 部分构建**:使用两层 GRU 层(GRU(128,128))和 MLP(256,64,64),输出预测收益 pRet 作为选股因子[22] (7)**因子处理**:对因子做行业市值中性化+标准化处理[22] - **模型评价**:该模型通过 GAN 增强量价时序特征生成能力,结合 GRU 捕捉时序依赖关系,提升选股因子的预测效果[4][13][30] --- 量化因子与构建方式 1 GAN_GRU 因子 - **因子名称**:GAN_GRU 因子[4][13] - **因子构建思路**:基于 GAN_GRU 模型输出的预测收益 pRet 作为选股因子[4][13][22] - **因子具体构建过程**: (1)使用 GAN_GRU 模型对全 A 股进行预测,输出每只股票的预测收益 pRet[22] (2)对 pRet 进行行业市值中性化+标准化处理,得到最终因子值[22] (3)每月末调仓,选取因子值排名前 10% 的股票作为多头组合[4][48] --- 模型与因子的回测效果 1 GAN_GRU 因子全市场表现(2019 年 1 月至 2025 年 8 月,月频调仓)[41][42] - IC:11.36% - ICIR(未年化):0.88 - 换手率:0.83 - 年化收益率:38.09% - 年化波动率:23.68% - 信息比率(IR):1.61 - 最大回撤率:27.29% - 年化超额收益率:23.52% 2 GAN_GRU 因子近期表现(截至 2025 年 8 月 28 日)[41][42] - 最新一期 IC:-2.56% - 近一年 IC 均值:8.94% 3 GAN_GRU 因子行业表现(截至 2025 年 8 月)[42][44] - **当期 IC 排名前五行业**: - 食品饮料:22.17% - 煤炭:18.28% - 建筑材料:13.48% - 公用事业:13.20% - 社会服务:12.23% - **近一年 IC 均值排名前五行业**: - 公用事业:15.87% - 钢铁:13.95% - 商贸零售:13.51% - 非银金融:12.78% - 建筑材料:12.44% 4 GAN_GRU 因子多头组合行业超额收益(截至 2025 年 8 月)[2][44][45] - **当期超额收益排名前五行业**: - 纺织服饰:5.19% - 公用事业:3.62% - 汽车:3.29% - 非银金融:2.56% - 医药生物:1.47% - **近一年月平均超额收益排名前五行业**: - 家用电器:4.97% - 建筑材料:4.11% - 公用事业:3.94% - 食品饮料:3.86% - 纺织服饰:3.35% 5 最新多头组合(2025 年 8 月末因子值排名前十个股)[5][49] 1. 神火股份(有色金属) 2. 广州港(交通运输) 3. 中谷物流(交通运输) 4. 中国外运(交通运输) 5. 汉缆股份(电力设备) 6. 民生银行(银行) 7. 兴发集团(基础化工) 8. 驰宏锌锗(有色金属) 9. 中信特钢(钢铁) 10. 中直股份(国防军工)
德国耐驰:树脂基复材在线固化监测与智能化生产控制
DT新材料· 2025-08-27 16:04
德国耐驰结合传感器、材料科学和AI 云计算,为聚合物、聚合物基复合材料领域加工提供独特的解决方案。本文重点介绍如何 将NETZSCH - sensXPERT 方案应用于空客公司的实际工艺流程。 许多行业面临类似问题: 汽车业和航空业可能使用不同的制造过程,但是它们在生产中 面临相同的问题:缩短生产节拍、提高成品率、动态控制每一个产品等等 。热固性塑 料和热固性复合材料越来越广泛地应用于生产高机械强度的高性能部件。针 对不同应用场景需要量身定制不同的树脂及配方材料 ,而材料的 多样性 给实际生产带来了许多挑战。 多年来,耐驰与客户一起观察和分析了行业痛点,目的是帮助企业发挥复材的全部潜力。复合材料部件生产工艺中,最缺乏的是所谓"数据透明性"。 也就是说,在部件固化的关键过程中,无法获得该个体的实时固化过程数据。 没有实时固化数据支撑,工艺优化、产品改进、效率提升……都无法真 正实现。 显然,为了获得材料的最优固化过程、改善生产过程,材料实时固化历程的数据是关键。 介电树脂固化监测仪DEA 德国耐驰仪器公司被空客公司选中为研发项目提供智能传感器解决方案: 著名的飞机制造商空客公司选择德国耐驰仪器公司提供的智能传感 ...
字节跳动再失大将,豆包大模型视觉研究负责人冯佳时离职
搜狐财经· 2025-08-27 05:06
核心高管变动 - 字节跳动豆包大模型视觉基础研究团队负责人冯佳时确认离职 此前公司曾于六月辟谣该消息[1] - 冯佳时师从AI顶尖学者颜水成 曾任新加坡国立大学助理教授 拥有超过400篇学术论文 谷歌学术引用量达6.9万次[3][11] - 其主导推动视频多模态大模型Sa2VA和自回归视频生成模型VideoWorld等创新研究[11] 研发团队架构 - 豆包大模型团队核心成员包括视觉基础研究负责人冯佳时 AML和Foundation团队负责人项亮 大语言模型研究负责人王明轩[6][8][10] - 项亮同时为《推荐系统实践》作者及Resys China推荐系统社区创始人[8] - 王明轩专注于模型超级对齐、可解释性及合成数据等研究方向[10] 人才流动情况 - 自去年12月以来 字节大模型团队连续流失多位核心人才 包括剪映产品负责人张逍然 TikTok算法负责人陈志杰 火山引擎AI应用产品线骆怡航[13] - 公司通过全球招聘弥补人才缺口 以数千万年薪招募原阿里通义大模型技术团队关键成员[13] - 近期新增高管包括经纬创投合伙人熊飞(加入飞书团队)及谷歌DeepMind研究副总裁吴永辉(担任Seed基础研究负责人)[13] 行业竞争态势 - AI大模型领域人才争夺战持续加剧[19] - 字节跳动在面临人才流失挑战的同时 仍积极通过招募顶级人才维持行业领先地位[13][19]
打磨7年,李航新书《机器学习方法(第2版)》发布,有了强化学习,赠书20本
机器之心· 2025-08-27 03:18
机器之心报道 机器之心编辑部 每个领域的发展,都离不开几本奠定基础的经典书籍,人工智能亦是如此。 此前,李航老师的《统计学习方法》《统计学习方法(第 2 版)》可以说是机器学习宝典,很多学生、老师都将此书奉为必读书籍。 然而,随着 AI 技术的快速发展,特别是深度学习的飞跃式进展,一本仅覆盖传统机器学习的教材,已无法全面反映当前机器学习技术的全貌。 因此,李航老师在前两版的基础上,又推出了《机器学习方法》,新增深度学习内容。 而近期,AI 圈对于强化学习的关注也在迅速升温。从大模型与智能体的融合尝试,到强化学习在游戏、机器人控制、决策优化中的广泛应用,这一方向再次成为 焦点。然而,此前许多教材对此涉及较少,甚至完全缺席,导致很多人无法系统学习。 现在这个问题也解决了。 李航老师全新上线新书《机器学习方法(第 2 版)》 ,将强化学习独立成篇,系统介绍了强化学习的基本框架与代表算法,包括马尔可 夫决策过程、多臂老虎机问题、深度 Q 网络等。 全书共分为 4 篇( 或 4 册) ,对应 监督学习、无监督学习、深度学习和强化学习 4 个主要分支。 至此,《机器学习方法(第 2 版)》构建起了一个覆盖监督学习、无监督 ...
对话菁英投顾——“智选多资产ETF”主创何嘉文
I S090062 元多合产品 - 款以量化策略驱动,全球配置的智慧型 ETF投顾服务产品! 在当今复杂多变的市场环境中,普通投资者面临着前 所未有的挑战:个股数量持续扩容,选择越来越难? 如何在全球资产配置中把握机会? 如何在市场波动中 保持理性? 如何解决只赚指数不赚钱的投资困境? ETF就是一个绝佳的多元工具箱,据统计,自8月以来 截止8月13日收盘,全市场5424只个股,其中上涨占 比为83%;1661只ETF/LOF上涨占比接近95%。再 继续分析近6月、近1年、近2年、近3年上涨家数占 比,ETF上涨占比均显著高于A股。 | | 8 月以来 | 近6月 | 近1年 | 近2年 | 近3年 | | --- | --- | --- | --- | --- | --- | | 个股 | 83% | 77% | 93% | 65% | 59% | | FTF 和I OF | 010/ | 030 | 06% | 810/ | 74% | 基于此,本期我们专访了申万宏源"智选多资产 ETF"主创何嘉文老师,作为拥有26年投资经验、最 高管理规模超120亿元的资深投资经理,何老师将分 享他如何通过量化模型和系 ...
媒体看天正 | 国家级智能工厂的“数字医生”
搜狐财经· 2025-08-26 11:44
工业互联网发展特征 - 工业互联网呈现高度融合、智能化和生态化特征 [3] - 工业互联网广泛应用于制造业、能源、交通、医疗等多个领域 [3] 工业互联网运维师职能 - 工业互联网运维师是智能工厂的"数字医生" 负责守护工业互联网系统高效安全运行 [3] - 工业互联网运维师需精通传统互联网知识 同时掌握大数据分析、人工智能和机器学习等前沿技术 [3] - 工业互联网运维师核心职能是搭建维护平台 无缝连接物理设备与信息系统 运用云计算和边缘计算确保实时数据处理高效可靠 [3] 公司数字化转型实践 - 公司智能断路器未来工厂通过数字孪生平台清晰展示各智能化车间生产情况和数据 [3] - 公司乐清总部信息部拥有近30名工业互联网运维师 [4] - 工业互联网运维师需驻扎生产车间并走访产业链上游企业 摸排企业上云用数过程中的困难 [4] 行业认可与成就 - 公司"需求驱动的输配电及控制设备智能工厂"上榜国家首批卓越级智能工厂名单 为温州唯一入选项目 [4]
推理速度快50倍,MIT团队提出FASTSOLV模型,实现任意温度下的小分子溶解度预测
36氪· 2025-08-26 07:23
研究突破 - 麻省理工学院研究团队开发了FASTSOLV模型,通过结合化学信息学工具与BigSolDB数据库,改进FASTPROP和CHEMPROP架构,实现溶质分子、溶剂分子及温度参数的多输入直接回归训练[1][2] - 在严格溶质外推场景下,优化后模型的RMSE相较Vermeire等人的SOTA模型降低2–3倍,推理速度提升最高达50倍[1][2][14] - 模型在SolProp测试集上RMSE=0.83,接近实验随机不确定极限(RMSE=0.75 log单位),且性能优于MolFormer、ChemBERTa-2等大模型[14][15] 技术架构 - 模型将溶质和溶剂分子结构映射为表征向量,与温度参数拼接后输入全连接神经网络进行logS回归训练[11] - 采用集成策略,在4个不同随机初始化条件下训练FASTPROP模型组合成FASTSOLV,有效降低随机波动风险[13] - 支持SHAP可解释性分析,并能区分结构相似的己烷与庚烷溶剂[14][20] 数据体系 - BigSolDB数据库系统收录有机固体在多溶剂及温度条件下接近沉淀极限的溶解度数据,logS分布集中在–1附近且低溶解度端呈长尾分布[6][7] - 训练采用严格以溶质为单位的数据切分:95%溶质用于训练,5%用于验证,同一溶质在不同溶剂与温度下的测量不会跨子集出现[9] - 使用ASTARTES工具包按完整实验为单位随机划分验证集,确保评测独立性[9] 性能表现 - 在Leeds数据集上,FASTPROP与CHEMPROP的RMSE分别降至0.95和0.99(Vermeire模型为2.16),P₁均超69%[14] - 模型在SolProp测试集上预测高度相关(Pearson r=0.81),温度梯度预测分布一致(EMD=0.03/0.02)[17] - 对利培酮预测RMSE=0.16(Vermeire为1.64),对L-脯氨酰胺预测RMSE=0.25(Vermeire为2.33)[20] 行业应用 - 制药行业采用高通量溶解度评估技术(如AspenTech的Aspen Solubility Modeler),基于少数溶剂实测数据预测数百种溶剂组合溶解度,在GSK和AstraZeneca等公司提升晶体筛选与工艺开发效率[25] - 材料研发领域通过数据驱动模型分析分子结构与性能数据,预测新材料特性以缩短研发周期并降低成本[25] - 化工企业利用模型预测不同溶剂和温度条件下的反应效果,优化生产工艺并提高产品质量[25] 学术影响 - 英国利兹大学开发结合人工智能与物理-化学机制的Causal Structure Property Relationship模型,在有机溶剂与水体系中实现预测精度接近实验误差水平的溶解度预测[24] - 麻省理工学院利用图神经网络Chemprop测定39,312个化合物的抗生素活性和毒性,并对12,076,365个化合物展开预测,成功应用于新抗生素挖掘[24]
国元证券:促消费政策再加码 智能家居产业链有望受益
智通财经· 2025-08-26 02:33
政策层面 - 国家加力扩围实施消费品以旧换新政策 家电补贴品类从8类扩大至12类 [2] - 政策组合拳包括设备更新 消费品以旧换新及回收循环利用等多方面发力 [2] - 全国消费品以旧换新工作推进会议强调落实促消费增量政策 加快培育消费市场新增长点 [1] 技术层面 - 物联网 人工智能 机器学习和大数据分析等前沿科技持续演进 [3] - 技术进步拓宽智能家居设备应用边界与交互深度 为行业构筑坚实技术底座 [3] - 科技发展有望催生更多高附加值创新产品和服务 满足消费者多样化需求 [3] 需求层面 - 中美关税战缓和有望利好中国家电企业出海 [4] - 居民生活水平提升与科技普及推动智能家居行业升级迭代 [4] - 老龄化加速带来居家养老需求激增 成为行业增长新动力 [4] 行业影响 - 智能家居产业链上中下游有望受益于政策与技术双轮驱动 [1][5] - 贴息政策与以旧换新政策形成组合拳 叠加科技进步和现实需求 [1] - 行业维持推荐评级 聚焦家电 家居等领域消费刺激 [2][5]
研判2025!中国机器人流程自动化(RPA)行业发展历程、产业链及市场规模分析:技术融合AI与云化趋势推动RPA升级,助力各行业自动化革新[图]
产业信息网· 2025-08-26 01:34
行业概述 - 机器人流程自动化(RPA)是一种基于软件机器人或人工智能(AI)工作者的技术,通过模拟人类在计算机上的操作,自动执行重复性高、规则性强的任务 [2] - RPA 利用用户界面(UI)和表面级特征组合,创建自动处理常规性、可预测数据转录工作的脚本,从而替代人工完成低价值、重复性的工作流程,提升效率并减少错误 [2] 行业发展历程 - 我国 RPA 行业发展历程可划分为四个阶段:初期阶段、崛起阶段、市场竞争加剧阶段、技术整合与创新阶段 [4] - 2001年,基于抓屏技术与工作流程自动化技术开发而成的按键精灵软件出现,成为国内最早的 RPA 产品 [4] - 弘玑(2015)、云扩科技(2017)、金智维(2016)等本土企业集中成立,推动技术国产化 [4] - RPA 与 AI、低代码等技术深度融合,开启超自动化新时代 [4] 行业产业链 - 产业链上游主要包括服务器、存储设备、网络设备、操作系统、数据库、自然语言处理、计算机视觉、机器学习、开发工具、云服务等技术与工具 [6] - 产业链中游为 RPA 软件与平台供应商 [6] - 产业链下游主要应用于金融、制造业、政务、医疗健康、电商与物流等领域 [6] 市场规模 - 2024年,中国 RPA 行业市场规模约为67.9亿元,同比增长35.80% [1][10] - RPA 技术在中国的应用领域广泛,涵盖了金融、制造业、医疗保健、零售与电商、政务与公共部门等多个行业 [1][10] - 在金融行业,RPA 被广泛应用于财务报表生成、贷款审批、反洗钱监控等场景 [1][10] - 在制造业,RPA 用于采购订单处理、质量检测报告生成、供应商对账等 [1][10] - 在医疗保健领域,RPA 应用于患者预约安排、治疗周期监控等 [1][10] 技术融合与趋势 - RPA 技术正与人工智能(AI)、机器学习、自然语言处理(NLP)等技术深度融合,实现更高级别的认知智能和更复杂的业务流程优化 [1][10] - 实在智能等厂商将 OCR、NLP 与机器学习融入 RPA,实现了非结构化数据处理能力的突破 [1][10] - RPA 产品的云化趋势也日益明显,以满足企业对灵活性、可扩展性和成本效益的需求 [1][10] - RPA 技术正从规则驱动向认知智能跃迁,生成式 AI 与低代码平台的融合成为核心驱动力 [18] - 未来,RPA 技术将越来越多地采用云原生架构和低代码开发模式 [21] 重点企业经营情况 - 金智维、艺赛旗、来也科技、实在智能、弘玑等厂商占据了主要市场份额 [12] - 金智维凭借其在金融领域的深厚积累和强大的技术实力,在 RPA 市场中占据领先地位 [12] - 艺赛旗在 RPA+AI 领域具有深厚的技术积累,尤其在流程挖掘方面表现突出 [12] - 金智维服务包括国有六大行总行在内的1000+政企,并在2020年完成A轮近亿元融资,2021年完成B轮逾2亿元融资,2023年完成C轮近5亿元融资 [13] - 艺赛旗服务的客户超1000家,覆盖金融、通信运营商、能源、电力、制造业等垂直行业 [15] 应用案例与效益 - 在金融行业,工商银行部署1700个 RPA 场景,年节省3万人年成本 [20] - 在制造业,宇通客车通过 RPA 将订单处理时间从20分钟压缩至3分钟 [20] - 在政务领域,北京密云区政务局利用来也科技 RPA 实现无纸化审批,录入时间压缩90% [20] - 在医疗领域,RPA 带动挂号患者等待时间减少60% [20] - 2025年上半年,中国制造业现价 GDP 为16.99万亿元,同比增长3.84% [8]