深度强化学习
搜索文档
致敬钱学森,我国学者开发AI虚拟现实运动系统——灵境,解决青少年肥胖难题,揭示VR运动的减肥及促进大脑认知作用机制
生物世界· 2025-06-24 03:56
青少年肥胖问题 - 青少年肥胖已成为全球性公共卫生危机,发病率迅速上升,增加心血管代谢疾病风险并导致持久认知变化[2] - 青少年大脑对肥胖相关认知障碍特别敏感,可能损害工作记忆等执行功能[2] - 体力活动是一线治疗方法,但运动积极性低、不良同伴经历和缺乏个性化指导等障碍限制了参与度[2] REVERIE系统开发 - 研究团队开发全球首个面向超重/肥胖青少年的VR智能运动干预系统REVERIE(灵境)[4] - 系统采用深度强化学习驱动和Transformer架构的虚拟教练智能体,通过迭代用户交互优化[4] - 系统提供安全、有效、沉浸式且富有同理心的运动指导,生物力学表现和心率响应与真实运动无显著差异[4] - 系统中文名"灵境"致敬钱学森1990年对VR技术的预见性命名[6][8] 临床试验设计 - 研究完成全球首例针对超重/肥胖青少年的VR运动干预随机对照试验,纳入227名参与者[11] - 参与者随机分为对照组、真实乒乓球组、真实足球组、VR乒乓球组和VR足球组[11] - 运动组每周增加三次干预课程,运动强度通过心率监测控制在相同区间[11] - 主要终点为体脂含量变化,次要终点包括体成分、糖脂代谢、体适能、心理健康和认知功能等[11] 临床试验结果 - 八周干预后,VR运动组体脂量平均减少4.28千克,真实运动组减少5.06千克,效果相当[13] - VR和真实运动组肝酶水平和低密度脂蛋白胆固醇均下降,身体素质和心理健康均改善[13] - 6个月随访显示VR运动组的改善更为持久[13] - VR运动在认知功能增强方面表现更优,嗅觉测试和反应工作记忆测试证实[14] - fMRI显示VR运动增强神经效率和可塑性,多组学分析揭示与认知能力提升相关的独特变化[14] - VR运动组轻微受伤率7.69%,低于真实运动组的13.48%,均无严重不良事件[15] 行业意义 - REVERIE系统为解决青少年缺乏运动和肥胖问题提供富有同理心的方案[16] - 系统不仅能减重,还能全面改善身体、心理和认知健康[16] - Nature Medicine评论指出VR运动为超重/肥胖青少年提供新颖有效策略,某些方面优于传统运动[17]
字节跳动ByteBrain团队提出秒级推理强化学习VMR系统
快讯· 2025-06-05 06:49
技术研发 - 字节跳动ByteBrain团队联合UC Merced和UC Berkeley研发了基于深度强化学习的VMR系统[1] - 该系统将推理时间压缩至1.1秒,同时保持近似最优性能[1] - 研究成果已在系统顶会EuroSys25发表[1] 团队构成 - 研究论文的两位共同一作是字节跳动ByteBrain团队的实习生[1] - 研究聚焦于虚拟机重调度(VMR)这一长期被忽视但至关重要的问题[1]
深度强化学习赋能城市消防优化,中科院团队提出DRL新方法破解设施配置难题
36氪· 2025-06-03 07:27
地理空间优化技术发展 - 地理空间优化是数学组合优化与地理信息科学的结合,致力于解决空间布局、资源配置等实际问题,在城市建设、工业园区选址、公共服务设施选址等领域具有重要研究意义 [4] - 传统求解方法包括精确算法、近似算法和启发式算法,但分别存在计算复杂度高、算法设计复杂、缺乏理论最优性保证等局限性 [4][5] - 深度学习技术为地理空间优化带来新转机,通过数据驱动实现快速近似代替复杂计算,并自动设计新启发式算法的通用框架 [6] 深度学习模型创新 - 提出动态覆盖注意力模型SpoNet,通过智能体与环境交互实现回报最大化,无需生成标签信息,并利用知识驱动提升对空间覆盖关系的理解能力 [7][9] - 开发自适应交互注意力模型AIAM,包含交互注意力编码器、节点移除/插入解码器,在2,162个居民点和80个医院中验证了最小化总距离的可行性 [12][13][16] - 分层DRL方法通过统筹整体布局与局部调整,整合设施分布、火灾风险和交通状况等多维数据,提升城市应急消防设施配置效率 [17][22] 实际应用案例 - 在北京市朝阳区应急设施布局优化中,从132个候选设施中选择20个中心枢纽点,使覆盖节点数量最大化(服务距离2千米) [11] - 面向城市火灾风险预测的时空神经网络能自动捕捉空间结构、消防设施分布及火灾统计数据动态变化,通过注意力机制输出预测值 [18][19][21] - 应急消防设施配置引入火灾频率、交通状况等不确定性因素,将灾害损失纳入目标函数以提升布局稳健性 [22] 未来研究方向 - 计划引入地理计算机制增强空间感知能力,融合地形、网络通达性等地理结构特征 [23] - 扩展至城市群、省域级多中心联动优化,提升方法可扩展性与计算效率 [24] - 探索多智能体协同、异步训练等技术优化DRL算法框架,实现更有效实际问题求解 [25] 研究团队背景 - 梁浩健博士团队隶属于中国科学院空天信息创新研究院,研究方向涵盖地理空间优化、深度强化学习、遥感大数据分析等领域 [26][28] - 团队由王少华研究员领导,致力于通过时空大数据分析和AI技术实现空间环境智能化决策,推动智慧城市发展 [28]