Workflow
主动防御框架
icon
搜索文档
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
36氪· 2025-08-12 11:30
核心观点 - 清华朱军团队提出强化学习驱动的主动防御框架REIN-EAD 通过模拟人类视觉系统的主动探索机制 显著提升具身智能体在对抗攻击下的感知鲁棒性和泛化能力 [1][2][33] 技术框架 - REIN-EAD由感知模块和策略模块组成 通过循环神经结构整合历史观测数据 构建时间一致性的环境表征 [3][8][10] - 框架采用"感知-决策-行动"闭环机制 实现多步交互下的最优动作选择和环境反馈修正 [10][14] - 引入基于不确定性的奖励塑形机制 解决稀疏奖励问题 支持物理环境下的高效策略更新 [2][16] 算法创新 - 提出累计信息探索的强化学习算法 优化多步探索路径 避免贪婪策略的局部最优缺陷 [4][11][13] - 设计离线对抗补丁近似技术(OAPA) 通过预计算对抗补丁流形 降低训练成本并保持对抗不可知性 [5][6][18] - 理论证明多步累积交互目标与累积信息探索的一致性 确保长期不确定性最小化 [13][14][15] 性能表现 - 人脸识别任务中 攻击成功率最低降至1.06% 较基线方法提升超过50% [21][22][23] - 物体分类任务中 对自适应攻击的防御成功率达71.04% 显著优于传统方法 [25][26][27] - 目标检测任务中 平均精度保持83.15% 在对抗场景下仍能维持82.86%的检测精度 [28][29][31] - 在补丁大小、形状和攻击强度等变量测试中 展现出稳定的泛化能力 [31][32] 应用价值 - 框架适用于人脸识别、自动驾驶等安全关键领域 解决三维物理场景中的对抗攻击威胁 [2][7][33] - 突破传统被动防御对攻击先验的依赖 为对抗防御提供新的研究范式 [2][7][33] - 开源代码和论文提供完整实现细节 促进领域内进一步研究应用 [33]
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
量子位· 2025-08-12 09:35
核心观点 - 清华朱军团队提出强化学习驱动的主动防御框架REIN-EAD,模拟人类视觉系统的主动探索与纠错机制,提升对抗场景下的感知鲁棒性 [1][2][3] - REIN-EAD通过多步连续观察和循环预测优化即时准确率与长期预测熵,显著降低未知攻击与自适应攻击的成功率 [4][12][31] - 框架引入基于不确定性的奖励塑形机制和离线对抗补丁近似技术(OAPA),解决传统被动防御方法的局限性 [6][7][30] 技术框架 - **感知-决策-行动一体化**:REIN-EAD由感知模型(生成环境增强表征)和策略模型(生成主动感知动作)组成闭环系统,实现动态环境中的持续观测与理解 [10][12][13] - **累积信息探索算法**:通过多步累积交互目标优化策略,避免贪婪探索的局部最优问题,结合PPO算法实现稳定策略更新 [20][21][23] - **离线对抗补丁近似(OAPA)**:预先计算对抗补丁流形近似,降低3D环境训练开销,提升对未知攻击的泛化能力 [7][30] 实验性能 - **人脸识别任务**:REIN-EAD在CelebA-3D数据集上将自适应攻击成功率降至7.37%(基线EAD为22.11%),标准精度保持89.03% [32][35] - **物体分类任务**:在OmniObject3D数据集上,REIN-EAD对MeshAdv攻击的防御成功率提升至95.66%(未防御组为3.81%),标准精度88.93% [40] - **目标检测任务**:CARLA场景中,REIN-EAD平均精度(AP)达83.15%,对抗条件下AP保持82.12%(未防御组为35.85%) [43] 创新贡献 - **主动防御范式**:首次将强化学习与运动视觉机制结合,通过环境交互构建时间一致性表征,突破静态防御瓶颈 [5][12][49] - **跨任务泛化性**:在安全关键领域(人脸识别、自动驾驶)实现统一防御框架,对像素空间、隐变量空间攻击均有效 [8][31][42] - **工程实用性**:OAPA技术使训练效率提升3倍以上,支持物理引擎(如UE)不可微分环境下的鲁棒训练 [7][18][30]