核心观点 - 清华朱军团队提出强化学习驱动的主动防御框架REIN-EAD 通过模拟人类视觉系统的主动探索机制 显著提升具身智能体在对抗攻击下的感知鲁棒性和泛化能力 [1][2][33] 技术框架 - REIN-EAD由感知模块和策略模块组成 通过循环神经结构整合历史观测数据 构建时间一致性的环境表征 [3][8][10] - 框架采用"感知-决策-行动"闭环机制 实现多步交互下的最优动作选择和环境反馈修正 [10][14] - 引入基于不确定性的奖励塑形机制 解决稀疏奖励问题 支持物理环境下的高效策略更新 [2][16] 算法创新 - 提出累计信息探索的强化学习算法 优化多步探索路径 避免贪婪策略的局部最优缺陷 [4][11][13] - 设计离线对抗补丁近似技术(OAPA) 通过预计算对抗补丁流形 降低训练成本并保持对抗不可知性 [5][6][18] - 理论证明多步累积交互目标与累积信息探索的一致性 确保长期不确定性最小化 [13][14][15] 性能表现 - 人脸识别任务中 攻击成功率最低降至1.06% 较基线方法提升超过50% [21][22][23] - 物体分类任务中 对自适应攻击的防御成功率达71.04% 显著优于传统方法 [25][26][27] - 目标检测任务中 平均精度保持83.15% 在对抗场景下仍能维持82.86%的检测精度 [28][29][31] - 在补丁大小、形状和攻击强度等变量测试中 展现出稳定的泛化能力 [31][32] 应用价值 - 框架适用于人脸识别、自动驾驶等安全关键领域 解决三维物理场景中的对抗攻击威胁 [2][7][33] - 突破传统被动防御对攻击先验的依赖 为对抗防御提供新的研究范式 [2][7][33] - 开源代码和论文提供完整实现细节 促进领域内进一步研究应用 [33]
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
36氪·2025-08-12 11:30