AI白帽黑客

搜索文档
大模型智能体不止能写代码,还能被训练成白帽黑客
机器之心· 2025-09-11 03:36
大模型在网络安全领域的新范式 - Amazon AWS AI的Q Developer团队提出训练网络安全大模型的两种新方法Cyber-Zero和CTF-Dojo 实现AI在网络安全攻防中的实战应用 [2][3] - 闭源大模型如Google Gemini系列已展现漏洞发现潜力 但训练范式不透明且无法自主改造 存在潜在风险 [8] - 传统训练方式需搭建真实运行环境 成本高、风险大且高质量安全攻防数据稀缺 制约AI白帽黑客发展 [8] Cyber-Zero免运行时训练方法 - 核心思想是通过runtime-free training利用CTF竞赛writeups生成高质量行为轨迹 无需真实环境 [9][11] - 基于不同人格模拟攻防对话 攻击者生成利用路径 防御者进行应对 形成训练轨迹 [11] - 实验显示其训练效果与真实环境轨迹相当 部分指标更优 32B模型性能接近Claude-3.7-Sonnet但推理成本仅1% [13][15] - 关键发现:通用软件工程智能体无法直接迁移至网络安全任务 模型规模与性能正相关 [15] CTF-Dojo实战训练体系 - 构建可运行CTF攻防环境 智能体可直接执行命令并与系统交互 发现利用漏洞 [17] - 使用CTF-Forge工具自动搭建运行时 几分钟部署数百挑战实例 大幅降低人力成本 [17] - 基于pwn.college CTF Archive数据集 筛选658个独立任务实例覆盖六大漏洞类别 [19][21] - 通过推理增强技术收集1000+成功轨迹 最终获得486条高质量验证轨迹 [21] - 训练后模型在En IGM A+基准取得最高11.6%绝对提升 性能随样本增加持续提升 [22][24] 虚拟与实战结合的闭环体系 - Cyber-Zero提供安全可扩展的训练数据 CTF-Dojo提供实战演练环境 形成完整能力培养路径 [26] - 两者结合解决数据成本与能力迁移问题 推动AI网络安全应用落地 [26] 技术前景与挑战 - 应用场景包括企业安全自动扫描、红队演练测试、教育陪练等 有望实现普惠安全 [28] - 双重用途风险突出 免运行时方法降低训练门槛 可能被滥用于进攻目的 [28] - 未来方向包括构建实时更新CTF基准和强化学习交互 需平衡开放与安全 [29]