360数字安全集团CTO潘剑锋:跳出通用模型框架,要打造真正的安全垂直大模型
行业技术发展趋势 - 安全行业对大模型的探索从快速集成模式迈向纵深实战化阶段 要求跳出通用模型框架深入底层技术创新打造安全领域垂直大模型 [1] - 基于人脑快慢思考方法论重构大模型与智能体能力边界 将安全子任务划分为快思考任务和慢思考任务分别处理再综合应用 [1] - 快思考对应人类95%日常潜意识决策 大模型擅长通过海量标签数据挖掘统计规律进行直觉判断 [1] - 慢思考对应人类深思熟虑的多步推理 需结合事实性知识与外部工具 在安全领域体现为复杂威胁溯源和多维度关联分析等深度推理任务 [1] 公司技术突破路径 - 以在专业场景中实现小参数模型能力远超通用大尺寸模型为目标 通过三级跳式发展实现安全大模型效能跃升 [3] - 第一阶段聚焦单个安全任务探索垂直模型结构与训练方法创新 为不同任务定制专用模型并开展专项训练 [3] - 创新将EDR日志转化为终端行为监控录像 每条操作对应一帧画面 使AI以看录像看精华方式完成分析 实现研判与归因准确率达99.42% [3] - 第二阶段推出多专家协同大模型架构 以大基座为基础插入不同专家分区 多数参数固定 任务执行时无需激活所有参数 解决多模型协同难题 [3] - 第三阶段主导推出业界首个开源RL-LoRA训练框架 显存和带宽开销呈数量级降低 支持更大Batch Size使训练效率翻倍周期大幅缩短 [4]