核心观点 - 粤港澳大湾区生成式人工智能安全发展联合实验室将构建多场景全链条防护体系 通过多方协同机制和创新AI监管模式 为大湾区提供兼具国际视野与本地化适配的AI安全发展范式 [2][10] 迫切需求 - 大湾区最迫切需要科学精准高效评测并持续增强大模型输出内容的可信性 包括降低幻觉程度和提升合规水准 以支持金融医疗政务教育等高敏感场景落地 [4] - 可信性短板需补齐 防止大模型捏造事实误导用户 确保输出符合法律法规社会伦理及行业监管红线 [4] 资源与优势 - 联合实验室具备独一无二的资源拼图 包括政府主导的顶层政策导向与监管需求 腾讯等头部企业提供的实战场景与算力支持 以及高校提供的安全可信与量化评级科研能力 [4] - 各方资源在同一平台高频碰撞快速迭代 为破解大模型幻觉与合规等难题提供别处无法复制的大湾区方案 [4] 技术路径 - 将建立覆盖各类安全风险的百万级安全测试题库 训练大模型安全智能评测引擎 [5] - 探索技术对抗技术和AI评测AI的工作思路 显著提升安全评测效率和覆盖范围 应对生成式AI快速迭代带来的新型风险 [2][5] 标准体系 - 研究制定对标《人工智能安全治理框架》的大模型安全可信及量化评级评测体系 结合两项法规标准 从价值对齐安全可控能力可靠三大核心方向切入 [5] - 行业安全发展标准体系应涵盖数据安全与隐私 内容安全可信与伦理合规 模型透明度与可解释性以及安全应急响应等核心维度 [6] - 对金融医疗自动驾驶等高危领域执行强制性标准 对创新应用提供安全测试空间允许可控试错 实现发展与安全的动态平衡 [6] 评测体系 - 发布大模型可信能力评测排行榜2.0 从评测大类细分维度行业适配性等多方面优化 形成更科学更动态更具实践指导意义的评测体系 [6] 协同机制 - 政府部门发挥引导监管作用 高校科研机构负责理论研究和专业人才培育 企业作为技术研发和应用主体 行业协会搭建交流平台 [7][8] - 联合实验室整合企业高校科研机构及媒体资源 形成政产学研用协同机制 实现监管与发展的双向平衡 [10] 人才培养 - 高校在课程体系中深度融入AI伦理法律与治理模块 开设《可信人工智能》等核心课程 [8] - 组织学生参与全国性AI安全竞赛 以赛促学提升实战能力 与腾讯等企业建立联合实训基地积累前沿实战经验 [8] 发展愿景 - 成为国家级AI安全评测标杆平台 推动中国AI治理模式走向国际 [9] - 构建可持续演进的可信生态 推动模型迭代与产业优化 输出湾区经验为全球AI治理提供大湾区方案 [9] 独特作用 - 具备顶层设计优势技术生态优势和模式创新优势 强化跨境数据流动治理与安全可控能力 [10] - 依托腾讯产业引擎能力和中山大学科研积累 构建多场景全链条防护体系 [10]
将研制大模型量化评级体系
南方都市报·2025-09-15 23:10