JADE大模型安全风险分析治理平台

搜索文档
AI时代未成年人需要“调控型保护”
南方都市报· 2025-09-13 23:13
9月12日,在外滩大会"规范AI内容 共筑清朗生态"见解论坛上,南都大数据研究院编制并发布《AI新 治向:生成式人工智能内容与传播风险治理观察》报告。 "AI新治向"重磅报告首发、实验"AI造假"路人反应、专家献策"AI谣言"治理、脱口秀抛梗"AI新生 活"……9月12日下午,以"规范AI内容 共筑清朗生态"为主题的外滩大会见解论坛在上海举办。论坛汇 聚AI治理专家学者、企业精英、青年学子及青少年代表,围绕人工智能生成合成内容及传播过程中的 风险挑战议题深入探讨。据悉,本次论坛由南方都市报社、南都大数据研究院、中国互联网协会人工智 能工作委员会、复旦大学传播与国家治理研究中心主办。 多元协同共筑清朗生态 最新报告聚焦AI风险治理 活动现场,本次活动的主办方代表、南方都市报社主编刘江涛致辞表示,AI已经渗入日常生活当中, 未来还将从根本上改变诸多方面,但社会也需要形成共识,要对AI保持一份足够的清醒,按照国家的 相关要求确保人工智能安全、可靠、可控。南都愿意做"铺路石",或是"吹哨者",与多方协力共建智慧 交流平台。 中国互联网协会人工智能工作委员会秘书长邓凯在致辞时指出,应对AI内容治理挑战可从三方面着力: ...
复旦大学张谧:大模型工具本无善恶,向善引导是关键
南方都市报· 2025-09-12 11:26
9月12日,2025外滩大会"规范AI内容 共筑清朗生态"见解论坛上,复旦大学计算与智能创新学院教授、 白泽智能团队负责人张谧以"大模型的安全风险与治理"为主题展开分享,从技术基础视角切入,结合团 队实践经验与成果,深入剖析大模型安全风险与治理,提出创新性解决方案。她认为,大模型作为工具 本身没有善恶之分,其发展方向取决于人类如何利用和引导它向善发展。 本次论坛由南方都市报社、南都大数据研究院、中国互联网协会人工智能工作委员会、复旦大学传播与 国家治理研究中心联合主办。 随着大模型能力的迅速提升,其安全治理问题已成为不容忽视的全球性挑战。张谧将大模型安全问题分 为两个方面,一是大模型自身的安全问题,包括内容合规、隐私泄露和生成内容追溯等;二是以大模型 为中心的全环节安全。作为"智能大脑",大模型与外部系统交互时,会在任务规划、记忆模块、外部资 源获取、工具调用等环节暴露风险,尤其在多智能体协同场景下,行为可控性进一步降低。 "当前大模型已具备AGI雏形,自主性是其核心特征,也是风险根源。"张谧通过多个案例印证这一观 点。如AgentGPT能从零开始设计游戏、PaLM-E基于多模态大模型的具身智能、GPT-4驱 ...