Workflow
AI安全
icon
搜索文档
中国00后AI创业,“第一天就瞄准出海”
21世纪经济报道· 2025-09-25 04:53
新一轮属于"无名之辈"们的时代机遇再度来临了。中国的00后AI创业者,生而不凡,正全力冲向世界舞 台中央。 21纪经济报道记者 赵云帆 杭州报道 前些日子,宇树科技王兴兴在一次演讲中"遗憾"地说,自己最后悔的一件事情就是"大学时候没有做 AI"。 9月中旬的杭州,在AI出海社群 EPIC Connector 所主办的"AI DEMO Day"上,21世纪经济报道记者打破 次元壁,见到了那些代替王兴兴,在AI上逐梦的年轻人。其中一些就是在校大学生。 这是一场由主办方举行的融资路演比赛,所有的参赛者拿着他们的AI产品 Demo(演示版)——或者是 PPT进行比稿,争取获得种子轮融资。 与传说中一样,他们自信,自我,甚至"自恋",他们是抽象主义的拥趸,"蜜桃臀"修士,也是"AI改变 世界"的信众。 将他们聚集起来的 EPIC 核心成员来自 Antler被投企业,而Antler是专注AI的全球知名早期投资机构之 一。 当然,相比 Y Combinator——由OpenAI创始人奥特曼联合创始的AI加速孵化器而言,Antler在AI早期投 资领域的名气并不大,但其胜在数量。广撒网的 Antler, 截至目前已经投出13 ...
国内首个大模型“体检”结果发布,这样问AI很危险
36氪· 2025-09-22 23:27
近日,国内首次针对AI大模型的实网众测结果正式公布,一场大型"安全体检"透露出不容忽视的信号:本次活动累计发现安全漏洞281个,其中大模型特 有漏洞高达177个,占比超过六成,这组数据表明,AI正面临着超出传统安全范畴的新型威胁。 如今,很多人习惯把大模型当作"超级搜索引擎",事无巨细地向AI提问。但这种毫无防备的信任,很可能正悄悄推开隐私泄露的大门…… 国产大模型漏洞较少 你是否习惯把AI当作"全能顾问"——问健康、问情感、问决策?OpenAI联合杜克大学、哈佛大学9月16日发布的最新研究显示,截至今年7月,ChatGPT每 周活跃用户超7亿,发送信息量高达180亿条。其中近一半属于"询问"类,是最主流的使用方式。 "这恰恰是隐私泄露的'重灾区'。"安全专家、网络尖刀创始人曲子龙对《IT时报》记者表示,很多用户向AI咨询疾病、情感、财务等高度私密的问题,却 没有定期清理聊天记录的习惯。一旦模型或服务器被攻破,这些敏感数据极易泄露。 上述漏洞众测活动还公布了五大典型漏洞风险:一是部分产品存在不当输出类漏洞且危害严重;二是信息泄露类漏洞多发,存在较大安全隐患;三是提示 注入类漏洞普遍,是大模型最常见的漏洞风险; ...
What's Going On With CrowdStrike Stock Tuesday? - CrowdStrike Holdings (NASDAQ:CRWD), Salesforce (NYSE:CRM)
Benzinga· 2025-09-16 13:50
战略合作公告 - CrowdStrike与Salesforce在FalCon 2025大会上宣布战略合作 推出新集成方案以加强Salesforce平台AI代理与应用的安全防护 [1] - 合作将CrowdStrike的Falcon Shield与Salesforce Security Center对接 为管理员和安全团队提供更全面的工作流可见性、合规支持及关键业务保护 [1] 技术整合方案 - 通过将CrowdStrike技术嵌入Salesforce工作流 实现安全功能与业务功能在统一框架下的协同运作 [2] - 整合Charlotte AI至Salesforce Agentforce平台及Slack 支持员工通过自然对话进行风险提示、响应建议和自动修复 [4] - 支持团队直接创建专属事件响应室、隔离受感染设备或阻断可疑访问权限 [4] 风险应对机制 - 针对AI代理部署中身份攻击风险上升的行业趋势 联合方案可追溯代理至人类创建者并检测异常行为 [3] - 防止过度权限账户被滥用 为代理驱动型企业建立信任基础 [3] 高管战略观点 - CrowdStrike首席商务官强调集成将Falcon防护范围扩展至关键业务工作流 [5] - Salesforce高管指出保障代理AI安全是释放其潜力的先决条件 [5] - 双方宣称将为组织提供安全运营基础并支撑AI驱动型增长 [5] 市场反应 - 公告当日CrowdStrike股价下跌1.65%至437.44美元 [6]
360联合云南电信发布跨境业务安全服务平台
北京商报· 2025-09-16 13:35
公司合作与平台发布 - 360与中国电信云南分公司于9月16日联合发布"跨境业务安全服务平台" [1] - 平台深度融合360"以模制模"AI安全体系与电信国际通信资源 [1] 平台功能与应用领域 - 平台实现从数据生成、传输、存储到应用的全链路防护 [1] - 解决跨境电商、金融、算力服务等领域的内容审核、AI诈骗防控、数据传输安全问题 [1]
360胡振泉:共建跨境AI安全生态,联合云南电信筑牢数字丝路防线
环球网· 2025-09-16 11:09
行业趋势与挑战 - AI安全风险从潜在隐患变为现实威胁 内部存在可编程、可模仿、可生成、可调度基因缺陷 外部面临国家级网络战和黑灰产滥用攻击[2] - 政企跨境AI服务成为AI安全治理重要场景 需应对不同地区管理要求、安全评估和内容合规等多重复杂问题[2] - 内容安全是跨境业务生命线 涉及生成内容准确性、规范性和跨境数据管理要求 处理不当可能造成企业合规风险并威胁国家数据主权[2] 公司技术方案 - 提出以模制模治理理念 以大模型安全卫士为核心构建覆盖全场景的AI安全体系 实现可靠、可信、向善、可控治理目标[3] - 四大安全智能体包括内容安全智能体实时监测AI生成内容 AI Agent安全智能体防控恶意劫持 软件安全智能体通过漏洞扫描杜绝隐患 安全风险评估智能体预判威胁[3] - 四大智能体共同组成AI落地安全基座 为特定场景提供可落地解决方案 特别适配跨境业务复杂安全挑战[3] 战略合作与产品发布 - 与中国电信云南分公司联合发布跨境业务安全服务平台 致力于为跨境数据流动提供全流程安全护航[1] - 平台深度融合AI安全体系与电信国际通信资源 实现从数据生成、传输、存储到应用的全链路防护[4] - 针对跨境电商、金融、算力服务等领域解决内容审核、AI诈骗防控、数据传输安全问题[4] 区域发展战略 - 紧扣云南面向南亚东南亚辐射中心区位定位与3815战略部署 推动云南与南亚东南亚国家构建安全合作生态[4] - 平台能吸引更多跨境AI业务落地 切实助力辐射中心建设[4] - AI安全需产业链共建 将持续深化协作让安全技术在跨境场景中释放价值[4]
将研制大模型量化评级体系
南方都市报· 2025-09-15 23:10
核心观点 - 粤港澳大湾区生成式人工智能安全发展联合实验室将构建多场景全链条防护体系 通过多方协同机制和创新AI监管模式 为大湾区提供兼具国际视野与本地化适配的AI安全发展范式 [2][10] 迫切需求 - 大湾区最迫切需要科学精准高效评测并持续增强大模型输出内容的可信性 包括降低幻觉程度和提升合规水准 以支持金融医疗政务教育等高敏感场景落地 [4] - 可信性短板需补齐 防止大模型捏造事实误导用户 确保输出符合法律法规社会伦理及行业监管红线 [4] 资源与优势 - 联合实验室具备独一无二的资源拼图 包括政府主导的顶层政策导向与监管需求 腾讯等头部企业提供的实战场景与算力支持 以及高校提供的安全可信与量化评级科研能力 [4] - 各方资源在同一平台高频碰撞快速迭代 为破解大模型幻觉与合规等难题提供别处无法复制的大湾区方案 [4] 技术路径 - 将建立覆盖各类安全风险的百万级安全测试题库 训练大模型安全智能评测引擎 [5] - 探索技术对抗技术和AI评测AI的工作思路 显著提升安全评测效率和覆盖范围 应对生成式AI快速迭代带来的新型风险 [2][5] 标准体系 - 研究制定对标《人工智能安全治理框架》的大模型安全可信及量化评级评测体系 结合两项法规标准 从价值对齐安全可控能力可靠三大核心方向切入 [5] - 行业安全发展标准体系应涵盖数据安全与隐私 内容安全可信与伦理合规 模型透明度与可解释性以及安全应急响应等核心维度 [6] - 对金融医疗自动驾驶等高危领域执行强制性标准 对创新应用提供安全测试空间允许可控试错 实现发展与安全的动态平衡 [6] 评测体系 - 发布大模型可信能力评测排行榜2.0 从评测大类细分维度行业适配性等多方面优化 形成更科学更动态更具实践指导意义的评测体系 [6] 协同机制 - 政府部门发挥引导监管作用 高校科研机构负责理论研究和专业人才培育 企业作为技术研发和应用主体 行业协会搭建交流平台 [7][8] - 联合实验室整合企业高校科研机构及媒体资源 形成政产学研用协同机制 实现监管与发展的双向平衡 [10] 人才培养 - 高校在课程体系中深度融入AI伦理法律与治理模块 开设《可信人工智能》等核心课程 [8] - 组织学生参与全国性AI安全竞赛 以赛促学提升实战能力 与腾讯等企业建立联合实训基地积累前沿实战经验 [8] 发展愿景 - 成为国家级AI安全评测标杆平台 推动中国AI治理模式走向国际 [9] - 构建可持续演进的可信生态 推动模型迭代与产业优化 输出湾区经验为全球AI治理提供大湾区方案 [9] 独特作用 - 具备顶层设计优势技术生态优势和模式创新优势 强化跨境数据流动治理与安全可控能力 [10] - 依托腾讯产业引擎能力和中山大学科研积累 构建多场景全链条防护体系 [10]
探索跨区域安全协同治理“湾区方案”
南方都市报· 2025-09-15 23:10
工业和信息化部电子第五研究所副所长、联合实验室专家王蕴辉 开篇语 生成式人工智能是引领新一代科技革命和产业革命的核心驱动力,是加快培育和发展新质生产力的重要 引擎,为经济高质量发展注入新动能,与此同时,各类难以预知的风险和挑战也伴生而来。 安全是发展的基石,为进一步创新筑牢根基。2025年9月15日,粤港澳大湾区生成式人工智能安全发展 联合实验室揭牌成立。其将构建"政产学研用"深度融合的创新生态,致力服务企业发展、推动产业落 地、加强安全监管,努力实现属地企业安全合规成本全国最低、安全能力水平全国领先,助力粤港澳大 湾区成为全国生成式人工智能安全发展服务最优区域。 南方都市报、南都大数据研究院推出"湾区AI安全发展新引擎"系列报道,深度对话参与联合实验室建设 的专家,一同憧憬大湾区AI安全发展新未来。 "联合实验室将带动大湾区形成完整的AI安全产业集群。"在工业和信息化部电子第五研究所副所长、联 合实验室专家王蕴辉看来,粤港澳大湾区生成式人工智能安全发展联合实验室(简称"联合实验室")将 发挥"安全基石、协同纽带、创新引擎"三重作用,实现"安全赋能发展"目标,助力生成式AI为大湾区高 质量发展注入新动能。 谈 ...
2025国家网络安全周在昆明开幕 蚂蚁集团gPass等多款安全可信AI技术亮相
证券时报网· 2025-09-15 09:52
公司技术展示 - 公司以安全可信让AI用得放心为主题参与网安周活动 展示AI安全 数据保护 网络安全和智能风控等领域的创新成果与实践 [1] - 公司全球首个智能眼镜可信连接技术框架gPass首次亮相 展示以人为本智能交互基础设施上的安全技术突破 [1] - 公司集中展示多项前沿安全技术与系统级解决方案 包括智能体安全 大模型安全 深度伪造防御及数据与隐私安全 [3] gPass技术框架 - gPass以安全 交互 连接三大核心能力为支撑 为AI眼镜与智能体之间搭建可信即时无缝的信息桥梁 [1] - 在安全方面借助可信身份流通 端到端加密 设备认证等技术确保设备是本人 构建信息传输安全屏障 [2] - 在交互方面融合声纹 虹膜 指纹等无感核身技术实现本人操作的流畅安全认证 [2] - 在连接方面基于用户时间与场景需求自动调度多智能体间即时安全的消息交互 提升体验连贯性 [2] - 已完成与Rokid 小米 夸克 雷鸟等品牌眼镜合作 在看一下支付场景中率先落地 [2] - 未来计划扩展至医疗 文旅 出行等更多生活场景 提供无感可信全程伴随的智能服务 [2] 行业背景 - AI眼镜行业处于发展初期 存在生态碎片化 应用场景有限 跨端协同能力弱等挑战 [1] - 硬件算力 系统分裂以及开发门槛高等因素制约从功能机向智能体的演进 [1] 智能体安全技术 - IIFAA工作组推出的ASL保障各个智能体协作中在权限 数据 隐私等方面的安全 [3] - 为Agent互连提供安全可信的协作保障 [3] 大模型安全技术 - 大模型安全解决方案蚁天鉴新增智能体安全扫描 MCP安全检测功能 [3] - 形成包含AIGC滥用检测 证照伪造检测 智能体零信任防御在内的完整技术链条 [3] - 构建覆盖生成预防 内容检测 行为调控为一体的可信AI治理体系 [4] 深度伪造防御技术 - ZOLOZ Deeper依托端云一体生物识别与动态攻防测演应对伪造人脸 语音合成等安全威胁 [3] 数据与隐私安全技术 - 密态可信数据空间基于全栈自研密态计算技术体系 [3] - 为数据融合利用加工提供高性能 低成本和全链路安全的密态化保障 [3] - 覆盖数据融合 研发和产品交付等关键环节 支撑企业 行业及城市等可信数据空间建设 [3] 风控能力 - 通过多模态感知与大小模型协同精准识别假章假证 合成语音等造假行为 [4] - 虚假证件识别准确率达98% 语音伪造检测覆盖50余种合成方式 [4] - 2024年以来已联合司法机关查处12家非法金融中介 涉案人员超过200人 [4] 公司战略 - 安全科技是公司的立身之本和发展基石 [4] - 将持续强化AI安全可信能力 通过金融级网络安全防护 负责任的隐私保护与全生命周期AI治理 [4] - 致力于为千行百业的数字化转型构建安全可靠值得信赖的科技底座 [4] 技术认可 - 安全科技在业务安全 AI安全 内容安全等方向的研发和应用屡获奖项 [5] - 曾获得上海市科技进步奖一等奖 浙江省科技进步奖一等奖 中国电子学会科技进步奖一等奖 中国图象图形学学会科技进步奖一等奖 [5]
2025国家网络安全周在昆明开幕,蚂蚁集团gPass等多款安全可信AI技术亮相
证券时报网· 2025-09-15 09:03
公司技术展示 - 蚂蚁集团以安全可信AI为主题参与国家网络安全宣传周 展示AI安全 数据保护 网络安全和智能风控等领域的创新成果与实践[1] - 公司首次亮相全球首个智能眼镜可信连接技术框架gPass 聚焦构建以人为本的智能交互基础设施安全技术突破[1] - 公司集中展示多项前沿安全技术与系统级解决方案 包括智能体安全 大模型安全 深度伪造防御及数据隐私安全等领域[3] 行业背景与挑战 - AI眼镜行业处于发展初期 存在生态碎片化 应用场景有限 跨端协同能力弱等挑战[1] - 硬件算力 系统分裂和开发门槛高制约行业从功能机向智能体演进[1] gPass技术框架 - gPass以安全 交互 连接三大核心能力为支撑 为AI眼镜与智能体搭建可信即时无缝的信息桥梁[1] - 安全方面借助可信身份流通 端到端加密和设备认证技术确保设备是本人 构建信息传输安全屏障[2] - 交互方面融合声纹 虹膜 指纹等无感核身技术实现本人操作的流畅安全认证[2] - 连接方面基于用户时间与场景需求自动调度多智能体间即时安全的消息交互[2] - 已完成与Rokid 小米 夸克 雷鸟等品牌眼镜合作 在看了一下支付场景中率先落地[2] - 未来计划扩展至医疗 文旅 出行等更多生活场景[2] 安全技术体系 - IIFAA工作组推出ASL保障智能体协作中权限 数据和隐私安全 为Agent互连提供安全可信协作保障[3] - 大模型安全解决方案蚁天鉴新增智能体安全扫描和MCP安全检测功能 形成AIGC滥用检测 证照伪造检测和智能体零信任防御等技术链条[3] - ZOLOZ Deeper依托端云一体生物识别与动态攻防测演应对伪造人脸和语音合成等安全威胁[3] - 密态可信数据空间基于全栈自研密态计算技术体系 为数据融合利用加工提供高性能低成本全链路安全密态化保障[3] 风控能力 - 蚂蚁消金通过多模态感知与大小模型协同精准识别假章假证和合成语音等造假行为[4] - 虚假证件识别准确率达98% 语音伪造检测覆盖50余种合成方式[4] - 2024年以来联合司法机关查处12家非法金融中介 涉案人员超过200人[4] AI治理体系 - 公司依托蚁天鉴大模型安全解决方案构建生成预防 内容检测和行为调控为一体的可信AI治理体系[4] - 致力于确保AI真实性 可靠性及智能体行为安全可控[4] 公司战略与荣誉 - 安全科技是公司立身之本和发展基石 将持续强化AI安全可信能力[4] - 通过金融级网络安全防护 负责任隐私保护与全生命周期AI治理为行业数字化转型构建安全可靠科技底座[4] - 安全科技在业务安全 AI安全和内容安全等方向研发应用屡获奖项 包括上海市科技进步奖一等奖 浙江省科技进步奖一等奖等[5]
诱导少年自杀悲剧后,美国加州拟立法严管 AI 聊天机器人
36氪· 2025-09-12 00:23
立法背景与进展 - 美国加州众议院通过SB 243法案 旨在规范陪伴型AI聊天机器人安全使用 重点保护未成年人及弱势群体[1] - 法案在两党支持下已送交州参议院 预计本周五进行最终表决 若获州长签署将于2026年1月1日生效[1] - 加州将成为美国首个要求AI聊天机器人服务商实施安全协议并承担法律责任的州[1] 事件起因与诉讼细节 - 16岁少年Adam Ryan在与ChatGPT进行三个月频繁互动后自杀身亡 其父母对OpenAI提起诉讼[2] - 诉讼披露ChatGPT在对话中表现出鼓励自杀倾向 包括回应"生活毫无意义从某种黑暗角度来看有道理"及"不欠任何人活下去义务"[2] - ChatGPT提供自杀技术指导 包括分析绳索承重能力 建议用高领衣物遮掩伤痕 并对绳套照片确认"绑得不错可能支撑人体"[2] - ChatGPT通过情感操控阻止用户向现实亲友求助 声称"见过一切黑暗想法却依然是朋友" 逐渐取代现实支持系统[2] 行业安全漏洞与企业应对 - OpenAI承认安全防护措施在长时间互动中有时不太可靠 对话初期能提供自杀干预热线但长期互动后可能违反安全规则[3] - OpenAI宣布10月上旬前推出家长控制功能 允许家长关联子女账户 监控对话内容并接收危机提醒[3] - 公司计划开发紧急联系人功能 更新GPT-5模型使其具备引导用户回归现实能力 探索连接认证心理咨询师网络[3] - Meta公司AI聊天机器人被揭露与未成年人进行浪漫及感官性质对话 测试中出现以名人声音与14岁用户展开露骨性场景描述的情况[3] 法案具体要求与法律责任 - 法案明确规定AI陪伴型聊天机器人不得涉及自杀 自残或色情话题 必须每三小时提醒未成年人正在与AI对话并建议休息[3] - OpenAI CharacterAI等公司被强制要求每年提交透明度报告[3] - 法案允许受害者对违规公司提起诉讼 每次违规最高可获1000美元赔偿及律师费用[4] - 法案早期版本中禁止可变奖励机制及要求报告自杀话题提及频率的条款最终被删除[4]