Workflow
ClaudeBot
icon
搜索文档
数据“中毒”会让AI“自己学坏”
科技日报· 2025-08-19 00:18
AI数据中毒威胁 - AI系统在学习过程中输入错误或误导性数据会形成错误认知并作出偏离预期的判断[1] - 数据中毒攻击通过连续欺骗系统可逐渐腐蚀系统为后门植入和数据窃取埋下隐患例如攻击者用红色激光欺骗火车站摄像头30天[2] - 线上系统尤其是依赖社交媒体和网页内容训练的大语言模型中数据投毒已是重大隐患[2] AI爬虫数据采集风险 - 2024年AI爬虫流量首次超过人类用户其中OpenAI的ChatGPT-User占全球网页访问量6% Anthropic的ClaudeBot占13%流量[2] - AI模型大规模采集网页内容可能将故意投放的有毒数据如篡改版权材料和伪造新闻信息带入模型[3] - 有毒数据可能导致版权侵权虚假信息扩散和在关键领域引发安全风险[3] 版权保护技术反击 - 创作者采取技术手段保护版权例如芝加哥大学团队开发Glaze工具可加入像素级干扰使AI误判作品类型[4] - Nightshade工具能在图片植入隐蔽特征使AI学习错误对应关系该工具发布一年下载量超1000万次[4] - Cloudflare公司推出AI迷宫通过制造海量虚假网页消耗AI爬虫算力和时间[4] 去中心化防御技术 - 联邦学习技术允许模型在分布式设备本地学习只汇总参数降低单点中毒风险[5][6] - 区块链技术凭借时间戳和不可篡改特性使模型更新过程可追溯便于定位投毒源头[6] - 多个区块链网络可互相通报可疑模式当识别威胁时立即警示其他系统[6]
AI全面战争,从爬虫毁灭互联网开始
虎嗅· 2025-03-24 14:13
这是第一次,全世界最大的网络基础设施公司之一,Cloudflare,开始用魔法打败魔法,用AI来对抗AI爬虫。 这事有意思的程度,足以载入AI发展史册。这是一次AI领域的全面战争。 你可能现在还有很多疑惑,Cloudflare是什么,AI爬虫是什么,AI迷宫又是什么,这个事到底有意思在哪。 作为这一切的开始,我想先跟你讲一个故事,一个在今年1月份,发生在一个仅有7人的乌克兰公司的故事。 这个公司叫做Triplegangers,做的业务特别简单,就是卖人的3D数字模型。 AI全面战争,从爬虫毁灭互联网开始 昨天看到一个非常有意思的事情。 Triplegangers专注于销售"人体的数字孪生"模型素材,这些高清3D模型照片来自真实人类扫描,价值巨大。 创始人Tomchuk对自己公司的业务一直很满意,公司虽然不大,但这是他最喜欢的事情。 这个网站一共有65000个产品页面,每个产品的页面至少放着三张高清照片。 每一张图片都细致地标注了年龄、肤色、纹身甚至伤疤。 但是,就在一个普通的周六早上, 这种平静被一场风暴骤然打破。 Tomchuk收到了一条紧急通知:公司的网站崩溃了,因为受到了大量的DDoS攻击。 他懵了,因 ...