偷2396部黄片训练AI，Meta遭3.59亿美元天价“碰瓷”

诉讼事件概述 - 美国成人电影厂商Strike3于7月23日向旧金山联邦法院起诉Meta 指控其通过43个公司IP及4个员工家庭IP地址秘密下载2396部色情电影用于AI模型训练并索赔3.5亿美元平均单部影片索赔15万美元 [2][5][6] - Meta对此予以否认认为Strike3是借版权诉讼进行"碰瓷"营利据估算该公司每年通过和解金可获得1500万至2000万美元收入 [3][20][22] 技术证据分析 - Strike3提交47个下载IP证据其中43个属于Meta/Facebook公司网络 4个来自同一员工家庭宽带且超过10万条网络日志显示下载文件哈希值与版权库完全匹配 [6][7][8] - 下载行为呈现机器操作特征：高频次批量下载长片同时获取多分辨率版本(480p/720p/1080p) 平均做种时间达21.7天(远超过正常用户1-2天) 表明属于系统性数据收集行为 [10][11][13] - Meta被指控自2018年起通过6个虚拟私有云搭建匿名下载网络使用脚本自动化操控BT做种甚至通过员工家庭宽带持续运作 [14][24] 数据选用动机 - 成人影片具备独特训练价值：长镜头提供连续画面流稳定灯光与简单背景减少干扰干净的声音画面同步数据有助于AI学习时间流动与动作衔接 [16][17] - 高分辨率与重复镜头手法(推拉摇移/固定机位)为AI提供结构化学习素材类似"语法课"般的规律性数据有助于提升模型对视觉规律的理解 [18][19] 行业背景与模式 - Strike3采用系统性诉讼营利模式：2017-2024年发起超20000起版权诉讼 2024年创单年纪录通过传票威吓获取数百至数千美元和解金年均获利1500-2000万美元 [22][23] - 该公司自主研发VXN Scan爬虫工具通过哈希值识别BT种子文件并记录IP地址再通过网络服务商获取用户信息进行批量诉讼 [23] 历史行为关联 - Meta曾于2023年因盗取数据被作家群体起诉指控其通过虚拟私有云隐藏IP 从LibGen、Z-Library等平台爬取81.7TB盗版电子书训练LLaMA模型 [24] - 本次涉事IP与先前书籍盗版案中使用的匿名IP技术手段高度相似表明可能存在系统性数据获取模式 [24] 行业影响与趋势 - 本案成为美国首例由成人娱乐公司直接推动的AI版权争议标志性案件揭示AI行业普遍依赖灰色数据训练模型的现状 [21][25] - OpenAI与Microsoft同样面临《纽约时报》及《每日新闻》作者的合并版权诉讼反映行业整体面临数据来源合规性质疑 [26] - 案件核心指向AI训练数据边界问题大型企业尚可承担合规成本但初创公司可能因数据获取限制面临发展瓶颈 [26]