诉讼事件概述 - 美国成人电影厂商Strike3于7月23日向旧金山联邦法院起诉Meta 指控其通过43个公司IP及4个员工家庭IP地址 秘密下载2396部色情电影用于AI模型训练 并索赔3.5亿美元 平均单部影片索赔15万美元 [2][5][6] - Meta对此予以否认 认为Strike3是借版权诉讼进行"碰瓷"营利 据估算该公司每年通过和解金可获得1500万至2000万美元收入 [3][20][22] 技术证据分析 - Strike3提交47个下载IP证据 其中43个属于Meta/Facebook公司网络 4个来自同一员工家庭宽带 且超过10万条网络日志显示下载文件哈希值与版权库完全匹配 [6][7][8] - 下载行为呈现机器操作特征:高频次批量下载长片 同时获取多分辨率版本(480p/720p/1080p) 平均做种时间达21.7天(远超过正常用户1-2天) 表明属于系统性数据收集行为 [10][11][13] - Meta被指控自2018年起通过6个虚拟私有云搭建匿名下载网络 使用脚本自动化操控BT做种 甚至通过员工家庭宽带持续运作 [14][24] 数据选用动机 - 成人影片具备独特训练价值:长镜头提供连续画面流 稳定灯光与简单背景减少干扰 干净的声音画面同步数据 有助于AI学习时间流动与动作衔接 [16][17] - 高分辨率与重复镜头手法(推拉摇移/固定机位)为AI提供结构化学习素材 类似"语法课"般的规律性数据有助于提升模型对视觉规律的理解 [18][19] 行业背景与模式 - Strike3采用系统性诉讼营利模式:2017-2024年发起超20000起版权诉讼 2024年创单年纪录 通过传票威吓获取数百至数千美元和解金 年均获利1500-2000万美元 [22][23] - 该公司自主研发VXN Scan爬虫工具 通过哈希值识别BT种子文件并记录IP地址 再通过网络服务商获取用户信息进行批量诉讼 [23] 历史行为关联 - Meta曾于2023年因盗取数据被作家群体起诉 指控其通过虚拟私有云隐藏IP 从LibGen、Z-Library等平台爬取81.7TB盗版电子书训练LLaMA模型 [24] - 本次涉事IP与先前书籍盗版案中使用的匿名IP技术手段高度相似 表明可能存在系统性数据获取模式 [24] 行业影响与趋势 - 本案成为美国首例由成人娱乐公司直接推动的AI版权争议标志性案件 揭示AI行业普遍依赖灰色数据训练模型的现状 [21][25] - OpenAI与Microsoft同样面临《纽约时报》及《每日新闻》作者的合并版权诉讼 反映行业整体面临数据来源合规性质疑 [26] - 案件核心指向AI训练数据边界问题 大型企业尚可承担合规成本 但初创公司可能因数据获取限制面临发展瓶颈 [26]
偷2396部黄片训练AI,Meta遭3.59亿美元天价“碰瓷”