Google Books
搜索文档
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
量子位· 2025-06-26 03:43
核心观点 - 美国法院首次裁定AI公司可在未经作者许可情况下使用合法购买的已出版书籍训练AI 依据合理使用原则认定AI训练属于转化性使用 未取代原作市场且有利于技术创新[2][3][17] - 法院明确区分数据来源合法性 盗版书籍训练不构成合理使用 需承担侵权责任 但合法采购书籍的扫描副本可用于训练[15][16][33] - 裁决显著降低AI行业训练数据的版权风险 为LLMs发展提供法律支持 可能影响OpenAI和Meta等同类案件审理[3][32][34] 案件背景 - Anthropic被指控在2021-2022年通过盗版网站LibGen等非法下载超700万份受版权保护书籍建立数字图书馆 2023年使用子集训练Claude模型[7][8][10] - 2024年转向合法采购 雇佣前Google图书扫描项目负责人Turvey采购数百万本纸质书 但未持续跟进出版商授权沟通[11][12] - 2024年8月三位作家起诉其非法复制作品训练AI 法院最终支持合法来源数据的使用权[6][13] 法律依据 - 援引美国版权法"合理使用"原则 认定AI训练具有高度转化性 输出内容未侵犯原作且未形成市场替代[2][14] - 参考历史判例:2015年Google Books案确立数字化检索属合理使用 2022年GitHub Copilot案确认代码训练转化性[24][25][29] - 法院强调技术中立性 类比人类阅读学习过程 认为AI消化书籍信息应获同等权利[4][18] 行业影响 - 加速AI公司数据获取合规化进程 Anthropic等企业需建立正版采购渠道 避免盗版资源[11][15] - 技术解决方案受推动 GitHub Copilot已部署代码来源标注功能 防范许可证冲突[29][30] - 创作者权益保护机制待完善 需探索新型授权模式应对AI训练需求[19] 争议焦点 - 法律界对"转化性使用"标准存在分歧 部分观点认为AI大规模复制不同于人类学习[19] - 开源社区担忧商业公司滥用合理使用条款 将免费资源转化为付费服务[28][29] - 出版商面临正版采购与盗版监控的双重成本压力[12][31]
AI版权风波再起,英美图书界重申捍卫版权的必要性
新京报· 2025-05-13 12:48
英国AI版权立法争议 - 英国下议院否决了一项要求AI公司告知版权拥有者其作品被用于模型训练的具体信息的修正案 该法案未采纳修正案即获通过并将送返上议院进行关键投票[1] - 以石黑一雄等知名作家及作家协会、泛麦克米伦出版社CEO为代表的大批英国创意工作者联名签署公开信 敦促首相执行版权法并接受被否决的修正案[1] - 公开信警告 若任由少数海外科技公司主导并免费使用作品 将损害英国创意工作者的未来收入、英国作为创意强国的地位以及科技体现英国价值观的期望[2] 行业对科技公司行为的指控与历史教训 - 美国出版商协会年度大会上 多位主讲人强调必须抵御科技巨头未经许可或未付费使用出版内容训练大模型的行为[2] - 南加州大学教授乔纳森·巴奈特警告 出版商需吸取谷歌“Google Books”项目无偿抓取内容并被法院认定为“合理使用”的教训 指出AI公司正试图复制此模式将内容收集成本降至零[3] - Kadrey诉Meta案临时首席律师马克斯韦尔·普里特指控Meta公司在建立内容数据库时进行了“蓄意的大规模盗版” 并称其非法采集的内容数量对创意界是一场“生存危机”[3] 版权保护立场与未来机制展望 - 尽管有不利历史先例 但巴奈特与普里特认为当前法院未必再接受过去的“合理使用”辩解 因为已出现庞大的创作者经济体且有强烈的版权保护诉求[4] - 建立内容许可机制被视为积极进展 这将使AI公司更难依赖“合理使用”为借口 并可能促使市场发展出适用于AI生态的授权与补偿机制[4] - 哈珀·柯林斯出版公司CEO布赖恩·默里表示 出版商正与科技巨头进行一场前所未有的法律之战 关乎内容、知识产权未来及公民基本权利 并强调削弱版权法将使美国在AI领域失去基于优质内容的竞争优势[5] 版权制度的核心价值与行业警告 - 美国出版商协会CEO玛丽亚·帕兰特指出 版权是出版业的基础结构 决定了从作者获酬到公众利益实现的全链条 当前争议的赌注比历史上更大[6] - 帕兰特总结 美国AI公司需保持全球竞争力 但在此过程中牺牲版权制度只会成全大科技公司而非服务公众利益 削弱知识产权保护是短视行为 将导致科技行业摧毁出版业等关键行业的风险[6]