作者:by Matilda Battersby
世界上最大的贸易出版商已经修改了其版权页上的文字,以帮助保护作者的知识产权不被用于训练大型语言模型(LLM)和其他人工智能(AI)工具。书商独家披露。
企鹅兰登书屋(PRH)已对其在全球所有出版品牌中的版权声明进行了修改,确认将在“我们市场上的各出版品牌的页面中出现”。新的版权声明内容为:“本书任何部分均不得以任何形式用于训练人工智能技术或系统”,并将包含在所有新书中以及重新印刷的所有旧版书籍中。
该声明还“根据欧洲议会的指令明确保留了文本和数据挖掘例外中的标题”。
该举措特别禁止AI公司使用其头衔开发聊天机器人和其他数字工具,这一决定是在美国发生了一系列版权侵权案件以及报道指出大量盗版书籍已被科技公司用于训练人工智能工具之后做出的。2024年,包括泰勒弗朗西斯、威利和萨奇在内的几家学术出版商宣布与AI公司合作,授权内容给这些公司。
据信,PRH是五大英语贸易出版商中第一家修改其版权信息以反映人工智能系统的加速发展以及科技公司据称依赖使用已发表作品来训练语言模型的情况的出版社。
PRH英国首席执行官汤姆·韦尔登在今年8月告诉PRH员工,该公司“将积极捍卫属于我们作者和艺术家的知识产权”,但同时也表示会“负责任地创新”并且“有选择性和负责任地使用生成式AI工具,在我们认为这些工具可以推进我们的目标的情况下”。
作者许可和收集协会最近对其成员进行了调查,以了解他们对人工智能的看法,并欢迎企鹅兰登书屋的更新。该协会会长芭芭拉·海耶斯表示:“看到像企鹅兰登书屋这样的大型出版商在其印刷材料中采用新措辞,重申版权原则,并明确禁止技术公司使用受版权保护的作品来训练其人工智能模型,这是令人鼓舞的。我们希望更多出版社效仿这一做法,并且希望那些开发此类模型的公司能够立即采取行动。”
作者协会也表示,PRH版权页面的变化是一个“受欢迎的举措”,但补充说当前的措辞还不够充分,因为还需要修改作者合同。SoA的首席执行官安娜·甘利说道:“并没有标准的‘保留所有权利’表述,甚至最基础的通知也涵盖了所有的使用情况。话虽如此,我们很高兴看到出版商开始在‘保留所有权利’的通知中明确排除将作品用于训练[生成式AI]的目的,这为读者提供了更多的清晰度,并帮助解释了在没有版权所有者同意的情况下不能做的事情。”
她补充说:“除了这一变化,我们现在还希望在出版合同中看到相应的改变,并增加适当的保护措施,因为我们认为同样重要的是,出版社应保证创作者在其使用或允许他人使用生成式人工智能与作品的制作相关联之前(例如用于叙述、翻译、图像、封面设计等)会征求创作者的同意,并且在出版社授予任何AI系统访问或使用该作品的权利之前也需征得创作者的同意。”
SoA还表示将继续倡导“建立一个尊重现有和正在发展的AI技术市场解决方案的法律框架,即确保创作者和权利持有人因其作品使用而获得适当且透明的许可。看到整个创意产业联合起来捍卫我们创意经济这一基本原则是非常令人鼓舞的。”
COPYRIGHT律师詹威吕(Chien-Wei Lui),福威廉律师事务所(Fox Williams LLP)高级关联合伙人告诉书商“一个AI平台提供的输出本身是作者作品的复制或侵权的可能性非常低。”
她说训练大规模语言模型“这是侵权行为,出版商应该确保他们能够控制这一行为,以保障自身及其作者的利益”。
吕指出,在快速变化的生成型人工智能背景下,出版行业仍在努力建立最佳实践。“在非合同/许可基础上进行的训练越多,作者内容被贬值的风险就越大,”她说。“如果一个平台怀疑该内容已经在‘外面’了,它为什么要支付许可证费用来使用这些内容进行训练呢?虽然生成型人工智能的发展给出版业带来了存在性的问题,但更现实的担忧是,如果没有获得许可就被用于训练的内容所损失的收入,无论是出版商还是作者都在蒙受损失。”
Lui补充道:“出版商需要确保他们了解所有可用的工具,以限制第三方使用其内容进行培训的能力。例如,明确声明保留所有训练和文本及数据挖掘的权利是有帮助的。”
她指出,几家出版商已经向一些较大的LLM平台发送了停止和终止信函,但她建议采取实际措施防止内容被抓取或用于训练。“许多AI平台已发布指南,说明用户如何‘选择退出’以防止其内容被用于AI训练,并且这些指南在互联网上很容易找到。此外,您可以使用robots.txt文件来防止您的网站内容被抓取。另外,正在创建新的可机读文本和数据挖掘许可,以便任何前来抓取您内容的机器可以被指引到合法的访问方式(付费或非付费)。"她说道。
书商联系了其他主要出版商,询问他们是否因人工智能的挑战而改变了或计划修改他们的版权信息。泛麦克米伦、哈奇ette和西蒙舒斯特拒绝评论,而费伯未能回应评论请求。然而,书商理解到Faber最近采纳了一项“AI政策”,禁止自由职业者将其作者书籍中的任何信息复制到人工智能程序中“用于编辑、检查、提取或其他任何目的”。
PRH的版权声明全文如下:“企鹅兰登书屋重视并支持版权。版权激发创造力,鼓励多样化的声音,促进言论自由,并支持充满活力的文化。感谢您购买本书的授权版本,并且通过不以任何方式复制、扫描或分发本书的任何部分来尊重知识产权法律。您正在支持作者,并使企鹅兰登书屋能够继续为所有人出版书籍。未经许可,不得以任何形式使用或复制本书的任何部分用于培训人工智能技术或系统的目的。根据《2019年数字单一市场指令》第4(3)条,企鹅兰登书屋明确保留本作品免受文本和数据挖掘例外条款的限制。”