英语轻松读发新版了,欢迎下载、更新

透视图:我的书无权培训AI模型。现在什么?

2025-05-04 03:00:00 英文原文

作者:By Adam Nevill

2023年,我的九本书侵犯了他们的版权,再加上另外180k的头衔,当时所有这些书都在海盗网站上被刮擦,以纳入Books3数据集,以培训大型科技公司的LLM。

在最近的700万本书的元抢劫案中,我的所有书籍(包括外国版本)也都包含在该网站上。因此,在几年内,科技公司培训了他们的大型语言模型,因此我一生的作品的版权受到了侵犯。

亚历克斯·雷斯纳(Alex Reisner)的调查在《大西洋杂志》上发表的,清楚地表明,科技公司的员工知道他们在做什么是非法的。欺骗先于盗窃之前,然后盗窃。

无论令人沮丧和沮丧,我也总是试图寻找解决方案。我与一家许可公司(由人类创建)进行了交谈,并设立了一个帐户,以指出我没有书籍的书来供AI剥削。现在,我必须一一输入216个标题(每本书的许多版本),并在两种AI使用情况下进行排除。这种禁运只有在将来合法的AI公司希望许可我的未来书籍,并与我或代表我工作的第三方联系时,才适用这种禁运。

不过,这就像吐出强风,因为无论如何,早期的公司与海盗网站勾结只是帮助自己。另外,我写的所有内容都已被刮擦。但是,我会吐出风,因为我需要做点什么。

同样,这项技术显然可以被刮擦和用于培训AI的所有东西。多么方便。

如果您打算在人类历史上拉开最大的文化盗窃,您希望您所做的一切都可以撤销;为了避免诉讼,直到宇宙的尽头,您希望以这种方式将被偷走的东西洗净成衍生物,从而使无法准确检测到被盗的原始材料的使用情况。

这是因为我多年来将撤销消息发送到海盗书网站,结果不同。我想写书,出版书籍,而不是花时间和能力起草,发出撤出通知,并在许可网站上填写无尽的领域。

我最近居住的英国政府表明,对受版权保护的作品进行培训应或多或少是公平的。根据法案中的提议,我可以防止我的工作被训练AI的唯一方法是让我选择所有书籍,在每个版本中,在每个领域,而不是选择。”

因此,每本书的每本书生成的每本ISBN(因此,上面引用的216个)都必须单独选择。如果您错过了10年前的旧电子书版本怎么办?

只是不可行或实用。但是,选择加入的安排将是:除非作者指出他们的工作可用于培训AI,AI的科技公司和用户被禁止触摸工作。即便如此,一切都已经被刮擦了,并且可能是不理的,因此所有这些选择仅适用于未来的作品。

该法案还表明,淘汰另一端的衍生物可以受到版权保护。它的信念。因此,您要批准所有现有人类创造书籍的侵犯版权,但在法律上会保护因盗窃而造成的衍生物吗?

再次,我所写的所有内容已经被刮擦并可能训练了语言模型。这匹马已经螺栓了。

因此,我没有写新小说,而是提高了作为公民的声音向我们的政府解释这项立法的不公平程度,以及对作家以及人类创造的文化的可怕后果。对于人工智能公司而言,文化是饲料是饲料,并且只有科技公司将其分配给它的想法,这太令人震惊了,无法理解。

仁慈的是,英国的上议院有问修正案强迫AI爬行者观察英国版权法,揭示其身份和目的,并让创意人知道是否已刮除其版权作品。”

令我沮丧的是,这些讨论中包括的唯一因素似乎是金钱,收入,财富的转移等。但是我相信,这里更有价值的东西在这里受到威胁:作为一种物种,我们有能力抽象地思考并理解自己,世界,我们的地位,时光,并保留最重要的讲故事的方面,这些方面是每个人的智慧,即经历了我们的每一个传统的生成我们的物种的智慧。

而且,让我们不要丢弃使人们愚蠢并通过技术与真相无关的神经,心理和社会影响。

我感觉到一切都处于危险之中。

关于《透视图:我的书无权培训AI模型。现在什么?》的评论


暂无评论

发表评论

摘要

2023年,一本作者的九本书是从海盗网站上刮下来的18万本书中的AI培训数据集。作者声称,这种侵权是通过科技公司的员工对违法行为的知识来促进的。由于盗版和数据刮擦规模,许可和限制使用的努力在很大程度上是无效的。建议对受版权保护的AI培训进行公平用法的建议被批评为不切实际和不公平,可能通过法律漏洞将盗窃合法化。作者提倡修正案,要求遵守AI实体对版权法的遵守,并强调对文化保护和人类认知的更广泛的影响。