作者:Steven Levy
十亿美元是过去的事,但它仍然集中在思想。至少当我听到AI公司人类同意时,这对我来说确实如此至少15亿美元的和解协议对于作者和出版商,他们的书籍被用来培训其大型语言模型Claude的早期版本。这是在法官发出简易判决后,就盗用了它使用的书籍的简易判决。据报道,拟议的协议仍在审查中,据报道,每本书的作者至少授予作者3,000美元。我写了八本书,我的妻子已经找到了五个。我们在这里谈论浴室退化的美元!
由于和解是基于盗版书籍的,因此它并没有真正解决AI公司在受版权保护的工作中训练其模型是否还可以的大问题。但重要的是要涉及真钱。以前,对AI版权的论点是基于法律,道德甚至政治假设的。现在情况已经越来越现实了,现在该解决基本问题的时候了:由于精英AI取决于书籍内容,公司是否公平地建立万亿美元的企业而不付钱?
除了合法性,我一直在为这个问题而苦苦挣扎。但是,既然我们从法院搬到了支票簿上,这部电影已经从我眼中掉下来了。我应该得到那些美元!付费作者感觉就像是正确的事情。尽管有强大的力量(包括美国总统唐纳德·特朗普)辩论。
在我走得更远之前,让我放下一个免责声明的人。正如我提到的那样,我本人是作者,并从这个论点的结果中获利或失去。我也在作者协会的理事会上,这是作者的强烈拥护者,并正在起诉Openai和Microsoft,以将作者的作品包括在他们的培训中。(因为我涵盖了科技公司,所以我放弃了与这些公司诉讼有关的投票。)显然,我今天为自己讲话。
过去,我在理事会上是一个秘密的离群值,在公司是否有权在合法购买的书籍上培训其模型的问题确实陷入了困境。人类正在建立大量人类知识的论点确实引起了我的共鸣。当我采访了艺术家格里姆斯在2023年,她对这项实验的贡献表达了热情:哦,生病了,我可能会永远活着!”她说。那也与我共鸣。广泛传播我的意识是我喜欢自己的工作的重要原因。
但是,将书嵌入由巨型公司建立的大语言模型中是不同的。请记住,书籍可以说是AI模型可以摄入的最有价值的语料库。他们的长度和连贯性是人类思想的独特导师。他们涵盖的主题庞大而全面。它们比社交媒体可靠得多,并且比新闻文章提供了更深入的了解。我敢说,如果没有书籍,大型语言模型将会变得较弱。
因此,人们可能会争辩说,OpenAI,Google,Meta,Anthropic和其余的人应该为书籍访问。上个月末,那个可耻的白宫科技晚餐,首席执行官轮流为唐纳德·特朗普(Donald Trump)留下了深刻的印象,他们据称他们投资于美国数据中心,以满足AI计算需求。苹果承诺要有6000亿美元,Meta表示将符合这一金额。Openai是一家5000亿美元的合资企业的一部分,称为Stargate。与这些数字相比,作为解决方案的一部分,人类的15亿美元同意向作者和出版商分发,作为侵权案件的一部分,这听起来并不令人印象深刻。
但是,很可能是法律站在这些公司方面。版权法可以根据几个标准对书籍和文章进行无偿的剥削,其中之一是它的使用是否是变革性的,这意味着它以创新的方式建立在本书的内容上,而不是与原始产品竞争。负责人类侵权案的法官统治了在培训中使用合法获得的书籍确实受到合理使用的保护。确定这是一个尴尬的练习,因为我们正在处理互联网之前绘制的合法码数,更不用说AI了。
显然,必须基于当代情况有一个解决方案。白宫的AI行动计划宣布了这一五月没有提供的行动。但是在关于计划的讲话中,特朗普权衡问题。他认为,作者不应该付钱,因为很难建立一个可以公平支付它们的系统。特朗普说,当每本文章,书籍或其他阅读或研究的其他内容时,您都可以获得成功的AI计划。”我们感谢这件事,但不能做到这一点。