英语轻松读发新版了,欢迎下载、更新

英国作者“绝对生病”,发现据称Meta使用的“影子图书馆”的书籍训练AI

2025-03-29 02:41:38 英文原文

作者:Gemma Peplow Culture and entertainment reporter @gemmapeplow

英国作者告诉《天空新闻》,他们觉得“绝对恶心”看到他们的书籍出现在据称由科技巨头元用来帮助开发人工智能软件的“影子图书馆”中。

一位最畅销的小说家说:“这是我的一生。”“想到有人在硅谷或从任何地方进行这项工作来生产伪造的AI版本的想法……真是令人沮丧。”

搜索Libgen数据库的工具由大西洋上周,法庭文件作为美国喜剧演员莎拉·西尔弗曼(Sarah Silverman)诉讼的一部分和其他作者针对梅塔(Meta)的诉讼的一部分,后者在今年早些时候公开了Facebook,Instagram和WhatsApp的Meta,目前的市场价值超过1TRN。

梅塔(Meta)被指控违反了版权法,使用利比根(Libgen)匿名操作的著名的所谓“影子图书馆”,据称包含数百万个盗版书籍,期刊文章和其他材料的副本来开发其AI软件。梅塔(Meta)否认了这一主张,并认为该案应被撤出。

本周早些时候提交的法律文件这家科技公司表示,它并没有通过从利比根某些地方下载书籍来训练其旗舰AI系统Llama 3来违反版权法,并说它“合理地利用了材料”,而Llama 3并未“复制”作者的作品。

在较早的法院文件中,Silverman的律师和其他指称的内部通讯显示Meta首席执行官马克·扎克伯格尽管某些工人担心,但“批准”使用Libgen数据集。

Author Rowan Coleman. Pic: Carolyn Mendelsohn

图像: 作者罗文·科尔曼(Rowan Coleman)写了数十本小说。图片:Carolyn Mendelsohn

作者协会(SOA)工会将梅塔所谓的行为描述为“令人震惊的”,并说公司“需要补偿它正在利用的所有作品的正确薪酬”。

小说家罗文·科尔曼(Rowan Coleman)说:“这是我写过的每本书。”罗恩·科尔曼(Rowan Coleman)自2002年的第一本书以来就出版了大约40本书,其中包括2014年《星期日泰晤士报》畅销书《记忆书》和《勃朗特神秘》系列系列。

“我感到绝对生病 - 我无法知道我花了多少收入。像大多数作家一样,我很难支付账单。我有三份工作,我有三个工作,有孩子可以养育和抵押贷款。而且有一些技术亿万富翁从我的工作中获利,也有无数其他作者的作品,也是正确的。

据称,梅塔(Meta)决定获得“他们廉价,迅速地需要的东西”。

但是,除了经济补偿,她说还有一个更大的问题。“这对这个职业也是一个威胁,甚至能够继续存在。我认为,我们有真正的风险,没有任何书籍让人们真正盗版的书籍 - 至少不是人类写的任何书籍。”

Pic: Netflix

图像: 欧文·库珀(Owen Cooper)和斯蒂芬·格雷厄姆(Stephen Graham)在青春期。图片:Netflix

科尔曼(Coleman)强调了最近由斯蒂芬·格雷厄姆(Stephen Graham)共同撰写和主演的Netflix戏剧《青春期》(Netflix)的青春期,该戏剧曾在美国脱口秀节目到英国议会的任何地方进行了讨论。“如果不是因为作家坐下来工作和嫁接几个小时,我们就不会有。

尽管JK Rowling,Stephen King和James Patterson可能值得数百万,但2022年的一项调查发现,英国的作者的平均中位收入约为7,000英镑。

Romcom小说家汉娜·道尔(Hannah Doyle)将于5月份出版她的第五本小说《水疗中断》(The Spa Break)。

像科尔曼一样,她还有其他工作来补充作者的收入。她说,每本书大约需要一年的时间才能完成。

“是大卫和巨人”

Author Hannah Doyle

图像: 作家汉娜·道尔(Hannah Doyle)即将出版她的第五本小说

她说:“我们是小人物,就像大卫和巨人一样。”“当我们面对这些价值数万英镑的技术巨头时,我们如何捍卫自己的权利?

“这是不对的,因为最终是盗窃。据称他们正在窃取我们的作品,他们正在利用它来改善他们的AI系统。因此,我们的职业会发生什么?”

道尔说,如果作者得到了并提供报酬,情况可能会有所不同。

她说:“我认为AI在某些领域有很多好处。”“例如,对于医学研究而言,它有可能非常有用。需要发生的事情是,我们确实需要在完全接管之前给它一些界限。”

屡获殊荣的作家达米安·巴尔(Damian Barr)在数据库中似乎也出现在数据库中,他在Instagram上分享了一篇文章,写道:“读者和观众 - 因为这么多电视和电影和剧院都以一本书开头 - 受到机器产生的Bilge的创造性,文化和经济上的bilge,而在财务上,AI在抢劫了所有人。”

Richard Osman. Pic: Carsten Koall/picture-alliance/dpa/AP Images

图像: 理查德·奥斯曼(Richard Osman)。图片:Carsten Koall/Picture-Alliance/DPA/AP图像

电视节目主持人兼作家理查德·奥斯曼(Richard Osman)在周四的谋杀俱乐部系列中取得了巨大成功,他在X上写道:“版权法律根本不复杂。如果您想使用作者的作品,您需要要求允许允许。如果未经许可,您就会违反法律。您会违反法律。这是如此简单。这对我们来说非常困难,对于其他受影响的工业,我们会在Meta上进行良好的行为,''

创建了Libgen Search工具的大西洋作家Alex Reisner在他的文章中提出了警告,即“不可能”确切知道Libgen Meta使用了哪些部分以及尚未使用哪些部分,并且数据库正在“不断增长”。

他说,他的快照是在2025年1月创建的,在诉讼称该诉讼已被这家技术巨头访问一年多了,因此当时似乎无法下载一些头衔。

SOA敦促英国的作者写信给Meta以及当地的国会议员。

首席执行官安娜·甘利(Anna Ganley)在一份声明中说:“ AI公司并没有征求允许并为这些受版权保护的材料付款,而是故意选择在竞选中窃取他们以占据市场的占主导地位。”

“这是大型技术的令人震惊的行为,目前,政府目前正在启用,这些政府没有干预加强和维护当前的版权保护。”

一位元发言人在一份声明中告诉《天空新闻》,该公司“开发了转型Genai开源LLM,为个人和公司提供了令人难以置信的创新,生产力和创造力的动力”。

声明继续说:“公平利用受版权保护的材料对此至关重要。我们不同意原告的主张,完整的记录讲述了一个不同的故事。我们将继续积极地捍卫自己并保护Genai的发展,以使所有人的利益受益。”

美国诉讼

Sarah Silverman at the 96th Academy Awards Vanity Fair Party in 2024. Pic: AP

图像: 喜剧演员莎拉·西尔弗曼(Sarah Silverman)是起诉美国元的作者之一。图:AP

包括喜剧演员西尔弗曼(Silverman),理查德·卡德里(Richard Kadrey)和塔尼希西·科茨(Ta-Nehisi Coates)在内的作者于2023年在加利福尼亚对梅塔(Meta)提起了集体诉讼。

他们指责这家科技公司非法下载书籍的数字副本,并在未经他们的同意或提供薪酬的情况下使用它们来培训AI。

围绕Libgen的争议是有关AI和版权法的更广泛辩论的一部分。在美国,作者协会表示,据称使用盗版书籍和元数据正在针对其他AI公司的法律行动。

该组织建议作者说,如果元人使用其书籍,则它们将自动包含在Kadrey vs Meta集体诉讼中,即Silverman和其他作者的诉讼,“无需采取任何立即采取行动”。

从《天空新闻》中阅读更多信息:
BAFTA电视奖提名揭示了
看门狗说,绿洲球迷可能被误导

分别在2023年,作者行会和17位作者在纽约对OpenAI提起了集体诉讼,要求其涉嫌侵犯版权。命名的原告包括John Grisham,George RR Martin和Jodi Picoult。

这个问题也是2023年好莱坞罢工背后的驱动力之一。但并不是创意产业中的每个人都反对。

去年,出版商哈珀·柯林斯(Harper Collins)与一家未命名的技术公司达成了一项协议,允许“有限地使用精选的非小说背景标题”来培训AI模型。

并在2023年获奖犯罪作者阿贾伊·乔杜里(Ajay Chowdhury)告诉《天空新闻》,他正在接受这项技术

英国的AI法律 - 发生了什么?一个

英国AI版权法的咨询结束于2月。根据该计划,将对培训AI的版权豁免,因此技术公司不需要使用受版权保护的材料的许可证 - 创作者需要选择退出以防止其工作被使用。

一位政府发言人当时表示,英国目前对版权的政权和AI“阻止了创意产业,媒体和人工智能部门意识到自己的全部潜力 - 这无法持续”。

发言人说,“直到我们绝对有信心我们制定了一项实用计划,该计划提供了我们的每个目标,包括增加对权利持有人的控制权,以帮助他们轻松许可其内容,从而使合法访问材料培训英国的世界领先的AI模型,并建立更大的透明度,以实现更大的透明度”。

但是,创意产业中的许多作家和其他作家都没有说服。

科尔曼说:“这只是为了大量剥削人们的权利,人们的数据及其工作而开门。”“我真的会敦促政府对此进行重新思考,并保护英国文化身份王冠上的珠宝 - 做正确的事。”

关于《英国作者“绝对生病”,发现据称Meta使用的“影子图书馆”的书籍训练AI》的评论


暂无评论

发表评论

摘要

英国作者正在起诉META,指控该公司从图书馆Genesis(Libgen)数据库中非法下载其书籍的数字副本以未经允许或赔偿而培训AI系统。作者协会还针对其他AI公司提起诉讼,据称使用盗版书籍,包括针对OpenAI的集体诉讼,涉及John Grisham和George R.R. Martin等作者。这一争议强调了英国关于AI和版权法的辩论,在此提议更改版权法,旨在为培训AI造成豁免,但面临着关心剥削其权利和工作的反对者的反对。英国作者正在敦促政府保护知识产权,而梅塔(Meta)坚持使用其对受版权保护的材料的使用是合法的,该材料是合法的。

相关讨论