梅塔(Meta)被指控非法使用受版权保护的材料来训练其AI模型,而技术巨头的防守非常薄。
在持续的西装 理查德·卡德里(Richard Kadrey)等人诉元平台马克·扎克伯格(Mark Zuckerberg)领导的一群作家,包括普利策奖得主安德鲁·肖恩·格里尔(Andrew Sean Greer)和国家图书奖得主Ta-Nehisi Coates,Mark Zuckerberg领导的公司辩称,其所谓的刮擦超过700万本书从盗版的图书馆中,利比根构成了材料的“合理使用”,因此不是非法的。
奇异的防御并没有结束。作为 虚荣博览会聚光灯在新的文章中,梅塔的律师也争辩说公司无数书用来训练其数十亿美元的语言模型,然后将跳板本身训练成头刺的嗡嗡声AI竞赛实际上毫无价值。
梅塔(Meta)引用了一位专家证人,他轻描淡写了书籍的个人重要性,平均一本书将其LLM的表现调整为“行业标准基准的0.06%”,这与噪音没有任何不同的变化。”
因此,梅塔(Meta虚荣博览会“但是[作者]的作品都没有单独作为培训数据具有经济价值。”其他沟通表明,元员工从下载的书籍中剥离了版权页。
这是Meta的Chicaneries和两面逻辑的象征,当AI行业的整个AI行业都对其吞噬的所有人类创建的内容进行了压力。”
不知何故,那些东西同时并不是那么有价值,我们都应该停止对艺术的神圣性掌握,无论如何还是AI现在写有创意的散文和人类但是,对于建立我们的新合成神也是绝对必要的将解决气候变化,所以请不要让我们为使用任何一个付费。最后一点是openai向英国议会争论去年,公共领域中没有足够的东西来加强其AI型号,因此必须允许它在不支付一分钱的情况下倾斜现代版权作品的赏金。
看来,这是AI顶级公司的不言而喻的理解。一位元研究人员询问公司的法律团队是否有可以使用利比根(Libgen)回答说:“我没有问问题,但这是Openai对GPT3的作用,Google对Palm的作用以及DeepMind对Chinchilla的作用,因此我们将对[O]做什么”,”虚荣博览会,从诉讼中引用的内部消息。
说明的是,非正式政策似乎根本不谈论它。
“在任何情况下,我们都不会公开透露我们已经对利比根进行了培训,但是实际的风险外部各方可以推断出我们对该数据集的使用,”内部元滑板甲板上写道。甲板指出:“如果有媒体报道表明我们已经使用了一个我们知道的数据集,例如Libgen,这可能会破坏我们与监管机构在这些问题上的谈判立场。”
有关AI版权的更多信息:Openai说,如果它可以窃取您所有受版权保护的工作