作者:Kyle Wiggers, Maxwell Zeff
Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 似乎利用 YouTube 删除盗版内容的斗争来捍卫自己的公司对包含受版权保护的电子书的数据集的使用,这一点在他最新发布的证词片段中透露去年年底。
该证词是原告律师向法院提交的诉状的一部分,与人工智能版权案有关Kadrey 诉 Meta Platforms。这是美国法院系统审理的众多此类案件之一,人工智能公司与作者和其他知识产权持有者展开对立。大多数情况下,这些案件中的被告——人工智能公司——声称对受版权保护的内容进行培训是“合理使用”。许多版权所有者不同意。
“例如,我认为 YouTube 最终可能会在一段时间内托管一些人们盗版的内容,但 YouTube 正在努力将这些内容删除,”据报道,扎克伯格在证词中说道。成绩单的一部分周三晚上提供。“我认为 YouTube 上的绝大多数内容都不错,而且他们有许可这样做。”
扎克伯格证词的片段提供了扎克伯格对版权内容和合理使用的思考的一些线索。但值得注意的是,证词的完整记录并未公布。TechCrunch 已联系 Meta 以获取更多背景信息,如果该公司做出回应,我们将更新这篇文章。
根据证词要点,扎克伯格似乎正在为 Meta 使用名为 LibGen 的电子书训练数据集来开发名为 Llama 的人工智能模型系列进行辩护。Meta 的 Llama 与 OpenAI 等人工智能公司的旗舰模型竞争。
LibGen 将自己描述为“链接聚合器”,提供对出版商(包括 Cengage Learning、Macmillan Learning、McGraw Hill 和 Pearson Education)的版权作品的访问。LibGen 曾多次因侵犯版权而被起诉、责令关闭,并被罚款数千万美元。
根据本周公布的法庭文件,扎克伯格据称批准使用 LibGen 来训练至少一个 Meta 的 Llama 模型,尽管该公司的人工智能高管和研究团队对法律影响表示担忧。
原告的律师(包括畅销书作家 Sarah Silverman 和 Ta-Nehisi Coates)援引 Meta 员工的话称 LibGen 是“我们知道是盗版的数据集”,并指出它的使用“可能会破坏 [Meta”]s] 与监管机构谈判立场,- 根据法律备案。
在作证期间,扎克伯格声称他“没有真正听说过”LibGen。
“我知道你想让我对 LibGen 发表意见,而我还没有真正听说过,”扎克伯格在证词中说道。“只是我不了解具体的事情。”
在原告律师 David Boies 的询问下,扎克伯格解释了为什么禁止使用像 LibGen 这样的数据集是不合理的。
– 那么,我是否希望制定一项政策,禁止人们使用 YouTube,因为某些内容可能受版权保护?不,”他说。“在某些情况下,全面禁止可能不是正确的做法。”
扎克伯格确实表示,Meta 应该“非常谨慎地对待”有关受版权保护的材料的培训。
– 您知道,[如果]有人提供网站,并且他们故意试图侵犯人们的权利……显然,这是我们希望成为的事情根据文字记录,扎克伯格在证词中表示,我们对如何参与其中持谨慎态度,甚至可能阻止我们的团队参与其中。
Kadrey 诉 Meta Platforms 案的原告律师自 2023 年向美国加利福尼亚州北区地方法院旧金山分院提起诉讼以来,已多次修改诉状。原告律师于 2023 年提交的最新修订诉状周三包含针对 Meta 的新指控,包括该公司将 LibGen 中的某些盗版书籍与可供许可的受版权保护的书籍交叉引用。律师声称 Meta 使用这种策略来确定与出版商达成许可协议是否有意义。
根据修改后的文件,Meta 据称使用 LibGen 来训练其最新的 Llama 模型系列 Llama 3。原告还声称 Meta 正在使用该数据集来训练其下一代 Llama 4 模型。
根据修改后的文件,Meta 研究人员据称试图通过在 Llama 的微调中插入“监督样本”来掩盖 Llama 模型接受受版权保护的材料训练的事实。修改后的投诉称,Meta 早在 2024 年 4 月就从另一个来源 Z-Library 下载了盗版电子书,用于 Llama 培训。
Z-Library 或 Z-Lib 已成为出版商提起的一系列法律诉讼的对象,包括域名查封和删除。2022 年,据称维护该网站的俄罗斯公民被指控侵犯版权、电信欺诈和洗钱。
Kyle Wiggers 是 TechCrunch 的高级记者,对人工智能特别感兴趣。他的文章曾发表在 VentureBeat 和 Digital Trends 以及一系列小工具博客上,包括 Android Police、Android Authority、Droid-Life 和 XDA-Developers。他和他的伴侣(一位钢琴教育家)住在布鲁克林,他自己也涉足钢琴。偶尔——如果大多不成功的话。
Maxwell Zeff 是 TechCrunch 的高级记者,专门研究人工智能和新兴技术。此前,Zeff 曾在 Gizmodo、彭博社和 MSNBC 报道过人工智能的崛起和硅谷银行危机。他居住在旧金山。不报道的时候,他会徒步旅行、骑自行车,探索湾区的美食。