英语轻松读发新版了,欢迎下载、更新

创作者要求技术巨头为AI培训数据支付

2025-02-07 12:29:00 英文原文

英国议会委员会本周听说,政府允许AI开发商窃取内容 - 既有创意和新闻业”。

随着自动化的材料开始使人类创造者脱颖而出,您将获得音乐文化的香草化。

尽管有一个技术行业的数字坚持认为,文本和数据挖掘的“原始罪”已经发生,内容创作者和立法者应该继续前进,但发行人的联合委员会和一位由科技行业不受控制的版权剥削感到愤怒的作曲家而感到愤怒。材料。

文化,媒体和体育委员会以及科学,创新与技术委员会询问作曲家Max Richter,他将如何知道“坏信仰演员”是否正在使用其材料来培训AI模型。

他告诉国会议员:“我真的无能为力。”“有几种音乐AI模型,使它们产生一段音乐听起来很容易,就像我一样。这是不可能的。除非它不问我并且不付钱,否则它就振奋了我的东西。这很大程度上发生了。

里奇特(Richter)的作品已用于许多主要的电影和电视成绩,他说,对创意音乐家和作曲家的后果将是可怕的。

他说:“随着自动化的材料开始使人类的创造者提升,您将获得音乐文化的香草化,并且您也将获得人类创造者的贫困。”“值得记住的是,英国的音乐业务是一个真正的成功故事。去年的收入是76亿英镑,有超过20万人受雇。这是一个很大的影响。如果我们允许版权侵蚀,这确实是如此价值是在音乐领域创造的,然后我们将处于将来不会有艺术家的位置。”

前Google工作人员詹姆斯·史密斯(James Smith)发表讲话说,文本和数据挖掘造成的大部分损失可能已经造成。

“如果您愿意的话,最初的罪过已经发生了。”“问题是,我们如何前进?我希望看到政府在这些新的AI代理商时代为互联网提供了更多的努力,作为可行的互联网替代货币化模式。”

但是出版商的代表并不是那么乐观。

《金融时报》全球公共政策和平台战略总监马特·罗格森(Matt Rogerson)说:“我们只能处理我们面前看到的东西,即人们接受我们的内容,将其用于培训,使用它因此,从我们的角度来看,我们会在我们运营的每个国家中起诉相同的论点,我们看到我们的内容被盗。”

他说,如果情况继续存在,这种风险是从创意和信息行业中挖空的。

罗杰森说,一项FT委托研究发现,有1,000个独特的机器人正在刮下3,000个发布者网站的数据。“我们不知道这些机器人与谁合作,但我们知道他们正在与AI公司合作。平均而言,出版商有15个机器人,每个机器人都是针对每个机器人的目标,目的是为AI模型提取数据,他们将数据转售给AI平台以获取金钱。”

当被问及创意和信息行业的“意想不到的后果”能够查看AI公司如何获得和使用其内容并得到补偿,Rogerson表示,科技公司可能会降低利润率,但这是政府似乎不愿实施的。

“问题是我们看不到谁偷了我们的内容。我们正处于这些非常大的公司(通常占90%的利润率)的阶段,可能必须少一些利润,这显然会令人沮丧对于他们的投资者而言,这并不意味着他们不应该是对的,我们不幸的是,政府认为您无法降低这些大的利润率。科技公司;否则,他们不会建立数据中心。”

专业出版商协会首席执行官Sajeeda Merali表示,尽管AI部门争辩说,对数据刮擦和ML培训数据的透明度将对商业敏感,但其真正的关注是,其真正的关注是,出版商会要求公允价值以交换该数据。

同时,出版商还担心,如果他们选择退出分享数据进行ML培训,他们将在搜索引擎结果中受到惩罚。

Openai的Chatgpt于2022年登陆后,围绕用于培训LLM的数据的辩论涉及培训LMS。该公司的价值约为3000亿美元。尽管微软与OpenAI建立了100亿美元的合作伙伴关系,但Google和Facebook是开发自己的大型语言模型的其他公司。

去年,英国出版商协会首席执行官丹·康威(Dan Conway)告诉上议院通讯和数字委员会大型语言模型正在以“绝对庞大的规模”侵犯受版权保护的内容,认为Books3数据库列出了120,000个盗版书籍。®

关于《创作者要求技术巨头为AI培训数据支付》的评论


暂无评论

发表评论

摘要

英国议会委员会听取了出版商和作曲家对技术行业对未经同意或付款的AI培训的剥削的担忧。作曲家麦克斯·里希特(Max Richter)警告说,这可能导致人类创作者的创意音乐文化和收入下降。出版商担心他们的内容被大规模偷走,研究表明,成千上万的机器人从发布者网站上刮擦了AI模型的数据。代表认为,科技公司需要降低利润率并公平地补偿创作者,但由于对技术领域的投资的潜在影响,政府不愿实施此类变化。