作者:Elaine Low
每当人工智能出现时在去年的 WGA 和 SAG-AFTRA 罢工期间,这是一个有争议的问题,但它似乎作为一个抽象概念而存在,是简洁纠察标志的素材。
但随着上周的发现,去年理论上的恐惧变成了一种真实的、深刻的个人恐惧。大西洋报数据集中超过 139,000 个电视和电影剧本用于训练 AI。它让作家群聊火热起来,显然没有人能安全地让自己的作品被人工智能吞没,而搜索功能是由人工智能构建的。大西洋报揭示 AI 使用了 508 个脚本珊达·莱姆斯, 346 来自瑞安·墨菲和 742马特·格勒宁— 的剧集未来世界和辛普森一家。(过去一周的大部分时间里,剧集主管和编剧都在搜索栏中疯狂输入自己的名字,回来时却惊恐万状。)
训练数据不是上传的脚本,而是字幕来自那些电视剧集和电影,来自一个名为OpenSubtitles.org。如果您想知道您的节目或电影的剧本是否在此数据集中浮动,在这里搜索。
作家和程序员亚历克斯·赖斯纳, 谁建造了大西洋报的搜索工具检查数据,写道:
我现在可以绝对有信心地说,许多人工智能系统已经接受过电视和电影编剧工作的培训。不只是在教父和阿尔夫,但在超过 53,000 部其他电影和 85,000 部其他电视剧中:所有对话都包含在 AI 训练数据集中,该数据集已被 Apple、Anthropic、Meta、Nvidia、Salesforce、Bloomberg 和其他公司使用。我最近下载了这个数据集,我在有关各种大型语言模型(或 LLM)开发的论文中看到了引用。它包括从 1950 年到 2016 年每部获得最佳影片提名的电影的写作,至少 616 集辛普森一家, 170集宋飞传, 45集双峰,以及每一集电线,黑道家族, 和绝命毒师. –
(赖斯纳告诉我,如果你想知道为什么无法从 Apple TV+ 或 Disney+ 等较新的流媒体服务中找到任何较新的电影或影片,这些字幕是在 2018 年提取的。)
——我很生气。我完全愤怒了。这太恶心了,”少年泰坦™ 大卫·斯莱克在数据库中发现了 42 个他认可的脚本后告诉我,其中包括感兴趣的人,对我撒谎和众目睽睽之下。– 这是我的大量工作。。。这些是我倾注了心血的事情。”
当作家们愤怒时,他们想知道他们有什么追索权,以及可以建立什么样的系统来让他们得到补偿。我和几个人谈过,其中包括好妻子共同创造者罗伯特·金,关于他们的问题和想法。
当然,还有拥有这些脚本版权的工作室。他们应该做什么?我采访了几位知名作家和律师,他们的专业范围从人工智能和娱乐法到专利和版权诉讼,了解他们的看法以及肯盆地派拉蒙影业和亚马逊影业前商务主管,《电视业。
在本周的系列业务中,您将了解到:
为什么脚本中的对话对人工智能训练特别有价值
作家对在数据库中找到自己的作品的反应
为什么工作室对这场争议保持沉默
如果作家无法阻止人工智能,他们希望如何获得报酬的想法
美国作家协会如何回应这一发现
关于使用受版权保护的材料来训练人工智能的法律现状
新兴技术有望让好莱坞更好地控制局势
为什么作家们担心他们的艺术被用来训练人工智能聊天机器人是一个“滑坡”
此栏目适用于付费订户仅有的。对您的团队或公司的小组感兴趣吗?点击这里。
要完全访问并继续阅读 Ankler 的所有内容,付费订阅者可以单击这里。