作者:Alex Reisner
编者注:此分析是大西洋对如何使用YouTube视频来培训AI工具的调查。您可以直接使用搜索工具这里,查看您创建或观看的视频是否包含在数据集中。这项工作是AI看门狗,,,,大西洋对生成行业的持续调查。
wHen Jon Peters上传了他的第一个视频在2010年,他不知道它会导致的位置。他是一名专业的木工,经营着一家小型企业,他决定拍摄自己在谷仓里发现的一条古老双腿制作餐桌。事实证明,人们喜欢他的坦率风格,随着他发布更多视频,粉丝群开始增长。他告诉我,突然有人会欣赏我所做的工作。评论是一个动机。十五年后,他的频道拥有超过100万的订户。彼得斯告诉我,有时候,在他的大多数观众的大型电视上,他的大部分电视都在他们的商店里得到人们的照片,是在向他寻求指导的木工。
但彼得斯的频道可能很快就会过时,还有数百万个其他视频是由在YouTube上分享专业知识和建议的人们制作的。在过去的几个月中,我发现了超过200万个渠道的视频,未经允许下载来培训AI产品。从我的角度来看,其中近一百万个是操作视频。您可以通过AI公司,大学和研究组织的AI开发人员通过在线AI-Development Hub等网站(例如AI开发人员分发)在至少13个不同的数据集中找到这些视频。
在大多数情况下,视频是匿名化的,这意味着不包括标题和创建者名称。我能够通过从数据集中提取唯一标识符并在YouTube上查找类似于我透露的过程时在YouTube上查找它们来识别视频。书籍3,,,,opensubtitles, 和利比根数据集。您可以使用下面的工具搜索数据集,例如,键入MRBEAST或JAMES CHARLES等频道名称。
((用户的注释:仅仅因为这些数据集中出现视频并不意味着它被用于AI公司的培训,这可以选择在开发其产品时省略某些视频。)
为了创建能够生成视频的AI产品,开发人员需要大量视频,YouTube已成为常见来源。尽管YouTube确实为付费订阅者提供了下载视频并通过公司应用程序观看视频的能力,但这是不同的:视频文件从YouTube en Masse中删除,并将其保存在AI算法中的文件中。这种下载违反了平台的服务条款,但是许多工具允许AI开发人员以这种方式下载视频。YouTube似乎没有做任何事情(如果有的话)来停止大规模下载,并且该公司没有回应我的置评请求。
并非所有的YouTube视频都具有版权(有些是由拥有版权的人上传的),但许多视频都在上传。这些视频的未经授权复制或分发是非法的,但是在许多持续诉讼中,AI培训是否构成一种复制还是分发形式仍然是一个问题。科技公司认为,培训是对受版权保护的工作的合理使用,有些是法官不同意在他们的回应中。如果科技公司能够继续从事创作者的工作来构建与他们竞争的AI产品,那么法院如何最终将法律应用于这项新技术可能会对创作者发布其作品的动机产生巨大后果,那么创作者可能别无选择,只能停止共享。
g充满活力的工具已经在生产与在YouTube上与人造工作竞争的视频。AI生成的历史视频具有数十万观看次数和许多不准确性被淹死了事实检查,专家生产的内容。流行的音乐 - 复发视频经常创建使用此技术,其中许多人的表现比人造视频更好。
但是,这个问题远远超出了YouTube。大多数现代聊天机器人都是多模式,这意味着他们可以通过创建相关媒体来回答问题。例如,Google的Gemini Chatbot将为付费用户生产简短的剪辑。很快,您也许可以询问Chatgpt或其他有关如何从发现的腿构建桌子并获取自定义操作视频的餐桌的工具。即使这种响应不像彼得斯(Peters)那样好,它也将是立即的,并且它将根据您的规格量身定制。在线出版业务已经是通过文本生成工具削减;视频创建者应该期望在不久的将来会产生类似的挑战。
根据我阅读的研究论文以及与我交谈的AI开发人员的研究论文,许多主要的科技公司已经使用这些数据集来培训AI。该小组包括Microsoft,Meta,Amazon,Nvidia,Runway,Bytedance,Snap和Tencent。我与这些公司询问了他们对这些数据集的使用。只有Meta,Amazon和Nvidia做出了回应。这三个人都说他们尊重内容创建者,并认为根据现有版权法,他们对工作的使用是合法的。亚马逊还分享说,在涉及视频的情况下,它目前专注于开发从简单提示中生成引人注目的高质量广告的方法。”
我们可以确定所有这些公司是否会使用视频来创建营利性视频生成工具。他们所做的一些工作可能只是实验性的。但是,其中一些公司对追求商业产品有明显的兴趣:例如,元正在开发一套名为的工具电影gen从文本提示中创建视频,然后Snap提供AI视频镜头这使用户可以通过生成AI增强视频。这些数据集中的视频是类似产品的原材料;就像Chatgpt无法像莎士比亚一样写莎士比亚的莎士比亚一样,视频发电机无法构建一个假新闻广播,而无需观看大量的录制广播。实际上,这些数据集中的大量视频来自新闻和教育渠道,例如BBC(在数据集中至少有33,000个视频,其各个品牌)和TED(近50,000个)。成千上万的人如果没有更多的人来自彼得斯等个别创造者。
人工智能公司对某些视频比其他公司更感兴趣。电子表格泄漏到404媒体由跑道的一位前员工建造了AI视频生成工具,该公司展示了该公司对某些频道的评价:高级的电影风景,电影中的高质量场景,“超级高质量科幻短片”。另一个被标记为“只有4个视频,但确实做得很好。
开发人员以多种方式寻找高质量的视频。在此收集的两个数据集的策展人HOWTO TO100M和HD-VILA-100M优先视频优先视频,并在YouTube上占据了高视图,这将受欢迎程度等同于质量。另一个数据集的创建者HD-VG-130M,著名的高视图不保证视频质量,并使用AI模型选择了高级美学质量的视频。数据集创建者经常试图避免使用包含覆盖文本的视频,例如字幕和徽标,因此这些识别功能不会出现在其模型中产生的视频中。因此,对YouTubers的一些建议:在视频中加上水印或徽标,甚至是一个小型徽标,都使它们不太理想培训。
为了准备培训的视频,开发人员将录像片分成短片段,在许多情况下,在任何地方都会换一个场景或相机。然后给出每个剪辑的英文语言描述,以便可以训练模型以将单词与移动图像相关联,并从文本提示中生成视频。AI开发人员有一些编写这些字幕的方法。一种方法是向工人付钱。另一个是使用单独的AI模型自动生成描述。由于成本较低,后者更加普遍。一个
我的视频工具就像聊天机器人或图像发生器一样主流,但它们已经广泛使用。您可能已经看过Ai-Triped视频而没有意识到。例如,泰德(Ted)一直在使用AI来用不同的语言来配音。这包括视频以及音频:扬声器的嘴是嘴唇同步有了新单词,看起来他们会讲日语,法语或俄语。泰德(Ted)的总法律顾问Nishat Ruiter告诉我,这是由演讲者的知识和同意来完成的。
还有其他面向消费者的产品,用于使用AI调整视频。例如,如果您的脸看起来不正确,例如,您可以尝试一个脸部增强剂Facetune,或完全用烟草扔掉杯子,例如面w。与跑道Aleph,您可以更改物体的颜色,或者将阳光变成暴风雪。
然后有一些工具根据您提供的图像生成新视频。谷歌鼓励双子座用户为了使他们喜欢的照片动画。结果是一个剪辑,可以从初始图像中推断出八秒钟的运动,使人跳舞,厨师或摆动高尔夫俱乐部。这些通常既令人毛骨悚然又令人毛骨悚然。说话的人会说话员工导向视频例如,也正在前进。vidnoz ai有望产生任何风格的现实AI发言人。arcads将与演员和配音一起制作完整的广告。经营Tiktok的公司Bytedance提供了一种类似的产品,称为Synphony Creative Studio。AI视频的其他应用包括虚拟穿衣服,,,,生成自定义电子游戏和动画卡通人物和人。
一些公司都在与AI合作,并同时努力捍卫其内容免于被AI公司窃取。这反映了AI的狂野西部心态,现在利用合法的灰色地区来了解如何获利。当我调查这些数据集时,我再次了解了一次涉及Tedâ的事件,这是此处捕获的数据集中最受推销的组织之一,以及试图雇用AI来推进自己的业务的事件。6月,戛纳国际广告节(Cannes Lions International Advertising Festival)颁发了一项大奖赛奖,其中包括来自北卡罗来纳州州州参议员Deandrea Salvador的TED演讲中的深深的录像。广告代理DM9使用AI克隆来改变她的演讲,并将其重新用于商业广告活动,” Ruiter最近在视频电话中告诉我。当发现操纵时,戛纳狮子节撤回了该奖项。上个月,萨尔瓦多起诉DM9及其客户和领事以及盗用她的相似性。DM9为事件道歉,引用•广告的生产和发送一系列失败。惠而浦的一位发言人告诉我,该公司没有意识到参议员的言论已经改变。
电影界的其他人已针对AI公司提起诉讼,以培训其内容。6月,迪士尼和环球公司起诉Midjourney,这是一个产生图像的工具的制造商,可以产生包含可识别角色的图像(华纳兄弟加入上周的诉讼)。该诉讼称Midjourney为窃的无底坑。在接下来的一个月中,两家成人电影公司起诉Meta下载(并通过Bittorrent分发)2,000多个视频。Midjourney和Meta都没有回应这些指控,也没有回应我的置评请求。一位YouTuber提起了自己的诉讼:去年8月,大卫·米莱特(David Millette)起诉NVIDIA在培训其培训方面,不公正地充实和不公平的竞争宇宙AI,但几个月后,此案被自愿驳回。
迪士尼角色和深深的萨尔瓦多广告只是这些工具如何破坏的两个实例。闸门可能很快就会进一步开放。由于对技术的大量投资,生成的视频开始到处都有。一家公司Deepbrain AI,付钱要在YouTube上发布使用其工具制作的AI生成的视频。目前,它提供了500美元的视频,该视频可获得10,000次观看次数,阈值相对较低。经营社交媒体平台的公司,例如Google和Meta,也通过广告收益共享向用户付款以及许多直接鼓励AI生成的内容的发布。毫不奇怪,是大师已经到达了用AI生成的内容来教授赚钱的秘密。
谷歌和元还从自己平台上培训了大量视频的AI工具:Google已采用至少7000万来自YouTube的剪辑,Meta的剪辑比来自Instagram的6500万个剪辑。如果这些公司成功地通过合成视频淹没了平台,那么人类创作者可能会承担与机器竞争的一项令人羡慕的任务,即与他们的原始作品竞争,这些机器会搅动无尽的内容。社交媒体将变得更加社交。
我问彼得斯,他是否知道他的视频已从YouTube带走训练AI。他说他没有,但他并不感到惊讶。我认为一切都会被盗,”他告诉我。但是他不知道该怎么办。我是否退出,还是只是继续制作视频,并希望人们想与一个人建立联系?