英语轻松读发新版了,欢迎下载、更新

通过 .ASS 字幕防止 AI 抄袭

2025-01-25 18:02:00 英文原文

大约两年前,世界充斥着关于生成人工智能或大型语言模型将如何彻底改变世界的新闻。当时很容易陷入炒作之中,但在接下来的几个月里,除了一些边缘情况之外,这些工具在生产性工作方面几乎没有做任何事情,而且大多是在将互联网变成现实的同时消耗大量现金。甚至比之前更加荒凉的荒地。他们主要通过将文本、音频和视频等人类创作物反省成低劣的拟像来做到这一点,如果你仍然想在互联网上生存,那么基本上你无法阻止这种抄袭行为。除了向 AI 模型提供垃圾数据(就像这位 YouTuber 开始做的那样)

至少就 YouTube 而言,人工智能抄袭最严重的罪犯会下载视频字幕,将其传递给某种人工智能模型,然后根据原始创作者的作品生成另一个 YouTube 视频。大多数字幕文件都相当简单.srt文件类型仅允许时间和文本信息。但有一种更晦涩的字幕文件类型,称为 Advanced SubStation Alpha,或者。屁股,允许各种字幕自定义,如方向、格式、字体类型、颜色、阴影等等。YouTube 用户 [f4mi] 意识到,使用此字幕系统,可以将额外的垃圾文本放置在字幕文件类型中,但将其置于视频本身的视图之外,方法是将文本放置在可视区域之外或增加其透明度。因此,现在当人工智能爬虫下载字幕文件时,它无法区分真正的字幕和放入其中的垃圾字幕。

[f4mi] 创建了一些脚本来自动执行此操作,这样就不必为每个脚本都手动完成。对于出于可访问性原因需要字幕的人来说,它也不会影响屏幕上的实际字幕。这是一种“毒害”人工智能模型的好方法,至少让它们更难抄袭原创艺术家的作品,[f4mi] 的测试表明它确实有效。事实上,我们很久以前就见过一种类似的方法来毒害电子邮件的数据集,当时我们集体更担心像国家安全局这样的组织在我们的电子邮件中使用自动窥探工具,而不是机器会窃取我们的创造性成果。

感谢 [www2] 的提示!

关于《通过 .ASS 字幕防止 AI 抄袭》的评论


暂无评论

发表评论