英语轻松读发新版了,欢迎下载、更新

谷歌为人工智能创建的内容添加水印以防止诈骗和作弊

2024-10-25 00:21:37 英文原文

作者:By Joe Salas

并附有 YouTube 链接。几秒钟后,前总统巴拉克·奥巴马在屏幕上发表讲话,他在讲话中宣称唐纳德·特朗普总统“是一个彻头彻尾的[咒骂]”。

不过,这实际上并不是前总统奥巴马。这是由 制作的 Deepfake 视频乔丹·皮尔和 Buzzfeed。整个视频是为了提高人们对我们当时拥有的人工智能能力的认识,这些能力可以创造带有画外音的头像。在这种情况下,皮尔利用巴拉克·奥巴马(Barack Obama)传递了一个信息,即要谨慎、警惕,并坚持使用可信的新闻来源。

那是六年半前— 或人工智能时代的几个世纪。

我们如何才能信任任何现在有来源吗?

从那时起,我们在人工智能技术方面取得了无数的进步。皮尔用来制作奥巴马深度伪造品的技术确实实现了飞跃。GPT-2于2019年向公众推出,可以通过简单的提示用于文本生成。

2021 年发布了 DALL-E,这是一款人工智能图像生成工具,其逼真的图像甚至能够欺骗最敏锐的眼睛。2022 年,DALL-E 2 的功能得到了更多改进。MidJourney 也于当年发布。两者都采用主题、情境、动作和风格的文本输入来输出独特的艺术作品,包括照片般逼真的图像。

A picture of my tiger-striped dog jumping off a slide having just caught a frisbee. Just kidding, it's actually an AI-generated image using Google's ImageFX, watermarked with SynthID

我的虎纹狗刚抓到飞盘从滑梯上跳下来的照片。开玩笑,它实际上是使用 Google 的 ImageFX 人工智能生成的图像,带有 SynthID 水印谷歌

到 2024 年,生成式人工智能已经完全消失

香蕉Meta 的 Make-A-Video 允许用户仅根据文本描述生成 5 秒长的视频,而 Meta 的新 Movie Gen 已将 AI 视频生成提升到新的高度。OpenAI Sora、Google Veo、Runway ML、HeyGen...通过文本提示,我们现在可以生成任何事物我们能想到的最疯狂的想象力。也许更重要的是,因为人工智能生成的视频有时会随着我们的输入而疯狂,从而产生一些非常迷人和迷幻的视觉效果。

Synthesia 和 DeepBrain 是另外两个 AI 视频平台具体来说旨在使用人工智能生成的化身来提供类似人类的内容,就像新闻播音员在您最喜欢的本地频道上提供最新新闻一样 - 说到这里,您的整个本地频道可能很快就会由人工智能生成 - 就像非凡的第一频道。还有更多。

什么是真的,什么是假的?谁能说出其中的区别?当然不是你在 Facebook 上不断分享那些荒谬图片的阿姨。真相、现实和真实的概念受到攻击,其影响远远超出了屏幕。因此,为了给人类一些机会抵御即将到来的谎言海啸,Google DeepMind 开发了一种技术,可以为人工智能生成的媒体添加水印并识别它,称为 SynthID。

SynthID 可以通过对人工智能内容进行数字水印,将合法的真实内容与人工智能生成的内容分开,这种方式人类无法感知,但可以被专门寻找水印的软件轻松识别。

这不仅适用于视频,还适用于图像、音频甚至文本。Deepmind 表示,这样做不会损害原始内容的完整性。

文本AI水印

ChatGPT 等大型语言模型 (LLM) 使用“令牌”来读取输入并生成输出。标记基本上是单词或短语的一部分或整个单词或短语。如果您曾经使用过法学硕士,您可能会注意到它倾向于在其回答中重复某些单词或短语。模式对于法学硕士来说很常见。

SynthID 如何为 AI 生成的文本添加水印非常棘手,但简单地说,它巧妙地操纵了整个文本中不同标记的概率。它可能会调整一个句子中的十个概率,整页上数百个概率,从而在生成的文本中留下 Deepmind 所谓的“统计签名”。

SynthID uses complex token prediction algorithms as a watermark for text files

SynthID 使用复杂的令牌预测算法作为文本文件的水印

谷歌

它仍然对人类来说是完全可读的,除非你有接近超自然现象的模式识别技能,否则你无法分辨。

但 SynthID 水印检测器可以判断,并且随着文本变长,其准确度会更高,并且由于不涉及特定的字符模式,因此数字水印对于一定程度的文本编辑也应该相当稳健。

音视频AI水印

多媒体内容应该变得更加容易,因为各种信息都可以编码到文件中看不见、闻所未闻的工件中。对于音频,SynthID 创建文件的频谱图,并放入人耳无法察觉的水印,然后将其转换回波形。

SynthID's watermarked specrtogram of an audio file

SynthID 的音频文件的水印频谱图

谷歌

照片和视频只是将水印以非破坏性的方式嵌入到图像的像素中。即使图像或视频已通过滤镜或裁剪进行更改,水印仍然可以检测到。

SynthID watermark is imperceivable to the human eye, as shown here

SynthID 水印是人眼无法察觉的,如下所示

谷歌

谷歌已经开源了 SynthID 技术,并鼓励公司构建生成式人工智能工具来使用它。这里的利害关系不仅仅是人们被人工智能假货愚弄——大公司本身需要确保人工智能生成的内容可以出于不同的原因与人类生成的内容区分开来——以便明天的人工智能模型接受“真实”人类生成内容的训练,而不是人工智能生成的废话。

如果人工智能模型被迫吃太多自己的排泄物,那么当今早期模型中普遍存在的所有“幻觉”都将成为新模型对地面事实理解的一部分。确保下一个 Gemini 模型接受尽可能最佳的数据训练,这绝对符合谷歌的既得利益。

但归根结底,像 SynthID 这样的方案非常容易被选择加入,因此,选择退出的公司(其 GenAI 文本、图像、视频和音频更难以检测)将拥有引人注目的销售宣传提供给任何真正想歪曲事实或愚弄别人的人,从干预选举的类型到懒得写自己作业的孩子。

也许各国可以立法强制使用这些水印技术,但肯定会有一些国家选择不这样做,并且会有一些不正当的行为建立自己的人工智能模型来绕过任何此类限制。

但这只是一个开始——虽然你或我一开始可能仍然被 TikTok 上泰勒·斯威夫特赠送锅碗瓢盆的视频所愚弄,但有了 SynthID 技术,我们将能够在发送 9.99 美元的运费之前检查它们的真实性。

来源:谷歌深度思维

关于《谷歌为人工智能创建的内容添加水印以防止诈骗和作弊》的评论


暂无评论

发表评论

摘要

那是 2018 年 4 月,和往常一样的一天,直到收到第一条短信,询问“你看过这个吗?!”那是六年半前的事了——或者说是人工智能时代的几个世纪。音频和视频人工智能水印多媒体内容应该变得更加容易,因为各种信息都可以编码到文件中看不见、闻所未闻的工件中。SynthID水印是人眼无法察觉的,如下Google所示谷歌已经开源了 SynthID 技术,并鼓励公司构建生成式人工智能工具来使用它。但归根结底,像 SynthID 这样的方案非常容易被选择加入,因此,选择退出的公司(其 GenAI 文本、图像、视频和音频更难以检测)将拥有引人注目的销售宣传提供给任何真正想歪曲事实或愚弄别人的人,从干预选举的类型到懒得写自己作业的孩子。那是 2018 年 4 月,和往常一样的一天,直到收到第一条短信,询问“你看过这个吗?!”

相关讨论