谷歌工具使生成的AI写作易于检测

作者：#author.fullName}

技术

谷歌DeepMind几个月来一直在其Gemini聊天机器人响应中使用AI水印方法——现在它将该工具提供给任何AI开发人员

一个词跟随另一个词的概率可以用来创建AI生成文本的水印。
维克拉姆·阿鲁恩/Shutterstock

谷歌一直在使用人工智能水印技术自动识别该公司Gemini聊天机器人的生成文本，使其更容易区分AI生成的内容和人类撰写的文章。该水印系统有助于防止将AI聊天机器人用于传播错误信息和虚假信息——更不用说在学校和商业环境中作弊了。

现在，这家科技公司正在提供其技术的开源版本，以便其他生成式AI开发人员可以为其自己的大型语言模型类似地添加水印。科利·普舒米特在谷歌深度思维（该公司的人工智能研究团队，结合了之前的Google Brain和DeepMind实验室），“虽然SynthID不是识别AI生成内容的万能解决方案，但它是在开发更可靠的AI识别工具方面的一个重要构建块，”他说。

独立研究人员也表达了类似的乐观态度。“虽然没有已知的水印方法是万无一失的，但我真的认为这可以在一定程度上帮助发现一些由AI生成的虚假信息和学术作弊等问题，”一位研究者表示。斯科特·阿伦森在德克萨斯大学奥斯汀分校，此前曾在OpenAI从事AI安全工作的他说：“我希望其他大型语言模型公司，包括OpenAI和Anthropic，会跟随DeepMind在这方面的行动。”

今年五月，Google DeepMind宣布它已经实施了其SynthID方法，用于对来自Google的Gemini和Veo AI服务的AI生成的文字和视频添加水印。该公司现已在其期刊上发表了一篇论文自然展示了SynthID通常优于类似的AI水印技术在文本上的表现。比较涉及评估来自各种带水印的AI模型的响应被检测的难易程度。

在谷歌DeepMind的AI水印方法中，当模型生成一串文本时，“锦标赛采样”算法会微妙地引导它选择某些特定的词“标记”，从而创建一个可通过相关软件检测到的统计签名。该过程以淘汰赛的形式随机配对可能的单词标记，在每一对中获胜者是根据水印功能得分最高的那个。胜出者继续进入下一轮的比赛，直到只剩下最后一个——这是一种“多层方法”，可以“增加任何潜在反向工程或移除水印尝试的复杂性”。黄芙蓉在马里兰大学。

一个拥有巨大计算能力的“决心敌对者”仍然可以去除这样的AI水印，他说。张翰林在哈佛大学。但他认为SynthID的方法是有道理的，鉴于AI服务中存在可扩展水印的需求。

无实际内容需要翻译，保持原样。原文：The谷歌深度思维公司研究人员测试了两个版本的SynthID，这两个版本在使水印签名更容易被检测到和不扭曲AI模型通常生成的文本之间进行了权衡。他们展示了一个非扭曲版的AI水印仍然有效，在一次实验证明它不会明显影响由 Gemini 生成的2000万条文本回复的质量。

但研究人员也承认，水印技术在处理较长且可以以多种方式回答的聊天机器人回复时效果最佳——例如生成一篇文章或电子邮件，并表示该技术尚未对数学或编程问题的回答进行过测试。

谷歌DeepMind团队及其他研究人员描述了防止滥用技术所需的额外保障措施的需求。AI聊天机器人黄建议加强监管。“通过法律强制要求加水印可以解决实用性和用户接受度的挑战，确保大型语言模型的安全使用。”她说。

主题：

OC

谷歌工具使生成的AI写作易于检测

技术

关于《谷歌工具使生成的AI写作易于检测》的评论

发表评论

摘要

相关新闻

相关讨论