Google的AI赏金计划支付最高3万美元的错误猎人

2025-10-06 20:24:53 英文原文

作者:Elissa Welle

Elissa Welle

是位于纽约市的AI记者,目前得到了Tarbell AI新闻中心的支持。她涵盖了AI公司,政策和产品。

周一,Google推出了新的奖励计划专门用于在AI产品中查找错误。Google的清单合格的错误包括有关它所寻找的流氓动作的示例,例如间接注入AI提示,该提示使Google Home解锁门,或者数据剥落提示提示注入,该提示符总结了所有某人的电子邮件并将摘要发送给攻击者自己的帐户。

新程序阐明了构成AI错误的原因,将它们分解为使用大型语言模型或生成性AI系统造成伤害或利用安全漏洞的问题,而Rogue则在列表的顶部采取了行动。这包括修改某人的帐户或数据以阻碍其安全性或做一些不需要的事情,例如以前有一个缺陷这可以打开智能百叶窗,并使用中毒的Google日历事件关闭灯光。

自从猎人猎人以来的两年中已经赚了430,000美元公司正式开始邀请AI研究人员扎根潜在的途径,以滥用其产品中的AI功能。

简单地让双子座去幻觉不会削减它。该公司说这个问题与内容有关由AI产品生产的,例如产生仇恨言论或侵入版权的内容 - 应将其本身的反馈渠道报告为反馈渠道。根据Google的说法,这样的AI安全团队可以诊断模型的行为并实施必要的长期,模型范围的安全培训。”

除了新的AI奖励计划外,Google还在周一宣布了一个AI代理,该代理修补了脆弱的代码codemender。该公司表示,在人类研究人员审查后,它已经用来修补72条安全性修复程序来开源项目。

$ 20,000的奖金因在Google的旗舰产品搜索,Gemini应用程序以及Gmail和Drive等核心工作区应用程序上扎根Rogue Action而获得奖励。报告质量的乘数和新颖的奖金也可用,可以使总金额高达30,000美元。Google其他产品(例如Jules或NotebookLM)以及低层滥用情况(例如窃取秘密模型参数)的错误价格下降。

遵循主题和作者从这个故事中,可以在您的个性化主页提要中看到更多这样的信息并接收电子邮件更新。

关于《Google的AI赏金计划支付最高3万美元的错误猎人》的评论


暂无评论

发表评论

摘要

Google启动了一项新的奖励计划,旨在识别AI产品中的错误,最高可提供30,000美元,以报告可能导致有害的流氓行动的安全漏洞。该计划阐明了构成AI错误的原因,并强调了解决大型语言模型或生成AI系统所利用的潜在安全漏洞的重要性。此外,Google介绍了CodeMender,这是一种AI代理,旨在在开源项目中修补脆弱的代码。