加州人工智能安全法案的误传 - 布鲁金斯学会

2024-09-27 16:28:58 英文原文

待决的加州参议院第 1047 号法案 (SB-1047),即《前沿人工智能模型安全创新法案》,被描述为从温和到专制,正在引发激烈的争论。虽然对该法案的一些分歧源于技术监管方面真正不同的理念,但其他分歧则源于对该法案文本的潜在歪曲。这些影响了该法案的最终修正案,该修正案于上个月在加州立法机构获得通过。

现在,所有人的目光都集中在州长加文·纽瑟姆身上,他必须在 9 月 30 日之前签署或否决该法案。在这个美国人工智能的热点事件中政策,至关重要的是,州长的决定应基于法案的实际文本,而不是其普遍的误解。

SB-1047 的作用是什么?

SB-1047,由州提出参议员 Scott Wiener(旧金山民主党人)的目标是防范未来人工智能 (AI) 系统带来的潜在灾难性风险,包括大规模杀伤性武器造成的大规模伤亡以及关键基础设施网络攻击造成的超过 5 亿美元的损失。SB-1047 要求所涵盖模型的开发人员在创建和遵循安全保障协议 (SSP) 时采取合理的谨慎态度,这些模型使用花费超过 1 亿美元的大量计算能力进行训练,或通过超过 1000 万美元的微调进行更改。。这包括防止模型被盗的网络安全措施、模型测试程序规范以及针对危险功能的防护措施。然而,除了这些高级规范之外,开发人员还可以为自己的 SSP 设计详细信息,从而实现敏捷、技术上知情的合规性。

鉴于合理谨慎的标准已经通过现有的侵权法适用于人工智能开发人员,SB-1047 在很大程度上阐明了合理关注对于前沿发展意味着什么,而不是创建新的、可能繁重的合规标准。涵盖的模型开发人员还必须接受年度第三方 SSP 合规性审核,公开发布其 SSP 的编辑版本,并为其控制下的所有涵盖的模型实例实施终止开关。

对该法案规定,加州总检察长现在只能在严重损害迫在眉睫或已经发生时才能够起诉公司,而不是像以前那样针对损害前疏忽的安全做法。这一变化是应前沿实验室 Anthropic 的要求,显着降低了 SB-1047 的保护能力。该法案创建了一个由来自整个行业的专家组成的精简的前沿模型委员会,该委员会更新了所涵盖的模型阈值并发布技术指导,以取代之前更广泛的前沿模型部门。该法案中的其他条款包括举报人保护、针对初创公司和学者的公共人工智能培训集群,以及针对人工智能培训出口云计算资源的“了解你的客户”要求。

最重要的事情之一关于该法案需要注意的是,只有使用大量且昂贵的计算能力来训练模型的开发人员才有合规责任。因此,它只针对最大的开发商,而排除小型初创公司、小型企业和学术机构。

SB-1047 的误述和修订

自草案版本以来,SB-1047进行了一些更改和最终修订。导致该法案最终版本的大部分讨论都是基于对技术监管的真正分歧,例如是否在模型开发级别或应用程序和使用级别进行监管,以及该法案的实际问题,例如,5 月 16 日版本中,开发人员可以无限期地更改另一个模型,而无需转移责任。

然而,该言论也充满了法案内容反对者的虚假主张或失实陈述。其中最重要的四个是关于安全的信心阈值、伪证的含义、终止开关要求的范围以及该法案涵盖的开发人员的范围。SB-1047 又进行了修改,以适应其中一些误解所产生的反对意见。

安全性的置信阈值

一个常见的说法是,所涵盖的模型开发人员必须证明、保证或证明其模型的每一种可能的使用都不会造成灾难性的伤害。正如加州理工学院的反对派研究人员所说,这种程度的信心实际上是不可能的。毕竟,前沿大语言模型 (LLM) 的功能很难完全发挥出来,并且行业最佳实践仍在发展中。

然而,在加州理工学院的信函发布时,该法案其明确指出的所需合理保证并不意味着完全确定性或实际确定性。这种失实陈述可能是导致该标准从法案中删除的原因之一。在最终修正案中,对不合理风险的合理保证被替换为防止此类风险的合理谨慎。

尽管合理保证可能需要更高标准的谨慎和对安全实践的信心,但它也并不那么好-被确立为合理谨慎的标准,已有数百年的法律先例。最终结果可能是安全性降低,法律环境更加确定。

伪证的含义

根据一些批评者的说法,开发者不仅必须不可能地证明安全性他们的模型:如果他们在这个证明中犯了任何错误,那么在作伪证的处罚下提交 SSP 的事实可能会让他们入狱。最夸张的是,这被描述为赋予现已解散的前沿模型部门警察权力,可以将模型开发人员因进行人工智能研究的思想犯罪投入监狱。初创加速器 Y Combinator (YC) 在 SB-1047 的整个开发过程中一直强烈反对,并宣扬人工智能软件开发人员可能会因为未能预见到其软件被滥用而入狱。

然而,这并不是伪证在法庭上可能发生的方式。要在加利福尼亚州被判伪证罪,被告必须故意声明[]该信息是真实的,即使[他们]知道该信息是错误的。正如维纳参议员在回应 YC 以及更强烈反对的风险投资公司 Andreessen Horowitz 时所说:善意的错误不是伪证。模型造成的伤害不是伪证。对模型性能的错误预测不是伪证。

此外,由于难以证明意图,伪证很少被指控,甚至更很少被定罪。相反,对伪证的惩罚通常是强调真实证词的必要性的一种方式。刑事责任是否适当是一个单独的问题:事实上,一些人警告说,对于 SB-1047,雄心勃勃的检察官可能会敌对地使用伪证执法。与此同时,由于该法案认为危害严重,故意对 SSP 撒谎可能需要承担刑事责任,即使伪证很少被执行。不管怎样,伪证罪的处罚被加州对向政府提交的文件中撒谎的标准民事责任所取代。鉴于伪证定罪的罕见性,这一变化可能不会产生太大影响。

终止开关要求的范围

该法案的一项条款特别引起了支持者的愤怒开源 AI 模型的内部工作原理公开发布以供下载和修改,要求受保护的模型开发人员实现在紧急情况下完全关闭其模型的能力。斯坦福大学著名人工智能专家李飞飞声称,这种终止开关条款实际上会杀死开源人工智能,因为开发者一旦发布就无法控制这些模型。

这一具体说法是否是误传该法案的内容更加模糊。一方面,一些人表示,这是因为它是在 6 月 20 日修正案之后制定的,该修正案规定,只有由开发商控制的涵盖模型衍生品(包括未经修改的副本)才需要终止开关。当李提出反对 SB-1047 时,这一修正案已经完成。此外,该法案的先前版本明确要求开发人员控制模型,但这并没有阻止对这一点的明显歪曲。另一方面,此次修正案还表示,全面停产要求适用于无资格覆盖的车型。这似乎包括任何涵盖模型,包括那些已经开源并因此不受开发人员控制的模型。

涵盖模型与所有涵盖模型衍生品(其中包括未经修改的副本)之间的紧张关系可能会导致困惑。SB-1047 的最终修正案增加了一项资格,即所涵盖的模型还必须由开发人员控制才能满足关闭能力要求。

澄清一下,该法案确实使开源人工智能变得更加困难陪审团会认为发布具有危险功能的模型不受限制,不采取合理的谨慎措施。这是可能的,因为有奉献精神的个人可以在 45 分钟内以不到 2.50 美元的价格消除当前前沿开源模型的保护措施。然而,该法案对开源发布的影响只有在现有侵权法尚未适用类似的合理注意标准的情况下才重要。

该法案涵盖的开发者范围

对 SB-1047 最广泛的误解可能是它直接适用于小型企业、初创公司和学术机构。然而,正如之前所言,除非开发人员使用大量且昂贵的计算能力,否则该法案基本上不适用于他们。如果这些阈值将来出现问题,前沿模型委员会可以提高它们。

尽管如此,李表示,新晋程序员和企业家将因必须预测其模型的每一种可能用途而受到伤害。进步商会认为,[法案]的要求使新模型开发商面临严厉的处罚和执法行动,同时要求大量的前期投资。安德森·霍洛维茨(Andreessen Horowitz)在回复维纳斯参议员的信函时声称,该法案适用于模型的微调,不考虑培训成本,误解了该法案对开发者的定义。这些陈述都表明了对该法案关键特征之一的误解:它故意只针对资源最充足的开发人员。

事实上,SB-1047 最初仅根据如何覆盖哪些模型来定义创建它们需要大量的计算能力。然而,该定义后来被更改为也考虑了型号的价格。做出这一改变是因为,随着技术的进步,强大的计算变得更加便宜,这将使较小的公司能够在未来使用大量计算能力创建先进的人工智能模型。这一变化还促进了竞争,并减轻了政府未来验证合规性的负担。

SB-1047 成为焦点

在这种激烈的话语环境中,州长必须签署或否决9 月 30 日之前通过该法案。随着这一决定即将出台,纽瑟姆州长应该警惕 SB-1047 被歪曲的各种方式,而是根据该法案的实际文本及其对其可能后果的评估做出决定。

关于《加州人工智能安全法案的误传 - 布鲁金斯学会》
暂无评论

摘要

待决的加州参议院第 1047 号法案 (SB-1047),即《前沿人工智能模型安全可靠创新法案》,被描述为从温和到专制,正在引发激烈的争论。然而,除了这些高级规范之外,开发人员还可以为自己的 SSP 设计详细信息,从而实现敏捷、技术性的合规性。刑事责任是否适当是一个单独的问题:事实上,一些人警告说,对于 SB-1047,雄心勃勃的检察官可能会敌对地使用伪证执法。安德森·霍洛维茨(Andreessen Horowitz)在回复维纳斯参议员的信函时声称,该法案适用于模型的微调,不考虑培训成本,误解了该法案对开发者的定义。然而,该定义后来被更改为也考虑了型号的价格。