我想象一下有人开着一辆顶级跑车驶进了一家酒吧——一辆150万英镑的科尼赛克瑞格拉随机挑选一个例子——有人走进酒吧,在你喝酒的地方闲逛,他们径直走到顾客中间,当着你的面把手伸进你的口袋,微笑着从你的钱包里取出所有的现金和卡片。
大声喊叫并质问那些小偷在干什么,他们就会停下来。“对不起带来了不便,”小偷说。“这是一个默认退出制度,朋友。”
听起来很荒谬。然而,这似乎是政府为了安抚人工智能公司所采取的措施。一项咨询程序即将开启,金融时报报道这将允许人工智能公司从个人和组织那里抓取内容,除非这些个人和组织明确选择不被使用他们的数据。
人工智能革命既迅速又全面。即使你不是那 billions 中的一员,也感受到了它的影响。 注意:原文中“billions”部分缺失了具体数字或上下文信息,因此保持未翻译状态,同时根据语境补充完整句子。如需更准确的译文,请提供完整内容。如果需要直接输出原文中的缺省部分,则为:“ billions 中的一员”。两亿人谁每周登录ChatGPT,或者尝试其生成式AI竞争对手如Claude和Gemini,你无疑已经与一个AI系统进行了互动——无论是有意还是无意。但是维持AI之火需要两个不断补充的源泉才能生存而不至于熄灭。一个是能量——这就是为什么AI公司正在进入能源业务的原因。购买核电站另一个是数据。
数据对于人工智能系统至关重要,因为它们帮助模拟我们如何互动。如果人工智能有任何“知识”——尽管这有很大争议,因为它实际上只是一个高级模式匹配机器——那么这种知识源于其训练所用的数据。
一项研究预测类似ChatGPT的大规模语言模型将会用完了训练数据到2026年,它的胃口如此之大。然而,如果没有那些数据,人工智能革命可能会停滞不前。科技公司明白这一点,这就是为什么它们正在从各个方向签署内容许可协议的原因。但这带来了摩擦,并且对于过去十年来一直奉行“无摩擦”这一非官方座右铭的行业来说,这是一个问题。快速行动打破常规“不产生摩擦。”
这就是为什么他们已经开始试图引导我们采取默认放弃版权的模式,即除非我们明确拒绝,否则我们将所输入、发布和分享的所有内容都将成为AI训练数据,而不是需要公司征得我们的同意才能使用我们数据的模式。我们现在就可以看到公司正在如何为我们接受这种现实做准备:本周,X开始通知用户其服务条款的变化,这些变化将允许所有帖子被用于训练Grok模型,埃隆·马斯克设计的与ChatGPT竞争的人工智能模型。而Meta(Facebook和Instagram的母公司)也进行了类似的变化——导致了病毒式传播的“告别Meta AI”现象。都市传说那据说可以凌驾于法律协议之上。
显然,AI公司希望采用选择退出制度的原因是:如果你询问大多数人是否愿意让他们撰写的作品、制作的音乐或在社交网络上发布的帖子和照片用于训练AI,他们中的大多数会说不。这样一来,人工智能革命就会遇到障碍。政府希望对已经存在了几百年的版权概念进行这样的改变的原因是:三百年以上并被法律明确规定了时限超过100这一点不太明显。但像很多事情一样,似乎归根结底还是钱的问题。
政府面临着大型科技公司的游说活动,这些公司表示这是将该国视为投资地点并分享人工智能创新成果的必要条件。谷歌撰写的一份游说文件建议支持其退出版权制度的做法将会“确保英国“因此,政府提出的议题框架对于大型科技游说团体来说是一个巨大的胜利,因为该框架已经将退出机制作为需要反对的方法摆在桌面上。”
随着科技行业资金的大量流动以及对人工智能项目的巨额投资,凯尔·斯塔默不想错过潜在的利益是可以理解的。政府如果不考虑如何取悦正在开发改变世界的科技公司,并努力使英国成为人工智能强国,那就太失策了。
但这并不是答案。让我们说清楚:英国提议的版权方案实际上会允许公司随意窃取我们的数据——我们发布的每一条帖子、写下的每一本书、创作的每一首歌,而无需承担任何后果。这将要求我们必须为每一个单独的服务注册,并告知他们不希望他们利用我们的数据来构建一个对我们不准确的画像。可能涉及数百个服务提供商,从小型研究实验室到大型科技公司。
以免我们忘记,OpenAI——一家如今估值达超过1500亿美元– 正计划放弃其创始的非营利原则,转变为营利性公司它金库里的钱足够用来购买训练数据,而不是依赖公众的慷慨捐助。这样的公司当然有能力用自己的钱,而不需要用我们的钱。所以请不要干涉。
-
克里斯·斯托克尔-沃克是《抖音热潮:中国的炸裂应用及社交媒体超级势力的竞赛》一书的作者