人工智能搜索可能会破坏网络

2024-10-31 17:50:00 英文原文

作者:By Benjamin Brooksarchive page

十月底,新闻集团提交了一份诉讼对抗流行的人工智能搜索引擎 Perplexity AI。乍一看,这似乎没什么了不起。毕竟,这起诉讼与两打类似案件一起,寻求人工智能开发人员使用数据的信用、同意或补偿。然而,这个特殊的争议是不同的,它可能是所有争议中最重要的一个。

人工智能搜索的未来岌岌可危,即总结网络信息的聊天机器人。如果他们的越来越受欢迎有迹象表明,这些人工智能“答案引擎”可以取代传统搜索引擎,成为我们通往互联网的默认网关。虽然普通的人工智能聊天机器人可以重现(通常不可靠)通过训练学到的信息,但人工智能搜索工具,如 Perplexity、Google 的 Gemini 或OpenAI 现已公开的 SearchGPT旨在从第三方网站检索并重新打包信息。他们向用户返回一个简短的摘要以及一些来源的链接,从研究论文到维基百科文章和 YouTube 记录。人工智能系统负责读写,但信息来自外部。

在最好的情况下,人工智能搜索可以更好地推断用户的意图,放大高质量的内容,并综合来自不同来源的信息。但如果人工智能搜索成为我们进入网络的主要门户,它就有可能扰乱本已岌岌可危的数字经济。如今,在线内容的制作依赖于一系列与虚拟客流量相关的脆弱激励措施:广告、订阅、捐赠、销售或品牌曝光。通过将网络屏蔽在无所不知的聊天机器人后面,人工智能搜索可能会剥夺创作者生存所需的访问量和“眼球”。 

如果人工智能搜索打破了这个生态系统,现有的法律不太可能提供帮助。各国政府已经相信内容正在通过法律体系的漏洞而流失,并且他们正在学习以其他方式规范网络上的价值流动。AI产业应该利用这个狭隘的 在政府采取无效、只使少数人受益或阻碍思想在网络上自由流动的干预措施之前,这是建立更智能的内容市场的机会之窗。

版权并不是人工智能搜索中断的答案

新闻集团辩称,利用其内容提取信息用于人工智能搜索相当于侵犯版权,声称Perplexity AI“争夺读者,同时搭便车”出版商。这种观点很可能得到了以下人士的认同:纽约时报,这发出了停止和停止十月中旬推出 Perplexity AI。

在某些方面,反对人工智能搜索的理由比反对人工智能搜索的理由更有力。其他情况涉及人工智能培训。在培训中,当内容平淡且重复时,其影响力最大;人工智能模型通过观察大量数据集中的重复模式来学习可概括的行为,并且任何单个内容的贡献都是有限的。在搜索中,当内容新颖或独特,或者创作者具有独特权威时,其影响力最大。根据设计,人工智能搜索旨在从基础数据中再现特定特征,调用原始创建者的凭据,并站在原地原始内容。 

即便如此,新闻集团仍面临着一场艰苦的战斗,要证明 Perplexity AI 在处理和总结信息时侵犯了版权。版权不仅仅保护事实,也不保护产生这些事实所需的创造性、新闻和学术劳动。美国法院历来青睐那些将内容用于充分变革目的的科技被告,这种模式似乎很可能继续。如果新闻集团成功,其影响将远远超出 Perplexity AI 的范畴。限制将信息丰富的内容用于非创造性或非表达性目的可能会限制对丰富、多样化和高质量数据的访问,从而阻碍提高人工智能系统安全性和可靠性的更广泛努力。 

政府正在学习规范在线价值的分配

如果现有法律无法解决这些挑战,政府可能会寻求新法律。受到最近与传统搜索和社交媒体平台的争议的鼓舞,各国政府可以效仿《2017 年》颁布的媒体讨价还价准则,推行积极的改革。澳大利亚加拿大或提议于加利福尼亚州和美国国会。这些改革迫使指定平台向某些媒体组织支付展示其内容的费用,例如新闻片段或知识面板。欧盟通过以下方式施加了类似的义务:版权改革,而英国则推出了广泛的竞赛可用于强制讨价还价的权力。 

简而言之,各国政府已经表明,他们愿意规范内容生产者和内容聚合者之间的价值流动,放弃传统上不愿干预互联网的态度。

然而,强制讨价还价是解决复杂问题的生硬解决方案。这些改革青睐一小类新闻机构,其运营假设是 Google 和 Meta 等平台会利用出版商。实际上,尚不清楚他们的平台流量有多少真正归因于新闻,估计范围为2%35%搜索查询的数量3社交媒体提要的百分比。与此同时,平台通过扩大内容为出版商提供了巨大的利益,而且很少有共识关于这种双向价值的公平分配。有争议的是,这四个讨价还价规则只是规范索引或链接到新闻内容,而不仅仅是复制新闻内容。这威胁到“自由链接的能力”支撑网络。此外,讨价还价规则主要针对传统媒体——仅 1,400 种出版物加拿大, 1,500 在欧盟,以及 62 个组织澳大利亚– 忽略无数贡献帖子、博客、图像、视频、播客和评论来推动平台流量的日常创作者和用户。

然而,尽管存在种种陷阱,强制讨价还价可能会成为对人工智能搜索的有吸引力的回应。一方面,这个案子更有力。与传统搜索不同的是,传统搜索会索引、链接并显示来源的简短片段,以帮助用户决定是否点击浏览,而人工智能搜索可以直接用生成的摘要替代底层源材料,从而可能会耗尽下游的流量、眼球和曝光度网站。超过一个第三的 Google 会话在没有点击的情况下就结束了,而在人工智能搜索中这一比例可能会明显更高。人工智能搜索还简化了经济计算:由于只有少数来源对每个响应做出贡献,因此平台和仲裁员可以更准确地跟踪特定创作者对参与度和收入的推动程度。 

最终,细节决定成败。善意但设计不当的强制性谈判规则可能无助于解决问题,只能保护少数人,并可能削弱网络上信息的自由交换。 

行业建立更公平的奖励制度的窗口很窄

然而,仅仅威胁干预可能比实际改革产生更大的影响。人工智能公司悄悄地认识到诉讼升级为监管的风险。例如,Perplexity AI、OpenAI 和 Google 已经引人注目的交易与出版商和内容平台合作,其中一些涵盖人工智能培训,另一些则专注于人工智能搜索。但与早期的谈判法一样,这些协议只使少数公司受益,其中一些公司(例如红迪网)尚未承诺与自己的创作者分享该收入。 

这种选择性绥靖政策是站不住脚的。它忽视了绝大多数在线创作者,他们无法轻易选择退出人工智能搜索,也没有传统出版商的讨价还价能力。它通过安抚最强烈的批评者来消除改革的紧迫性。它通过机密和复杂的商业交易使一些人工智能公司合法化,使新进入者很难获得平等的条件或平等的赔偿,并可能巩固新一波人工智能公司的地位。搜索垄断者。从长远来看,这可能会激励人工智能公司青睐低成本、低质量的资源,而不是高质量但更昂贵的资源新闻或内容,培养不加批判的文化信息消费在此过程中。

相反,人工智能行业应该投资于奖励各类创作者分享有价值内容的框架。从YouTube抖音X,技术平台已经证明它们可以为复杂内容市场中的分布式创作者提供新颖的奖励。事实上,日常内容更公平的货币化是一个核心目标受到风险投资家推崇的“web3”运动。同样的推理也适用于人工智能搜索。如果查询产生有利可图的参与但用户不会点击访问来源,商业人工智能搜索平台应该找到方法将这种价值归因于创作者并大规模分享。

当然,我们的数字经济有可能从一开始就被打破了。靠滴流广告收入维持生计可能是不可持续的,注意力经济已经对在线隐私、诚信和民主造成了真正的伤害。支持优质新闻和新鲜内容可能需要其他形式的投资或激励措施。 

但我们不应该放弃更公平的数字经济的前景。如果说有什么不同的话,那就是,虽然人工智能搜索使内容讨价还价变得更加紧迫,但它也使其比以往任何时候都更加可行。人工智能先驱者应该抓住这个机会,为智能、公平和可扩展的奖励体系奠定基础。如果他们不这样做,政府现在就有了框架和信心来强加自己的共同价值愿景。

本杰明·布鲁克斯是一位哈佛大学伯克曼克莱因中心研究员审查对人工智能的监管和立法反应。他曾领导 Stability AI 的公共政策,该公司是图像、语言、音频和视频生成开放模型的开发商。他的观点并不一定代表任何附属组织的观点,无论是过去的还是现在的。 

关于《人工智能搜索可能会破坏网络》的评论


暂无评论

发表评论

摘要

新闻集团就人工智能搜索引擎使用数据问题对 Perplexity AI 提起诉讼,标志着人工智能搜索技术未来的重大争议。与普通的聊天机器人不同,像 Perplexity 这样的人工智能搜索工具旨在从第三方网站检索和重新打包信息,这可能会扰乱依赖虚拟客流量来货币化的数字经济。新闻集团认为这种做法侵犯了版权,但法律先例可能不支持他们的主张,因为现行法律不足以监管此类破坏。政府可能会采取强制性谈判规则或干预措施来应对,尽管这些可能会产生意想不到的后果。相反,人工智能行业开发公平奖励系统的窗口很窄,这些系统可以公平地补偿各个平台上的内容创作者。哈佛大学伯克曼克莱因中心人工智能监管专家本杰明布鲁克斯强调了科技行业这一机会的紧迫性和可行性。