AI机器人群udspace以获取信息|udaily

2025-09-26 14:35:43 英文原文

作者:Article by Jamie Washington

Jeffrey C. Chase的照片插图 2025年9月26日

慢慢筛选密集的信息的日子已经一去不复返了,以回答有思想的问题或与科学发现保持最新状态。现在,人工智能机器人正在通过蜂拥而至的学术内容来对我们进行分类和总结。 

Udspace,特拉华大学的数字存储库,滴着蜂蜜。这种宝贵的资源由UD图书馆,博物馆和新闻界管理,以保存和提供长期免费,开放的访问权限,以获取UD教职员工,学生和员工生产的学术研究成果,其中包括文章,白皮书,报告以及论文和论文。

在去年,AI机器人对UDSPACE的在线信息查询量引起了重大峰值,这使系统的容量紧张,并导致响应延迟或根本不可用。UDSPACE正在处理其自身成功的不可预见的后果:通过使任何人免费使用UD研究,它实际上使每个人都无法使用它。

图书馆,博物馆和出版社的图书馆教学和技术副研究,教学和技术图书馆馆长安妮·约翰逊(Annie Johnson)说。AI公司一直在寻找更多数据来改善其大型语言模型(LLM)。Udspace具有大量对这些公司有吸引力的高质量数据。

约翰逊说,这种现象并不是乌德空间所独有的 - 其他机构存储库也在处理这一挑战。在过去的一年中,AI机器人也在杜克大学北卡罗来纳大学教堂山, 例如。北美,欧洲和其他地区的类似机构也面临着同样的挑战。最近的调查由英格兰埃克塞特大学的联合研究中心和纽约大学法学院的联合研究中心(Glam-e Lab)撰写,重点是画廊,图书馆,档案馆和博物馆。

图书馆信息技术负责人Mark Grabowski说,在正常一天开始时,我们曾经收到少于10个同时的查询来访问信息。您可以想象,我们很惊讶地与用户抱怨Udspace无法访问的用户同时进行80至100个问题。” 

图书馆的IT团队勤奋地调查了这个问题,发现AI机器人在大约半秒内提交了多个复杂的请求,包括研究人员的名称,主题,日期和标题。Grabowski说,AI机器人有一些简单请求的规则,但是机器人大多忽略了这些规则,团队注意到许多搜索是随机的,并且很快通过UDSPACE移动。” 

随着搜索几乎不间断,几乎来自世界各地的任何地方,图书馆助理负责人科琳·埃斯特斯(Colleen Estes)说,找到解决方案是一个反复试验的问题。最初的想法之一是阻止IP地址。

ESTES说,我们的目标始终是启用,改善和增加获取信息的访问。”我们知道,永久决议可能不会阻止IP地址,因为这将导致我们阻止整个国家,我们不想阻止真正的人访问信息。”

另一个临时响应是该系统告诉AI机器人不存在信息。 

格拉布洛夫斯基说,当我们这样做时,就像戳大黄蜂的巢一样,机器人更加努力。”异常高的80-100同时搜索跃升至250至300同时搜索。

自2025年5月以来,UDSPACE给AI机器人的信息发生了变化:我们有您要寻找的信息,但您禁止访问它。 

Grabowski说,UDSPACE有三层:接收请求的网站,处理请求的应用程序以及根据请求查询信息的基础数据库。现在,当请求来自机器人时,会出现在网站级别上的一条禁止消息,允许服务器接收流量,监视AI bot,但没有请求并放慢速度。 

他说:“整个周末都有一轮机器人查询,决心在没人看时收集尽可能多的信息。”现在,我们已被禁止了,他们会收到如此多的拒绝,他们停止提出要求。” 

人工智能正在迅速改变现实,但是人类的智力仍然是解决诸如AI机器人之类的挑战的有力力量。 

约翰逊说,这证明了我们的团队保持信息访问信息的巨大距离。”AI正在更改规则,这是UD图书馆IT团队迅速采用令人难以置信的解决方案做出响应的一个很好的例子,该解决方案不会限制我们的学生,教职员工,员工和全球社区,无法访问UDSPACE拥有的信息。”

关于《AI机器人群udspace以获取信息|udaily》的评论


暂无评论

发表评论

摘要

由特拉华大学图书馆,博物馆和出版社管理的数字存储库UDSPACE由于AI机器人寻求模型的数据而在线查询中经历了巨大的在线查询。这种尖峰的系统容量使UD研究降低了。副大学图书馆员安妮·约翰逊(Annie Johnson)解释说,AI公司被UDSPACE的高质量数据所吸引。为了解决该问题,IT团队实施了措施,例如识别机器人行为模式并在网站级别引入“禁止”消息,该级别有效地减少了过度查询,而不会阻止合法访问。