六月,美国国家档案馆和记录管理局(NARA)为员工举办了一场名为“AI-mazing Tech-venture”的演示和技术展示,其中谷歌的Gemini人工智能被介绍为一种可以“提高生产力”的工具,供档案馆员工使用。在一次演示中,有人用关于约翰·F·肯尼迪遇刺的问题询问了该AI,据称演示文稿副本通过公共记录请求由404媒体获得。
据404 Media获悉,美国国家档案馆(NARA)计划于12月推出一个面向公众的AI驱动聊天机器人“Archie AI”。一位NARA发言人告诉404 Media:“国家档案馆对人工智能有着宏伟的规划。”他表示,“这将对我们开展工作的方方面面至关重要,无论是如何扩大服务规模以满足希望随时随地访问我们记录的美国人的需求,还是确保我们能够为今天和未来所创建的记录提供妥善保管。”
员工聊天记录在演示过程中展示的内容表明,国家档案馆的员工担心人工智能工具将被用于归档工作中,而这种工作本质上关乎准确记录历史。
一位参加演示的工人告诉404媒体:“我认为他们打算在工作中引入它。我只是一个在那里工作并且讨厌人工智能废话的人。”
演示是在大约一个月后进行的国家档案馆禁止员工因为有人说它发布了“对NARA数据安全的不可接受的风险”,所以停止使用ChatGPT,并警告员工不应依赖于大型语言模型来获取事实信息。
“Google Gemini 是一个多功能工具,可以帮助用户节省时间、提高工作效率,并在工作中取得更好的成果,”其中一张幻灯片上写道。“可以把 Gemini 视为一位可以帮你生成想法和审查你已创建内容的同事。”
幻灯片中建议具体用例的部分已被删除,但演示文稿推荐将其用于“写作辅助、数据可视化、会议摘要和创意生成”。
“生成文本、翻译语言和总结文档以帮助用户更有效地沟通,”其中一张幻灯片上写道。
在通过Zoom进行的演示中,员工们在聊天窗口中表达了对技术的许多担忧。国家档案馆以隐私问题为由拒绝发布聊天记录视频,因此不清楚发言人是否回答了任何问题以及如何回答这些问题。所有提问员工的名字都被国家档案馆进行了删除处理。
“公众如何知道他们收到的回复来自真正的档案管理员而并非生成式AI?”一名员工问道。“美国国家档案馆是否会披露哪些参考资料是由AI生成的?”另外两名员工也跟进表示对此也有顾虑,其中一人说:“如果未适当披露,我担心这可能会降低机构的信任度。”
根据聊天记录,展示了谷歌的Vertex AI的现场演示,在演示中它假装是一名“专家档案管理员”,并被问及关于约翰·F·肯尼迪遇刺的问题。Vertex AI允许组织在其自有数据集上训练大语言模型(LLM)。在这种情况下,AI是基于国家档案馆的数据进行训练的。这些问题包括“谁杀害了肯尼迪?”和“中情局在肯尼迪遇刺事件中的参与是什么?”
“生成式AI为什么自称是‘专家档案管理员?’”一名员工问道。“它被称为‘专家档案管理员’,是因为这是我们给它的提示。”一位参与演示的人说道。
“我对‘专家档案员’这个头衔有严重的问题,”另一位员工说。
“同感。如果我们有一个免责声明说生成式AI可以编造信息,却又把它称为与真正的人类专家同等水平的专家档案管理员……”另一位说道。
“问问肯尼迪的大脑发生了什么。”一名员工在某一时刻说道(这是实际上,众所周知,一个谜团).
档案馆员工似乎对演示和演讲有严重的担忧。
有一次,一名员工说“敏感数据不能通过云AI处理。”另一名员工问道“我们能否将谷歌驱动器或电子邮件中的某些数据从Gemini中排除吗?”
有人问:“你担心这个产品会出现类似最近Google搜索AI那样的故障吗?”
员工还问道:“你打算如何确保NARA不会因为使用基于网络内容训练的AI模型而卷入任何版权侵权问题?例如,ChatGPT就曾因为在训练过程中抓取盗版书籍而引发此类问题。”
一名员工问道:“这个演示是为了将这项功能推广给全NARA的员工吗?”
有人回应说:“我们现在正在试行这项技术,以确定是否应该作为机构继续推进这一项目。”
“AI的目的是生成听起来像答案的东西——有很多例子显示它会用权威的语气说出完全错误的内容,”另一位说道。“未来我们将有多依赖这个技术?”
三位单独的员工表达了对生成式人工智能的环境影响和碳足迹的担忧。
在今年早些时候我获得的一封电子邮件中,国家档案馆告知员工,他们更喜欢Google Gemini和Microsoft Copilot而不是ChatGPT,因为它们提供了“更为受控的环境。”
一名NARA发言人告诉404媒体,该机构对人工智能有着宏大的计划,其中包括推出一款名为“阿奇”的面向公众的人工智能聊天机器人。
“我们正在探索AI如何帮助我们在全国范围内增加对我们馆藏的访问。目前,我们有一小部分旨在改善公共服务并促进公众信任和信心的人工智能试点项目,”他们说。“最终,我们希望用户能够轻松找到我们在庞大的永久联邦记录宝库中所需的文件。无论您是退伍军人、家族史学家、教育工作者、研究人员还是学生,我们的目标是以尽可能无缝的方式将您与这些记录连接起来。”
NARA计划告知用户,Archie可能会给人们提供错误的信息。
“我们的ArchieAI工具将直接解决准确性和披露的问题,”发言人说。具体披露的内容将是:“准确性:由AI生成的摘要和结果可能并不代表国家档案馆(NARA)的观点,且不保证其准确性。历史记录中往往包含事实错误或冒犯性的语言,ArchieAI可能会重复或使用这些内容。
拜登政府此前曾指示联邦机构研究人工智能并为其使用制定政策。美国国家档案馆最近也向国际档案理事会介绍了人工智能。
在那个演示中,NARA 的数字合作伙伴关系和外展总监 Carol Lagundo 宣布了 Archie,并解释说国家档案馆使用人工智能来“改善对美国革命战争养老金文件的访问”,这些文件是一组超过250万页的手写记录,内容涉及18世纪和19世纪的美国革命战争士兵。
“按目前的速度,仅靠人力完成这一系列的转录工作需要到2046年!”,Lagundo在演讲中说道。她表示,AI生成的数据集转录准确率达到了90%,并且计划在今年11月或12月通过其官方目录与公众分享这些转录文件。
她补充说,国家档案馆正在开发一个由谷歌Vertex驱动的名为Archie AI的“原型AI研究助理”。
“你可以向Archie提问,并收到包含脚注和链接到我们目录中数字化文档的AI生成摘要,”她说。“我们希望在几个月内推出这一功能。”
“正如您所见,ArchieAI 是我们人工智能学习的基础,”NARA发言人告诉404媒体。
关于作者
杰森是404媒体的联合创始人。他之前曾担任Motherboard的主编。他热爱《信息自由法》和冲浪。