2023年的春天, 当他开车前往德克萨斯州星基的SpaceX实习时,一位名叫卢克·法里托的学生发现自己被一档播客深深吸引。主持人正在描述一项竞赛,其目标大胆:不通过物理方式展开,就能阅读两千年前的一卷羊皮卷。这卷手稿是维苏威火山爆发时埋藏并碳化的纸草卷的一部分,那次喷发毁灭了公元79年的罗马城市庞贝和赫库兰尼姆。如果用手打开,这些卷轴会化为碎片,使其中的信息荡然无存。参赛者若能利用机器学习技术找到方法一窥内里,则可以获得超过一百万美元的奖金。
“我当时想,天啊,我得做这件事,”现在22岁的Farritor说。“关于它有很多吸引人的地方,最大的一点是有可能会发现一个来自古代世界的全新图书馆,这是一件大事。”
虽然他在日常工作重心在于太空旅行,Farritor这位计算机科学专业的人员却将自己的夜晚和周末时间投入到 Vesuvius 挑战中——这类似于时间旅行。这份来自赫库兰尼姆一座别墅的卷轴(据信属于尤利乌斯·恺撒岳父所有的财产),上面写着什么呢?
为了找到答案,参赛者必须开发自己的程序,这些程序能够解读现有的卷曲卷轴的3D扫描,并绘制微妙的物理变化以检测焦痕材料上的文字。
法里托首先研究了碳基墨水在碳化纸草上几乎不可察觉的部分的CT扫描。比赛中的一位竞争对手,该比赛以现金奖励的形式鼓励参赛者分享早期成果,观察到了类似干涸泥地的“裂纹”图案,但这些裂纹也可能表明有墨水的存在。因此,法里托训练了一个机器学习模型来专注于识别这种裂纹纹理。
在一个星期六的深夜,在内布拉斯加大学,法里特尔接到消息说卷轴的新部分已经上传给参赛者了。他当时在参加一个聚会,于是用手机登录到他的台式机上,让他的AI模型开始处理这张新的图片。几个小时后,他查看手机,看到了希腊字母π,奥米克隆, 和 rho穿越千年的闪烁目光注视着他。
“意识到,哇,我刚刚自动发现了罗马帝国的三个新字母,那一刻真是太酷了,”Farritor 说。“我当时激动坏了;所有人都很激动。我把这个发现发给了组织者。我也发给了我妈妈。”
这些字母原来是希腊语中表示“紫色”的词的一部分,使法里特奥尔成为自该卷轴被数十英尺厚的火山碎屑掩埋以来第一个看到这个词的人。
这卷轴是18世纪从挖掘井工人们发现的别墅中回收的大约一千卷之一,该别墅位于现代埃科尔拉诺镇下方。学者们认为这批文物很可能是希腊哲学家和诗人斐洛德穆斯的希腊图书馆。但他们怀疑在尚未发掘的部分别墅区域内可能还有一座更大的拉丁文图书馆。如果比赛证明学者们可以安全且轻松地阅读未开封的卷轴,这可能会激发对更多历史材料的搜寻。
这样的收藏可能包含希腊和罗马历史、哲学和文学中遗失的杰作。如果不再发现更多的卷轴,“这仍然会改变我们对古代世界的理解,”研究古希腊和罗马的历史学家兼播客主持人加勒特·瑞安说。但如果找到了这座图书馆,它将“在古典学领域引发一场深刻的革命。”
(一千万被奴役的美国人的名字在历史上缺失。人工智能正在帮助识别他们。)
图书馆有什么用处如果无法阅读?早期尝试打开脆弱的卷轴损坏了许多,留下了碎片供纸草学家拼凑。肯塔基大学计算机科学教授布伦特·西尔斯与技术投资者纳特·弗里德曼和丹尼尔·格罗斯共同发起了维苏威挑战赛。西尔斯和他的实验室在墨水检测和数字展开方面做了开创性的工作,竞争对手在此基础上进行了研究。通过发起这项竞赛,他们似乎为这种非侵入性的历史调查增加了更多的紧迫感、集体智慧和支持。
法里托的“紫色”突破只是开始。为了取得尽可能大的进展,法里托与其他两位竞争者组队合作。今年早些时候,他们因揭示卷轴上的15列文本(超过2000个字符)而获得了70万美元的大奖。他们的提交远远超出了挑战最初设定的目标——读取每段包含140个字符的四段文字。
三个人使用AI的方式略有不同。就像Farritor一样,28岁的团队负责人约瑟夫·纳达尔是一名在柏林攻读人工智能和机器学习博士学位的埃及人,他专注于改善墨水检测。与手动检查裂纹图案不同,纳德尔让他的模型在受损卷轴碎片上发现的墨水中进行训练。然后,他将该模型应用于CT扫描中显示目标卷轴内部结构的部分图像,这些图像是通过将卷轴置于粒子加速器光束中由竞赛组织者制作出来的。纳达尔的过程使得字符的渲染更加清晰和精确。
团队成员朱利安·施利格,29岁,是一名位于瑞士巴塞尔的计算机科学家,他负责研究如何通过数字手段“展开”卷轴,该卷轴在3D扫描的数千个横截面中可见其层。需要逐层追踪这些横截面并将它们数字化地“展平”,这本身就是一个劳动密集型的过程。施利格开发了一种使用AI的方法来帮助自动化这一过程。他创建了一个模型,可以识别出扫描图像中哪些点在卷轴各层面的片段上是相邻的。“这是一个让所有人都感到兴奋的时刻,表明你可以自动完成这项工作。”他说。
被迷住的纸草文献学家确定,团队揭示的这些石柱是关于享乐的一篇沉思文,很可能由菲洛德穆斯撰写。其中一个片段写道:“就食物而言,并不是稀缺的东西一定比丰富的东西更令人愉快。”
随着挑战进入第二年的尾声,组织者设定了新的目标:阅读四卷经书中的90%,而2023年仅读取了一卷经书的5%,并计划扩大第一年所开创的技术规模。为了阅读大约300卷完整的经书以及可能成千上万更多的经书,自动化程度的提高将至关重要。“我绝对相信这个问题将会得到解决,我们将能够扫描这些文献并通过按下一个按钮来获取其中90%的内容。”Seales说。
迄今为止的进展令经典学界兴奋不已,学者们渴望了解这些复原文物还能告诉我们什么。“当我们第一次看到AI揭示的文字时,那一刻令人震惊,”英国牛津赫库兰尼姆学会主席罗伯特·弗owler说,该学会支持别墅遗址的保护工作。“我们现在能够做到这一点,并跨越千年时光接触的不再是单一的一本书而是一座图书馆……这与永恒相连。”