cURL Error Code: 7 cURL Error Message: Failed to connect to 127.0.0.1 port 9200: Connection refused cURL Error Code: 7 cURL Error Message: Failed to connect to 127.0.0.1 port 9200: Connection refused “就像第一次戴上眼镜一样”——人工智能如何改进地震检测 - OurCoders (我们程序员)

“就像第一次戴上眼镜一样”——人工智能如何改进地震检测

2025-10-10 11:00:24 英文原文

人工智能在检测小地震方面“出奇地擅长”——这就是为什么这一点很重要。

信用:奥里希·劳森 |盖蒂图片社

2008年1月1日凌晨1点59分,加利福尼亚州卡利帕特里亚发生了地震。你没有听说过这场地震;即使你住在卡利帕特里亚,你也不会感觉到任何东西。震级为-0.53,大约相当于一辆卡车经过时的震动程度。尽管如此,这次地震还是值得注意的,不是因为它很大,而是因为它很小——但我们都知道它。

在过去的七年里,基于计算机成像的人工智能工具几乎完全自动化了地震学的基本任务之一:检测地震。过去由人类分析师完成的任务(以及后来更简单的计算机程序)现在可以通过机器学习工具自动快速完成。

这些机器学习工具可以检测到比人类分析师更小的地震,特别是在城市等嘈杂的环境中。地震提供了有关地球组成以及未来可能发生的危险的宝贵信息。

“在最好的情况下,当你采用这些新技术时,即使是在相同的旧数据上,也有点像第一次戴上眼镜,你可以看到树上的叶子,”该书的合著者凯尔·布拉德利 (Kyle Bradley) 说。 地震见解通讯。

我与几位地震科学家进行了交谈,他们都同意机器学习方法已经取代了人类,在这些特定任务中做得更好。

“这真的很了不起,”康奈尔大学教授、布拉德利的合著者朱迪思·哈伯德告诉我。

接下来会发生什么就不太确定了。地震检测是地震学的基本组成部分,但还有许多其他数据处理任务尚未中断。最大的潜在影响,一直到地震预报,尚未实现。

“这确实是一场革命,”德克萨斯大学达拉斯分校教授乔·伯恩斯说。– 但革命仍在继续。 –

当一个地方发生地震时,震动会穿过地面,就像声波穿过空气一样。在这两种情况下,都可以对波穿过的材料进行推断。

想象一下敲击墙壁以确定它是否是空心的。由于实心墙的振动方式与空心墙不同,因此您可以通过声音找出其结构。

对于地震,同样的原理也适用。地震波以不同的方式穿过不同的物质(岩石、石油、岩浆等),科学家利用这些振动来拍摄地球内部的图像。

科学家传统上使用的主要工具是 地震仪。这些记录了地球在三个方向上的运动:上下、南北和东西。如果发生地震,地震仪可以测量该特定位置的震动。

老式物理地震仪。如今,地震仪以数字方式记录数据。信用:维基媒体上的山口先生 CC BY-SA 3.0

然后,科学家处理原始地震仪信息来识别地震。

地震会产生多种类型的震动,且震动速度不同。初级 (P) 波和次级 (S) 波这两种类型尤其重要,科学家喜欢确定每个阶段的开始。

在出现良好的算法之前,地震编目必须手动进行。伯恩斯说,“传统上,像美国地质调查局这样的实验室会有一大群主要由本科生或实习生组成的队伍,研究地震图。”

然而,您可以手动查找和分类的地震数量有限。长期以来,创建有效发现和处理地震的算法一直是该领域的首要任务,尤其是自 20 世纪 50 年代初计算机出现以来。

“从历史上看,地震学领域总是随着计算技术的进步而进步,”布拉德利告诉我。

不过,传统算法面临着巨大的挑战:它们无法轻松发现较小的地震,尤其是在嘈杂的环境中。

常见事件的合成地震图。请注意每个事件的形状略有不同。信用:EarthScope 联盟 CC BY 4.0

正如我们在上面的地震图中看到的那样,许多不同的事件都会引起地震信号。如果方法过于敏感,就有可能错误地将事件检测为地震。这个问题在城市尤其严重,那里交通和建筑物的持续嗡嗡声可能会淹没小地震。

然而,地震有一个特征“形状”。例如,上面的 7.7 级地震看起来与直升机着陆时的情况截然不同。

因此,科学家们的一个想法是根据人类标记的数据集制作模板。如果新波形与现有模板密切相关,则几乎可以肯定是地震。

如果您有足够的人工标记示例,模板匹配效果会非常好。2019 年,加州理工学院的 Zach Ross 实验室使用模板匹配寻找南加州发生的地震数量是之前已知的地震数量的 10 倍,包括本文开头的地震。他们发现的 160 万次新地震几乎全部都非常小,震级为 1 级及以下。

但是,如果您没有大量预先存在的模板数据集,则无法轻松应用模板匹配。这在南加州不是一个问题,那里已经有基本完整的 1.7 级地震记录,但在其他地方却是一个挑战。

此外,模板匹配的计算成本很高。使用模板匹配创建南加州地震数据集需要 200 个 Nvidia P100 GPU 连续运行数天。

必须有更好的方法。

人工智能检测模型解决了所有这些问题:

  • 它们比模板匹配更快。

  • 由于 AI 检测模型非常小(大约 350,000 个参数,而 GPT4.0 等法学硕士有数十亿个参数),因此它们可以在消费级 CPU 上运行。

  • 人工智能模型可以很好地推广到原始数据集中未表示的区域。

作为额外的好处,人工智能模型可以提供有关不同类型地震何时发生的更好信息。确定两个最重要的波(P 波和 S 波)到达的时间称为相位选取。它使科学家能够对地震的结构做出推断。人工智能模型可以与地震检测一起做到这一点。

地震检测(和相位选取)的基本任务如下所示:

来自 Earthquake Transformer 的裁剪图 - 一个用于同步地震检测和相位选取的细心深度学习模型。信用:自然通讯

前三行代表不同的振动方向(分别为东-西、北-南和上-下)。考虑到振动的这三个维度,我们能否确定是否发生了地震,如果发生了,地震何时开始?

我们想要检测直接从地震现场到达的初始 P 波。但这可能很棘手,因为 P 波的回波可能会被其他岩层反射并稍后到达,从而使波形更加复杂。

理想情况下,我们的模型在样本中的每个时间步输出三件事:

  1. 此时发生地震的概率。

  2. 第一个 P 波此时到达的概率。

  3. 第一个 S 波此时到达的概率。

我们在第四行中看到所有三个输出:检测为绿色,P 波到达为蓝色,S 波到达为红色。(此样本中有两次地震。)

为了训练人工智能模型,科学家们需要大量的标记数据(如上所述),并进行监督训练。我将描述最常用的模型之一:地震变压器,由后来成为哈佛大学教授的 S. Mostafa Mousavi 领导的斯坦福大学团队于 2020 年左右开发。

与许多地震检测模型一样,Earthquake Transformer 采用了图像分类的思想。读者可能熟悉 AlexNet,这是一个著名的图像识别模型掀起了深度学习热潮2012 年。

AlexNet 使用卷积,这是一种神经网络架构,其基于物理上靠近的像素更有可能相关的想法。AlexNet 的第一个卷积层将图像分解为小块(每边 11 个像素),并根据边缘或梯度等简单特征的存在对每个块进行分类。

下一层将第一层的分类作为输入,并检查更高级别的概念,例如纹理或简单形状。

每个卷积层分析图像的较大部分并在更高的抽象级别上运行。在最后几层,网络正在查看整个图像并识别“蘑菇”和“集装箱船”等物体。

图像是二维的,因此 AlexNet 基于二维卷积。相比之下,地震仪数据是一维的,因此 Earthquake Transformer 在时间维度上使用一维卷积。第一层分析 0.1 秒块中的振动数据,而后面的层则识别逐渐更长的时间段内的模式。

很难说地震模型正在挑选出什么样的确切模式,但我们可以将其类比为使用一维卷积的假设音频转录模型。该模型可能首先识别辅音,然后是音节,然后是单词,然后是随着时间尺度的增加而出现的句子。

Earthquake Transformer 将原始波形数据转换为高级表示的集合,指示地震和其他地震学重大事件的可能性。接下来是一系列反卷积层,可准确确定地震及其最重要的 P 波和 S 波发生的时间。

该模型还在模型中间使用了一个注意力层来混合时间序列不同部分之间的信息。注意力机制最著名的是 大语言模型,它有助于在单词之间传递信息。它在地震检测中起着类似的作用。地震地震图具有一般结构:P 波,然后是 S 波,然后是其他类型的震动。因此,如果一个片段看起来像 P 波的开始,注意力机制会帮助它检查它是否适合更广泛的地震模式。

Earthquake Transformer 的所有组件都是神经网络文献中的标准设计。其他成功的检测模型,例如 相网,甚至更简单。PhaseNet 仅使用一维卷积来选取地震波的到达时间。没有注意力层。

伯恩斯表示,总的来说,“没有太多需要为地震学发明新的架构”。源自图像处理的技术已经足够了。

那么是什么让这些通用架构运行得这么好呢?数据。很多。

Ars此前曾报道关于如何引入 图像网图像识别基准测试帮助引发了深度学习热潮。大型、公开的地震数据集在地震学中发挥了类似的作用。

Earthquake Transformer 使用以下方法进行训练 斯坦福地震数据集 (STEAD),其中包含来自世界各地的 120 万条人工标记的地震图数据片段。(STEAD 的论文明确 提到 ImageNet作为灵感)。其他模型(例如 PhaseNet)也接受了数十万或数百万标记片段的训练。

斯坦福地震数据集中所有记录的地震。信用:IEEE(CC BY 4.0)

数据和架构的结合才能发挥作用。伯恩斯表示,目前的模型在识别和分类地震方面“非常出色”。通常,机器学习方法发现的地震是先前在某个地区发现的地震的 10 倍或更多倍。您可以直接在意大利地震目录中看到这一点:

来自 Beroza 等人的《机器学习和地震预测 - 下一步》。信用:自然通讯(CC-BY 4.0)

人工智能工具不一定比模板匹配检测到更多的地震。但基于人工智能的技术的计算和劳动力密集程度要低得多,这使得它们更容易被普通研究项目所利用,并且更容易在世界各地应用。

总而言之,这些机器学习模型非常出色,几乎完全取代了检测和选相地震的传统方法,尤其是对于较小震级的地震。

地震科学的圣杯是地震预测。例如,科学家 知道西雅图附近将发生大地震,但几乎不知道它是明天发生还是一百年后发生。如果我们能够足够准确地预测地震以便让受影响地区的人们撤离,那将会很有帮助。

您可能认为人工智能工具将有助于预测地震,但这似乎还没有发生。

康奈尔大学的朱迪思·哈伯德 (Judith Hubbard) 表示,这些应用程序更具技术性,不那么华而不实。

更好的人工智能模型为地震学家提供了更全面的地震目录,从而解锁了“许多不同的技术”,布拉德利说。

最酷的应用之一是理解和成像火山。火山活动会产生大量小地震,其位置有助于科学家了解岩浆系统的结构。在 2022 年 约翰·威尔丁 (John Wilding) 和合著者使用人工智能生成的大型地震目录创建了这张令人难以置信的夏威夷火山系统结构图像。

每个点代表一次单独的地震。信用:Wilding 等人,夏威夷地下的岩浆网。

它们提供了先前假设的帕哈拉岩床深部复合体与莫纳罗亚浅层火山结构之间存在岩浆联系的直接证据。您可以在图像中看到这一点,箭头标记为帕哈拉-莫纳罗亚地震活动带。作者还能够将帕哈拉岩床复合体的结构阐明为离散的岩浆片。这种详细程度可能有助于更好地实时监测地震和更准确地预测火山喷发。

另一个有前景的领域是降低处理庞大数据集的成本。 分布式声学传感(DAS) 是一种强大的技术,它使用光纤电缆来测量整个电缆长度上的地震活动。休斯顿大学教授李嘉轩表示,单个 DAS 阵列每天可以产生“数百 GB 的数据”。如此多的数据可以产生极高分辨率的数据集,足以识别出个人的足迹。

人工智能工具可以非常准确地在 DAS 数据中确定地震时间。在引入用于 DAS 数据相位选择的人工智能技术之前,李和他的一些合作者尝试使用传统技术。虽然这些“工作原理粗略”,但对于下游分析来说不够准确。他告诉我,如果没有人工智能,他的大部分工作都会“困难得多”。

李还乐观地认为,未来人工智能工具将能够帮助他在丰富的 DAS 数据中分离出“新型信号”。

并非所有人工智能技术都获得了回报

与许多其他科学领域一样,地震学家面临着采用人工智能方法的一些压力,无论它们是否与他们的研究相关。

“学校希望你把人工智能这个词放在所有东西的前面,”伯恩斯说。“有点失控了。”

这可能会导致论文技术上合理但实际上毫无用处。哈伯德和布拉德利告诉我,他们看过很多基于人工智能技术的论文,这些论文“揭示了对地震如何发生的根本误解。”

他们指出,研究生可能会感受到专注于人工智能方法的压力,但代价是对科学领域基础知识的了解较少。他们担心,如果这种人工智能驱动的研究变得根深蒂固,旧的方法就会“因毫无意义而被淘汰”。

虽然这些都是现实问题,但理解人工智能已经 之前报道过,我不认为它们会损害人工智能地震检测的成功。在过去五年中,基于人工智能的工作流程几乎完全取代了地震学的基本任务之一。

这太酷了。

凯·威廉姆斯是一名记者了解人工智能,由 Ars Technica 校友 Timothy B. Lee 创立的 Substack 时事通讯。他的工作得到了支持塔贝尔奖学金订阅理解人工智能从蒂姆和凯那里得到更多。

关于《“就像第一次戴上眼镜一样”——人工智能如何改进地震检测》的评论


暂无评论

发表评论

摘要

人工智能显着改善了地震检测,特别是对于城市等嘈杂环境中的较小地震。机器学习工具现在可以使用计算机成像技术自动快速检测地震,超越了依赖人类分析师或更简单算法的传统方法。这些进步导致检测到的地震数量大幅增加,提供了宝贵的数据,增强了我们对地球构成和潜在危险的了解。Earthquake Transformer 和 PhaseNet 等人工智能模型利用大型数据集和标准神经网络架构来实现地震检测和相位选取的高精度,使这些技术能够广泛用于全球地震研究。

相关新闻

相关讨论