到目前为止的故事:12月4日,谷歌深度思维推出 GenCast,人工智能该公司表示,人工智能模型可以比大多数现有工具更好地预测天气,并且可以提前更多天。型号详情已发表在该杂志的同行评审论文中自然。
我们如何预测天气?
“天气预报……是通过对大气进行多次数值模拟而产生的,”澳大利亚联邦科学与工业研究组织的高级研究科学家瓦西里·基西奥斯本月早些时候写道。– 每次模拟都是从对当前天气的略微不同的估计开始的。这是因为我们不知道此时此刻世界各地的天气状况如何。...通过求解描述自然基本物理定律的方程,模拟可以预测大气中会发生什么。”
这个过程称为数值天气预报(NWP)。最好的数值天气预报需要使用强大的超级计算机以及特定地点天气的高质量数据。即使如此,数值天气预报也只能提前一周左右预测天气。
集合预报在 20 世纪 90 年代开始出现。在这里,科学家使用 NWP 模型在不同的起始条件下及时对某个特定位置进行多次预测。这些预报的集合称为集合,表示气象可能性的范围。
GenCast 的表现如何?
谷歌的 GenCast 也使用集合预测,但集合中的选项来自人工智能模型而不是 NWP。谷歌的工程师利用 1979 年至 2019 年 40 年的再分析数据来训练这个人工智能模型。根据欧洲中期天气预报中心的数据(欧洲金属加工联合会), – 再分析数据提供了目前可能的过去天气和气候的最完整的图景。它们融合了过去的短期天气预报和现代天气预报模型的观测结果。”
GenCast 的训练分两步进行:步骤 I 需要 3.5 天,步骤 II 需要 1.5 天,均使用 32 个 TPU v5 实例。“TPU”是“张量处理单元”的缩写,是 Google 开发的用于运行机器学习模型的集成电路,通过 Google Cloud 销售。2023 年 12 月,谷歌云推出称为 v5p 的 TPU:包含 8,960 个互连芯片,带宽为 4,800 Gbps/芯片,成本每芯片小时 4.2 美元一经请求。
就像 ChatGPT 擅长识别未完成句子中的下一个单词可能是什么一样,GenCast 擅长在给定某个时刻之前的天气情况下猜测下一时刻的天气。根据自然论文中指出,GenCast 在我们评估的 1,320 个目标中的 97.2% 上具有比 ENS 更高的技能,并且可以更好地预测极端天气、热带气旋路径和风力发电。 ENS 指的是 ECMWF 生成的集合预报,被认为是 ECMWF 的集合预报之一。最好的 NWP。
谷歌还说当要求提前 36 小时以上预测天气时,GenCast 在 1,320 个目标中的 99.8% 上比 ENS 更准确。
GenCast 是如何运作的?
论文中描述的 AI 模型有一个包含 41,162 个节点和 24 万条边的神经网络。每个节点都是网络中的一个点,在该点上接受、操作一些输入数据,并生成输出作为另一个节点的输入。边是节点之间的连接。
有关此设置如何处理数据的信息,请参见下图。说明:底部的地球仪依次显示四个时间点的天气预报。每个预测都是通过将现有天气数据与噪声输入相结合来生成的。GenCast 面临的挑战是从嘈杂的输入(顶部的地球仪)中提取下一时刻的天气预报。为此,模型通过细化(绿框)运行组合,产生噪声较小的预测,然后再次将其与输入数据组合,运行第二次细化,然后将新输出与输入数据组合,运行第三次细化以此类推,直至完成30次精炼。最终的去噪输出称为 X1,是下一时刻的最终天气预报。为了预测接下来的天气,模型首先接受 X1 作为输入,并以噪声输入重新开始。绿色盒子有神经网络。
显示 GenCast 如何生成预测的示意图。|照片来源:普莱斯,I.,桑切斯-冈萨雷斯,A.,阿莱特,F. 等人。使用机器学习进行概率天气预报。自然(2024)。
对噪声输入进行去噪的能力是扩散型 AI 模型(GenCast)的一个共同特征。其他使用扩散模型的著名应用程序包括 OpenAI 的文本到视频模型 Sora 和 Stability AI 的文本到图像模型 Stable Diffusion,这两个应用程序也是生成式 AI 的示例。
GenCast 一次至少为整体生成 50 个预测,谷歌表示每个预测都可以并行生成。总之,该集合一次包含 15 天的预报,空间分辨率为 0.25° x 0.25°(纬度-经度),时间分辨率为 12 小时。研究人员发现,整个过程在一台 TPU v5 单元上运行 GenCast 需要八分钟,比超级计算机 NWP 所需的几个小时要短得多。
GenCast 会取代 NWP 吗?
GenCast 的预测是概率性而非确定性的,即“12 月 25 日钦奈将有 25% 的降雨机会”,而不是“12 月 25 日钦奈将有 5 毫米的降雨量”。当前的 NWP 模型及其集合是确定性的。专家表示,概率天气预报更能揭示极端天气事件的可能性。
——我们应该更多地利用这些概率预测来预测极端事件,而不是依赖定量预测。概率预测提供了更多的准备时间,可用于更好的准备”,印度政府前秘书 Madhavan Rajeevan写在印度教2023 年 12 月。
也就是说,虽然 GenCast 的性能表明人工智能天气模型将很快超越 NWP 模型的能力,但 NWP 和 GenCast 都建立在仍然使用物理定律获取的更基本的天气数据之上。专家表示,利用这些定律了解天气仍然很重要,因为世界许多地区的天气正在迅速变化,历史天气条件无法让我们做好准备。
GenCast 本身需要更多的重新分析数据来训练自己。正如谷歌在一篇文章中所说公开声明: – 我们非常重视与气象机构的合作关系,并将继续与他们合作开发基于人工智能的方法,以增强他们的预测能力。与此同时,传统模型对于这项工作仍然至关重要。一方面,他们提供 GenCast 等模型所需的训练数据和初始天气条件。运行 GenCast 的代码是可以在 GitHub 上找到。
DeepMind 也一直在研究一个模型称为 GraphCast制定“确定性中期预测”。谷歌研究院一直在开发一种名为 NeuralGCM 的模型,该模型结合了 AI 和 NWP 模型来生成确定性预测,并且至少还有另外两个模型可以进行预测极端洪水并量化预测不确定性。在其他方面,华为的盘古天气模型可以一次预测一周的天气,其准确度与 NWP 相当,但速度要快得多。Nvidia 的FourCastNet模型已经可以超越最先进的ECMWF 的 NWP 设施在不到两秒的时间内预测极端降雨。
已发表- 2024 年 12 月 21 日上午 08:04(美国标准时间)