使用机器学习、深度学习和时间序列模型预测喜马拉雅山西北部海拔梯度的降雨量

2024-11-14 06:05:06 英文原文

作者:Mattar, Mohamed A.

介绍

气候变化对粮食安全的影响与其对农业的深远影响密切相关。由于气候变化的不可预测性造成普遍的不确定性,预测即将到来的种植季节的条件变得具有挑战性,这往往对农业活动不利1。因此,农民和农业决策者在做出有关耕作、播种和管理作物的关键决策时,很大程度上依赖于他们对区域气候模式的了解。然而,在不断变化的气候中,传统方法变得不太可靠2。增强的气候预测为改善农业部门的决策带来了希望。这些先进的预报有可能减轻季风季节不佳或延迟等因素的不利影响,并提供利用预计有利天气条件的机会3。接受这些预测可以帮助农民和其他农业专业人士更有效地应对不确定性,保护他们的作物和产量,同时为适应气候变化的可持续农业实践奠定基础4。此外,强降水可能导致洪水,影响基础设施、交通网络和人类生计5。因此,如果能够提前量化一个地区的潜在降雨量,将有利于决策过程。预测降雨量对于提高农业产量和确保国家居民获得食物和清洁水至关重要6

气候预测与农业之间的联系凸显了准确预测在塑造粮食安全未来方面的关键作用。近几十年来,改进降雨预报一直是科学界关注的焦点7。为了提高降雨预报的准确性,必须整合各种数据源并利用先进的建模技术。数值天气预报模型利用数学方程来模拟大气的行为以及与各种气候因素的相互作用。这些模型结合了历史数据、气象站的实时观测、卫星图像和复杂的计算算法8。降雨量与一系列气候因素有着错综复杂的联系,每一个因素都会影响其他因素,也受到其他因素的影响。这些因素包括最高和最低温度、大气压力、相对湿度和风速9。这些变量的相互关联性创造了一个复杂的系统,在维持整体气候平衡方面发挥着至关重要的作用。数值天气预报模型旨在通过检查气候要素和降雨之间的复杂关系来提供更精确的预报。大气的复杂性和不断变化的性质以及各种气候因素复杂的相互作用对降雨预报的改进提出了挑战。尽管在增强降雨预测技术方面取得了显着进展,但有几个因素仍然导致任务的复杂性。一个重大障碍是大气过程固有的不可预测性10。气氛充满活力和混乱,有突然的变化和意想不到的互动。这种不可预测性表明,即使初始条件发生微小变化,随着时间的推移也会导致截然不同的结果11。这种现象对气象学家和气候科学家来说是一个巨大的挑战,他们致力于创建准确的模型来预测降雨模式。使降雨预报复杂化的另一个关键方面是需要长期历史数据来构建可靠的预测模型。历史数据帮助科学家识别降雨模式、趋势和周期。然而,获取全面、高质量的历史数据并不总是那么简单,特别是在监测基础设施有限的地区12

降雨预测涉及复杂的随机和非线性行为,可以使用数据挖掘、人工智能 (AI)、ML 和 DL 等先进技术来解决。机器学习方法可以揭示历史降雨数据中的隐藏模式,并已被提议作为非线性和动态系统的替代建模方法5。因此,近年来,机器学习方法已成为降雨预测领域传统数据挖掘技术的有力继承者,这反映出人们对机器学习方法在应对预测降水模式的复杂挑战方面的能力的日益认可。13,14,15,16。证明机器学习方法优于传统的降雨预测确定性方法。ML 模型的示例包括 RF、SVR 和 SVM。RF 采用决策树集合进行预测、提高准确性并处理复杂的数据关系17 号。SVR 是一种适用于回归任务的 SVM,可以有效捕获数据中的非线性模式。SVM 是一种用于分类和回归的多功能模型,通过支持向量创建最佳决策边界18

深度学习作为机器学习的一个子集,还展示了通过利用受人脑互连神经元启发的复杂神经网络来增强预测能力的巨大潜力19。深度学习技术涵盖了人工神经网络的各种算法。这些网络由互连的节点层或“神经元”组成,每个层都处理和转换输入数据,然后将其传递到下一层。这些网络的深度和复杂性使它们能够捕获广泛数据集中的复杂模式和关系。这种能力在以高维和非线性数据为特征的领域尤其有价值,例如气候科学和气象学20。深度学习方法与传统的机器学习方法密切相关,尽管在架构复杂性和特征提取层次上有所不同21。虽然深度学习和传统机器学习都致力于识别数据模式,但深度学习模型擅长在多个抽象级别自主学习数据表示。这意味着深度学习模型可以自动发现原始数据中的复杂特征,而无需显式特征工程,这通常需要领域专业知识并且可能非常耗时22。深度学习在降雨预测中的应用涉及根据历史气候数据训练神经网络。这些网络旨在识别关键变量之间的隐藏相关性、非线性关系和时间依赖性,以实现准确的降雨预报23。当神经网络处理这些数据集并从中学习时,它们会完善其内部表示,从而逐渐使它们能够做出越来越准确的预测。深度学习方法有效地利用了降雨预报中气候因素的相互关联性,考虑了温度、湿度、风速和气压等多种变量,并认识到它们对降雨模式的综合影响24。这种综合方法比传统方法具有优势,传统方法可能难以捕捉这些变量之间复杂的相互作用。此外,DL 处理大量数据的能力非常符合气象预报的要求,其中历史气候记录跨越数十年并包含一系列变量。深度学习模型能够识别这些数据集中的微妙趋势、非线性依赖性和复杂的时间模式,从而可以实现更准确、更可靠的降雨预测25

深度学习方法的示例包括 ANN、RNN、KNN 和 GRU。人工神经网络模拟互连的神经元来捕获数据中的复杂关系,从而增强学习能力。RNN 专门研究序列建模,为语言处理等任务保留先前输入的记忆26。KNN 是一种根据特征空间中数据点的接近程度进行预测的学习算法。GRU 是 RNN 的一种变体,解决了 RNN 中的梯度消失问题并改进了远程依赖性捕获27 号。此外,还有 ARIMA、LSTM、三角函数、Box-Cox 变换、ARMA 和 TBATS 模型等时间序列模型。这些模型允许数据分析师跨各种应用程序对时间序列数据进行建模和预测。例如,ARIMA 将自回归和移动平均组件与差分相结合以处理非平稳数据。LSTM 是一种 RNN,可以捕获序列中复杂的时间关系28,29。三角模型利用正弦函数来捕获循环模式,这对于具有周期性波动的数据来说是理想的选择。Box-Cox 变换稳定方差并增强数据的正态性30。ARMA 模型融合了自回归和移动平均成分,而 TBATS 考虑了复杂的趋势和季节性模式17 号。使用线性回归作为机器学习方法旨在通过建立与其他大气变量的关系来预测降雨量31,3233。进行了彻底的比较研究,以评估统计模型和回归技术在利用环境特征预测降雨量方面的有效性。该研究强调了回归技术在预测降雨模式时优于统计模型的性能。此外,他们的调查表明,与 SVM 和决策树方法相比,RF 模型在 ML 算法中表现出更高的预测准确性。这项研究为降雨预测提供了宝贵的见解,揭示了特定建模方法的优势。DL LSTM 模型已被证明对于降雨预测是有效的。印度海得拉巴地区降雨预报研究20,34等人提出了一种增强的 LSTM 模型,并将其与 Holt-Winters、ARIMA、极限学习机 (ELM) 和 RNN 等其他模型进行了比较。使用ANN预测月平均降雨量验证了结果35。研究结果表明,在三种不同类型的网络(层循环、级联前馈反向传播和前馈反向传播)中,前馈反向传播网络类型产生了最佳结果。

先前的研究利用线性回归模型来确定预测降雨的关键特征,包括太阳辐射、可检测到的水蒸气和日常模式36。研究发现,温度、风和气旋可以用来预测农业部门增长的降雨量,农民可以据此做出决定。一些研究人员还利用温度、相对湿度、压力和风速等大气特征,使用 ANN、RF 和多元线性回归模型等机器学习技术来准确预测降雨量37,38。因此,机器学习、深度学习和时间序列建模的结合代表了一个有希望的前沿领域,可以增进我们对气候模式的理解并提高我们预测降雨的能力。

本研究的重点是探索喜马拉雅山西北部的降雨数据,有几个关键目标。首先,我们的目标是评估先进的机器学习算法在预测降雨模式方面的有效性。其次,我们寻求评估专门针对该地理区域定制的深度学习模型的准确性。第三,我们打算将机器学习和深度学习方法的性能与气象预测中常用的传统时间序列技术进行比较。此外,我们的研究旨在分析海拔变化如何影响这些预测模型的精度。最后,根据我们的研究结果,我们的目标是提出一种整体方法来提高该地区降雨预测的整体准确性。通过这些目标,我们旨在贡献宝贵的见解,以促进山区气象预报的科学理解和实际应用。这项研究采用多维方法来揭示该地区降水趋势的复杂性,该地区因其复杂的海拔依赖气候变化而闻名。通过整合这些创新方法,我们的目标是解码环境因素与降雨之间的复杂关系,最终开发出更准确和本地化的预测模型。

材料和方法

案例研究区域、气象数据和预处理。研究区域覆盖印度喜马拉雅山西北部地区,中心位置约为北纬33°5°24°240°,东经74°47°24°24°2。图 1说明了所覆盖的研究区域的位置。研究地图由QGIS 3.30.0生成。六个气象站位置分布在地图上的海拔梯度上。主要数据是从印度气象部 (IMD) 总部收集的。该数据集包含 40 年(1980 年至 2020 年)最高和最低气温以及降雨量的每日数据。初始数据预处理阶段涉及多项任务:数据转换、处理缺失值、编码分类变量以及将数据集划分为训练集和测试集。由于原始数据同时显示缺失值和极值或异常值,因此采取了纠正措施。缺失值被替换为不可用 (N.A)。随后,数据集在准备进行实验之前经历了编码过程。确定并隔离了对降雨预测至关重要的相关属性。然后对数据集进行划分,其中 80% 指定用于训练,20% 用于测试,作为模型的输入。

图1
figure 1

研究区域地图(地图是使用QGIS 3.30.0创建的https://www.qgis.org/)。

型号

本研究的重点是通过机器学习、深度学习和时间序列方法的组合方法进行降雨预测。该分析涵盖三种不同的 ML 算法:ANN、SVR 和 RF;三种深度学习算法:RNN、LSTM、GRU;以及两种时间序列算法:ARIMA 和 TBATS。这些不同的算法利用了与降雨量中度到强相关的输入变量,这些变量取自多个环境因素。模型参数和有关模型的信息在补充表中给出 1秒。该研究通过使用 RMSE 和 MAE 指标评估性能来确定并报告最有效的模型和算法,表中给出了各种模型在不同海拔高度的其他精度评估,例如 Bias 和 R2 1秒

机器学习 (ML) 算法

使用三种机器学习算法根据数据集的行为来预测降雨量。下面讨论这些算法:

人工神经网络(ANN)

ANN 是一种受大脑结构和功能启发的机器学习模型。人工神经网络的架构通常由输入层、一个或多个隐藏层和输出层组成。输入层接收输入数据并将其传递到隐藏层。隐藏层使用权重和偏差将输入数据转换为更适合任务的新表示。输出层根据隐藏层处理的信息产生最终预测。权重和偏差是在训练过程中学习的,使模型能够做出越来越准确的预测。隐藏层的数量、隐藏层的大小和使用的激活函数决定了模型的容量及其学习输入和输出之间复杂关系的能力。如图所示 2,\({y}_{t}\)被视为其滞后值的函数\(\:{y}_{t-1},{y}_{t-2},\点\:,\:{y}_{t-k}\)以及各自的权重。

图2
figure 2

ANN 的模型架构。

$$\:{y}_{t}={a}_{0}+\sum\:_{j=1}^{q}{a}_{j}g({\beta\:}_{0j}+\sum\:_{i=1}^{k}{\beta\:}_{ij}{y}_{t-i})+{\epsilon\:}_{t}$$

(1)

在哪里\(\:{a}_{j}\:(j=\text{0,1},2,\点\:,q)\)\(\:{\beta\:}_{ij}\:(j=\text{0,1},2,\dots\:,q;i=\text{1,2},.,k)\)是模型的连接权重;k是输入层中的节点数,q是隐藏层中的节点数。

支持向量回归(SVR)

SVR,由 Vapnik 等人开发。39,是一种用于回归和时间序列问题的 ML 模型。SVR模型架构由以下组件组成。首先,使用核函数(例如径向基函数(RBF)或多项式函数)将输入特征变换到高维空间。转换后的特征用于训练模型。该模型通过最大化数据点和边界之间的余量来找到最佳边界。使用惩罚偏离目标值的成本函数来估计模型参数。该模型通过将特征转换到高维空间并应用线性回归模型来对新的输入数据进行预测。核函数和正则化参数 (C) 是超参数,可以通过调整来提高模型的性能。SVR模型的主要优点是它可以使用合适的核函数处理输入和输出之间复杂的非线性关系。

随机森林 (RF)

RF 是一种基于决策树的 ML 算法。它构建多个决策树并结合它们的预测来提高模型的整体准确性和稳定性。许多决策树都是根据随机选择的训练数据子集进行训练的。每个决策树都经过训练,通过根据输入特征的值将数据递归地划分为子集来对目标变量进行预测。新输入样本的最终预测是所有决策树做出的预测的平均值。每次分割时随机选择特征有助于去相关树并减少过度拟合。用于训练每棵树的引导训练数据样本有助于减少预测方差。RF模型的架构如图1所示。 3

图3
figure 3

射频架构。

深度学习 (DL) 算法

为了根据当前环境数据估计每日降雨量,选择了 RNN、LSTM 和 GRU 三种特定算法进行实证研究。因此,对这三种深度学习算法进行了测试和并列,以确定预测每日降雨量的最佳方法。

循环神经网络(RNN)

RNN 是处理顺序数据的深度学习模型。它有一个反馈循环,允许信息从一个序列步骤传递到下一个序列步骤。RNN 的核心架构由一个具有隐藏状态的重复模块组成,该模块存储有关前一时间步的信息,以及一个输入到隐藏层,该层将当前输入和最后一个隐藏状态作为输入并输出当前隐藏状态状态。然后,隐藏状态用作隐藏到输出层的输入,该层生成当前时间步的输出。输入到隐藏层和隐藏到输出层的权重在所有时间步骤中共享,允许模型学习序列数据中的模式。RNN 模型的内部结构可以使用以下方程描述:

输入层:输入层接收表示为x(t)的输入序列,其中t表示时间步长。

隐藏层:隐藏层包含使用以下方程计算隐藏状态 h(t) 的循环神经元:

$$\:\text{h}\left(\text{t}\right)=\text{f}\left({\text{W}}_{hx}\text{*}\text{x}\right(\text{t})+{\text{W}}_{hh}\cdot\:\text{h}(\text{t}-1)+{\text{b}}_{h})$$

(2)

其中,f 是激活函数(例如 tanh),\(\:{\text{W}}_{hx}\)是输入到隐藏层连接的权重矩阵,\(\:{\text{W}}_{hh}\)是隐藏层到隐藏层连接的权重矩阵,并且\(\:{\text{b}}_{h}\)是偏置向量。

输出层:输出层使用以下方程计算输出 y(t):

$$\:\text{y}\left(\text{t}\right)\:=\:{\text{W}}_{hy}\:\text{*}\:\text{h}\left(\text{t}\right)\:+\:{\text{b}}_{y}$$

(3)

在哪里,\(\:{\text{W}}_{hy}\)是隐藏层到输出层连接的权重矩阵,并且\(\:{\text{b}}_{y}\)是偏置向量。

这些方程描述了简单 RNN 模型的基本结构。更复杂的 RNN 模型可能具有额外的层或使用不同类型的激活函数或循环神经元。该架构可以扩展多个隐藏层以形成深度 RNN 或多个隐藏状态以创建 LSTM 或 GRU。

长短期记忆(LSTM)及其变体

LSTM 是一种 RNN 类型,广泛用于处理时序数据,例如时间序列、语音信号和文本。它是由40作为传统 RNN 中出现的梯度消失问题的解决方案。LSTM模型是一种RNN类型,可以长时间记住之前的输入。LSTM 网络的架构由记忆单元、输入门、遗忘门和输出门组成。存储单元负责长期存储信息,而门则控制信息进出存储单元的流动。输入门控制进入记忆单元的信息流,允许网络决定保留哪些信息。遗忘门根据当前输入和之前的记忆状态决定应该丢弃哪些信息。输出门根据当前输入和之前的记忆状态决定应该输出什么信息。LSTM单元的结构如下图所示: 4和方程:

图4
figure 4

LSTM 单元的结构。

输入门:控制允许进入细胞状态的新信息量。它是使用以下等式计算的:

$$\:{i}_{t}=\sigma\:\left\{{W}_{i}*\left({h}_{t-1}*{x}_{t}\right)\右\}+{b}_{i}$$

(4)

在哪里,\(\:{它}\)是时间步的输入门\(\:t\),\(\:{W}_{i}\)是权重矩阵,\(\:\:{h}_{t-1}\)是先前隐藏状态的串联\(\:t-1\:\)和当前输入\(\:{x}_{t}\), 和\(\:{双}\:\)是偏置项。sigmoid 激活函数\(\:\西格玛\:\)确保输入门在 0 和 1 之间。

遗忘门:控制从细胞状态中遗忘的信息量。它是使用以下等式计算的:

$$\:{f}_{t}=\sigma\:\left\{{W}_{f}*\left({h}_{t-1}*{x}_{t}\right)\右\}+{b}_{f}$$

(5)

在哪里,\(\:\:{f}_{t}\)是时间步的遗忘门\(\:t\),\(\:{W}_{f}\)是权重矩阵,并且\(\:{b}_{f}\)是偏置项。

单元状态:模型的连续记忆,存储过去的信息。它使用以下等式进行更新:

$$\:{C}_{t}={f}_{t}*{C}_{t-1}+{i}_{t}*\stackrel{\sim}{{C}_{t}}$$

(6)

在哪里,\(\:{C}_{t}\)是时间步的细胞状态\(\:t\),\(\:{f}_{t}\)是遗忘门,\(\:{它}\)是输入门,\(\:{C}_{t-1}\)是之前的细胞状态,并且\(\:\stackrel{\sim}{{C}_{t}}\)是候选细胞状态,计算如下:

$$\:\stackrel{\sim}{{C}_{t}}=tanh\left\{{W}_{c}*\left({h}_{t-1}*{x}_{t}\右)\右\}+{b}_{c}$$

(7)

\(\:{厕所}\)\(\:{公元前}\)是候选人输入的权重和偏差。

输出门:控制从单元状态输出到隐藏状态的信息量。它是使用以下等式计算的:

$$\:{o}_{t}=\sigma\:\left\{{W}_{o}*\left({h}_{t-1}*{x}_{t}\right)\右\}+{b}_{o}$$

(8)

在哪里,\(\:{o}_{t}\)是时间步的输出门\(\:t\),\(\:{W}_{o}\)是权重矩阵,并且

\(\:{b}_{o}\)是偏置项。

隐藏状态:模型当前状态的表示。它是使用以下等式计算的:

$$\:{h}_{t}=\:{o}_{t}*tanh\left({C}_{t}\right)$$

(9)

在哪里,\(\:{h}_{t}\)是时间步的隐藏状态\(\:t\),\(\:{o}_{t}\)是输出门,并且\(\:{C}_{t}\)是细胞状态。

上述方程构成了 LSTM 单元的核心,多个单元可以堆叠在一起以创建多层 LSTM 网络。深度 LSTM 模型是 LSTM 模型的变体,具有多层 LSTM 单元。双向 LSTM 以两种方式处理输入序列:前向(从开始到结束)和后向(从结束到开始)。

门控循环单元 (GRU)

GRU 是 RNN 模型的改进版,具有两个门:重置门和更新门。这些门有助于调节信息流并防止传统 RNN 中可能出现的梯度消失问题。GRU 的架构类似于 LSTM 网络,但参数较少。

时间序列算法

选择 ARIMA 和 TBATS 使用实时环境数据来预测每日降雨强度。对这些算法进行了测试和比较,以确定准确的每日降雨量预测的最佳方法。

自回归综合移动平均线 (ARIMA)

ARIMA 是一种流行的时间序列预测算法,用于对单变量数据进行建模和预测。对于 ARIMA 模型,时间序列数据必须是平稳的,这意味着其均值、方差和协方差随时间保持恒定。如果数据不平稳,则应用差分步骤使其平稳。ARIMA 模型是根据 p、d 和 q 的值来选择的,其中 p 是 AR 项的数量,d 是应用的差分步骤的数量,q 是 MA 项的数量。自相关函数 (ACF) 和偏自相关函数 (PACF) 用于识别时间序列数据中的模式,并确定要包含在 ARIMA 模型中的自回归 (AR) 和移动平均 (MA) 项的数量。使用最大似然估计或其变体将该模型拟合到时间序列数据。使用残差分析并将预测值与预留用于验证的时间序列数据的一部分的实际值进行比较来验证模型。ARIMA 模型预测时间序列数据的未来值。

具有 Box-Cox 变换、ARMA 误差、趋势和季节性分量 (TBATS) 的指数平滑状态空间模型

TBATS 是一种针对单变量时间序列数据的时间序列预测算法。它是一种结合了指数平滑和 ARIMA 模型的混合算法,适合对季节性、趋势和不规则性等复杂时间序列模式进行建模。该算法将时间序列建模为多个分量的组合,包括趋势、季节性分量和不规则分量。该算法使用最大似然估计来估计模型参数,并通过组合不同元素来预测未来值。人们发现 TBATS 在各种时间序列数据集上表现良好,包括具有多种季节性模式、非平稳趋势和不规则波动的数据集。

统计评价

一般来说,有必要评估已开发的预测模型的性能,并使用特定的统计措施将其与其他模型进行比较。然而,采用多个统计指数至关重要,因为不同的模型可能会为特定指数产生相似或几乎相同的值。这种相似性使得确定哪个模型比其他模型表现更好变得具有挑战性。每个统计指标从单一角度评估模型的性能,即模型的输出与期望值的匹配程度。因此,建议跨多个统计指标评估模型,全面评估每个模型的性能并进行稳健的比较分析,最终确定最合适的建模方法。通常使用两个性能指标来评估预测模型的有效性:RMSE 和 MAE。RMSE 衡量预测值与实际值之间误差的平均大小。RMSE 值越低表示模型精度越高,因为它们表示预测数据点和观测数据点之间的差异较小。类似地,MAE 量化预测值和实际值之间的平均绝对差,值越低表示预测越准确。RMSE 和 MAE 可以定义为

$$\:\text{R}\text{M}\text{S}\text{E}=\frac{1}{n}\sqrt{\sum\:_{t=1}^{n}{\left({\text{Y}}_{\text{t}}-\widehat{{\text{Y}}_{\text{t}}}\right)}^{2}}$$

$$\:\text{M}\text{A}\text{E}=\frac{1}{\text{n}}\sum\:_{\text{t}=1}^{\text{n}}\left|{\text{Y}}_{\text{t}}-{\widehat{\text{Y}}}_{\text{t}}\right|$$

在哪里\(\:{\text{Y}}_{\text{t}}\)是实际值,\(\:\widehat{{\text{Y}}_{\text{t}}}\)是拟合值,n 是观测值的数量。

结果与讨论

喜马拉雅山西北部海拔梯度的温度描述性统计揭示了显着的变异性,这对于了解当地气候动态及其对降雨模式的影响至关重要。L1 至 L6 位置的平均最高温度范围为 11.65 至 20.21℃,反映了受海拔高度影响的不同热状况(表 1)。这些发现与之前强调海拔在温度变化中的作用的研究一致41。最高温度值范围广泛,从 5.70 ℃ 到 37.60 ℃,揭示了研究区域内广泛的气候谱,表明高山和低海拔气候。同样,同一地点的平均最低气温在 2.50 到 7.64 ℃ 之间,这表明与地势较低的地区相比,海拔较高的地区气候凉爽(表 2)。该梯度对于理解蒸散量和降水形成等与温度相关的过程至关重要42。最高和最低温度的标准误差和偏度值进一步阐明了分布特征,表明温度数据分布存在轻微的不对称性,但变异性相对较低,表明测量的稳健性34,43,44。这些温度统计数据是预测该地区降雨模式的基础框架。研究表明,温度梯度直接影响大气稳定性、水分含量和降水事件的发生45,46,47,48。通过将特定海拔温度数据整合到降雨模型中,研究人员可以提高针对山区的预测模型的准确性49

表1 喜马拉雅山西北部不同海拔梯度最高气温的描述性统计。
表2 喜马拉雅山西北部不同海拔梯度最低气温的描述性统计。

对喜马拉雅山西北部不同海拔位置(L1 至 L6)降雨模式的分析为了解山区降水建模相关的空间变化和预测挑战提供了宝贵的见解。平均降雨量范围从 1.94 到 4.09 毫米,说明相对较小的地理距离内降水水平存在显着差异(表 3)。每个地点观测到的最小和最大降雨量的广泛范围进一步强调了这种变化,反映了地形、大气动力学和当地气候条件的复杂相互作用。标准误差和偏度值为降雨数据的分布特征提供了额外的视角。较高的偏度值(例如在 L2、L3、L4 和 L5 位置观察到的偏度值)表明分布不对称,有极端降雨量较高或较低的趋势,可能受到局部天气现象(如地形抬升或对流过程)的影响44,50。相反,较低的偏度值表明降雨分布更加对称,表明降雨模式更加温和和一致51,52,53,54。应用机器学习模型(RF、SVR、ANN 和 KNN)根据气象变量预测降雨量揭示了不同海拔梯度上不同的模型性能。RF 和 SVR 模型在训练和测试阶段通常表现出较高的 RMSE 值,这表明在山区捕获预测变量与降雨结果之间复杂的非线性关系方面存在挑战。这些发现与之前的研究一致,强调统计模型对空间异质性的敏感性以及山区需要稳健的验证策略55,56,57。相比之下,ANN 和 KNN 模型表现出相对较低的 RMSE 值,表明它们有潜力更好地捕捉不同海拔地区降雨模式的空间变化和非线性。这些模型的卓越性能可能源于它们学习气象数据中固有的复杂模式和关系的能力,包括地形影响和微气候变化等与海拔相关的因素58,59。这些发现凸显了整合特定海拔气象数据和采用先进建模技术来提高山区降雨预报准确性的重要性。未来的研究方向可能包括通过纳入额外的环境变量(例如地形特征、植被覆盖)来完善模型输入,并探索集成建模方法以减轻与单个模型性能相关的不确定性60,61,62,63,64。此外,结合高分辨率卫星数据和地面观测可以进一步改善降雨模式的空间表示,并支持复杂地形环境中更稳健的模型验证。

表3 喜马拉雅山西北部不同海拔梯度降雨的描述性统计。

应用机器学习、深度学习和时间序列建模技术根据喜马拉雅山西北部海拔梯度的气象变量来预测降雨量,为模型性能和预测准确性提供了宝贵的见解(表 4)。RF、SVR、ANN 和 KNN 等 ML 模型表现出不同水平的有效性,如它们在不同海拔高度(L1 至 L6)的训练和测试 RMSE 值所示(图 1)。 5)。这些差异强调了这些模型对气候条件空间变化以及气象预报与降雨模式之间复杂相互作用的敏感性。深度学习模型(包括 LSTM、双向 LSTM、深度 LSTM、GRU 和 RNN)也表现出了跨海拔梯度的不同 RMSE 值。这些模型利用数据中的顺序依赖性,并在捕获气候变量中的时间模式和非线性关系方面显示出前景,这对于动态山区环境中准确的降雨预测至关重要40,65。此外,ARIMA 和 TBATS 等时间序列建模方法可以深入了解不同海拔高度降雨量的时间变化。这些模型表现出不同的训练和测试 RMSE 值,反映了它们捕获降雨数据的短期波动和长期趋势的能力56,66,67,68。在这些建模技术中观察到的 RMSE 值的差异凸显了选择适当方法来解释山区固有的复杂空间和时间动态的重要性。一些模型中较高的 RMSE 值表明准确捕捉局部尺度变化和极端天气事件面临挑战,这对于山区生态系统的有效水资源管理和备灾至关重要69,70,71。整合不同的建模方法并利用先进的统计技术增强了我们对山区降雨变化的理解。

表4 喜马拉雅山西北部不同海拔梯度下预测模型的性能指标。
图5
figure 5

跨海拔梯度的 RMSE 条形图。

深度学习模型(包括 LSTM、RNN、双向 LSTM、深度 LSTM 和 GRU)在各个研究地点表现出不同程度的有效性。LSTM 始终表现出强大的性能,在多个实例中与其他深度学习模型相比实现了更低的 RMSE 和 MAE30。例如,在位置 1,LSTM 的训练 RMSE 为 26.4051,测试 RMSE 为 38.2848,表明它能够熟练地捕捉温度变量和降雨模式之间的复杂关系。双向 LSTM 还表现出有竞争力的性能,尤其值得注意的是其在多个位置的 MAE 分数较低。然而,与 LSTM 相比,它显示出略高的 RMSE 值,这表明不同评估指标的预测准确性存在潜在差异。另一方面,Deep LSTM 和 GRU 虽然通常表现良好,但与 LSTM 和双向 LSTM 相比,表现出更高的 RMSE 和 MAE 值(图 1)。 6)。这一观察结果表明,这些模型可能更难以捕捉喜马拉雅山西北部地区特有的温度与降雨关系的复杂细微差别。相比之下,传统的 ML 模型(例如 ANN、KNN、SVR、RF 和时间序列方法 ARIMA)在所有位置始终表现出较高的 RMSE 和 MAE 值72。具体来说,KNN、SVR 和 RF 表现出明显更高的误差指标,突显了与 DL 模型相比,它们在准确捕获降雨预测任务固有的非线性依赖性方面的局限性。

图6
figure 6

MAE 沿海拔梯度的条形图。

在所有六个检查地点,深度学习模型的表现始终优于机器学习和时间序列模型(图 1)。 7)。具体来说,LSTM 和双向 LSTM 成为表现最好的模型,分别在位置 L1 到 L6 上实现了最低的 RMSE 和 MAE 分数。同时,RNN、LSTM、双向 LSTM 和深度 LSTM 因其在相同位置的测试 MAE 方面的性能而被确定为优秀模型。总体而言,DL 算法表现出卓越的准确性,其中双向 LSTM 显示出最高的有效性,其次是 LSTM、RNN、Deep LSTM 和 GRU(按降序排列)。相比之下,ML 模型的表现相对优于传统时间序列方法,其中 ANN 领先,其次是 KNN、SVR 和 RF。以 TBATS 和 ARIMA 为代表的时间序列模型精度排名最低(图 2)。 8)。DL 模型在预测喜马拉雅山西北部降雨模式时的偏好可归因于几个因素。首先,数据的复杂性和非线性性质,受海拔变化、地形和大气稳定性的影响,给机器学习和时间序列模型准确捕捉这些关系带来了挑战73。DL 模型(例如 LSTM 和双向 LSTM)专门设计用于通过自动学习复杂的数据模式来处理此类复杂性27 号,72。此功能减少了对手动特征工程的需求,并通过有效管理降雨和温度数据中固有的噪声来提高预测准确性。深度学习模型受益于该地区大型历史数据集的可用性,这对于有效训练这些模型至关重要。广泛的数据使深度学习模型能够很好地泛化,并针对数据的时间变化保持鲁棒性,从而提高整体预测准确性。这项研究通过将先进的机器学习(ML)和深度学习(DL)技术应用于降雨预测,为克服农业规划和气候适应方面的挑战做出了重大贡献。由于传统的预测方法与日益不可预测的气候作斗争,这项研究通过复杂的算法提高了预测的准确性,使农民和农业规划者能够做出更明智的决策。通过整合复杂的气候数据并评估喜马拉雅山西北部的模型有效性,该研究为提高预测精度和管理不同的环境条件提供了重要的见解。这一进步支持在气候变化的情况下更好的农业实践、基础设施发展和整体粮食安全。

图7
figure 7

天气变量在海拔梯度上的分布。

图8
figure 8

比较模型精度的高度泰勒图。

正如本研究所述,使用先进的机器学习 (ML) 和深度学习 (DL) 技术进行降雨预测代表了气象预报的重大进步,对工程师和利益相关者具有重要意义,特别是在半干旱地区。随机森林 (RF)、支持向量回归 (SVR)、长短期记忆 (LSTM) 和门控循环单元 (GRU) 等技术显着提高了降雨预测的准确性。这种精度的提高对于依赖季节性降雨的地区的有效规划和管理至关重要。然而,在实践中应用这些技术会带来一些考虑。一个关键问题是平衡模型的准确性和复杂性。虽然这些先进方法可以提供高度准确的预测,但它们也带来了更高的计算需求和复杂性。工程师和利益相关者必须评估提高准确性的好处是否足以应对与实施和维护这些复杂系统相关的挑战。这些模型需要强大的计算能力和专业知识,这对于技术资源有限的地区来说可能是一个障碍。有必要将这些先进模型正确集成到现有的预测系统中,以确保准确性的提高满足运营需求。另一个重要的考虑因素是对广泛且高质量数据集的依赖。这些先进模型在处理大量数据时表现最佳,而这些数据可能并不总是可用,特别是在气象信息稀疏的地区。这表明需要更好的数据收集基础设施。工程师应重点关注增强数据采集系统并制定处理有限数据的策略,以充分利用这些预测技术。

这些方法对湿度、风速和太阳辐射等其他气象变量的适应性也很重要。虽然这些方法背后的原理是通用的,但每种气候变量都有独特的挑战,可能需要专门的方法。尽管用于降雨预测的方法可以扩展到其他变量,但工程师需要根据每个特定情况定制模型,以确保准确性和有效性。运营整合是另一个实际挑战。将这些先进模型纳入现有的农业规划、灾害管理和基础设施发展系统需要仔细考虑。利益相关者必须解决如何将这些模型整合到实际决策过程中,这不仅包括技术适应,还包括用户的培训和能力建设。确保人员接受适当的培训以使用这些先进工具对于最大化他们的利益至关重要。改进降雨预报的好处是相当大的。预测精度的提高可以实现更好的农业规划,例如更精确的灌溉调度和有效的水资源管理。它还通过帮助工程师创建能够抵御极端天气事件的基础设施来支持基础设施设计和灾难准备。对于政策制定者来说,先进的预测技术为制定数据驱动的政策奠定了基础,以促进可持续资源管理和增强气候适应能力。总之,虽然先进的降雨预测技术具有相当大的优势,但它们还需要仔细管理模型复杂性、数据需求和操作集成。有效应对这些挑战可以显着改善决策、基础设施规划和政策制定,最终支持气象及相关领域更具弹性和可持续的实践。模型参数如表所示 2S

结论

总之,对喜马拉雅山西北部海拔梯度的温度和降雨模式的综合分析描绘了山区气候系统固有的显着变化和复杂性。该研究揭示了受海拔高度影响的不同热状况,不同地点的平均最高气温为 11.65 至 20.21 摄氏度,平均最低气温为 2.50 至 7.64 摄氏度。海拔高度是影响该地区温度变化的关键因素。广泛的温度值反映了高山和低海拔气候,这对于了解当地气候动态、蒸散过程和降水形成至关重要。统计分析,包括标准误差和偏度,进一步阐明了温度数据的分布特征,强调了测量的稳健性,尽管存在轻微的不对称。这个温度统计的基本框架不仅增强了我们对区域气候的了解,而且还是预测降雨模式的重要基础。将特定海拔温度数据整合到预测模型中,通过考虑影响大气稳定性、水分含量和降水开始的温度梯度,提高降雨预报的准确性。ML、DL 和时间序列分析等先进建模技术可以更深入地了解不同海拔梯度的降雨变化。与传统的机器学习和时间序列方法相比,深度学习模型,特别是 LSTM 和双向 LSTM,在捕获复杂的气候关系方面表现出了卓越的性能。他们处理非线性数据动态和利用广泛历史数据集的能力强调了他们在预测动态山区环境中降雨模式方面的有效性。展望未来,持续的研究工作应侧重于通过纳入额外的环境变量来完善模型输入,并探索集成建模方法,以进一步提高预测准确性。高分辨率卫星数据和地面观测将在改善复杂地形环境中的空间表示和验证模型方面发挥关键作用。通过提高我们的理解和预测能力,我们可以更好地管理水资源并减轻与山区生态系统气候变化相关的风险。在降雨监测和预警系统的实际应用中,统计、物理和数据驱动模型等独立方法具有明显的优势,但也面临着显着的局限性。统计模型(例如 ARIMA)简单且计算效率高,因此可以立即使用。然而,当面对突然的气候变化或复杂的天气模式时,它们倾向于假设线性关系和有限的灵活性可能会导致性能不佳。模拟大气和水文过程的物理模型可以通过考虑复杂的变量相互作用来提供深入的预测。尽管它们在明确的条件下具有准确性,但这些模型往往受到高计算需求和复杂性的阻碍,使得它们在资源有限的地区不太适合实时应用。此外,如果没有针对特定区域条件进行精确校准,物理模型也可能会遇到局部最优。数据驱动模型,例如机器学习和深度学习技术,擅长识别复杂的非线性模式,并且可以适应各种数据集。虽然它们具有高精度的潜力,但其有效性取决于对广泛和高质量数据的访问以及强大的计算能力。这些模型还容易出现过度拟合,它们在处理历史数据时表现出色,但在处理新数据或不同数据时可能表现不佳,而且它们复杂的性质通常会导致可解释性较低。总体而言,虽然先进的数据驱动方法在降雨预报方面提供了实质性改进,但其实际实施必须仔细解决数据质量、计算要求和持续维护,以确保可靠且可操作的预测。

数据可用性

当前研究期间使用和/或分析的数据集可根据合理要求从相应作者处获得。

参考

  1. SkendÅiä, S.、Zovko, M.、Åâivkoviä, I. P.、LeŪiä, V. 和 Lemiä, D. 气候变化对农业害虫的影响。昆虫12,440(2021)。

    文章一个 考研一个 考研中心一个 谷歌学术一个 

  2. Zuma-Netshiukhwi, G.、Stigter, K. 和 Walker, S. 南非西南部自由邦农民对传统天气/气候知识的使用:科学家的农业气象学习。气氛4,383–410 (2013)。

    文章一个 ADS一个 谷歌学术一个 

  3. Jones, J. W.、Hansen, J. W.、Royce, F. S. 和 Messina, C. D. 气候预测对农业的潜在好处。农业。生态系统。环境。82,169-184 (2000)。

    文章一个 谷歌学术一个 

  4. 陈,C.等人。基于固定滑动窗口长短期记忆的降雨分布预测工程师。应用。计算。流体机械。16,248–261 (2022)。

    谷歌学术一个 

  5. Abobakr Yahya,A.S. 等人。双场景下基于支持向量机模型的无水河流流域水质预测模型水。11,1231(2019)。文章一个 

    谷歌学术一个 Grote,U。我们可以改善全球粮食安全吗?社会经济和政治视角。

  6. 食品安全。6,187–200 (2014)。文章

    一个 谷歌学术一个 Trenberth, K. E. 和 Asrar, G. R. 水循环研究中的挑战和机遇:WCRP 的贡献。地球水力。

  7. 循环46,515–532 (2014)。Franzke, C. L.、OâKane, T. J.、Berner, J.、Williams, P. D. 和 Lucarini, V. 随机气候理论和建模。

  8. 威利跨学科。克莱姆牧师。改变。6,63–78 (2015)。文章

    一个 谷歌学术一个 王,H.等人。广州市气象因素与感染性腹泻发病的关系:时间序列研究(2006年—2017年)

  9. 科学。整体环境。第672章,7-15 (2019)。

    文章一个 ADS一个 中科院一个 考研一个 谷歌学术一个 

  10. Garbrecht, J. D.、Nearing, M. A.、Zhang, J. X. 和 Steiner, J. L. 气候变化对俄克拉荷马州中部农田土壤侵蚀影响的不确定性。应用。工程师。农业。32,823–836 (2016)。

    文章一个 谷歌学术一个 

  11. Resnicow, K. & Vaughan, R. 行为改变的混乱观点:健康促进的巨大飞跃。国际。J.行为。营养。物理。活动。3,1-7 (2006)。文章

    一个 谷歌学术一个 Praveen,B. 等人。使用非参数和机器学习方法分析印度降雨变化的趋势和预测。

  12. 科学。代表。10,10342(2020)。

    文章一个 ADS一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 

  13. Khambra, G. 和 Shukla, P. 在粉煤灰混凝土上的新型机器学习应用:概述。马特。今天:Proc。80,3411 - 3417 (2023)。

    中科院一个 谷歌学术一个 

  14. Alkesaiberi, A.、Harrou, F. 和 Sun, Y。使用机器学习方法进行高效风电预测:比较研究。能源15,2327(2022)。

    文章一个 谷歌学术一个 

  15. Patil, S. S. 和 Vidyavathi, B. 无线传感器网络中天气预报的机器学习方法。国际。J.Adv。计算。科学。应用。13(2022)。

  16. Namitha, K.、Jayapriya, A. 和 Kumar, G. S. In第三届计算机和信息学领域女性国际研讨会论文集。492—495。

  17. Wang, Z.、Wang, Y.、Zeng, R.、Srinivasan, R. S. 和 Ahrentzen, S. 基于随机森林的每小时建筑能源预测。能源建设。171,11-25(2018)。

    文章一个 谷歌学术一个 

  18. Levis, A. & Papageorgiou, L. 通过支持向量回归分析进行客户需求预测。化学。工程师。资源。德斯。83,1009-1018 (2005)。

    文章一个 中科院一个 谷歌学术一个 

  19. Calderaro, J.、Seraphin, T. P.、Luedde, T. 和 Simon, T. G. 用于肝细胞癌预防和临床管理的人工智能。J.肝素。76,1348–1361 (2022)。

    文章一个 考研一个 考研中心一个 谷歌学术一个 

  20. Indrakumari, R.、Poongodi, T. 和 Singh, K. 深度学习简介。副词。深度学习。工程师。科学。练习。方法。1,1-22 (2021)。Vieira, S.、Pinaya, W. H. 和 Mechelli, A. 使用深度学习研究精神和神经疾病的神经影像相关性:方法和应用。

  21. 神经科学。生物行为。牧师。。74,58–75 (2017)。文章

    一个 考研一个 谷歌学术一个 Janiesch, C.、Zschech, P. 和 Heinrich, K. 机器学习和深度学习。电子。

  22. 市场。31,685–695 (2021)。文章一个 

    谷歌学术一个 Ozcanli, A. K.、Yaprakdal, F. 和 Baysal, M. 电力系统的深度学习方法和应用:全面综述。国际。

  23. J.能源研究。44,7136–7157 (2020)。文章

    一个 谷歌学术一个 康,J.等人。基于循环神经网络的江西景德镇降水预测。

  24. 气氛。11,246(2020)。文章一个 

    ADS一个 谷歌学术一个 Mayer, M. J. 物理和机器学习混合对光伏发电预测的好处。更新。

  25. 维持。能源修订版168,112772(2022)。

    文章一个 谷歌学术一个 

  26. Almási, A. D.、Woźniak, S.、Cristea, V.、Leblebici, Y. 和 Engbersen, T. 神经网络进展回顾:神经设计技术堆栈。神经计算174,31-41 (2016)。

    文章一个 谷歌学术一个 

  27. Saha, S.、Baral, S. 和 Haque, A. DEK-Forecaster:一种与 EMD-KNN 集成的新型深度学习模型,用于流量预测。arXiv 预印本 arXiv:2306.03412 (2023)。

  28. Ban, W., Shen, L., Chen, J. & Yang, B. 基于深度学习自回归积分移动平均模型的波高短期预测。地球科学。信息。16,2251 - 2259 (2023)。

    文章一个 ADS一个 谷歌学术一个 

  29. Wani,O.A. 等人。气候在控制喜马拉雅山西北部土壤碳动态方面对土地管理起着主导作用。J.环境。管理。第338章,117740 (2023)。

    文章一个 中科院一个 谷歌学术一个 

  30. Godahewa, R.、Bergmeir, C.、Webb, G. I. 和 Montero-Manso, P。用于每周时间序列预测的准确且全自动的集成模型。国际。J. 预测。39,641–658 (2023)。

    文章一个 谷歌学术一个 

  31. Thirumalai, C.、Harsha, K. S.、Deepak, M. L. 和 Krishna, K. C. In2017 年电子和信息学趋势国际会议 (ICEI)。1114 - 1117 (IEEE)。

  32. Prabakaran, S.、Kumar, P. N. 和 Tarun, P. S. M. 使用改进的线性回归进行降雨预测。ARPN J. 工程。应用。科学。12,3715 - 3718 (2017)。

    谷歌学术一个 

  33. Tharun, V.、Prakash, R. 和 Devi, S.R. In2018第二届发明通信与计算技术国际会议(ICICCT)。1507 - 1512 (IEEE)。

  34. Kumar, S. S.、Wani, O. A.、Krishna, J. R. 和 Hussain, N. 气候变化对土壤健康的影响。国际。J.环境。科学。7,70–90 (2022)。

    谷歌学术一个 

  35. Abhishek, K.、Kumar, A.、Ranjan, R. 和 Kumar, S. In2012 年 IEEE 控制与系统研究生研究讨论会。82–87 (IEEE)。

  36. Chaudhari, M. 和 Choudhari, D. 使用数据挖掘研究各种降雨量估计和预测技术。是。J. 工程。资源。6,137–139(2017)。

    谷歌学术一个 

  37. Vijayan, R.、Mareeswari, V.、Mohankumar, P.、Gunasekaran, G. 和 Srikar, K. 在数据集上使用机器学习技术估计降雨量预测。国际。J. 科学。技术。资源。9,440–445 (2020)。

    谷歌学术一个 

  38. Gnanasankaran, N. & Ramaraj, E. 使用印度气象数据预测降雨量的多元线性回归模型。国际。J.Adv。科学。技术。29,746–758 (2020)。

    谷歌学术一个 

  39. Vapnik, V. & Chervonenkis, A. 经验风险最小化方法一致性的充分必要条件。模式识别。图像肛门。1,283–305 (1991)。

    谷歌学术一个 

  40. Hochreiter, S. 和 Schmidhuber, J. 长短期记忆。神经计算。9,1735 年至 1780 年(1997 年)。

    文章一个 中科院一个 考研一个 谷歌学术一个 

  41. Palazzi, E.、Filippi, L. 和 von Hardenberg, J. 通过 CMIP5 模型模拟深入了解青藏高原-喜马拉雅山脉与海拔相关的变暖。爬升。动态。48,3991 - 4008 (2017)。

    文章一个 谷歌学术一个 

  42. Patel, J. B. 通过独立于文化的方法分析与莱索托高地相关的微生物多样性 (2020)。

  43. Dunn, R. J.、Willett, K. M. 和 Parker, D. E. 次日表面温度和风速统计分布的变化。地球系统。动态。10,765–788 (2019)。

    文章一个 ADS一个 谷歌学术一个 

  44. 纳齐尔,S.F.,辛格,L.,沙阿,B.A.和阿里,O.R.I.气候变化情景下的稻麦种植系统:回顾。国际。J.化学。螺柱。8,1907 年至 1914 年(2020 年)。

    文章一个 谷歌学术一个 

  45. 吉梅诺,L.等人。大陆降水的海洋和陆地来源。地球物理学士。50(2012)。

  46. Moharana, L.、Sahoo, A. 和 Ghose, D. InIOP 会议系列:地球与环境科学。012054(IOP 出版)。

  47. Sahoo, A.、Behera, S. 和 Sharma, N.AIP 会议论文集。(AIP 出版)。

  48. Sahoo, A. 和 Ghose, D.K.智能智能计算与应用,第 1 卷:第五届智能计算与信息学国际会议 (SCI) 论文集307–317(施普林格,2021 年)。

  49. Körner,C. 等人。山区生物多样性数据库的创造性使用:GMBA-DIVERSITAS 的 Kazbegi 研究议程。山水库。开发。27 号,276–281 (2007)。

    文章一个 谷歌学术一个 

  50. Hornberger, G. M.、Wiberg, P. L.、Raffensperger, J. P. 和 DâOdorico, P.物理水文学要素(约翰霍普金斯大学,2014)。

  51. Rashid, M. M.、Beecham, S. 和 Chowdhury, R.K. 南澳大利亚 Onkaparinga 流域降雨量统计特征。J.水气候。改变。6,352–373 (2015)。文章

    一个 谷歌学术一个 Sahoo, A. & Ghose, D. K. 使用 KNN、SOM、RF 和 FNN 对缺失降水数据进行插补。柔软的。

  52. 计算。26,5919–5936 (2022)。文章

    一个 谷歌学术一个 Sahoo, B. B.、Jha, R.、Singh, A. 和 Kumar, D. 用于低流量水文时间序列预测的长短期记忆 (LSTM) 循环神经网络。地球物理学报。

  53. 67,1471–1481 (2019)。文章一个 

    ADS一个 谷歌学术一个 Sahoo, B. B.、Panigrahi, B.、Nanda, T.、Tiwari, M. K. 和 Sankalp, S. 使用深度学习模型进行多步城市用水需求预测。SN 计算。

  54. 科学。4,752(2023)。文章

    一个 谷歌学术一个 Dal Molin, M.、Schirmer, M.、Zappa, M. 和 Fenicia, F。了解对水流空间变异性的主导控制以建立半分布式水文模型:瑟尔流域的案例研究。水醇。

  55. 地球系统。科学。24,1319 - 1345 (2020)。

    文章一个 ADS一个 谷歌学术一个 

  56. Singh, G.、Batra, N.、Salaria, A.、Wani, O. A. 和 Singh, J. 利用水化学特征评估旁遮普中部平原地区卡普尔塔拉地区的地下水质量。J.土壤水保持。20,43–51 (2021)。

    文章一个 谷歌学术一个 

  57. 巴布,S.等人。生物炭对清洁农业生产和环境可持续性的影响。环境。科学:高级。2,1042 - 1059 (2023)。

    文章一个 中科院一个 谷歌学术一个 

  58. Dura, V.、Evin, G.、Favre, A. C. 和 Penot, D. 复杂地形区域季节性降水递减率的空间变异——在法国的应用。水醇。地球系统。科学。28,2579 - 2601 (2024)。

    文章一个 谷歌学术一个 

  59. 阿尔塔夫,S.等人。白蘑菇(双孢蘑菇)绿霉病的防治及其产量提高。J.真菌。8,554(2022)。文章

    一个 中科院一个 谷歌学术一个 Fisher, R. A. 和 Koven, C. D. 对陆地表面模型的未来以及表示复杂陆地系统的挑战的看法。J.Adv。

  60. 模型。地球系统。12,eMS001453 (2018)。

  61. Maxwell, A. E. & Shobe, C. M. 用于空间预测绘图和建模的地表参数。地球科学。牧师。226,103944(2022)。

    文章一个 谷歌学术一个 

  62. Sahoo, B. B.、Sankalp, S. 和 Kisi, O. 一种新颖的基于平滑的深度学习时间序列方法,用于每日悬浮沉积物负荷预测。水资源。管理。37,4271–4292 (2023)。文章

    一个 谷歌学术一个 Satapathy, D. P.、Swain, H.、Sahoo, A.、Samantaray, S. 和 Satapathy, S.C.智能系统设计:2022 年印度会议论文集

  63. 355–364(施普林格,2022 年)。Swagatika, S.、Paul, J. C.、Sahoo, B. B.、Gupta, S. K. 和 Singh, P。使用混合深度学习模型提高印度婆罗门河月径流时间序列的预测精度。J.水气候。

  64. 改变。15,139–156 (2024)。文章一个 

    谷歌学术一个 Greff, K.、Srivastava, R. K.、Koutník, J.、Steunebrink, B. R. 和 Schmidhuber, J. LSTM:搜索空间奥德赛。IEEE 传输。

  65. 神经网络。学习。系统。28,2222–2232 (2016)。

    文章一个 数学科学网一个 考研一个 谷歌学术一个 

  66. Momani, P. 和 Naill, P. 约旦降雨数据的时间序列分析模型:使用时间序列分析的案例研究。是。J.环境科学。5,599(2009)。

    文章一个 谷歌学术一个 

  67. Bouznad,I.E. 等人。使用 ARIMA 模型对降水、温度和蒸散值进行趋势分析和时空预测:以阿尔及利亚高地为例。阿拉伯。J.地球科学。13,1281(2020)。

    文章一个 谷歌学术一个 

  68. Hasan, N. A.、Dongkai, Y. 和 Al-Shibli, F. 使用 TBATS 和 ARIMA 模型进行 SPI 和 SPEI 干旱评估和预测,约旦。15,3598(2023)。

    文章一个 谷歌学术一个 

  69. Yucel, I. 和 Onen, A. 评估土耳其西北部极端降雨事件的中尺度大气模型和基于卫星的算法。纳特。危害地球系统。科学。14,611–624 (2014)。

    文章一个 ADS一个 谷歌学术一个 

  70. Kara, F., Yucel, I. 和 Akyurek, Z. 气候变化对伊斯坦布尔供水区极端降水的影响:使用集合气候模型和地理统计降尺度。水醇。科学。J。61,2481 - 2495 (2016)。

    文章一个 谷歌学术一个 

  71. 贾梅,M.等人。基于水文气象信号的加拿大大西洋地区径流预报精度的定量提高:多层次高级智能专家框架。生态。信息。80,102455(2024)。

    文章一个 谷歌学术一个 

  72. 萨哈,S.等人。使用深度学习算法测量不丹 Chukha 的山体滑坡脆弱性状态。科学。代表。11,16374(2021)。

    文章一个 ADS一个 中科院一个 考研一个 考研中心一个 谷歌学术一个 

  73. Huffman, G. J. & Bolvin, D. T. TRMM 等数据降水数据集文档。美国宇航局绿带28,1(2013)。

    谷歌学术一个 

下载参考资料

致谢

作者感谢沙特阿拉伯利雅得沙特国王大学的研究人员支持项目编号 (RSPD2024R730)。作者感谢农学部门 SKUAST Kashmir 和 NICRA、SKUAST Kashmir 项目和 IMD India 提供数据的支持。

资金

由吕勒奥理工大学提供的开放获取资金。研究人员支持项目编号 (RSPD2024R730),沙特阿拉伯利雅得沙特国王大学。

作者信息

作者和单位

  1. 克什米尔谢尔克什米尔农业科技大学 (SKUAST-K) 农业学院瓦杜拉农学部,查谟和克什米尔,193201,印度

    奥瓦伊斯·阿里·瓦尼 & 赛义德·谢拉兹·马赫迪

  2. ICAR-印度农业统计研究所,新德里,110 012,印度

    马里兰州耶辛

  3. 农业与水道部 (MOA & W) 农学部(块根作物),Suva City, 679, Fiji

    沙马尔·沙桑·库马尔

  4. 利物浦约翰摩尔斯大学生物与环境科学学院,利物浦,L3 3AF,英国

    亚历山大·S·加格农

  5. VIT-AP 大学高级科学学院数学系,印度安得拉邦伊纳沃卢,522237

    费赞·丹麦语

  6. 土木、环境和自然资源工程,吕勒奥理工大学,97187,吕勒奥,瑞典

    纳迪尔·安萨里

  7. 沙特国王大学食品与农业科学学院植物生产系,P.O.Box 2460, 利雅得 11451, 沙特阿拉伯

    萨拉赫·埃尔·亨达维

  8. 沙特国王大学农业工程系,食品与农业科学学院,P.O.Box 2460, 利雅得 11451, 沙特阿拉伯

    穆罕默德·马塔尔

  9. 雨养农业先进中心 (ACRA),Dhiansar, Bari-Brahmana-181133, SKUAST-Jammu, UT-J&K, 印度

    赛义德·谢拉兹·迈赫迪

贡献

概念化、监督、方法论、形式分析、写作——初稿准备、写作——审查和编辑、O.A.W.、S.S.M.、M.Y.、S.S.K.、A.S.G.;数据管理、项目管理、调查、写作审查和编辑、F.D.、N.A.-A.、S.E.-H.、M.A.M.所有作者均已阅读并同意稿件的出版版本。

通讯作者

通讯至赛义德·谢拉兹·迈赫迪,纳迪尔·安萨里或者穆罕默德·马塔尔。道德宣言

利益竞争

作者声明没有竞争利益。

附加信息

出版商备注

施普林格·自然对于已出版的地图和机构隶属关系中的管辖权主张保持中立。

电子补充材料

以下是电子补充材料的链接。

权利和权限

引用这篇文章

Check for updates. Verify currency and authenticity via CrossMark

Wani, O.A.、Mahdi, S.S.、Yeasin, M.

等人。使用机器学习、深度学习和时间序列模型预测喜马拉雅山西北部海拔梯度的降雨量。科学代表14 ,27876(2024)。https://doi.org/10.1038/s41598-024-77687-x

下载引文

  • 已收到:

  • 公认:

  • 已发表:

  • DOI:https://doi.org/10.1038/s41598-024-77687-x

关于《使用机器学习、深度学习和时间序列模型预测喜马拉雅山西北部海拔梯度的降雨量》的评论


暂无评论

发表评论

摘要

Owais Ali Wani 等人的文章“使用机器学习、深度学习和时间序列模型预测喜马拉雅山西北部海拔梯度的降雨量”。探索了几种预测喜马拉雅山特定地区不同海拔降雨模式的方法。该研究旨在评估各种预测建模技术(机器学习 (ML)、深度学习 (DL) 和时间序列分析)在预测降水方面的有效性。### 要点:1. **背景**:- 降雨预测对于山区的农业、水资源管理和防灾至关重要。- 喜马拉雅山西北部由于地形复杂和地面观测网络有限而面临挑战。2. **数据收集和预处理**:- 来自各种来源的数据(TRMM 卫星数据、气象站)用于降雨量估算。- 数据集涵盖多年,包括训练和测试阶段,以验证模型在不同海拔高度的性能。3. **使用的建模技术**:- **机器学习模型**:包括传统的 ML 算法,如随机森林 (RF)、支持向量机 (SVM) 和 k 最近邻 (kNN)。- **深度学习模型**:应用了卷积神经网络(CNN)和递归神经网络(RNN)。- **时间序列分析**:自回归综合移动平均 (ARIMA) 模型。4. **结果**:- 该研究评估了这些模型在不同海拔梯度下的预测能力。- 使用 RMSE、MAE 和 R 平方值等关键性能指标来评估不同海拔高度的模型准确性。5. **调查结果与讨论**:- 深度学习模型在准确性和对非线性模式的适应性方面通常优于传统的机器学习算法。- 时间序列分析提供了对时间趋势的宝贵见解,但可能无法像其他方法那样有效地捕获空间变化。- 不同模型的有效性随海拔高度的不同而变化,凸显了根据特定海拔区域进行模型调整的必要性。6. **结论**:- 该研究的结论是,深度学习和时间序列方法的结合为山区准确的降雨预测提供了广阔的前景。- 建议包括进一步研究集成多传感器数据并探索将深度学习与传统机器学习技术相结合的混合模型。### 影响:- 对于政策制定者来说,研究结果有助于更好的水资源管理和农业规划。- 研究人员可能会专注于开发针对山区环境的更强大的预测工具。- 从业者可以从实施这些先进的预测方法中受益,以增强早期预警系统和备灾能力。总体而言,该研究强调了在预测高海拔地区降雨模式时采用复杂的建模技术来解释地理复杂性的重要性。