本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/zhis/202506-3042.html
本文报告的AI流量预测模型在参考文献中扩展了工作 。35,它使用LSTM网络开发了水文幕后模型 ,该模型从气象输入数据的序列中模拟流量数据的序列。在此基础上,我们开发了一种预测模型,该预测模型使用编码器– decoder模型 ,其中一个LSTM跨越了历史序列的气象(和地球物理)输入数据(编码器LSTM)和另一个独立的LSTM,该序列在7天的预测范围内运行,并在气象学预测中的输入中运行。在扩展数据中说明了模型体系结构图4 。
该模型的后播序列长度为365天 ,这意味着每个预测序列(0-7天)都看到了先前365天的气象输入数据,并且在0-7天的预测范围内都看到了气象预测数据。我们为编码器和解码器LSTMS,线性细胞传输网络和非线性(具有双曲线切线激活功能的完全连接的层)使用了256个单元格状态的隐藏大小。该模型接受了50,000个小匹配的培训 ,其批量尺寸为256 。所有输入均通过减去平均值并按照训练期数据的标准偏差来进行标准化。
该模型预测,在每个时间步骤中,(时间步长)参数(时间步长)参数在区域纳向流量排放量上的单个不对称拉普拉斯分布的参数,如参考文献中所述。36 。损耗函数是该异质速度密度函数的关节负模样。需要明确的是 ,该模型可以在每个时间步骤和每个预测提前时间预测单独的不对称拉板分布。本文报告的结果是在水平图上计算出来的,该水文图是由三个单独训练的编码器– Decoder LSTM的集合的平均水平图导致的。来自这些单独训练的LSTM的水文图被视为从预测的拉普拉斯分布在每个时间步骤和预测交货时间的中位数流量值 。
使用本文所述的数据集,AI模型需要几个小时才能在单个NVIDIA-V100图形处理单元上训练。确切的壁时间取决于训练期间验证的频率。我们使用50个验证步骤(每1,000批) ,为完整的全球模型提供了10小时的火车时间 。
完整的数据集包括5,680个流域的模型输入和(流量)目标,总计152,259年。保存到磁盘的数据集的总大小(包括密集数组中的缺少值)为60 GB。
输入数据来自以下来源 。
在每个量规或预测点的总上游面积上,将所有输入数据平均在盆地多边形上平均。这项研究中使用的5,680个评估仪表的总上游面积范围为2.1 km2至4,690,998 km2。
没有将流量数据用作AI模型的输入 ,因为(1)无处不在的实时数据,尤其是在Ungaig的位置,并且(2)因为基准(Glofas)不使用自回旋输入 。我们先前讨论了如何在基于AI的流量模型31中使用近实时目标数据。
扩展数据图5显示了每个源的可用数据的时间段。在培训期间 ,通过使用来自其他数据源的类似变量(例如,使用ERA5-Land数据估算HRES数据),或使用平均值进行估算 ,然后添加二进制标志来指示估算值的值,从而估算丢失的数据 。31。
培训和测试目标来自全球径流数据中心(GRDC)37。扩展数据图6显示了本研究中用于训练和测试的所有流量测量值的位置。我们从完整的公共GRDC数据集中删除了流域,在该数据集中,GRDC报告的排水面积与使用水载蛋白存储库的流域多边形计算得出的排水区有所不同 ,这是必要的,这对于确保不完美的集水区域的较差数据是必不可少的 。这给我们留下了5,680个仪表。自从我们进行了本文中报告的实验以来,GRDC已为其仪表位置释放了流域多边形 ,因此不再需要与水载流域水域边界进行匹配。
我们使用一组交叉验证实验评估了AI模型的性能 。来自5,680个仪表的数据以两种方式分开。首先,使用设计的交叉验证褶皱分开数据,以使得从任何仪表中的任何测试数据的1年内(LSTM编码器的序列长度)内使用任何量规的训练数据。其次 ,使用随机(不替换)K = 10的k折交叉验证在空间中分配数据 。重复了这对交叉验证过程,以便所有数据(1984-2021)从所有仪表中进行了预测的所有数据(1984-2021),以时间和空间在样本外的方式进行预测。这避免了培训和测试之间的数据泄漏的任何潜力。这些交叉验证实验是本文的主要文本中报道的 。
我们执行的其他交叉验证实验包括按时按时间分配量规数据 ,并根据以下协议在非随机的空间中进行分配。
这些交叉验证拆分中的仪表显示在扩展数据中。图7中显示了这些交叉验证拆分的结果 。8和9。
GLOFAS输入类似于AI模型中使用的输入数据,其主要差异如下。
Glofas在3-肢体网格(大约5公里的水平分辨率)上提供了预测。为了避免GRDC提供的排水区和Glofas排水网络之间的巨大差异,丢弃了小于500 km2的所有GRDC站 。在GLOFAS网格上进行地理位置 ,并检查了GRDC提供的排水区域与Glofas排水网络之间的差异。如果排水面积之间的差异大于10%,即使对Glofas网格上的车站位置进行了手动校正,该车站被丢弃。在Glofas网格上将总共4,090个GRDC站进行地理位置 。
此外,与AI模型不同 ,Glofas未被完全取样。GLOFAS的预测来自量规和未加格的集水区的组合,以及校准和验证时间段的组合。扩展数据图6显示了校准Glofas的测量值位置 。这是必要的,因为与校准GLOFAS相关的计算费用 ,例如过度交叉验证分裂。有关Glofas校准的更多信息,请参见Glofas Wiki38。
这意味着与AI模型的比较有利于Glofas 。扩展数据图9显示了使用校准Glofas的一组标准水文指标的分数,并且可以与扩展数据进行比较 ,图8显示了所有评估位置中相同的指标。
尽管CEMS为GLOFAS版本第4版发布了完整的历史重新分析(无提前时间),但Glofas版本4的重新存档(过去预测)的长期档案却不会在分析时跨越整整一年。鉴于可靠性指标必须考虑事件峰的时间安排,这意味着只能在0天提前时间基准Glofas 。
主要文本报告精度和召回指标的结果是根据对返回周期定义的幅度预测的预测计算的。对于这两个模型 ,每个尺寸单分单独计算精度和召回指标。使用美国地质调查局公报17B39所述的方法,分别计算了模型和观察到的时间序列的5,680仪表中的每个仪表(分别计算了观察到时间序列的返回周期,分别计算了模型的时间序列)。我们考虑了一个模型 ,可以正确预测给定返回周期的事件,如果建模的水文图和观察到的水文图都在彼此之间两天内越过各自的回流阈值流量流量 。对于每个仪表,以标准方式分别计算精度,召回和F1得分。我们强调的是 ,所有模型均与实际流量观测值进行了比较,并且并非通过将AI模型的水平图与Glofas的水文图进行比较,并非直接计算指标。值得注意的是 ,由于没有预测的或没有给定幅度的观察到的事件(返回期),因此对于给定量规的给定模型的精确或召回可能是不确定的,并且并非总是如此 ,当召回不确定时,精确度是不确定的,反之亦然 。例如 ,这导致了图2所示的精度和回忆样品量的差异。
使用双面Wilcoxon(配对)签名级测试评估本文报告的所有统计显着性值。效应尺寸报告为Cohen的术语D40,该术语使用以下惯例报道,AI模型具有更好的平均预测会导致效应大小 ,反之亦然 。所有盒子图都显示分布四分位数(即中心栏显示中位数,而不是均值),其中误差栏横跨不包括异常值的全部数据范围。并非本文报告的所有结果都使用了所有5,680个量表,这是因为某些仪表没有足够的样本来计算精度和回忆得分 ,并在某些返回期间发生了召回得分。每个结果都记录了样本量 。
水文学家用来评估水文模拟41,特别是极端事件的指标。42。这些标准指标中的几个在扩展数据表1中描述,并报告了本文在扩展数据8中所述的模型 ,包括偏见,NASH – Sutcliffe效率(NSE)43和Kling -Gupta效率(KGE)44 。KGE是Glofas被校准的度量。扩展数据图9显示了相同的指标,但仅根据校准Glofas的仪表进行计算(AI模型在这些测量值中仍然是样本的)。扩展数据的结果。8和9表明 ,在对格罗法斯(Glofas)进行评估时,ungaig的AI模型与Glofas在计量盆地中的差异一样好,因为对Glofas在(KGE)上进行校准的指标进行了评估 ,并且在Ungaiged盆地中比Glofas在(密切相关的)NSE NEME指标上的Glofas比Glofas更好 。但是,Glofas的总体方差(Alpha-NSE度量)比在校准的位置(尽管不在未校准的位置)中的Ungaig AI模型更好,这表明可能会改善AI模型的潜在方式。
赞 (1)
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《全球对未加州流域极端洪水的预测》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览: 本文报告的AI流量预测模型在参考文献中扩展了工作。35,它使用LSTM网络开发了水文幕后模型,该模型从气象输入数据的序列中模拟流量数据的序列。在此基础上,我们开发了一种预测...