基于EOF和LSTM的广西月降水量预测模型研究_黄颖.pdf
《基于EOF和LSTM的广西月降水量预测模型研究_黄颖.pdf》由会员分享,可在线阅读,更多相关《基于EOF和LSTM的广西月降水量预测模型研究_黄颖.pdf(7页珍藏版)》请在咨信网上搜索。
1、44卷气象研究与应用引言广西地处亚热带季风气候区,受低、中高纬度天气系统的交替影响,降雨量时空分布不均,尤其是夏季雨季暴雨频繁,往往导致洪涝、滑坡泥石流等灾害,造成巨大的经济损失及危害人民生命。另一方面,由于广西夏季降水年际变化差异极大,致使广西夏季干旱也频繁发生,严重制约了社会和经济的发展。因此,如果能够提前预测旱涝灾害发生的具体区域和时段,可以有效减轻灾害损失。然而,影响月降水量变化的因素很多,具有显著的非线性不规则变化特征,是目前预报中的重点、难点问题之一。目前国内外学者开展降水量短期气候预测主要研究方法可分为数理统计预报方法、动力模式方法,以及动力统计预报三种方法14。杜良敏等5采用最
2、小二乘回归法建立中国夏季降水预测模型,5a独立样本预测检验的平均评分为771。郑然等6采用多元回归法建立中国西南夏季降水年际增量预测模型,后报检验7a的降水距平百分率的均方根误差为16。覃志年等7研发了广西月尺度动力模式产品解释应用系统,解释应用预测准确率一般在70分以上。何慧等8利用动力延伸预报产品制作广西月降水预报。由于短期气候预测所涉及的气候异常变化因子具有多样性和复杂性,相互作用机理的认识还远远不够等现状,困扰了短期气候预测准确性的进一步提高9。近年来,人工智能算法的发展为更好的深度挖掘隐藏在海量数据中的天气气候变化的物理机制,提取更有效的预报模型提供了一种新的方式,尤其在非线性智能计
3、算和机器学习理论的发展中,深度学习的长短期记忆神经网络(Long ShortTermMemory,LSTM)是以时间序列数据建模、数据特征提取和预测为目的,在国内外已成功地应用到水文、海洋工程、气象等领域,并取得到了较好的预报效果1019。收稿日期:2023-03-01基金项目:广西自然科学基金项目(2023GXNSFAA026414)、国家自然科学基金项目(42065004)、广西重点研发计划项目(桂科AB21196041)、广西自然科学基金项目(2018GXNSFAA281229)作者简介:黄颖(1983),女,硕士,高级工程师,主要从事天气预报技术方法研究与业务应用工作。Email:yi
4、nger2001126com基于 EOF 和 LSTM 的广西月降水量预测模型研究黄颖1,陆虹2,黄小燕1,赵华生1,吴玉霜3(1广西壮族自治区气象科学研究所,南宁530022;2广西壮族自治区气候中心,南宁530022;3广西壮族自治区气象台,南宁530022)摘要:针对夏季降水天气过程具有时间相关性和非线性变化的特点,以及现有预报方法未能充分获取月降水量的本质特征而造成的建模因子处理和预报建模困难等问题,提出了一种以自然正交展开(EOF)与深度学习长短期记忆神经网络(LSTM)相结合的月降水量预测模型。以广西81个气象观测站7月降水量为预报研究对象,对81站7月降水量作EOF计算,选取累积
5、方差贡献超过76的前7个主分量作为预报分量,再利用LSTM模型建立月降水量的深度学习预测模型,以19602016年81站7月降水量为建模样本,20172022年为独立样本进行建模研究。结果表明,在相同的预报建模样本和相同的预报因子条件下,新建立的预测模型比线性逐步回归预报方法有更高的预报能力,显示了对非线性月降水量预测问题的适用性。由于LSTM模型隐层里引入了存储单元状态和门结构,使得网络能够保留长期的状态,更适合于处理和预测时间序列中间隔和延迟相对较长的重要问题。关键词:气候预测;长短期记忆神经网络;自然正交展开;深度学习中图分类号:P457.6文献标识码:Adoi:10.19849/ki.
6、CN45-1356/P.2023.2.04黄颖,陆虹,黄小燕,等基于EOF和LSTM的广西月降水量预测模型研究J气象研究与应用,2023,44(2):2026Huang Ying,Lu Hong,Huang Xiaoyan,et al Study on monthly precipitation prediction model in Guangxi based on EOF and LSTMJJournal of Meteorological Research and Application,2023,44(2):2026第44卷第2期气象研究与应用Vol.44 No.22023年6月JOU
7、RNAL OF METEOROLOGICAL RESEARCH AND APPLICATIONJun.20232期在大气科学领域,孙际钰14建立了基于LSTM网络的海表温度预报模型。沈皓俊等15利用LSTM网络预测2014年和2015年中国夏季降水,Ps评分分别为74分、71分。程鹏宇等16、倪铮等17运用LSTM深度神经网络建立温度预报模型。徐楠楠18、张飞鸿19采用LSTM模型分别建立日尺度降水预测模型、短临降水预测模型。这些预报模型和预报方法在预报试验中都取得了较好的预报效果。为了进一步改进和提高月降水量预测准确性,探索新的短期气候预测方法,本文尝试以广西81站7月降水量为预报研究对象,
8、先采用EOF方法对81站7月降水量作EOF计算,选取前几个主分量作为预报分量,再利用更适用于解决非线性问题的LSTM模型建立月降水量的深度学习预测模型,进行预报建模试验。对预报分量(主分量)进行预报后,再乘以空间向量便可得到广西81站降水量预测值,而不需要对每个站建立预报模型进行预测,同时也极大地减少了计算量和解决单站资料建模时会遇到的随机性和不稳定性问题。1 LSTM方法介绍长短期记忆网络(Long ShortTerm Memory,LSTM)是在循环神经网络(Recurrent Neural Net-work,RNN)基础上提出的一种新型深度学习神经网络模型20,目前已在国内外成功地应用众
9、多学科领域1011,2124。由于RNN隐藏层只有一个h状态,仅对短期的输入较敏感,却较难捕获相隔较长时刻的历史数据信息,易出现梯度爆炸或消失问题,Hochreiter和SchmidHuber20于1997年提出了LSTM模型,他们在RNN的 隐 藏 层 里 引 入 了 存 储 单 元 状 态(CellState,也称为细胞状态)和门结构,使得网络保留长期的状态,有效解决了RNN中的梯度爆炸和梯度消失等问题。因此LSTM更适合于处理和预测时间序列中间隔和延迟相对较长的重要问题,比如短期气候预测中的月降水量预测。LSTM模 型 主 要 由 一 个 或 多 个 记 忆 细 胞ct(Memory C
10、ell)、一个输入门it(Input Gate)、一个遗忘门ft(Forget Gate)、一个输出门ot(Output Gate)组成(见图1)。遗忘门决定上一时刻的单元状态ct1有多少保留到当前时刻ct,输入门决定当前时刻网络的输入xt有多少保存到单元状态ct,而LSTM的当前输出值ht是由输出门和单元状态ct来决定。图1给出了LSTM网络隐层结构示意图。由图1可以看出,当前时刻网络输入值xt,上一时刻网络隐层输出值ht1,以及上一时刻网络单元状态输出ct1为LSTM隐层输入数据,当前时刻网络隐层输出值ht和当前时刻网络单元状态输出ct为LSTM隐层输出数据。LSTM通过门控单元控制位息是
11、否通过从而实现对存储单元信息的添加和删除25。LSTM模型主要分为3个阶段26:(1)遗忘门:遗忘门决定上一时刻的细胞状态ct1有多少信息保留到当前时刻。根据上一时刻网络隐 层 输 出 值ht 1和 当 前 网 络 输 入 值xt,由 激 活sigmoid函数生成遗忘门ft,产生一个01之间的数字,来筛选上一个细胞状态ct1,其中0表示完全舍弃上一状态信息,1表示完全保留上一状态信息,数字在0到1之间表示保留部分信息。遗忘门ft计算公式如下:ft(Wf ht1,xtbf)(1)(2)输入门:输入门决定取多少新信息用于更新细胞状态ct。根据上一个时刻的隐藏状态ht1和当前状态的输入xt,分别由激
12、活函数sigmoid生成输入门it(见式(2),由激活函数tanh产生候选记忆值(ct)(见式(3)。ct经过输入门it后得到的信息就是新加入的信息,将上一时刻的细胞状态ct1经过遗忘门ft得到的信息加上新加入的信息,就得到当前细胞状态ct(见式(4)。计算公式如下:it(Wi ht1,xtbi)(2)cttanh(Wc ht1,xtbc)(3)ctftct1itct(4)图1LSTM网络隐层结构示意图黄颖,陆虹,黄小燕,等:基于EOF和LSTM的广西月降水量预测模型研究2144卷气象研究与应用由式(4)可知,LSTM能保持长期记忆的关键在于单元状态ct。因为新单元状态ct的记忆与前一时刻t1
13、的记忆相连接27,在很长一段时间内保持信息的不变性,有效防止了梯度消失或爆炸问题。(3)输出门:输出门确定当前细胞状态ct的输出。与遗忘门相似,根据上一时刻隐藏层输出值ht1和当前网络输入值xt,由激活函数sigmoid生成输出门ot,去筛选当前细胞状态ct经过激活函数tanh层的结果ht。输出门ot和隐层的输出结果ht的计算公式如下:ot(Wo ht1,xtbo)(5)htottanh(ct)(6)将ht传送到输出层,计算预测结果yt,计算公式如下ytWdhtbd(7)式中,Wf、Wi、Wc、Wo、Wd是权重矩阵,bf、bi、bc、bo、bd是偏置项,ht1,xt表示将两个矩阵连接成一个更长
14、的矩阵,为sigmoid激活函数;tanh为双曲线正切激活函数。LSTM主要是求解权重矩阵和偏置项,定义交叉熵损失函数为损失函数,采用梯度下降的误差反向 传 播 算 法(Back Propagation Through Time,BPTT)求出权重和偏置参数,具体推导和计算过程参考相关文献28。2 LSTM模型的预报量和模型输入计算处理方法2.1预报量的预处理本文是以广西81个站7月降水量作为预报对象,预报量资料年限是从19602016年共57a为预报建模样本,20172022年共6a为独立预报样本,进行基于LSTM模型的月降水预测试验。考虑到如果81个站逐站建立预报方程,将要建立81个预报模
15、型,而对于月降水量这样的短期气候预测问题,以单站作为预报量去计算分析前期的环流场预报因子,会增加预报因子的随机性和不稳定性。为此我们 考 虑 首 先 采 用 自 然 正 交 展 开 方 法(EmpiricalOrthogonal Function,EOF)29,30,先计算降水量距平率,再对7月81站降水量距平率作EOF计算,得出7月81站降水空间分布特征向量以及代表平均降水量年际变化的时间系数(主分量)。某时段降水量距平率计算公式如下:PaP-P?P?100(8)式中,P为某时段降水量(单位:mm);P为计算时段同期气候平均降水量。本文P取19912020年共30a平均降水量。对7月81站降
16、水量作自然正交展开计算时,可以分解成时间系数Z和空间向量V两部分:XVZ(9)由于对平均降水量作EOF计算分析后得到的空间向量随时间变化很小29,因此可以将7月降水量展开的时间系数(主分量)作为预报量,进行预报建模。表1给出广西81个站7月降水量作自然正交展开后,前7个主分量累积方差贡献为7681。为此,本文将前7个主分量(时间系数)作为预报量建立预报模型,并对时间系数(主分量,Principalcomponent,PC)进行预报后,再乘以空间向量便可得到该区域的7月81站降水量预测距平值29,再结合式(8),即可得到7月81站降水量预测值。这样的计算方式,使得在对广西81个站7月降水量作预报
17、时,不需要对每个站(共81站)建立预报模型进行预测,只要建立7个预报方程,有效减小了需要建立的预报模型个数,并避免了单站资料的随机性和不稳定性。主成分 PC1 PC2 PC3 PC4 PC5 PC6 PC7 方差贡献 48.22 11.80 6.35 3.37 2.62 2.30 2.14 累积方差贡献 48.22 60.03 66.38 69.75 72.37 74.67 76.81 表17月81站降水量前7个主分量展开的方差和累积方差贡献()2.2预报因子的计算分析为了建立7月81站降水量7个预报分量的预报模型,本文以NCEP再分析资料的500hPa月高度场作为基本的预报因子场,分别计算分
18、析了7个预报分量与前期各月基本预报因子场(上一年1月至12月,当年1月至5月)格点的相关关系。从各预报222期分量与前期预报因子场成片相连的相关格点内,挑选出相邻成片的相关系数绝对值034(达到001相关显著性水平)的相关格点作为一个预报因子的计算格点区。这样的计算规定,可以保证每一个前期预报因子是由高相关(r034)的格点区域计算得出,保证了预报因子的稳定性和高相关性。表2统计给出了广西81站7月降水量7个预报分量(预报分量样本长度为57)与前期各月500hPa高度场相关普查计算得出的高相关(相关系数绝对值034)预报因子区的格点数。3短期气候预测试验3.1 LSTM方法建模以22节计算得到
19、的广西7月降水量7个预报分量的前期初选预报因子(表2)为基础,再利用第1节介绍的LSTM建模方法,对广西7月81个站的月降水量进行预测试验。根据预报分量的初选预报因子预报出各预报分量未来时刻的时间系数,再乘以相应的空间向量,并结合式(8),得到各个站点的月平均降水量预测值。在广西7月降水量LSTM预测模型的实际预测建模计算过程中,需要分别对第17个主分量(预报分量)进行逐年的预报,以第1个主分量(预报分量)为例进行说明。预报分量的建模样本长度为19602016年,共57a,20172022年共6a作为独立预报样本,进行预测试验。由表2可以看到第1个主分量(预报分量)有52个预报因子,面对众多的
20、初选预报因子,首先采用逐步回归方法,取F1,从52个预报因子中,自动筛选出15个左右的预报因子作为LSTM预报模型的输入因子进行预报建模。为了保证预报建模的客观性,在建立LSTM预报模型时,各项参数统一设定为输入节点为模型输入的因子个数,输出节点为1,网络层数为1,隐节点数为30,训练次数为300,总体收敛误差为106。图1给出了采用LSTM预测模型,对7月降水量2017年第1主分量预测计算时,LSTM对历史样本的拟合结果和实况值的对比结果。由图1可以看出,LSTM模型对历史样本的拟合情况还是较为接近的。利用该预报模型可以对7月81站降水量2017年第1主分量进行预报计算,得出第58个样本的主
21、分量预测值。依据上述相同的计算步骤,并保持LSTM网络模型的各项参数全部不变,将2017年的实况值加入建模样本,再对广西81站7月降水量2018年的第1主分量进行预测计算,以此类推,可以继续逐次计算81站20192022年第1主分量的预测值。再采用上述计算步骤,对广西81站7月降水量的第27主分量进行了20172022年逐年的LSTM预测计算。根据降水量预测场自然正交展开后,空间向量随时间变化较小的特点,将LSTM预测模型逐年预测得到的7个主分量20172022年的预测值与相应的空间向量合成,得到广西81个站20172022年每年各站7月降水量的预测值(见表3)。为了定量评价LSTM预报模型对
22、20172022年广西81个站7月降水量的趋势预报准确率,选取的评价指标有平均绝对误差(Mean Absolute Error,MAE)和Ps评分。计算公式如下:MAE1nni=1yi-y?i(10)PsaN0bN1cN2(NN0)aN0bN1cN2M100(11)式中,yi为降水量实况值,y?i为降水量预测值,N0为趋势预测正确站数,N1为1级异常预测正确站数,N2为2级异常预测正确站数,M为2级异常漏报站数,N为参加考核总站数,a、b、c为权重系数,分别取a2,b2,c4。由表3的统计结果得出,广西81个站20172022年7月降水量预报结果的Ps平均得分为7595,降水量平均绝对误差为6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 EOF LSTM 广西 降水量 预测 模型 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。