基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf
《基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf》由会员分享,可在线阅读,更多相关《基于1DCNN和LSTM的单站逐时气温预报方法_李晶.pdf(12页珍藏版)》请在咨信网上搜索。
1、李晶,唐全莉.基于1DCNN和LSTM的单站逐时气温预报方法J.热带气象学报,2022,38(6):800-811.文章编号:1004-4965(2022)06-0800-12基于1DCNN和LSTM的单站逐时气温预报方法李晶1,唐全莉2(1.宁波工程学院经济与管理学院,浙江 宁波 315000;2.昆明理工大学理学院,云南 昆明 650500)摘要:针对海量气象观测数据间存在大量的物理噪声、与气温无关的冗余特征以及时间相关性,提出了一种将一维卷积神经网络(1DCNN)和长短期记忆神经网络(LSTM)相结合的多信息融合气温预报方法。首先,运用差分法对气象观测数据进行预处理,得到平稳时间序列数据
2、;其次,运用1DCNN提取与气温变化相关的特征变量作为神经网络模型的输入变量;最后,运用 1DCNN 和 LSTM 构建多信息融合气温预报模型 1DCNN-LSTM,并以云南省昆明市历史气象观测数据为例,与传统的LSTM、1DCNN和反向传播神经网络(BP)对未来24小时的逐时气温预报进行了比较研究。研究结果表明,1DCNN-LSTM的均方根误差(RMSE)相较于LSTM、1DCNN 和 BP 最大降低了 5.221%、19.350%和 9.253%,平均绝对误差(MAE)最大降低了 4.419%、17.520%和8.089%。为气温的精准预报提供了参考依据。关键词:1DCNN神经网络;LST
3、M神经网络;多信息融合;气温预报;单站逐时预测中图分类号:P456.4文献标志码:ADoi:10.16032/j.issn.1004-4965.2022.074收稿日期:2021-04-13;修订日期:2022-08-08基金项目:浙江省统计局重点项目(22TJZZ25);国家自然科学基金(71964018);云南省社会科学基金(YB2019036);昆明理工大学学生课外学术科技创新基金(2020YB207)共同资助通讯作者:李晶,女,河北省人,副教授,博士,从事数据科学、质量管理工程研究。E-mail:第38卷 第6期2022年12月热 带 气 象 学 报JOURNAL OF TROPICA
4、L METEOROLOGYVol.38,No.6Dec.,20221 1 引引言言气温是影响气候最主要的参数之一,其变化可导致财产损失,甚至会威胁人类生命。因此,精准的气温预报在人类的经济活动、地质灾害防控、医疗实践等众多领域具有重要意义1-5。因此,有效挖掘地面气象观测站中的时间序列数据,预知未来气温的动态变化,受到国内外专家学者的高度重视6-8。早期的气温预报方法大多运用数值预报方法9和传统的统计学预报方法10。张金秀等11运用统计学方法系统分析了河西走廊东部强降温的时空分布、强度等气候特征,并利用Press准则和逐步回归方法对预报因子进行初选和精选,构建了一种基于最优子集回归的各地月最低
5、气温预报方法,为强降温预报和预警提供了客观有效的参考依据。张颖超等12基于气温在空间上的相关性,运用粒子群算法进一步改进了多面函数内插算法,进而构建了一种基于地面逐时气温观测资料的多站联网质量控制方法,该方法具有较强的地区适应性和气候适应性。李江峰等13基于偏最小二乘回归能完全消除多重共线性的特点,构建了水汽和地面气温多模式集成预报模型,进一步改善了比湿和地面气温多模式集成预报的效果。虽然这些方法在气温预报上都取得了良好的预报效果,但因受制于较大的计算代价、大量物理噪声以及与气温无关的冗余特征对气温变化的影响,传统的统计学气温预报方法无法有效地学习气象观测数据间的时间相关性,在气温预报精度上仍
6、具有一定的提升空间。随 着 深 度 学 习 的 发 展,人 工 神 经 网 络(Artificial Neural Networks,ANN)凭借超强的自学习能力,可深度学习海量数据间隐藏的复杂关系,第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法在气象领域已取得一定的应用成果14-18,例如小波神经网络(Wavelet Neural Network,WNN)19、反向传播神经网络(Back Propagation,BP)20、长短期记忆神经网络(Long Short-Term Memory,LSTM)以及 一 维 卷 积 神 经 网 络(One-DimensionalConvol
7、utional Neural Network,1DCNN)等。其中,1DCNN神经网络的表征学习能力,可挖掘时间序列数据中存在的长期依赖关系,进而提取高阶特征21;LSTM神经网络利用遗忘门、输入门和输出门,被证实在时间序列任务中具有较好的预报效果22。倪铮等23将LSTM深度神经网络用于精细化气温预报,在空军T511数据模型产品的试用过程中,发现该模型对转折天气具有较好的气温预报效果。陶晔等24利用随机森林(RandomForest,RF)可度量特征重要性的特点,将 RF 与LSTM模型相结合,构建了RF-LSTM气温预报模型。然而,尽管LSTM神经网络对时间序列数据具有较好的预报能力,但由
8、于海量气象观测数据间存在大量的物理噪声和与气温无关的冗余特征,因此,仅运用LSTM模型对气温进行预报存在训练时间长、易过拟合等缺陷。鉴于此,本文基于1DCNN能够进行特征提取的特点和LSTM较强的时间序列数据处理能力,构建了一种多信息融合气温预报方法 1DCNN-LSTM。该方法可有效地挖掘气象观测数据间存在的时间相关性,剔除与气温变化无关的物理噪声和冗余特征,降低数据维度和时间复杂度,进而可提取出与气温高度相关的潜在特征,进一步提高气温预报精度。2 2 研究方法概述研究方法概述2.1 1DCNN神经网络模型1DCNN 神 经 网 络 是 卷 积 神 经 网 络(Convolutional N
9、eural Network,CNN)的一种特殊结构,具有强大的表征学习能力,能够从输入信息中提取高阶特征25。一个典型的 1DCNN模型通常包括输入层、若干个交替的卷积层和池化层、全连接层和输出层这5个部分。其中,卷积层可对输入数据进行特征提取26。卷积层。卷积层通过卷积运算从输入数据中提取子序列,以达到从局部输入中提取高阶特征,提高特征鲁棒性的目的,卷积公式如式(1)所示。为了提高1DCNN模型的稀疏性,减少参数之间的依 存 关 系,通 常 采 用 线 性 整 流 函 数(RectifiedLinear Unit,ReLU)作为卷积层的激活函数,数学表达式如式(2)所示,xlj=f()i M
10、jxl-1i wlij+bj(1)al+1i()j=f()yl+1i()j=max0,yl+1i()j(2)其中,xlj为卷积操作的输出值,f为激活函数,Mj为输入的特征矢量,xl-1i为待卷积区域,wlij为卷积核(权重),bj为相应的偏置系数。yl+1i()j为卷积操作的输出值,al+1i()j为yl+1i()j的激活值。池化层。池化层在卷积层之后,利用最大池化方法对卷积层的输出执行池化操作,如式(3)所示,pl+1i()j=max()j-1 W+1 t jWqli()t(3)其中,pl+1i()j为池化操作的输出值,qli()t为第l层第i个特征矢量中第t个神经元的值,W为池化区域的宽度
11、。2.2 LSTM神经网络模型LSTM 神经网络是递归神经网络(RecursiveNeural Network,RNN)的 一 种 变 体,是 SeppHochreiter和Jrgen Schmidhuber专门研究梯度消失问题所提出的重要研究成果27。该方法提出了一种可携带信息跨越多个时间步的设计,因此,能够挖掘数据间存在的时间相关性,有效避免传统RNN模型由于无法学习数据间的时间依赖关系而面临的梯度爆炸和梯度消失问题。其单元结构如图1所示。图1LSTM单元结构图htCtCtCt-1ht-1XththtftitottanhtanhC?t801热 带 气 象 学 报第38卷由图1可看出,LST
12、M是由多个结构完全相同的单元构成,利用遗忘门、输入门和输出门的相互作用来调节单元状态。遗忘门、输入门和输出门的具体调节步骤如下。(1)通过遗忘门从单元状态中找到需要丢弃的信息,如式(4)所示,ft=()Wfht-1,xt+bf(4)其中,ft为遗忘门,为sigmoid激活函数,ht-1和xt分别为前一时刻的输出值和当前时刻的输入值,Wf和bf分别表示遗忘门的权重矩阵和偏置项。(2)通过输入门决定加入新状态的时间。通过sigmoid层找到需要更新的单元状态;通过双曲正切函数(tanh)层创建一个新的单元状态值;将旧单元状态更新到新单元状态,具体计算步骤如式(5)式(7)所示,it=()Wiht-
13、1,xt+bi(5)C?t=tanh()Wcht-1,xt+bc(6)Ct=ft Ct-1+it C?t(7)其中,it、C?t、Ct-1和Ct分别表示输入门、当前输入的单元状态、旧单元状态和跟新后的新单元状态,Wi和bi分别表示输入门的权重矩阵和偏置项,Wc和bc分别表示单元状态的权重矩阵和偏置项。(3)通过输出门将新单元状态和输入数据相结合,确定 LSTM 模型的输出值。首先,利用sigmoid层确定需要输出的信息,如式(8)所示;其次,将tanh层和sigmoid层相乘,得到最终的输出值,如式(9)所示,ot=()Woht-1,xt+bo(8)ht=ot tanh()Ct(9)其中,ot
14、表示输出门,ht表示LSTM模型最终的输出,Wo和bo分别表示输出门的权重矩阵和偏置项。3 3 基于基于1 1DCNNDCNN和和LSTMLSTM的多信息融的多信息融合气温预报模型构建合气温预报模型构建3.1 研究区域本文研究区域为云南省昆明市。由于其独特的地理位置,经常出现倒春寒、洪涝、干旱等多种气象灾害,以及由气象灾害引发的泥石流、山体滑坡等地质灾害,该地区时常遭受经济和人员等重大损失。因此,本文将通过挖掘云南省昆明市气象观测数据间的隐藏特征,进而提高气温预报精度,增强气象灾害预防能力。3.2 预报时间范围气温变化易受到各种不可控因素的影响,随着预报时间的增加,预报误差逐渐累积,进而导致气
15、温预报模型的预报精度不断降低。因此,预报时间越长,气温预报误差就越大。基于此,本文拟运用过去一周(即7天)的历史气象观测数据来预测云南省昆明市未来24小时的逐时气温,进一步探究多信息融合气温预报模型1DCNN-LSTM在未来24小时中的气温预报效果,为中长期气温预报的研究提供理论基础。3.3 数据收集传统的气温预报方法主要基于单变量的气温预报,即仅考虑了气温这一气象要素,忽略了其他气象要素对气温变化的影响。因此,导致气温预报模型的输入变量过少,时间序列数据之间关联信息不足,进而降低传统气温预报方法的精度。基于此,本文将构建多信息融合的预报方法对气温变化进行深入探究。通过运用文献分析法,得出影响
16、气温变化的主要因素有气温(T)、气象站气压(PO)、海 平 面 气 压(P)、相 对 湿 度(RH)、风 向(WD)、风速(WS)以及水平能见度(VV)。其单位分别为摄氏度()、hPa、hPa、百分率(%)、罗盘方向、米/秒(m/s)、千米(km)。其中,T 为本文的预测值(y),PO、P、RH、WD、WS以及VV为特征值(x)。根据以上影响因素,本文将收集云南省昆明市地面气象站2017年1月1日00时2019 年12月31 日23时(北京时间,共计1 095天)的每小时气象观测数据(共计26 280条)进行实证研究。同时,运用差分法对气象观测数据进行预处理,将预处理后的数据集中的前80%作为
17、训练集,后20%作为测试集,并随机抽取训练集中的20%作为验证集。3.4 数据预处理由于本文所收集到的气象观测数据具有明显的季节性变化,且其中的的风向数据属于文本数据,因此,本文的数据预处理主要包括以下3个方面:(1)运用地面气象电码将风向中的文本数据转换成对应的风向电码(数值数据),得到适用于神经网络模型的数据集;(2)运用差分法对转换后的气象观测数据集进行去季节化处理,剔除季节性变802第6期李晶等:基于1DCNN和LSTM的单站逐时气温预报方法化对模型产生的信号干扰,进而得到平稳的时间序列数据;(3)运用z-score标准化方法对去季节化后的数据进行标准化处理,得到均值为0标准差为1的服
18、从标准正态分布的数据,以解决不同气象要素之间由于量纲和量纲单位不统一而造成的可比性问题,如式(10)所示。该方法使训练数据更加集中,有效缩短了模型的训练时间,更有利于模型的正常运行。x*=x-x(10)其中,x为原始时间序列数据,x*、x 和分别为x标准化后的样本数据、x的均值和标准差。3.5 预报性能评价指标的选取通常情况下,用于评估机器学习模型预报性能所采用的评价指标主要包括均方根误差(RootMean Square Error,RMSE)、平均绝对误差(MeanAbsolute Error,MAE)、皮尔逊相关系数(PearsonCorrelation Coefficient,PCCs)
19、以及高斯核密度估计(Gaussian Kernel Density Estimation,GKDE)等。其中,RMSE和 MAE是预测误差的衡量指标,指标值越小,表明预测精度越高,即预测值越接近真实值。PCCs是度量相关性的衡量指标,常用r表示。r值越接近1,表明预测值与真实值之间的相关性越强,拟合度越高。GKDE模型是一种用于估计概率密度函数的非参数方法,通过比对各模型的误差分布,GKDE曲线峰度越高,表明模型产生的预报误差越集中地分布在0附近,即气温预测值越接近真实值。因此,本文选取模型的泛化能力、预报精度以及误差分布作为衡量 1DCNN-LSTM多信息融合气温预报模型预报性能的评价指标。
20、其中,RMSE、MAE和r的计算公式分别如式(11)(13)所示:RMSE=1Ni=1N()yi-yi2(11)MAE=1Ni=1N|yi-yi(12)r=1n()yi-y()yi-y 1n()yi-y 21n()yi-y 2(13)其中,yi、yi、y 以及y 分别为真实气温值、预报气温值、真实气温值的均值和预报气温的均值,N为测试样本的数量。3.6多信息融合气温预报模型 1DCNN-LSTM的建立随着科学技术的不断进步,尤其是计算机领域的逐渐壮大,神经网络模型在气温预报领域已取得一定的应用成果。其中,传统的气温预报方法 主 要 包 括 1DCNN、LSTM 和 BP 神 经 网 络。LST
21、M 神经网络具有良好的长期依赖性,能够挖掘出时间序列数据间存在的时间相关性,但存在参数过多、训练时间较长且容易过拟合的缺陷。1DCNN神经网络具有强大的特征学习能力,能够从输入信息中提取隐藏特征,从而挖掘出与气温高度相关的高阶特征,有效弥补了LSTM的不足,在提高模型预报精度的同时减少训练时间。BP神经网络具有较强的非线性映射能力,可利用误差反向传播算法自动调整权值和阈值,能够较好地完成时间序列预报任务。鉴于此,本文构建了一种将1DCNN神经网络和LSTM神经网络相结合的多信息融合气温预报模型1DCNN-LSTM,该模型主要由输入层、卷积层、SpatialDropout1D 层、池 化 层、L
22、STM 层、Dropout层和全连接层构成。1DCNN-LSTM模型的总体气温预报过程可分为5步。(1)运用输入层将形为(batch_size,time_steps,input_features)的气象观测数据输入神经网络模型。其中,batch_size表示用于训练的数据批量大小,即每次喂入神经网络的样本数,属于样本数量上的概念。经过反复试验,本文将其设置为32;time_steps表示气温预报的时间步长,即每个样本内包含的步长数,属于样本内部概念。由于本文运用过去7天(t-6,t-5,t-4,t-3,t-2,t-1,t)内T、PO、P、RH、WD、WS和VV的时间序列数据来预测t+24小时内
23、的逐时气温,故将 time_steps 设置为 7;input_features 表示输入数据的特征维度,由于输入7个特征因子,因此本文将其设置为7。(2)运用卷积层对输入数据进行特征提取。(3)运用池化层对提取到的深层特征进行下采样,以进一步降低数据维度。(4)运用LSTM 层挖掘时间序列数据之间的时间相关性,进而有效地学习气象观测数据之间的时间依赖关系。(5)运用全连接层输出第t+1时刻各气象要素的预报值,并利用该预报结果继续更新输入层中的时间序列数据,即输入(t-5,t-4,t-3,t-2,t-1,t,803热 带 气 象 学 报第38卷t+1)内各气象要素的数据来预测t+2时刻的气温值
24、。通过重复这个过程,可实现t+n小时内的逐时气温预报,本文将n设置为24。在整个试验过程中,设置1DCNN-LSTM气温预报模型的优化器为 Adam,损失函数 RMSE,epoch 为 200,batch_size 为 32,学习率=0.000 1,且每隔 100 个 epoch,学习率减小为原来的 1/10。同时,经过本文的反复实验,发现将 1DCNN-LSTM模型中一维卷积层层数设置为1,且该层一维卷积核大小设置为 5,一维卷积核个数设置为200,LSTM层层数设置为2,且每层LSTM神经元个数分别设置为128和64时,该模型的气温预报效果最好。此外,为了降低1DCNN-LSTM模型的过拟
25、合,进一步提高气温预报精度,本文在一维卷积层和 LSTM 层之后,分别添加了比率为 0.5 的SpatialDropout1D层和Dropout层。其总体框架如图2所示。图2多信息融合气温预报方法1DCNN-LSTM的总体框架由图 2 可看出,多信息融合气温预报方法1DCNN-LSTM主要分为两部分。第一部分,将经过数据预处理后 7 天内的气象观测数据作为1DCNN神经网络的输入变量,通过卷积层进行特征提取,利用池化层降低数据维度,进而提取出与气温高度相关的深层特征;第二部分,将1DCNN模型提取到的特征向量输入LSTM神经网络中,利用LSTM模型特殊的门结构,进一步学习数据间的时间依赖关系,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 DCNN LSTM 单站逐 时气 预报 方法 李晶
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。