融合空间和统计特征的CNN-GRU臭氧浓度预测模型研究.pdf
《融合空间和统计特征的CNN-GRU臭氧浓度预测模型研究.pdf》由会员分享,可在线阅读,更多相关《融合空间和统计特征的CNN-GRU臭氧浓度预测模型研究.pdf(11页珍藏版)》请在咨信网上搜索。
1、NATURCIENCEMar.,20232023年3月JOURNALNANNCNTVERSTTYVol.59,No.2第2 期第59 卷南京大学学报(自然科学DOI:10.13232/ki.jnju.2023.02.015融合空间和统计特征的CNN-GRU臭氧浓度预测模型研究杨雨佳1,肖庆来,陈健3.4,曾松伟(1.浙江农林大学数学与计算机科学学院,杭州,31130 0 2.松阳县自然资源和规划局,丽水,32 340 0;3.浙江农林大学省部共建亚热带森林培育国家重点实验室,杭州,31130 0;4.浙江农林大学林业与生物技术学院,杭州,31130 0;5.浙江农林大学光机电工程学院,杭州,3
2、1130 0)摘要:近年来,空气污染问题备受关注,近地面臭氧逐渐成为我国部分城市的首要污染物,因此对臭氧浓度的精准预测尤为重要为了进一步提高臭氧浓度预测的精度,提出一种融合空间特征和统计特征的卷积神经网络和门控循环单元(Co n v o l u t i o n a l Ne u r a l Ne t w o r k s a n d G a t e R e c u r r e n t U n i t,CNN-G R U)臭氧浓度组合预测模型,首先,通过对时空因素以及其他大气污染物与臭氧浓度进行相关性分析,利用基于统计域的方法和克里金插值法对臭氧浓度时序数据进行预处理来提取臭氧浓度数据的时空特征,
3、采用并联杂交CNN和GRU结构的组合预测模型得到最终的臭氧浓度预测结果.实验结果表明,CNN-GRU组合预测模型预测未来一小时的臭氧浓度可决系数、均方根误差和均方误差的值分别为0.9598,11.9 50 8 和8.2 7 53,未来两小时的臭氧浓度可决系数、均方根误差和均方误差的值分别为0.8 9 8 5,18.537 3和13.0045,优于独立的CNN、长短期记忆(LongShortTermMemory,LST M)网络、GRU、卷积-长短期记忆网络(ConvolutionalLSTMNetwork,ConvLSTM)、CNN-LST M 和CNN-GRU预测模型,这是由于CNN-GRU
4、组合预测模型融合了空间和统计特征,可以多角度提取特征并采用并联杂交的网络结构,所以预测精度较高,且具备较好的鲁棒性.关键词:臭氧浓度预测,卷积神经网络,门控循环单元,空间特征,统计域中图分类号:X51文献标志码:AResearch on CNN-GRU ozone prediction considering spatial featuresand statistical featuresYang Yujia,Xiao Qinglai2,Chen Jian3.4,Zeng Songwei5*(1.College of Mathematics and Computer Science,Zheji
5、ang A&F University,Hangzhou,311300,China;2.Songyang County Natural Resources and Planning Bureau,Lishui,323400,China;3.State Key Laboratory of Subtropical Silviculture,Zhejiang A&.F University,Hangzhou,311300,China;4.College of Forestry and Biotechnology,Zhejiang A&F University,Hangzhou,311300,China
6、;5.College of Optical Mechanical and Electrical Engineering,Zhejiang A&F University,Hangzhou,311300,China)Abstract:In recent years,air pollution has attracted much attention and near ground ozone gradually becomes the primarypollutant in some cities in China.Therefore,accurate prediction of ozone co
7、ncentration is particularly important.In order toimprove the prediction accuracy of ozone concentration,In this paper,we propose a combined prediction model of ozoneconcentration based on CNN-GRU(Convolutional Neural Network and Gate Recurrent Unit)by fusing spatial and statisticalfeatures.Firstly,b
8、y analyzing the correlation between temporal and spatial factors as well as other atmospheric pollutants andozone concentration,the statistical domain based method and Kriging interpolation method are used to preprocess the ozoneconcentration time series data to extract the spatial-temporal characte
9、ristics of the ozone concentration data.The combined基金项目:国家自然科学基金(4147 1442)收稿日期:2 0 2 2 一11-14*通讯联系人,E-mail:323第2 期杨雨佳等:融合间和统计特征的CNN-GRU臭氧浓度预测模型研究prediction model of parallel hybrid CNN(Convolutional Neural Networks)and GRU(Gate Recurrent Unit)structure is usedto obtain the final ozone concentratio
10、n prediction results.The results show that the combined prediction model of ozoneconcentration based on CNN-GRU has the highest accuracy and the best prediction effect,the values of R,RMSE(RootMean Squared Error)and MAE(Mean Absolute Error)of ozone concentration in the next hour are 0.9598,11.9508 a
11、nd8.2753,in the next two hours are 0.8985,18.5373 and 13.0045,outperform the independent CNN,LSTM(Long Short-TermMemory),GRU,ConvLSTM(Convolutional LSTM Network),CNN-LSTM and CNN-GRU prediction models.Becausethe prediction model combines spatial and statistical features,multi angle feature extractio
12、n and parallel hybrid networkstructure are used to obtain high prediction accuracy and good robustness.Key words:ozone concentration prediction,Convolutional Neural Network,Gated Recurrent Unit,spatial feature,statisticaldomain近年来,我国大气污染问题备受关注,其中,近地面的臭氧是大气污染物的一种,也是光化学烟雾的组成之一,是氮氧化物(NO.)和挥发性有机物(VOCs)等
13、污染物在大气中发生光化学反应生成的二次污染物 2 .高浓度臭氧不仅影响人体健康,导致多种疾病发生 3,还阻碍农作物的生产,影响昆虫的发育和行为 4,对生态环境产生严重的危害 5。目前,大气环境监测站为臭氧相关研究提供了数据支持,通过监测数据可以了解当前的空气质量,但无法直接预测未来空气质量的发展趋势.对未来臭氧浓度进行预测,可为受臭氧影响的户外工作者及政府决策提供科学支持,并对生态环境起保护作用.因此,对臭氧浓度的精准预测具有重要的现实意义当前对臭氧浓度预测的研究主要分两类.一类是基于传统方法的预测模型,例如,吴莹和王玉祥 6 利用嵌套空气质量预报模式系统和通用多尺度空气质量模型对臭氧进行预报
14、,两种模型对臭氧预报的相关系数分别为0.6 7 和0.7 9.此方法能对臭氧浓度进行大致的预测,但需要大量人力物力,且预测精度不高.另一类是基于机器学习的预测模型,和传统的预测模型相比,它使用臭氧浓度和相关气象因子的时间序列数据作为模型输人,众多学者搭建了随机森林 7-9 、误差反向传播算法(Error Back Propagation,EBP)10-1、决策树 12)、分布式梯度增强库(ExtremeGradientBoosting,XGBoost)13-15等数值关系模型来预测大气污染物的浓度,此类模型构造简单,便于操作.贾鹏程 16 通过分析气象因子、前体物以及颗粒物对近地面臭氧浓度的影
15、响,利用序列至序列(Sequence toSequence,seq2seq)模型对未来一小时的臭氧浓度进行预测,预测均方根误差为12.40gm-3,平均绝对误差为9.2 7 gm-3.王馨陆等 7 基于成都市的气象数据,使用随机森林等机器学习方法,建立了成都市夏季臭氧污染潜势模型,对臭氧的短期污染潜势有良好的预报效果,测试集的相关系数在0.7 3 0.7 6.蔡旺华 14运用XGBoost模型预测空气中的臭氧浓度,充分考虑臭氧浓度的时序变化规律,将气象条件和生成臭氧的重要前体物纳人模型考虑后,取得了90%的预报等级准确率.目前,臭氧浓度的预测方法着重研究臭氧的时间自相关性和臭氧与其他环境因子之
16、间的关系,使用的机器学习模型强调提高输人数据的质量和有效性,或优化单个模型的参数.但现有的臭氧浓度组合预测模型大都简单地将两个或多个预测方法进行结合,所以对未来臭氧浓度的预测精度仍有较大的提升空间.针对上述问题,本文提出一种融合空间特征和统计特征的CNN-GRU(C o n v o lu t i o n a l Ne u r a lNetworksandGateRecurrentUnit)臭氧浓度组合预测模型.该混合模型由统计模型和机器学习模型组合而成,采用并联杂交方法作为混合结构来整合个体预测模型,提高了模型的预测准确率。1数据与方法1.1数据及预处理杭州市(2 9 11N3034N,118
17、20E12037E)位于中国东部沿海的长江三角洲地区,属于亚热带季风气候,其大气污染以秋冬季PM2.5和夏季的臭氧超标为主,空气质量问题备受关注.本研究选取杭州市九个环境空气质量324第59 卷南京大学学报(自然科学)国控站点2 0 17 年5月1日至2 0 19 年6 月2 9 日的同时段逐小时的气象监测数据,其中,环境污染因子主要为O3,CO,SOz,NO2,PM2.5和PM1o.研究区域如图1所示,将2 0 17 年5月1日至2 0 18 年4月30 日的8 7 35条数据作为训练样本集,2 0 18 年5月1日至2 0 19 年6 月2 9 日的10 17 5条数据作为测试样本集.表1
18、为部分样本数据的示例.12000E12010:0*E120200F余桃区怡平姨X.0.02N0.02和壁小西溪浙江农大城烟锁镇红云XO.01.08图例空气质量监测站高区1216km12000*E120100g120200*E图1研究区域Fig.1Research area1.2融合空间和统计特征的CNN-GRU模型网络结构本文提出一种融合空间特征和统计特征的基于CNN和GRU的臭氧浓度并行组合预测的模型,图2 为CNN-GRU模型的网络结构图.为了研究邻近区域对预测站点臭氧浓度的影响,使用克里金插值法作为数据预处理方法,并利用二维CNN提取空间信息,基于CNN和GRU构造网络结构分支,将两个分
19、支和统计特征的输出以并联的方式作为全连接神经网络的输人(图2 a).1.3老卷积神经网络(CNN)分支CNN在传统意义上是为图像数据设计的,它在面对复杂的网络结构时能进行高效的特征提取,被广泛运用在计算机视觉网络等领域 17-18 为了使CNN适应时间序列数据集,增加模型精度,进一步提高网络的泛化能力,本文采用多层因果卷积来确保仅使用历史信息对臭氧浓度进行预测 19-2 1.对于隐藏层l的中间特征,滤波器的表达式如下:hi+1=A(W*h)(l,t)(1)(W*h)(1,t)=Et=W(l,t)hi-:(2)其中,h表示在t时刻1层的中间状态,*表示卷积运算符,W表示1层的过滤器权重,A()是
20、例如sigmoid的激活函数,代表任何特定于架构的非线性处理。在一维CNN的情况下,式(2)与数字信号处理中的有限长单位冲激响应滤波器存在强相似性,这也导致CNN在处理时间序列问题时会产生两个关键性影响.首先,在处理时间序列问题时CNN保持空间不变性,使每个时间步使用的滤波器权重集相同.此外,CNN在处理时间序列数据表1部分样本数据的示例Table 1Some of the data samples日期城市监测点名PM2.5(g*m-3)PMio(g*m-3)SO(gm-3)NO2(gm-3)O:(gm-3)co(g*m-3)2018/3/310:00杭州浙江农大1825637241.3201
21、8/3/311:00杭州浙江农大1722734361.22018/3/312:00杭州浙江农大1520731561.22018/3/313:00杭州浙江农大1620730781.22018/3/314:00杭州浙江农大1519730951.12018/3/315:00杭州浙江农大17187331071.12018/3/316:00杭州浙江农大20207311231.12018/3/317:00杭州浙江农大25NULL8441121.02018/3/318:00杭州浙江农大33331072751.12018/3/319:00杭州浙江农大47512068781.22018/3/320:00杭州浙江
22、农大58642081591.32018/3/321:00杭州浙江农大66741259941.12018/3/322:00杭州浙江农大67701254841.12018/3/323:00杭州浙江农大69731160551.1325第2 期杨雨佳等:融合空间和统计特征的CNN-GRU臭氧浓度预测模型研究DDDiND22D2NGRUiDD2nD2a,D2mDropoutDuDU:GRUDataDropoutConversionD2DenseConvolutionDenseD2,D2a,D2OutputL(Du,Du.,DulD2DLJ-Du,a2.,D(c)NumberofFeaturesD2,D2
23、,D2N(e)ConvolutionInputInputOTDm,DTmGRUbasedCNN basedHistorical statisticsindividuallearnerIndividual learnerNumberofFeaturesPoolingInputconcatenateDense-FlattenDenseDenseDenseDenseReluactivationDenseoutputDenseOutput(d)(b)Output(a)图2融合空间和统计特征的CNN-GRU模型网络结构Fig.2Network structure diagram of CNN-GRU m
24、odel integrating spatial and statistical features时,只能通过其定义的回溯窗口或接受域中的输入进行预测,因此需要对感受野大小进行精准调节,以确保模型对历史信息的充分利用.为了保证预测效果的稳定性并降低网络模型的复杂度,在CNN的网络架构上,本文将两层重复的卷积层连接在输人层之后,用较少的网络层尽可能多地提取特征,避免经过池化层后丢失重要的特征,经过连续的卷积和池化后,模型将获得的特征平化为一维,选用3X3的卷积核,池化层大小为2 2,神经元数量分别设置为32 个和2个,最后将数据输人Dense层(图2 b).使用线性整流函数作为激活函数,其具有的
25、稀疏激活特性可以避免过拟合现象,其表达式如下:f()=max(0,)(3)1.4门控循环单元(GRU)分支2014 年 Cho etal22提出的GRU是基于循环神经网络(RecurrentNeural Network,RNN)的一种门控机制,在保留过去信息影响的同时,遗忘一些非必要的信息。和长短期记忆(Long Short-Term Memory,LSTM)网络相比,GRU解决了处理长时间序列数据时梯度消失的问题,同时除去了输出门,使参数量更少,进一步提高了训练效率。因此,本文使用的模型采用双层GRU结构,采用一对一和多对一两种递归单元展开形式,使模型在每一个时间步对输人的时间序列数据产生新
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 融合 空间 统计 特征 CNN GRU 臭氧 浓度 预测 模型 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。