基于CMA-REPS格点预报数据的深度学习风速订正方法.pdf
《基于CMA-REPS格点预报数据的深度学习风速订正方法.pdf》由会员分享,可在线阅读,更多相关《基于CMA-REPS格点预报数据的深度学习风速订正方法.pdf(7页珍藏版)》请在咨信网上搜索。
1、Jun.2023JOURNAL OF CHENGDU UNIVERSITY OF INFORMATIONTECHNOLOGY2023年6 月Vol.38 No.3息报工程成都大学学第38 卷第3期信文章编号:2 0 9 6-16 18(2 0 2 3)0 3-0 2 6 4-0 7基于CMA-REPS格点预报数据的深度学习风速订正方法毛波,杨昊12,周世杰,杨康权34,陈敏1(1.成都信息工程大学计算机学院,四川成都6 10 2 2 5;2.电子科技大学信息与软件工程学院,四川成都610054;3.四川省气象台,四川成都6 10 0 7 2;4.四川省气象局重点实验室,四川成都6 10 0 7
2、 2)摘要:准确的风速预测对风能资源的充分利用和风电场的经济效益提升具有显著的意义。为提高集合数值预报的风速预报能力,弥补现有深度学习集合预报订正模型对格点预报数据时间特征提取的不足,引人ConvLSTM深度学习模型,对CMA-REPS(中国气象局区域集合预报模式)预测的华北地区近地面10 m风速格点数据进行偏差订正实验,以均方根误差(RMSE)作为评分标准将订正结果与CMA-REPS原始预报数据和Unet深度学习模型方法得到的订正结果进行对比。结果表明,ConvLSTM模型的订正效果相比Unet模型有进一步的提升,经ConvLSTM模型订正后的近地面10 m风速预报数据整体上更趋近于实况数据
3、。关键词:CMA-REPS;集合预报;偏差订正;深度学习;风速中图分类号:TP183文献标志码:Adoi:10.16836/ki.jcuit.2023.03.0030引言风能作为一种高效清洁的新能源,其巨大的发展潜力引起了国内外广泛的重视。实现准确的风速预测能够有效地提高风能资源的利用率,降低风功率波动对电网稳定性的影响,从而提升风电场的经济效益1。集合数值预报模式由于提供了关于天气预报的不确定性信息,相比于单一的确定性数值预报模式,往往能够得到更准确的风速预报结果,现已在全球多个国家的天气业务预报中心实现常规运行2 1。但在实际应用中,由于集合预报模式设计之初的各种不完美以及大气系统的不确定
4、性,集合预报模式一直存在系统性误差,从而造成风速预报的结果出现系统性偏差。为了满足更加精确和可靠的风速预报需求,需要对集合数值预报模式的结果进行偏差订正,以提升模式对风速的预报能力。目前,受限于风场本身所具有的变性特征,国内对风场集合预报结果偏差订正的方法还是多以传统的统计订正方法为主3,如集合模式输出统计法4 和贝叶斯模型平均法5。这类订正方法均通过建立线性统计模型来订正风场集合预报的误差,对于风场变化的随机特征,传统的线性统计模型往往不能很好地捕捉其中的非线性关系。随着近年来计算机硬件设备的不断提升以及人工智能技术的蓬勃发展,国内外气象领域的研究人员开始逐步结合机器学习方法或深度学习收稿日
5、期:2 0 2 2-10-2 1基金项目:国家重点研发计划资助项目(2 0 2 1YFC3000902);四川省科技计划重点研发专项资助项目(2 0 2 2 YFS0542)方法对数值预报模式结果进行偏差订正,实现风速的精细化预报。LahouarA等6 使用随机森林的机器学习方法,建立了提前一小时的风速预测模型。与其他大多数机器学习方法相比,随机森林方法不需要进行调整或优化,结果表明,使用该模型的风速预报精度有显著的提高。孙全德等7 使用常见的几种机器学习算法(LASSO回归、随机森林等)对数值天气预报模式ECMWF预测的华北地区近地面10 m风速进行订正,将订正结果与传统订正方法得到的订正结
6、果进行对比。结果表明,基于机器学习算法的风速订正方法效果均好于传统订正方法,显示了机器学习方法提升数值预报风速预报精度的潜力。但上述机器学习方法仅限于对确定性数值预报的数据进行偏差订正,尚未对集合数值预报模式进行尝试。且机器学习较依赖于复杂的特征工程,将机器学习应用于模式的偏差订正时,需要研究人员具备专业的气象知识和大量的时间,使训练过程成本偏高且十分具有挑战性。深度学习作为机器学习的一种特定形式,由于不需要进行特征工程,因此在对海量数据进行非线性建模时具有更大的优势。过去十年中,深度学习已在计算机视觉、语音识别及自然语言处理等多个领域取得了丰富的成果,为人类社会的进步和发展带来了极大的帮助。
7、对于大气系统所具有的特殊的高度非线性特征,深度学习现已成为人工智能领域与大气科学领域交叉应用的研究热点和主流发展方向。Stephan Rasp等8 率先使用深度神经网络在分布回归框架中对集合预报预测的2 m温度进行偏差订正实验,将连续分级概率评分(continuous ranked probability score,CRPS)毛265波:基于CMA-REPS格点预报数据的深度学习风速订正方法第3 期作为其模型的损失函数。该实验的局限在于只考虑单一站点位置以及单一天气变量的偏差订正,对目前的数值预报模式生成的二维网格数据不具有适用性。对于二维网格数据所具有的空间特性,需考虑使用诸如卷积神经网络
8、9 等方法来提取其空间特征。受此启发,GronquistPeter等【10 基于Unet模型搭建了集合预报的偏差订正模型,结果表明其模型在CRPS评分方面相比于传统订正方法取得了超过14%的相对改进。L Han 等11 基于 Unet 提出了一个 CU-net(CorrectionU-net)模型,将格点预报数据的偏差订正问题转化为深度学习中的图像识别问题,对ECMWF-IFS模式的格点预报数据进行订正,也取得了不错的订正效果。张延彪等12 为进一步加强CU-net模型对复杂的气象格点数据的偏差订正能力,引人稠密卷积模块13(Denseblock)对 CU-net 进行改进,构建了 Dense
9、-CUnet模型。上述研究虽然都对格点预报数据的偏差订正有较好的效果,但考虑到格点预报数据的空间特征,仍存在一些不足,主要体现在没有考虑模型对格点预报数据的时间维度特征的提取融合。集合数值预报模式预报的格点数据具有复杂的空间特征和时间特征,属于典型的时空序列数据。对这类数据进行偏差订正的深度学习方法,本文引入时空序列预测问题常用到的ConvLSTM模型14 对CMA-REPS预报的近地面(10 m)风速格点数据进行偏差订正,订正的预报时间为2 4h、48 h 和7 2 h。将订正结果与CMA-REPS原始预报数据和Unet模型得到的结果进行对比,结果表明该模型方法能进一步提升集合数值预报模式风
10、场格点数据的预报精度。1模式与方法1.1CMA-REPSCMA-REPS是中国气象局自主研发的新一代区域集合预报系统,其前身是GRAPES-REPS(g l o b a l a n dregional assimilation and prediction enhanced system-re-gional ensemble prediction system)区域集合预报系统,基于中国自主研究并建立的新一代多尺度通用资料同化与数值天气预报系统-GRAPES的区域模式发展而来15-16 。集合预报扰动方法对集合预报的可靠性提升极为重要,当前CMA-REPS初值扰动采用6 h循环计算方案的GRA
11、PES模式面集合变换卡尔曼滤波17 ;模式扰动采用单一物理过程参数化方案与随机物理过程倾向项(stochastic perturbed parameterization tenden-cies,SPPT 18 组合;边界扰动通过提取GRAPES-GEPS(global and regional assimilation and predictionenhanced system-global ensemble prediction system)全球集合预报系统扰动成员相比于自身控制预报的扰动测边界,并叠加在CMA-REPS的控制预报测边界上得到19 。CMA-REPS参数配置如表1所示,其水
12、平分辨率为0.1,垂直分辨率为50 层,集合预报成员数15个,预报区域为中国区域,预报时效8 4h(0 0 时,12 时(协调世界时),6 h(0 6 时,18 时(协调世界时)。CMA-REPS中的控制预报初值和侧边界来源于NCEP-GFS(national centers for environmental prediction-globalforecast system)全球模式的预报场;并且CMA-REPS加人了云分析同化技术与条件性台风涡旋重定位技术2 0 ,以期提高短临降水和台风预报能力。CMA-REPS具体参数配置见表1。表1CMA-REPS具体参数配置参数名称参数配置控制预报C
13、MA-MESO分辨率0.1/L50控制预报初值和侧边界NCEP-GFS同化分析技术云分析初值不确定性ETKF(6h循环)模式不确定性单一物理+SPPT边界不确定性CMA-CEPS台风不确定性条件性台风涡旋重定位技术集合成员数1515N65N,70E140E(2022年预报区域6月7 日之前),10 N60N,70E145E(2 0 2 2 年6 月7 日之后)84h(0 0 0 0、12 0 0 U T C),6 h(0 6 0 0、预报时效1800UTC)模式输出间隔1h1.2基于ConvLSTM的风速订正模型集合数值预报模式的格点预报数据是在时间上连续分布的空间数据2 1,具有典型的时空特
14、征。仅靠单一的基于CNN的深度学习模型如Unet,虽然可以有效地提取格点预报数据复杂的空间分布特征,但无法捕捉数据的时间序列信息。随着深度学习的发展,LSTM(l o n g s h o r t-t e r mme mo r y)对于气象要素站点数据的序列预测能力得到了验证。因此,考虑将时间成分纳人深度学习模型(例如通过使用LSTM),可以进一步提高深度学习模型对集合数值预报模式格点预报数据的偏差订正能力。但是,传统的长短期记忆单元无法实现对空间特征的提取。基于此,引入ConvLSTM模型,大266息都成程报信第38 卷学学尝试对CMA-REPS预报的近地面(10 m)风速格点数据进行偏差订正
15、。ConvLSTM模型是Shi等14 为解决时空序列预测问题,结合卷积神经网络对数据空间特征的提取与编码能力及长短期记忆网络的序列特征编码特性而提出的。ConvLSTM的单元结构图如图1所示。由图1可以看到,ConvLSTM是LSTM结构的一种变体,通过遗忘门(f.)、输入门(i)和输出门(o)控制数据在细胞内部的交流。各个门控制数据参与到细胞状态的更新,通过门来选择性地保留或舍弃信息。ConvLSTM与LSTM的区别在于ConvLSTM在“输人到状态”和“状态到状态”两部分都采用卷积运算来代替矩阵乘法,并且其所有的输人Xi,X,细胞输出Ci,C,隐藏状态H,,H,和遗忘门(f.)、输人门(i
16、)和输出门(o,)都是3维张量,这样做的好处是在提取序列的空间信息同时,可以去除大量空间穴余特征并且解决数据的时间依赖问题ConvLSTMtanhBN(7-1)(7)WpeerWt.anhbH-gWAO-BN-CBNW图1ConvLSTM单元结构图ConvLSTM门之间的传递关系如下:i,=o(Wx*X,+Wh*H,-I+W.oC,-I+b,)f,=o(Ww*X,+Ww*H,-+WgoC-I+by)C,=f,o Ct-+i,o tanh(Wxe*X,+Whe*H,-+b.)0,=o(Wxo*X,+Wh。*H,_I+W.C,+b。)H,=o,o tanh(C,)11+e一式中为输人门,f.为遗忘
17、门,C,为细胞状态,o,为输出门,H,为隐藏层输出,*表示卷积运算符,表示Hadamard乘积,为sigmoid 激活函数。遗忘门可以控制信息的遗忘,丢弃被认为几余的信息,保留有用的信息并将其向后传递;继续传递的信息进到输人门,通过sigmoid层确定需要更新的信息,并通过tanh层得到新的细胞信息对细胞进行更新。最后通过输出门中的sigmoid的信息乘以通过tanh的记忆细胞的信息得到模型的最终输出。对于本文的集合数值预报模式风场格点预报数据的偏差订正问题,通过堆叠多个ConvLSTM网络层搭建偏差订正模型,模型结构如图2 所示。模型输入由Y,和Pt+,组成,其中Y,是2 t、10 u、10
18、 和10 w这4个要素在t时刻的实况数据,P+,是2 t、10 u、10 及10 w在t时刻的,小时集合平均预报数据,可取的值有24、48 和7 2。将实况数据Y,与预报数据P+,拼接在一起,得到的模型输人数据大小为10 110 18。输人数据经过最小最大值归一化后进人两个ConvLSTM2D网络层,最后经过一层全连接层输出偏差订正后的CMA-REPS的,预报数据。两层ConvLSTM-2D网络层卷积核数目均为10,考虑数据本身的特征分布和网格分辨率大小,选用3x3大小的卷积核以避免丢失局部特征,并且卷积过程中使用填充设置使中间过程生成的特征图大小一致。输出层(全连接层)的神经元个数为1,其激
19、活函数为ReLu,用以提高模型的非线性表达能力。在每个ConvLSTM-2D网络层后加人批标准化层,通过对每层的输出进行批标准化处理,防止模型出现训练过拟合的同时加速模型训练的收敛过程。FullyConnection+Min-MaxNornualivalionERA5CMA-REPSConvLSTM1ConvLSTM2CorrectionResult图2基于ConvLSTM的风速订正模型结构图在模型训练过程中,使用Adam22作为模型的优化器,其学习率设为0.0 0 1,一阶矩估计的指数衰减率设为0.9,二阶矩估计的指数衰减率设为0.9 9 9。Adam算法相比于传统的随机梯度下降算法,可以通
20、过计算梯度的阶矩为不同的参数设计独立的自适应性学习率,并且拥有更高效的计算效率。训练的每一批数据大小batchsize设为10,并选取均方误差(MSE)作为模型的损失函数:12(y:-y.)2nMSE:二ni=o式中y和;分别代表训练集中的观测值和经模型训练后的订正值,n代表训练集样本数量。2数据2.1数据选取选取CMA-REPS预报的格点数据作为预报数据,267毛波基十CMA-REPS格点预报数据的深度学习风速订正方法第3 期采用第五代ECMWF全球再分析产品(ERA5)数据作为格点“实况”数据。其中,CMA-REPS 的格点预报数据的空间分辨率为0.10.1,网格数为7 5150 1,空间
21、范围为10 N6 0 N、7 0 E145E(2 0 2 2 年6 月7 日之前的空间范围为15 N 6 5 N、7 0 E 145E),起报时间为0 0 UTC和12 UTC,预报时效为0-84h(逐小时),成员数为15。ERA5数据的空间分辨率为0.1x0.1,网格数为10 110 1,空间范围为32 N42N、110 E12 0 E。对CMA-REPS预报的华北地区近地面10 m风速格点数据进行偏差订正,因此需要将CMA-REPS的格点预报数据裁剪成网格数为10 1101,空间范围为华北地区(32 N42 N、110 E120E),并选取预报时效为2 4h、48 h 以及7 2 h的2
22、m气温(2 t)、10 m风速(10 u:东西风;10 u:南北风)的预报数据。两套数据的时间范围均为2 0 19 年10 月2 0日至2 0 2 2 年5月1日。2.2数据预处理及划分首先将10 m纬向风分量(u)和10 m经向风分量()合成为10 m风速(w),合成公式:22W=u+u现在选取的CMA-REPS预报数据和ERA5数据包含的气象要素有2 t、10 u、10 u 和10 w,然后对两套数据进行质量控制,检测数据中是否存在缺失值或异常值。经检测,ERA54个要素的数据均存在缺失值。这是由于ECMWF数值模式预报资料数量大,存储空间占比高,导致资料在存储过程中出现数据缺失。针对格点
23、预报数据空间上存在连续性的特点,ERA5缺失值采用相邻非缺失值线性插值方法进行补缺。为了防止模型训练出现过拟合的现象,提升模型的泛化能力,还需要将所选数据分为训练集、验证集和测试集。由于实验订正的预报时间为2 4h、48 h 和72h,因此将数据分为3组,每组选取2 0 19 年10 月2 0日至2 0 2 1年4月30 日的对应预报时效的数据为训练集,2 0 2 1年5月1日至2 0 2 1年10 月31日对应预报时效的数据为验证集,2 0 2 1年11月1日至2 0 2 2 年5月1日对应预报时效的数据为测试集。在单个训练数据集合中,以订正2 4h预报数据为例,模型输人数据为起报时间t的E
24、RA5实况格点数据和CMA-REPS的2 4h预报数据,训练标签为t+24h的ERA5实况格点数据。3实验和结果3.1实验评价指标采用ConvLSTM深度学习模型对CMA-REPS模式预报的华北地区近地面10 m风场数据(10 u、10 和10w)进行偏差订正,订正的预报时效为2 4 h、48 h 和72 h,并将订正结果分别与 CMA-REPS 原始预报结果、EMOS方法订正结果和Unet模型订正结果进行比较,同时结合ERA5再分析场对模型的订正能力进行客观检验。对于模型订正性能的衡量,使用均方根误差(RMSE)来评估模型的订正效果。RMSE的计算公式如下:RMSE=2(y-.)ni=0式中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 CMA REPS 预报 数据 深度 学习 风速 订正 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。