基于VMD-IELM的淮安市二河溶氧量预测研究.pdf
《基于VMD-IELM的淮安市二河溶氧量预测研究.pdf》由会员分享,可在线阅读,更多相关《基于VMD-IELM的淮安市二河溶氧量预测研究.pdf(4页珍藏版)》请在咨信网上搜索。
1、2023 年第 7 期138计算机应用信息技术与信息化基于 VMD-IELM 的淮安市二河溶氧量预测研究陈肖1 张强1 姚年春1CHEN Xiao ZHANG Qiang YAO Nianchun 摘要 为实现对淮安市二河溶氧量精确预测,提出了一种变分模态分解结合改进极限学习机的水体溶氧量预测模型。引入流形学习概念提高极限学习机的稳定性,引入正则化系数解决极限学习机存在的不适定问题。使用变分模态分解对水质数据进行解耦,将解耦后的各分量带入改进极限学习机模型进行预测,将各分量叠加后得出预测结果。用该模型预测淮安市二河的溶氧量参数,并与其他常用预测模型对比,结果表明:上述模型能够更加精确的预测二河
2、的溶氧量,稳定性高,泛化性强。关键词 变分模态分解;流形学习;正则化;极限学习机;水质预测doi:10.3969/j.issn.1672-9528.2023.07.0351.江苏财经职业技术学院 江苏淮安 223300 基 金 项 目 江 苏 财 经 职 业 技 术 学 院 校 级 教 改 课 题(2022421053)基于 HHT 与极限学习机的淮安市二河水质预测研究0 引言淮安市二河作为沟通洪泽湖与京杭大运河的引河,支撑着淮安市城南区域的水产养殖、航道运输、农田灌溉以及供水等社会生产活动1。近年来,二河流域周围的人口与经济活动逐渐增多,周边的农业灌溉区大规模使用农药,在雨水的冲刷下流入二河
3、,加剧了二河水质的恶化2。溶氧量(dissolved oxygen,DO)作为一项重要的水质参数,具有随着季节变化而变化的特征。DO 的高低决定了水域内鱼类的生长情况,理化特性,也能反映出水域的水质条件与污染等情况。因此,对于 DO 发展趋势的精确预测,可以使相关部门提前布局,及时改善水质恶化程度,对淮安市的经济及社会可持续发展具有重要意义,同时也能为二河的饮用水源地保护提供一种新的思路。近年来,国内外有众多的学者将目光聚焦水质预测领 域,谢 雨 茜 等 人3将 经 验 模 态 分 解(empirical mode decomposition,EMD)与利用 K-means 聚类改进的长短时间
4、记忆网络(long short time memory,LSTM)结合,有效提高了水产养殖基地的溶氧量预测精度。但其并未解决 EMD 存在的严重模态混叠与端点效应问题,精度还可进一步提升。杨志民4利用灰色预测模型对契爷石水库水质进行预测,取得了理想的效果。但灰色预测模型本身只适合类似于指数增长的数据预测,自身存在较大的缺陷,对模型的优化较为不足。施珮等人5提出利用用偏最小二乘算法(partial least square,PLS)优化 ELM,避免了隐含层可能出现的共线问题。将该模型运用于江苏无锡某养殖试验池塘的溶氧量预测中,预测精度和效率明显优于其他模型。但是,该模型还可以继续优化,可对 E
5、LM 的权值和阈值进行寻优。孙小杰6等利用基于修正因子的果蝇算法优化 ELM 模型的权值阈值,以巢湖的水质监测数据为基础,对巢湖未来的水质数据进行预测。获得了更高的预测精度,收敛速度也更快。但是该模型并未考虑并解决ELM的系统性风险,预测精度可进一步提升,稳定性较差。基于此,本文对极限学习机进行改进,将变分模态分解(variational mode decomposition,VMD)与改进的极限学习机(improved extreme learning machine,IELM)结合,对淮安市二河的溶氧量数据进行预测。与其他预测模型相比,本文所提的方法预测精度更高,适应性更强,可以实现对二河
6、水质预测的高精度预测。1 VMD-IELM 预测模型的构建1.1 VMD 算法VMD 是 Konstantin Dragomiretskiy 和 Dominique Zosso共同提出的一种新颖的信号分析方法,它不同于以递归方式进行信号分解的传统方法,比如 EMD 等算法。这些使用递归模式的信号分解方法一般都会出现模态混叠的现象,并且会因为插值算法的缺陷出现较为严重的端点效应,同时对采样频率的要求较为严苛。VMD 将递归信号分解问题巧妙的转变为变分问题,这使得 VMD 拥有比较完善的理论基础,它的优势在于受到噪声干扰小、对采样频率有较好的鲁棒性和可以分离出频率相近的信号7。VMD 可以将原始的
7、信号分解为多个互不相关的子信号,我们称之为本征模态函数(intrinsic mode function,IMF)。VMD 的主要问题是分量个数 K 难以确定,需要人为对其进行设定或者参数寻优。而分量个数 K 的确定对于 VMD来说十分重要,K 值设置较小会导致模态欠分解,设置过大 2023 年第 7 期139计算机应用信息技术与信息化则会导致相近模态的重复以及噪声的增加。常见的 K 值确定方法有:相关系数法、样本熵法、智能算法寻优法等。本文利用相关系数法确定 K 值,通过对比各个分量与原始分量的相关系数,确定 VMD 算法的分解情况,当第一次出现某个 IMF 分量与原始分量的相关系数低于设定值
8、时,可以将其判定为接近过分解的临界点,以此作为停止条件。通过查阅大量文献,并根据二河水质数据的实际情况实验分析,本文将阈值取为 0.08,初始 K 的个数设置为2,VMD 利用相关系数将初始数据分解成 K 个 IMF 分量的流程如图 1 所示8。图 1 基于相关系数的 VMD 算法流程图1.2 改进的极限学习机1.2.1 极限学习机ELM 算法是 Huang 等人提出的一种单隐层前馈神经网络算法,其输入层与隐含层的权值阈值随机产生,只需要设置好隐含层节点数即可直接得到隐含层到输出层的权值9。在负荷预测,人脸识别,水质评价等许多领域被成功应用,其数学模型为:H=Y (1)式中,H 为隐含层输出矩
9、阵;Y 为输出矩阵;为隐含层到输出层的连接权值矩阵。求解式(1)的最小二乘解:minHY (2)解出=H+Y。H+为隐含层输出矩阵的摩尔彭罗斯广义逆矩阵。1.2.2 改进的极限学习机ELM 在训练的过程中只考虑经验风险最小化,即 ELM中存在的不适定问题10。如果不加以解决,在输入矩阵不是列满秩时,ELM 的稳定性将会大大降低。为了解决 ELM 的系统性风险,且保证数据间的流形关系,引入流形正则化概念。流形正则化目的是让原空间相似的两组数据在投影到新的空间时也能保留有原空间特征。即考虑到了每个数据样本的特征,使得相似的数据样本间的距离尽可能小于不相似的数据样本11。有效保证了数据样本的局部流行
10、结构的同时,提高了系统的稳定性。流形正则化最终可以在其要求的成本函数下将计算简化为最小化下面的目标函数:():Tmin tr Y LY (3)式中:tr(*)表示矩阵的迹;Y 为训练集的输出矩阵;L 是一个图拉普拉斯矩阵,上述公式的具体推导过程以及 L 的求解方法可参考文献 12。流形正则化系数加入 ELM 的目标函数后公式如下:(4)式中:C1为解决不适定问题的正则化参数,C2为流形正则化参数,引入后的输出权值 的计算公式为:(5)从公式(5)中可以看出,正则化参数 C1以及流行正则化参数 C2在输出权值 的求解过程中占有十分重要的地位,其参数的取值可以直接决定极限学习机预测的准确性与稳定性
11、。常见的取值方法有网格搜索法、智能算法参数寻优法等,本文选择网格搜索法寻找最优的正则化参数 C1以及流行正则化参数 C2。1.3 VMD-IELM 水质组合预测模型的一般流程(1)获取二河水质 DO 值的时序数据,对数据中的异常值与缺失值进行处理,将处理好的水质数据使用 VMD 算法进行数据解耦,将解耦出来的分量悉数保存。对每个分量进行分布式取值,每 10 个数据作为一组,构建多个序列,也就是使用前 9 周的值预测第十周的值。(2)对每个分量构建的数据集,均采用相同的训练集与测试集划分方法,设定好 IELM 的各项参数。(3)将各分量的预测结果叠加,作为 VMD-IELM 组合模型预测结果。2
12、 二河水质 DO 值的组合模型预测2.1 水质数据处理数据集使用淮安市生态环境局提供的 2010 年第 1 周至2020 年第 50 周共 537 周的水质 DO 数据。利用箱线图的方法找出水质 DO 值数据集中的异常值。利用公式(6)对异常值和缺失值进行修复。112+=aaaxxx (6)式中,xa为第a周缺失数据,xa-1与xa+1为xa前后两个周的数据。如果需要修复的数据连续分布,为了保证数据的完整性与科学性,基于相似日的方法13,通过气象网站查询当天的历史天气数据,在已有数据的日期中寻找与缺省值当日相似的天气数据,并以该天的数据作为最终的修复值进行填补。利用 VMD 对二河的 DO 数
13、据进行分解,首先确定 VMD算法的 K 值,根据 1.1 提供的步骤确定 VMD 算法的 K 值为5。将 VMD 算法的惩罚因子设为 1500,噪声容限度 为 0.1,收敛精度 为 10-7,其余参数均取默认值。VMD 算法对二河DO 序列进行分解的结果如图 2 所示。图 2 VMD 算法二河 DO 序列分解结果图2023 年第 7 期140计算机应用信息技术与信息化由图 2 可知,二河的 DO 序列被分解成 5 个分量,其中,IMF1 与 IMF2 频率最低,从中可以看出二河 DO 值的总体趋势,因此可以称之为趋势分量。IMF3 与 IMF4 可以看出 DO值变化的细节,可以称之为细节分量。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 VMD IELM 淮安市 二河溶氧量 预测 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。