基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf
《基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf》由会员分享,可在线阅读,更多相关《基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf(7页珍藏版)》请在咨信网上搜索。
1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1394-1400ISSN 1001-9081CODEN JYIIDUhttp:/基于烛台图模式匹配的PM2.5扩散特征的提取许睿1,梁爽1,万航2*,文益民1,沈世铭3,李建1(1.桂林电子科技大学 计算机与信息安全学院,广西 桂林 541004;2.南方海洋科学与工程广东省实验室(广州),广州 511458;3.卫星导航定位与位置服务国家地方联合工程研究中心(桂林电子科技大学),广西 桂林 541004)(通信作者电子邮箱)摘要:现有大气质量预测方法多基于单纯的时间序列数据
2、进行趋势预测,忽略了污染物传输和扩散规律及其分类间模式特征的问题。为此,提出一种基于烛台图模式匹配(CPM)的PM2.5(大气细颗粒物污染)扩散特征提取方法。首先,利用基于卷积神经网络(CNN)的卷积思想从大量历史PM2.5序列中生成基础周期烛台图;然后,通过距离公式对不同烛台图特征向量的浓度模式进行聚类分析;最后,结合CNN在图像识别中的独特优势,形成融合图形特征与时序特征序列的混合模型,判断带有反转信号的烛台图将导致的趋势反转情况。在桂林市大气质量在线监测站的监测时序数据集上的实验结果表明,与使用单一时间序列数据的深度卷积神经网络VGG(Visual Geometry Group)相比,基
3、于CPM的提取方法准确率提升了1.9个百分点。可见,基于CPM的方法能有效提取PM2.5趋势特征,可以用于预测未来污染物浓度周期变化。关键词:大气污染现象;烛台图理论;模式匹配;卷积神经网络;PM2.5中图分类号:TP391.4 文献标志码:AExtraction of PM2.5 diffusion characteristics based on candlestick pattern matchingXU Rui1,LIANG Shuang1,WAN Hang2*,WEN Yimin1,SHEN Shiming3,LI Jian1(1.College of Computer and In
4、formation Security,Guilin University of Electronic Technology,Guilin Guangxi 541004,China;2.Southern Marine Science and Engineering Guangdong Laboratory(Guangzhou),Guangzhou Guangdong 511458,China;3.Satellite Navigation Positioning and Location Service National and Local Joint Engineering Research C
5、enter(Guilin University of Electronic Technology),Guilin Guangxi 541004,China)Abstract:Most existing air quality prediction methods focus on simple time series data for trend prediction,and ignore the pollutant transport and diffusion laws and corresponding classified pattern features.In order to so
6、lve the above problem,a PM2.5 diffusion characteristic extraction method based on Candlestick Pattern Matching(CPM)was proposed.Firstly,the basic periodic candlestick charts from a large number of historical PM2.5 sequences were generated by using the convolution idea of Convolutional Neural Network
7、(CNN).Then,the concentration patterns of different candlestick chart feature vectors were clustered and analyzed by using the distance formula.Finally,combining the unique advantages of CNN in image recognition,a hybrid model integrating graphical features and time series features sequences was form
8、ed,and the trend reversal that would be caused by candlestick charts with reversal signals was judged.Experimental results on the monitoring time series dataset of Guilin air quality online monitoring stations show that compared with the VGG(Visual Geometry Group)-based method which uses the single
9、time series data,the accuracy of the CPM-based method is improved by 1.9 percentage points.It can be seen that the CPM-based method can effectively extract the trend features of PM2.5 and be used for predicting the periodic change of pollutant concentration in the future.Key words:air pollution phen
10、omenon;candlestick chart theory;pattern matching;Convolutional Neural Network(CNN);PM2.50 引言 实现经济和环境协同发展已经成为全球关注的热点,而大气环境污染是目前主要的环境问题之一。造成环境污染的细颗粒物种类众多,主要包括氮氧化物、硫氧化物、臭氧、文章编号:1001-9081(2023)05-1394-07DOI:10.11772/j.issn.1001-9081.2022030437收稿日期:2022-04-06;修回日期:2022-06-02;录用日期:2022-06-15。基金项目:广西自然科学基金
11、资助项目(2021JJA170096);广西重点研发计划项目(AB21196063);桂林市重大成果转化基金资助项目(20192013-1);桂林电子科技大学大学生创新创业训练计划项目(202010595031)。作者简介:许睿(1977),男,四川成都人,副教授,博士,CCF会员,主要研究方向:人工智能、深度学习与环境大数据、环境监测仪器仪表、环境遥感与地理信息系统;梁爽(1994),女,天津人,硕士研究生,CCF会员,主要研究方向:环境预测、深度学习与环境大数据;万航(1989),男,广东广州人,助理研究员,博士,CCF会员,主要研究方向:深度学习与环境大数据;文益民(1969),男,湖南
12、益阳人,教授,博士,CCF会员,主要研究方向:机器学习与数据挖掘、推荐系统、计算机视觉、大数据分析、人工智能安全、媒体分析;沈世铭(1985),男,广西桂林人,助理研究员,硕士,CCF会员,主要研究方向:环境大数据分析;李建(1991),男,山西长治人,助理研究员,硕士,CCF会员,主要研究方向:深度学习与环境遥感。第 5 期许睿等:基于烛台图模式匹配的PM2.5扩散特征的提取一氧化碳等。大气污染物浓度监测是环境治理的一个重要手段,不仅可以识别大气中的污染物质,还能掌握其分布和扩散规律,监视大气污染源的排放和控制情况。大气污染物浓度预测方法特点对比如表 1所示。在众多的污染物浓度预测方法中,基
13、于深度学习的方法以其学习能力强、适应性强、可移植性好以及准确率高等特点被广泛应用。本文考虑结合股票预测中广泛使用的K线图技术分析方法,充分挖掘PM2.5(大气细颗粒物污染)浓度扩散数据,以有效提取大气污染物扩散过程特征。本文提出了一种基于烛台图(Candlestick Chart,也称作K 线图)表示的卷积神经网络(Convolutional Neural Network,CNN)提取大气污染数值序列特征基于烛台图模式匹配(Candlestick Pattern Matching,CPM)的PM2.5扩散特征提取方法,通过聚类分析网络中烛台图的特征判断将会发生的趋势反转情况。烛台图被广泛应用在
14、股票市场用来记录和预测价格走势,烛台图分析技术的使用解决了非线性数据庞大无章的问题,同时保留了数据的语义关系。本文在引入烛台图的基础上,使用在深度学习领域广泛应用的 VGG(Visual Geometry Group)网络提取污染物浓度变化特征,并对最终走势进行预测。实验结果表明:本文的预测方法可以有效提取PM2.5趋势特征,验证了基于 CPM 的方法在预测未来污染物浓度周期变化时的有效性。1 相关工作 随着当今世界经济的发展,人们对环境污染的问题也越来越重视,PM2.5已成为大气污染与扩散领域的重点研究对象。一个旨在预测空气质量变化的模型,不仅要充分考虑多种复杂因素的影响,如气候、交通、地形
15、地貌、理化过程等,还需要充分保护数据的原始性,并考虑污染物浓度扩散的全局趋势以及局部变化特征。因此,将单纯时序数据与大气污染物扩散过程相对应,充分提取变化特征的研究具备实用性和学术价值。目前针对污染物浓度数据的分析中,利用传统的物理模型以及人工神经网络等各类方法对空气质量指标未来走势进行分析是大气环境监测领域的一个重要方向。例如,Zhang等1全面评估了具有在线耦合气象-化学的三维实时空气质量预测(3-D Real-Time Air Quality Forecasting,3-D RT-AQF)模型;李威凌等2分别采用高斯模型和空间插值法对空间扩散情况进行模拟;Sun等3提出了一种混合深度空气
16、 质 量 预 测 模 型(Mixing Depth Air Quality Prediction,HDAQP)来预测空气质量指标。现在基于人工神经网络的预测方法中,普遍集中在将初始处理的数据预处理成各种维度的数据向量后作为神经网络的输入样本。这些方法在对初始数据进行处理,或对输入数据的维度进行确定时,都对最原始的数据进行了改变和筛选,限定了原始数据呈现特征的形式,可能损失很多隐藏信息。在众多的数据分析方法中,烛台图被认为是能够最好保存时序数据指标的一种形式,烛台图模式对应数据走势中的浓度变化。例如,Takeuchi等4设计了改良的K线;Li等5将压力模式定义为一系列烛台图;魏连江等6从K线图角
17、度对瓦斯异常模式进行研究。但是,K线图对各类纷繁复杂的分析规则的应用主要依赖分析者个人的经验,因此利用科学统计的方法真正抓住K线图中预测涨跌的特征信号显得尤为重要。随着深度学习研究的日益发展,CNN在图片识别领域的应用取得了巨大成就。例如,Hu等7将深度学习方法(卷积自动编码器)与 K 线图分析技术相结合并应用在股票分析中;Chen 等8使 用 CNN 和 格 拉 姆 角 场(Gramian Angular Field,GAF)图像捕获了 8种主要的烛台形式;Huang等9通过阅读烛台图表而不是财务报告中的数值来预测价格走势;张智军等10则将含有需要识别的金融K线形态图像和该形态对应的坐标作为
18、神经网络的输入。通过深度学习算法在K线形态图像识别的应用,不仅克服了现有时间序列数据量化程序难以表达分析师根据经验得到的K线形态特征的问题,还能自主学习那些需要被识别的K线形态后再用于包含K线形态特征的实时图像识别中。在将神经网络应用于大气质量预测时,现有研究多集中于采集监测站中各种维度和各种频率的数据,然后进行插值和剔除等预处理,之后再输入到深度神经网络进行学习训练11,但少有方法能将原始数据不经破坏地保留下来。部分学者已经尝试在各个领域将图像分析方法和人工神经网络相结合,但还未单独考虑神经网络对于烛台图的识别分类问题12-14,没有将此技术分析方法应用到大气环境领域。因此,本文将K线分析技
19、术与CNN相结合,探讨由PM2.5生成的烛台图所包含的可以预测未来浓度变化的信息。2 研究区概况 污染物浓度序列种类繁多,具有动态、非线性、混乱等特点,是大气环境技术分析与量化投资领域的重要研究内容。从海量的历史污染物时间序列数据中,表征并捕获某种特征的扩散过程,是构建神经网络模型的基础15-17。本次研究采用桂林市大气质量在线监测站的监测数据,如图1所示。桂林地处中国华南,由于桂林特有的气象和地形条件,市区PM2.5扩散十分缓慢。烛台图的生成需要泄放时间较长的连续泄漏型数据,这使K线图像分析技术在大气环境领域的应用变得合理。这种泄放时间较长的连续型数据恰好利于烛台图的生成以及变化特征的提取,
20、为后续大气污染物浓度的预测提供数据基础。本文结合在股票价格预测中广泛使用的分析方法与深度学习技术来预测PM2.5在桂林市的浓度水平变化。在传统的烛台图表分析中,总会根据一些特殊烛台图表或趋势反转信号的出现来判断趋势变化。然而,不同的站点会有不同的浓度变化机制,当带有趋势反转信号的烛台图出现时,当前污染物的浓度变化将会继续或是反转,这取决于站点对污染表1大气污染物浓度预测方法特性对比Tab.1Comparison of characteristics of air pollutant concentration prediction methods预测方法基于物理模型的方法基于机器学习的方法基于
21、深度学习的方法基于组合模型的方法资源使用高高一般一般复杂度高高一般一般预测精度低一般高更高1395第 43 卷计算机应用物浓度的扩散模式18-20。因此,需要找出污染物浓度的扩散模式,以帮助预测具体的浓度改变数值。3 理论基础与模型构建 3.1模型框架在烛台图聚类分析和污染物浓度扩散机制相互联系的基础上,基于烛台图模式匹配(CPM)的大气质量预测框架如图 2所示,主要流程包括数据采集与预处理、特征提取与烛台图生成、模式匹配、趋势预测和结果分析。3.2烛台图库的生成PM2.5浓 度 K 线 图 中 主 要 包 括 4 类 数 据,即 起 始 值(First)、最高值(Highest)、最低值(L
22、owest)、结束值(Last)。PM2.5浓度扩散规律也是围绕这 4个数据进行研究。图 3中展示了污染物1天内的变化信息,以及PM2.5浓度的烛台图对应过程。为了建立一个明确的参考模型用于对未来模式研究进行合理分类,Hu 等21提出了 103 个已知烛台图案的综合形式规范。根据绘图规则,两种基本的烛台形状如图 4所示,所有可能存在烛台图的形状如图5。3.3大气污染扩散过程特征提取每一天内的浓度波动信息都通过5个基本特征来描述,将污染物浓度扩散过程定义为一系列的烛台图表,然后进行浓度匹配,预测当前污染物趋势发生逆转还是保持不变。3.3.1浓度烛台图的特征描述污染物浓度烛台图特征向量表示为:PC
23、Fi=fij|i=1,2,K,j=1,2,5(1)通过从烛台图中提取 5 个不同且有实际意义的特征fi1,fi2,fi5来反映 1 天内整体的浓度情况,分别对应以下特征:1)类别特征(Category Shape):通过区分浓度的升降、实体的有无、上下影线的有无,烛台图被定义为12种不同的形状,类别特征表示为CShape 1,2,12。2)实体特征(Entity Features Length):在烛台图中,实体的长短表征着污染物浓度上升/下降的强度,较长实体的烛台表征明显的增加/减少的趋势。实体特征的计算方法为:E=|Openi-Closei(2)其中:Openi为第i天起始浓度值,Clos
24、ei为第i天结束浓度值。3)上影线特征(Upper Hatch Feature Length):具有较长上影线的浓度烛台图表示浓度趋势下降的幅度很明显,甚至在下一个时间间隔内,持续下降的可能性更大。上影线的计算方法为:UpLEN=Highi-max(Openi,Closei)(3)其中:Highi为第i天最高浓度值。4)下影线特征(Undercut Feature Length):具有较长下影线的浓度烛台图表示浓度趋势上升的信号很强烈,这将导致图1桂林市大气质量在线监测站分布Fig.1Distribution of air quality online monitoring stations
25、in Guilin图2基于CPM的大气质量预测框架Fig.2Air quality prediction framework based on CPM图31天中PM2.5浓度变化与对应的烛台图Fig.3Candlestick chart corresponding to PM2.5 concentration change in one day图4两种基本的浓度烛台图形状Fig.4Two basic concentration candlestick charts图512种类别烛台图Fig.5Twelve types of candlestick charts1396第 5 期许睿等:基于烛台
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 烛台 模式 匹配 PM_ 2.5 扩散 特征 提取 许睿
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。