欢迎来到咨信网! | 成为共赢成为共赢 咨信网助力知识提升 | 自信网络旗下运营:咨信网 自信AI创作助手 自信AI导航
咨信网
全部分类
  • 包罗万象   教育专区 >
  • 品牌综合   考试专区 >
  • 管理财经   行业资料 >
  • 环境建筑   通信科技 >
  • 法律文献   文学艺术 >
  • 学术论文   百科休闲 >
  • 应用文书   研究报告 >
  • ImageVerifierCode 换一换
    首页 咨信网 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf

    • 资源ID:274637       资源大小:2.02MB        全文页数:7页
    • 资源格式: PDF        下载积分:10金币
    微信登录下载
    验证码下载 游客一键下载
    账号登录下载
    三方登录下载: QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    验证码: 获取验证码
    温馨提示:
    支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    开通VIP
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    声明    |    会员权益      获赠5币      写作写作
    1、填表:    下载求助     索取发票    退款申请
    2、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    3、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    4、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    5、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
    6、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    7、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。

    基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf

    1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1394-1400ISSN 1001-9081CODEN JYIIDUhttp:/基于烛台图模式匹配的PM2.5扩散特征的提取许睿1,梁爽1,万航2*,文益民1,沈世铭3,李建1(1.桂林电子科技大学 计算机与信息安全学院,广西 桂林 541004;2.南方海洋科学与工程广东省实验室(广州),广州 511458;3.卫星导航定位与位置服务国家地方联合工程研究中心(桂林电子科技大学),广西 桂林 541004)(通信作者电子邮箱)摘要:现有大气质量预测方法多基于单纯的时间序列数据

    2、进行趋势预测,忽略了污染物传输和扩散规律及其分类间模式特征的问题。为此,提出一种基于烛台图模式匹配(CPM)的PM2.5(大气细颗粒物污染)扩散特征提取方法。首先,利用基于卷积神经网络(CNN)的卷积思想从大量历史PM2.5序列中生成基础周期烛台图;然后,通过距离公式对不同烛台图特征向量的浓度模式进行聚类分析;最后,结合CNN在图像识别中的独特优势,形成融合图形特征与时序特征序列的混合模型,判断带有反转信号的烛台图将导致的趋势反转情况。在桂林市大气质量在线监测站的监测时序数据集上的实验结果表明,与使用单一时间序列数据的深度卷积神经网络VGG(Visual Geometry Group)相比,基

    3、于CPM的提取方法准确率提升了1.9个百分点。可见,基于CPM的方法能有效提取PM2.5趋势特征,可以用于预测未来污染物浓度周期变化。关键词:大气污染现象;烛台图理论;模式匹配;卷积神经网络;PM2.5中图分类号:TP391.4 文献标志码:AExtraction of PM2.5 diffusion characteristics based on candlestick pattern matchingXU Rui1,LIANG Shuang1,WAN Hang2*,WEN Yimin1,SHEN Shiming3,LI Jian1(1.College of Computer and In

    4、formation Security,Guilin University of Electronic Technology,Guilin Guangxi 541004,China;2.Southern Marine Science and Engineering Guangdong Laboratory(Guangzhou),Guangzhou Guangdong 511458,China;3.Satellite Navigation Positioning and Location Service National and Local Joint Engineering Research C

    5、enter(Guilin University of Electronic Technology),Guilin Guangxi 541004,China)Abstract:Most existing air quality prediction methods focus on simple time series data for trend prediction,and ignore the pollutant transport and diffusion laws and corresponding classified pattern features.In order to so

    6、lve the above problem,a PM2.5 diffusion characteristic extraction method based on Candlestick Pattern Matching(CPM)was proposed.Firstly,the basic periodic candlestick charts from a large number of historical PM2.5 sequences were generated by using the convolution idea of Convolutional Neural Network

    7、(CNN).Then,the concentration patterns of different candlestick chart feature vectors were clustered and analyzed by using the distance formula.Finally,combining the unique advantages of CNN in image recognition,a hybrid model integrating graphical features and time series features sequences was form

    8、ed,and the trend reversal that would be caused by candlestick charts with reversal signals was judged.Experimental results on the monitoring time series dataset of Guilin air quality online monitoring stations show that compared with the VGG(Visual Geometry Group)-based method which uses the single

    9、time series data,the accuracy of the CPM-based method is improved by 1.9 percentage points.It can be seen that the CPM-based method can effectively extract the trend features of PM2.5 and be used for predicting the periodic change of pollutant concentration in the future.Key words:air pollution phen

    10、omenon;candlestick chart theory;pattern matching;Convolutional Neural Network(CNN);PM2.50 引言 实现经济和环境协同发展已经成为全球关注的热点,而大气环境污染是目前主要的环境问题之一。造成环境污染的细颗粒物种类众多,主要包括氮氧化物、硫氧化物、臭氧、文章编号:1001-9081(2023)05-1394-07DOI:10.11772/j.issn.1001-9081.2022030437收稿日期:2022-04-06;修回日期:2022-06-02;录用日期:2022-06-15。基金项目:广西自然科学基金

    11、资助项目(2021JJA170096);广西重点研发计划项目(AB21196063);桂林市重大成果转化基金资助项目(20192013-1);桂林电子科技大学大学生创新创业训练计划项目(202010595031)。作者简介:许睿(1977),男,四川成都人,副教授,博士,CCF会员,主要研究方向:人工智能、深度学习与环境大数据、环境监测仪器仪表、环境遥感与地理信息系统;梁爽(1994),女,天津人,硕士研究生,CCF会员,主要研究方向:环境预测、深度学习与环境大数据;万航(1989),男,广东广州人,助理研究员,博士,CCF会员,主要研究方向:深度学习与环境大数据;文益民(1969),男,湖南

    12、益阳人,教授,博士,CCF会员,主要研究方向:机器学习与数据挖掘、推荐系统、计算机视觉、大数据分析、人工智能安全、媒体分析;沈世铭(1985),男,广西桂林人,助理研究员,硕士,CCF会员,主要研究方向:环境大数据分析;李建(1991),男,山西长治人,助理研究员,硕士,CCF会员,主要研究方向:深度学习与环境遥感。第 5 期许睿等:基于烛台图模式匹配的PM2.5扩散特征的提取一氧化碳等。大气污染物浓度监测是环境治理的一个重要手段,不仅可以识别大气中的污染物质,还能掌握其分布和扩散规律,监视大气污染源的排放和控制情况。大气污染物浓度预测方法特点对比如表 1所示。在众多的污染物浓度预测方法中,基

    13、于深度学习的方法以其学习能力强、适应性强、可移植性好以及准确率高等特点被广泛应用。本文考虑结合股票预测中广泛使用的K线图技术分析方法,充分挖掘PM2.5(大气细颗粒物污染)浓度扩散数据,以有效提取大气污染物扩散过程特征。本文提出了一种基于烛台图(Candlestick Chart,也称作K 线图)表示的卷积神经网络(Convolutional Neural Network,CNN)提取大气污染数值序列特征基于烛台图模式匹配(Candlestick Pattern Matching,CPM)的PM2.5扩散特征提取方法,通过聚类分析网络中烛台图的特征判断将会发生的趋势反转情况。烛台图被广泛应用在

    14、股票市场用来记录和预测价格走势,烛台图分析技术的使用解决了非线性数据庞大无章的问题,同时保留了数据的语义关系。本文在引入烛台图的基础上,使用在深度学习领域广泛应用的 VGG(Visual Geometry Group)网络提取污染物浓度变化特征,并对最终走势进行预测。实验结果表明:本文的预测方法可以有效提取PM2.5趋势特征,验证了基于 CPM 的方法在预测未来污染物浓度周期变化时的有效性。1 相关工作 随着当今世界经济的发展,人们对环境污染的问题也越来越重视,PM2.5已成为大气污染与扩散领域的重点研究对象。一个旨在预测空气质量变化的模型,不仅要充分考虑多种复杂因素的影响,如气候、交通、地形

    15、地貌、理化过程等,还需要充分保护数据的原始性,并考虑污染物浓度扩散的全局趋势以及局部变化特征。因此,将单纯时序数据与大气污染物扩散过程相对应,充分提取变化特征的研究具备实用性和学术价值。目前针对污染物浓度数据的分析中,利用传统的物理模型以及人工神经网络等各类方法对空气质量指标未来走势进行分析是大气环境监测领域的一个重要方向。例如,Zhang等1全面评估了具有在线耦合气象-化学的三维实时空气质量预测(3-D Real-Time Air Quality Forecasting,3-D RT-AQF)模型;李威凌等2分别采用高斯模型和空间插值法对空间扩散情况进行模拟;Sun等3提出了一种混合深度空气

    16、 质 量 预 测 模 型(Mixing Depth Air Quality Prediction,HDAQP)来预测空气质量指标。现在基于人工神经网络的预测方法中,普遍集中在将初始处理的数据预处理成各种维度的数据向量后作为神经网络的输入样本。这些方法在对初始数据进行处理,或对输入数据的维度进行确定时,都对最原始的数据进行了改变和筛选,限定了原始数据呈现特征的形式,可能损失很多隐藏信息。在众多的数据分析方法中,烛台图被认为是能够最好保存时序数据指标的一种形式,烛台图模式对应数据走势中的浓度变化。例如,Takeuchi等4设计了改良的K线;Li等5将压力模式定义为一系列烛台图;魏连江等6从K线图角

    17、度对瓦斯异常模式进行研究。但是,K线图对各类纷繁复杂的分析规则的应用主要依赖分析者个人的经验,因此利用科学统计的方法真正抓住K线图中预测涨跌的特征信号显得尤为重要。随着深度学习研究的日益发展,CNN在图片识别领域的应用取得了巨大成就。例如,Hu等7将深度学习方法(卷积自动编码器)与 K 线图分析技术相结合并应用在股票分析中;Chen 等8使 用 CNN 和 格 拉 姆 角 场(Gramian Angular Field,GAF)图像捕获了 8种主要的烛台形式;Huang等9通过阅读烛台图表而不是财务报告中的数值来预测价格走势;张智军等10则将含有需要识别的金融K线形态图像和该形态对应的坐标作为

    18、神经网络的输入。通过深度学习算法在K线形态图像识别的应用,不仅克服了现有时间序列数据量化程序难以表达分析师根据经验得到的K线形态特征的问题,还能自主学习那些需要被识别的K线形态后再用于包含K线形态特征的实时图像识别中。在将神经网络应用于大气质量预测时,现有研究多集中于采集监测站中各种维度和各种频率的数据,然后进行插值和剔除等预处理,之后再输入到深度神经网络进行学习训练11,但少有方法能将原始数据不经破坏地保留下来。部分学者已经尝试在各个领域将图像分析方法和人工神经网络相结合,但还未单独考虑神经网络对于烛台图的识别分类问题12-14,没有将此技术分析方法应用到大气环境领域。因此,本文将K线分析技

    19、术与CNN相结合,探讨由PM2.5生成的烛台图所包含的可以预测未来浓度变化的信息。2 研究区概况 污染物浓度序列种类繁多,具有动态、非线性、混乱等特点,是大气环境技术分析与量化投资领域的重要研究内容。从海量的历史污染物时间序列数据中,表征并捕获某种特征的扩散过程,是构建神经网络模型的基础15-17。本次研究采用桂林市大气质量在线监测站的监测数据,如图1所示。桂林地处中国华南,由于桂林特有的气象和地形条件,市区PM2.5扩散十分缓慢。烛台图的生成需要泄放时间较长的连续泄漏型数据,这使K线图像分析技术在大气环境领域的应用变得合理。这种泄放时间较长的连续型数据恰好利于烛台图的生成以及变化特征的提取,

    20、为后续大气污染物浓度的预测提供数据基础。本文结合在股票价格预测中广泛使用的分析方法与深度学习技术来预测PM2.5在桂林市的浓度水平变化。在传统的烛台图表分析中,总会根据一些特殊烛台图表或趋势反转信号的出现来判断趋势变化。然而,不同的站点会有不同的浓度变化机制,当带有趋势反转信号的烛台图出现时,当前污染物的浓度变化将会继续或是反转,这取决于站点对污染表1大气污染物浓度预测方法特性对比Tab.1Comparison of characteristics of air pollutant concentration prediction methods预测方法基于物理模型的方法基于机器学习的方法基于

    21、深度学习的方法基于组合模型的方法资源使用高高一般一般复杂度高高一般一般预测精度低一般高更高1395第 43 卷计算机应用物浓度的扩散模式18-20。因此,需要找出污染物浓度的扩散模式,以帮助预测具体的浓度改变数值。3 理论基础与模型构建 3.1模型框架在烛台图聚类分析和污染物浓度扩散机制相互联系的基础上,基于烛台图模式匹配(CPM)的大气质量预测框架如图 2所示,主要流程包括数据采集与预处理、特征提取与烛台图生成、模式匹配、趋势预测和结果分析。3.2烛台图库的生成PM2.5浓 度 K 线 图 中 主 要 包 括 4 类 数 据,即 起 始 值(First)、最高值(Highest)、最低值(L

    22、owest)、结束值(Last)。PM2.5浓度扩散规律也是围绕这 4个数据进行研究。图 3中展示了污染物1天内的变化信息,以及PM2.5浓度的烛台图对应过程。为了建立一个明确的参考模型用于对未来模式研究进行合理分类,Hu 等21提出了 103 个已知烛台图案的综合形式规范。根据绘图规则,两种基本的烛台形状如图 4所示,所有可能存在烛台图的形状如图5。3.3大气污染扩散过程特征提取每一天内的浓度波动信息都通过5个基本特征来描述,将污染物浓度扩散过程定义为一系列的烛台图表,然后进行浓度匹配,预测当前污染物趋势发生逆转还是保持不变。3.3.1浓度烛台图的特征描述污染物浓度烛台图特征向量表示为:PC

    23、Fi=fij|i=1,2,K,j=1,2,5(1)通过从烛台图中提取 5 个不同且有实际意义的特征fi1,fi2,fi5来反映 1 天内整体的浓度情况,分别对应以下特征:1)类别特征(Category Shape):通过区分浓度的升降、实体的有无、上下影线的有无,烛台图被定义为12种不同的形状,类别特征表示为CShape 1,2,12。2)实体特征(Entity Features Length):在烛台图中,实体的长短表征着污染物浓度上升/下降的强度,较长实体的烛台表征明显的增加/减少的趋势。实体特征的计算方法为:E=|Openi-Closei(2)其中:Openi为第i天起始浓度值,Clos

    24、ei为第i天结束浓度值。3)上影线特征(Upper Hatch Feature Length):具有较长上影线的浓度烛台图表示浓度趋势下降的幅度很明显,甚至在下一个时间间隔内,持续下降的可能性更大。上影线的计算方法为:UpLEN=Highi-max(Openi,Closei)(3)其中:Highi为第i天最高浓度值。4)下影线特征(Undercut Feature Length):具有较长下影线的浓度烛台图表示浓度趋势上升的信号很强烈,这将导致图1桂林市大气质量在线监测站分布Fig.1Distribution of air quality online monitoring stations

    25、in Guilin图2基于CPM的大气质量预测框架Fig.2Air quality prediction framework based on CPM图31天中PM2.5浓度变化与对应的烛台图Fig.3Candlestick chart corresponding to PM2.5 concentration change in one day图4两种基本的浓度烛台图形状Fig.4Two basic concentration candlestick charts图512种类别烛台图Fig.5Twelve types of candlestick charts1396第 5 期许睿等:基于烛台

    26、图模式匹配的PM2.5扩散特征的提取下一个时间点浓度的增加。下影线的计算公式为:UndLEN=min(Openi,Closei)-Lowi(4)其中:Lowi为第i天最低浓度值。5)变化率特征(Rate Change):比较两个相邻位置的烛台图,计算出平均浓度变化趋势的信息,来锁定对当前时刻有用的污染物浓度模式。在一天当中,整体的浓度水平用平均浓度变化来表征,并以此作为浓度烛台的中心。此项特征将通过当天与前一天的浓度水平变化来描述,即:RChange=AVGi-AVGi-1(5)通过提取带有浓度变化趋势的烛台图模式特征,捕捉出反转信号。如图6展示了一些带有浓度反转信号的烛台图,表征趋势的转折点

    27、,当过去几天出现连续的浓度增加,而这种信号减少的烛台图出现时,预示未来浓度可能会降低。其中,浓度递减烛台图(14)和具有长上影线的烛台图(5、6)代表具有递减反转信号的烛台图。此外,那些不具备实体的特殊形状的烛台图(79)也可被看作是可能存在的转折点。同样,带有递增反转信号的烛台图特征也是如此。3.3.2污染物浓度模式匹配1)浓度增加/减小周期:在连续的时间间隔t1,t2,tn,当i=2,3,n-1时,如 果 满 足Ci,avg max(Ci-1,avg,Ci+1,avg),则Ci,avg是浓度周期的峰值;当i=2,3,n-1时,如果满足Ci,avg min(Ci-1,avg,Ci+1,avg

    28、),则Ci,avg是浓度周期的谷值。比如,Ci1,avg、Ci3,avg是两个最近相邻的浓度谷值,Ci2,avg是两者之间的浓度峰值,并且i1 i2 i3,则浓度谷值Ci1,avg和下一个浓度峰值Ci2,avg之间的连续时间间隔被视为浓度增加周期,浓度谷值Ci2,avg和下一个浓度峰值Ci3,avg之间的连续时间间隔被视为浓度减小周期。2)浓度模式:浓度模式是由浓度烛台图特征向量PCFi组成的序列,即M=PCF1,PCF2,PCFK,在每个浓度增加或减少的周期中,K是浓度周期的长度。鉴于最近的烛台图能够对未来预测提供更有用的信息,按照从后向前的顺序进行匹配。定义匹配率,指 K 组特征中有 组参

    29、数能够完成匹配,并通过距离衡量两个烛台的特征向量的匹配率。如果匹配距离低于某一个阈值,则认为匹配成功。距离公式定义为:D()PCFi,PCFi=j=15wjD()fij,fij;|D()fi1,fi1=1,fi1 fi10,fi1=fi1D()fij,fij=|fij-fij;j=2,3,4,5(6)其中:wi(i=1,2,5)是权重因子,j=15wj=1。本文方法的权重采用层次分析(Analytic Hierarchy Process,AHP)算法确定。距离当前天数最近的烛台图能够描述更加有用的信息,因此对应的权重w1将被赋予最高的数值。对于类别特征CShape,要求匹配的准确率最高。针对实

    30、体、上影线、下影线、变化率四个特征,本文采用Z-score标准化对原始监测数据进行归一化处理,以加快深度学习模型的收敛。3.4卷积神经网络模型的设计3.4.1网络模型的结构在图像识别和分类领域,广泛使用CNN处理实际问题。CNN因具有极小的特征工程需求而被广泛应用,这为深度学习在大气质量领域的合理应用提供了技术支持。深度卷积神经网络 VGG(Visual Geometry Group)是 CNN 的经典模型,在特征提取和分类方面均表现优秀22-24。基于VGG的浓度趋势预测框架如图 7所示。污染过程的局部特征由卷积层提取,对应大气污染物扩散过程。即第一天污染将对第二天和第三天污染造成的影响,此

    31、类模式的特征被卷积层捕获;池化层进一步加强统计特征层的信息,使网络强特征表现更明显,弱特征作用相对较小。污染过程的全局趋势信息由全连接层进行整合,能提高预测大气污染变化趋势的准确性。如图7所示,将连续3天的PM2.5浓度数据通过K线发生器生成污染物烛台图,然后通过模式匹配,输入VGG网络结构中。最后,综合评估了网络的效果和可用的计算机硬件条件,确定用以下CNN结构进行研究:第一个卷积层设计32个卷积核,第二个卷积层设计32个卷积核,第三个卷积层设计16个卷积核,卷积核大小为33。在 该 网 络 模 型 中,激 活 函 数 都 采 用 线 性 整 流 单 元(Rectified Linear U

    32、nit,ReLU),ReLU的使用不仅可以解决梯度消失的现象,还可以有效加速模型的训练。通过max()函数描述 ReLU的过程,并加入 Dropout层,以随机断开链接的方式防止模型过拟合。还在模型的最后一个卷积层加入Flatten层,将多维数据压缩成一维。3.4.2网络模型的训练准备本文设置批次大小batch_size=200,即每输入200张图片训练后,网络进行权重校正并完成参数迭代。在前面设计的CNN预训练期间,79次的训练可以使神经网络达到最好收敛状态,因此在所有对比实验中设置epochs=10。图6浓度增加/减少过程中可能存在转折点的PM2.5烛台图Fig.6PM2.5 candle

    33、stick charts with possible turning points in concentration increasing/decreasing process1397第 43 卷计算机应用4 实验与结果分析 4.1数据收集及预处理4.1.1数据收集本次研究采用桂林市大气质量在线监测站的监测数据,桂林市总共配有 61个监测站负责监控大气环境质量,其中10个是固定站,51个为微型站。数据库中存储的数据通过服务设备每5 min记录一次相应站点对应的污染物和气象数据。其中,气象数据有大气的气压、降雨量、风速、风向、湿度、温度等;污染物浓度数据包括 NO2、SO2、CO、O3、PM2.

    34、5、PM10等。数据时间窗口选择自2019年8月8日2021年8月7日,共计3年的日污染物浓度数据。本次实验通过Hadoop引擎连接大数据系统,导出研究所用数据集。4.1.2数据预处理数据的预处理分为两部分:首先是对数据集的基本面预处理,然后是对数据进行初始分类,包括极端值或缺失值处理、Z-score标准化处理等。为避免因不同站点的污染物浓度数据差异较大对模型预测结果产生影响,本次实验采用Z-score方法对历史PM2.5浓度数据进行标准化处理。Z-score将不同量级的数据统一转换成同一量级,并统一用计算出的Z-Score值来衡量,以保证数据之间的可对比性。4.2评价指标评估分类模型的评价指

    35、标中最常见的是混淆矩阵。在本次实验中,最终输出结果将会展示未来污染物浓度上升还是下降,考虑到污染物浓度上升会对环境产生的不良影响,故将浓度在分类型模型中表现上升设为 positive,浓度在分类型模型中表现为下降设定为negative。准确率指模型预测正确的样本数占样本总数的比重,可以直观衡量模型总体性能,如式(6)所示:A=(TP+TN)(TP+TN+FP+FN)(7)精确率指在模型预测是 positive 的所有结果中,模型预测对的比重,如式(7)所示:P=TP(TP+FP)(8)召回率指在预测出的分类样本中被正确预测的比重,如式(8)所示:R=TP(TP+FN)(9)F1分数是P与R的加

    36、权平均值,计算公式如式(10):F1=2PR(P+R)(10)4.3模型对比分析为评价本文提出的基于 CPM 的 PM2.5扩散特征提取方法,对比了未考虑大气污染扩散过程的VGG的方法,以及在相同实验条件下基于支持向量机(Support Vector Machine,SVM)、AlexNet的预测方法。实验结果表明本文方法表现出了更好的性能。通过对图5中的12种不同外观的烛台图进行统计后发现,浓度烛台形状 3 和 4 最为常见,占比分别为 48.74%和31.31%。图8是带有浓度烛台图序列的大气污染物时间序列片段。可以看出,当伴有反转信号的烛台图出现时,污染物浓度的变化趋势不会立刻反转,因此

    37、,通过浓度扩散模式进行判断。在获取污染物浓度模式的过程中,跳过了没有任何数据的时间间隔,只考虑完整的浓度循环周期。匹配率被用来调控匹配时间,从时间序列片段中提取两个浓度模式:模式1和模式3,如图8所示,即代表第1015天的污染物浓度增加模式以及第 2124天的污染物浓度减小模式。匹配过程中,调整匹配率=1时,会无法找到这两种模式对应的精确匹配;当设=0.8时,成功找到了历史模式中对应的模式2和4与之匹配。表2显示了不同匹配率的预测结果,最终选择匹配率0.8作为本文模型的参数。分别利用SVM、AlexNet、VGG和本文方法的改进VGG模图7基于VGG的PM2.5浓度趋势预测框架Fig.7PM2

    38、.5 concentration trend prediction framework图8PM2.5浓度模式匹配图Fig.8PM2.5 concentration pattern matching diagram1398第 5 期许睿等:基于烛台图模式匹配的PM2.5扩散特征的提取型进行训练。此次实验选用的多源数据所包含的内容信息如 4.1.1 节所示,划分其中 70%的样本作为训练集,30%样本用来测试,并以准确率、精确率、召回率和F1分数作为模型评价指标。为了控制变量,均采取50个epoch作为每个网络的训练批次。不同预测方法的准确率比较结果如表3所示,本文方法取得了最高的准确率,为95.

    39、1%,与基于普通VGG的方法相比,准确率提高了 1.9个百分点,也优于传统的机器学习方法(SVM)和其他图像识别模型(AlexNet)。这是因为,单纯的 VGG 没有充分融入一天内的污染物浓度扩散过程;而后两种方法在捕获转折点变化信号时,过分注重整体趋势,往往会忽略一些小的短期浓度波动,准确率更低。污染物浓度随着长期的浓度循环变化,短期波动也会很大,基于 CPM 的卷积神经网络预测方法可以捕捉更细粒度上的浓度变化信息。在精确率、召回率和F1分数指标上,不同方法对 PM2.5浓度上升、下降和不变情况的预测结果对比如表4所示,本文方法同样取得了最好的结果。SVM模型预测精确率高于 AlexNet

    40、模型,但召回率却较低,这是因为,SVM在寻找重要的污染物浓度趋势转折点时更有效,但却没办法捕获一些小的趋势变化信号,存在一定的滞后现象。VGG 在捕获短期浓度变化信号时表现敏感,但会产生过拟合的现象。显然,基于 CPM 设计的卷积神经网络模型表现出的性能明显优于基于普通时间序列的其他网络。因此,将股票分析中被广泛应用的K线图应用到大气污染物分析领域,不仅能完整保存数据信息,还能够充分提取大气污染扩散过程中污染物浓度变化过程的局部变化信息,从而为大气污染物浓度趋势变化提供指导。5 结语 提高大气污染物的预测精度是大气环境监测领域面临的重要任务。目前,众多的污染物浓度预测模型都未曾充分提取原始数据

    41、的变化特征,也无法融入大气扩散机制。因此,本文提出了一种基于烛台图时空聚类的深度学习预测方法。实验训练数据集由一组时间序列数据构建而成,其中包括历史PM2.5浓度数据、相关污染物数据以及气象关联参数。首先,利用烛台图形式化表示污染物扩散周期性变化;然后,通过浓度模式匹配融入大气物理扩散机制;最后,结合其余情景参数,通过卷积神经网络VGG提取局部特征,并进行趋势预测。通过实验对本文方法的整体性能进行了评估,并与基于传统的时间预测模型(AlexNet)、普通的机器学习模型(SVM)以及不结合烛台图的深度学习模型(VGG)的方法进行了比较。结果表明,本文方法的准确率、精确率、召回率和F1分数均取得了

    42、最好的结果。烛台图简洁直观、立体感强,还能够全面透彻地观察到污染物浓度的真正变化,将K线分析技术应用到大气污染领域,具有很高的实用性。但本文方法仅预测了污染物未来的浓度水平变化,还无法预测下一个具体的浓度水平。因此,未来将进一步分析PM2.5的长期依赖特征提取,以捕捉大气污染物的浓度变化行为。参考文献(References)1 ZHANG Y,BOCQUET M,MALLET V,et al.Real-time air quality forecasting,part:history,techniques,and current statusJ.Atmospheric Environment,

    43、2012,60:632-655.2 李威凌,吴怀宇,陈洋.基于高斯模型的武汉市区PM2.5扩散问题研究 J.高技术通讯,2014,24(11):1153-1159.(LI W L,WU H Y,CHEN Y.PM2.5 diffusion problem research based on Gaussian model in Wuhan cityJ.Chinese High Technology Letters,2014,24(11):1153-1159.)3 SUN Q,ZHU Y M,CHEN X M,et al.A hybrid deep learning model with mult

    44、i-source data for PM2.5 concentration forecastJ.Air Quality,Atmosphere and Health,2021,14(4):503-513.4 TAKEUCHI K,YOKOYAMA T,WADA K,et al.Modified K-line in neck extension is a prognostic indicator of the surgical outcome at 5 years after cervical laminoplasty for cervical spondylotic myelopathy J.S

    45、pine,2021,46(19):E1031-E1041.5 LI Y P,FENG Z N,FENG L.Using candlestick charts to predict adolescent stress trend on micro-blogJ.Procedia Computer Science,2015,63:221-228.6 魏连江,胡青伟,梁伟,等.基于K线图理论的瓦斯异常模式诊断研究 J.煤矿安全,2019,50(6):24-27,31.(WEI L J,HU Q W,LIANG W,et al.Research on gas abnormal mode diagnosi

    46、s based on K-line theory J.Safety in Coal Mines,2019,50(6):24-27,31.)7 HU G S,HU Y X,YANG K,et al.Deep stock representation 表2匹配率变化时的预测误差Tab.2Prediction error when matching rate changes匹配率0.60.70.8平均预测误差0.190.180.17匹配率0.91.0平均预测误差0.230.25表3不同预测方法的准确率比较单位:%Tab.3Accuracy comparison of different method

    47、sunit:%方法基于AlexNet的方法基于SVM的方法基于VGG的方法本文方法训练数据集89.991.393.997.8测试数据集85.291.493.295.1表4不同方法对PM2.5浓度变化情况的预测对比Tab.4Comparison of different methods for predicting change of PM2.5 concentration方法基于AlexNet的方法基于SVM的方法基于VGG的方法本文方法PM2.5浓度上升精确率0.632 80.670 90.743 90.800 7召回率0.653 10.608 10.715 00.843 2F1分数0.64

    48、8 90.638 20.720 40.812 7PM2.5浓度下降精确率0.623 60.691 20.746 20.820 7召回率0.658 30.604 40.714 80.853 9F1分数0.643 50.627 20.728 90.829 5PM2.5浓度未发生改变精确率0.694 50.708 40.743 70.710 8召回率0.611 50.600 70.694 90.623 2F1分数0.619 40.604 80.703 10.637 51399第 43 卷计算机应用learning:from candlestick charts to investment decis

    49、ionsC/Proceedings of the 2018 IEEE International Conference on Acoustics,Speech and Signal Processing.Piscataway:IEEE,2018:427-433.8 CHEN J H,TSAI Y C.Encoding candlesticks as images for patterns classification using convolutional neural networksJ.Financial Innovation,2020,6:No.26.9 HUNG C C,CHEN Y

    50、J.DPP:deep predictor for price movement from candlestick chartsJ.PLoS ONE,2021,16(6):No.e0252404.10 华南理工大学.一种基于深度学习的K线形态图像识别方法:201811238452.8P.2019-03-29.(South China University of Technology.A K-line morphological image recognition method based on deep learning:201811238452.8 P.2019-03-29.)11 ONG B


    注意事项

    本文(基于烛台图模式匹配的PM_(2.5)扩散特征的提取_许睿.pdf)为本站上传会员【自信****多点】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4008-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表




    页脚通栏广告
    关于我们 - 网站声明 - 诚招英才 - 文档分销 - 便捷服务 - 联系我们 - 成长足迹

    Copyright ©2010-2024   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:4008-655-100    投诉/维权电话:4009-655-100   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   



    关注我们 :gzh.png  weibo.png  LOFTER.png