基于多源异构时空数据融合的交通流量预测模型.pdf
《基于多源异构时空数据融合的交通流量预测模型.pdf》由会员分享,可在线阅读,更多相关《基于多源异构时空数据融合的交通流量预测模型.pdf(14页珍藏版)》请在咨信网上搜索。
1、69TOPIC 专题2023042-1基于多源异构时空数据融合的交通流量预测模型摘要交通流量预测问题具有多源异构性,未来时刻的流量不仅与之前时刻的流量相关,同时也受城市区域间关系、天气情况、兴趣点(point of interest,POI)等异构时空数据的影响。针对此问题,提出一种基于多源异构时空数据融合的交通流量预测模型MHF-STNet。首先使用聚类方法获得城市区域不同的流量模式,并使用拼接、权重相加、注意力机制等多种方式融合交通流量、城市区域间的位置关系、天气、POI、工作日、假期多个模态的时空数据,使用深度学习方法对异构数据统一建模,预测未来时刻的交通流量。在北京出租车、纽约出租车和
2、纽约自行车3个流量数据集上进行实验,与经典的交通流量预测模型相比,MHF-STNet的预测准确度有所提升。结果验证了MHF-STNet对异构时空数据统一建模的有效性。关键词交通流量预测;多源异构数据统一建模;时空相关性中图分类号:TP311 文献标志码:A doi:10.11959/j.issn.2096-0271.2023042Urban traffic flow prediction based on the multi-source heterogeneous spatio-temporal data fusionAbstractThe problem of traffic flow f
3、orecasting has multi-source heterogeneity.The traffic flow in the future is not only related to the flow at the previous moment,but also affected by heterogeneous spatio-temporal data such as the relationship between urban regions,weather conditions and POI(point of interest).To solve this problem,a
4、 traffic flow prediction model based on multi-source heterogeneous spatio-temporal data fusion was proposed,which was called MHF-STNet(multi-source heterogeneous fusion spatio-temporal network).Firstly,this model used clustering methods to obtain different traffic patterns in urban areas,and utilize
5、d various methods such as concatenation,weight addition,and attention mechanism to integrate spatio-temporal data of multiple modalities,including traffic flow,location relationships between urban areas,weather,POI and the time of day.Deep learning methods were used to uniformly AN Yang1,SUN Jianwei
6、2,LI Qian2,GONG Yongshun11.School of Software,Shandong University,Jinan 250100,China2.No.15 Research Institute,China Electronics Technology Group Corporation,Beijing 100083,China安洋1,孙健玮2,李倩2,宫永顺11.山东大学软件学院,山东 济南 250101;2.中国电子科技集团有限公司第十五研究所,北京 100083BIG DATA RESEARCH 大数据70model heterogeneous data and
7、 predict traffic flow in the future.Experiments were conducted on three real-world traffic datasets,TaxiBJ,TaxiNYC and BikeNYC datasets.The results showed that MHF-STNet achieved the best performance compared with some classic traffic flow prediction models,which verified the effectiveness of MHF-ST
8、Net for unified modeling of heterogeneous spatio-temporal data.Key wordstraffic flow prediction,unified modeling of multi-source heterogeneous data,spatio-temporal correlation0 引言随着城市交通运输量的不断增加,出行拥堵严重、道路资源紧缺等问题也随之而来。城市开始逐渐关注智慧交通的建设,使用人工智能、大数据等智能计算技术,深度挖掘交通数据之间的关系,分析并处理城市中的交通数据,为居民的出行畅通和城市的建设发展提供技术支持
9、。交通流量预测是智慧交通的经典问题之一,根据城市之前时刻每个区域的交通流量,预测接下来时刻城市各区域的交通流量。交通流量预测具有高度的复杂性,下个时刻的流量受城市中多种异构时空数据的共同影响。如图1所示,在时间维度上,前几个时刻的流量趋势影响下个时刻的流量。在空间维度上,城市区域的地理位置关系影响相邻区域的流量流动,同时由于城市不同的区域规划,其流量呈现不同的交通模式变化,比如包含车道的区域流量大,包含郊区的区域流量小。同时,交通流量还与当时的天气、是不是工作日、是不是假期、POI等跨管辖域的异构时空数据有关。因此,交通流量具有很强的时空相关性和多源异构性,如何对异构时空数据统一建模,充分融合
10、多模态时空数据,有效捕获城市区域流量的时空特征,建立一个有效准确的预测模型,是交通流量预测的关键任务。目前,研究人员提出了大量方法用于解决交通流量预测问题。由于交通流量复杂的时空关系,大部分研究方法从流量的时间维度和空间维度进行分析,时间维度即根据之前时刻的流量趋势预测未来时刻的流量,空间维度即根据城市区域的地理位置关系预测相邻区域的流量。但是还存在一些难点有待解决,具体如下。交通流量不仅与过去时刻的流量和区域空间关系有关,还与天气、时间、POI等实时属性有关,统一建模并有效融合多源时空数据,可以更准确地预测流量。城市区域间不仅存在地理位置关系,还存在隐式的相关关系。具有相似流量模式的区域之间
11、流量会相互影响,同时不同的流量模式呈现不同的流量变化。研究区域间的相关关系,可以更准确地捕获流量的变化趋势。针对上述问题,本文提出一个基于多源异构时空数据融合的城市交通流量预测模型MHF-STNet(multi-source 图 1交通流量预测的时空相关性和多源异构性2023042-271TOPIC 专题heterogeneous fusion spatio-temporal network),将交通流量、城市区域的空间关系、交通模式、天气、时间、POI等多源异构时空数据统一建模,利用深度学习方法有效融合多源时空特征。本文的主要贡献如下。研究区域之间的相关关系,根据区域的流量模式,使用K-Me
12、ans算法将具有相似流量模式的区域聚集起来,提取不同交通模式的流量特点。本文提出了MHF-STNet模型,将交通流量、城市空间关系、交通模式、天气、假期、POI多模态时空数据统一建模,使用拼接、加法融合、注意力机制等多种融合方法融合多源异构时空数据,联合提取交通流量的时空特性,预测未来时刻的流量。在北京出租车、纽约出租车和纽约自行车数据集上进行实验,与7个经典的交通流量预测模型相比,本模型预测准确度有所提高。1 相关工作与本文相关的工作主要有两类:交通流量预测和异构数据统一建模。1.1 交通流量预测很多学者从20世纪60年代开始研究交通流量预测问题,已经提出了许多交通流量预测方法。早期基于统计
13、的流量预测方法是对历史流量进行数学统计分析,获得预测流量的计算式,主要有历史平均模型(HA)和差分自回归平均移动模型(ARIMA)。历史平均模型1利用过去时刻的平均流量预测未来时刻的流量。差分自回归平均移动模型2将随时间变化的流量数据看成一个序列,使用模型拟合流量序列预测下个时刻的流量。这类模型只考虑了时间关系,不易处理复杂且非线性的交通流量数据。基于机器学习的流量预测方法使用智能算法提取流量的时空特征,可以对更复杂的流量数据建模,其主要使用的模型是K近邻3、支持向量机。但这类方法依赖于特征工程,需要依靠专家经验提取有效信息。随着深度学习算法的快速发展,越来越多的研究人员开始使用这种方法来预测
14、交通流量。2017年,Zheng Y等4提出时空预测模型ST-ResNet,根据交通流量的周期性,从小时、天、周3个维度分别用残差网络提取流量的临近性、周期性、趋势性特征,有效提高了流量预测的准确度。Kipf T N等5提出图卷积神经网络,根据图中节点的邻接关系聚集节点本身和邻居的特征,有效捕获图的拓扑结构。Guo S N等6提出基于图卷积的交通流量预测模型ASTGCN,通过自注意力机制7学习更重要的时间和空间特征,把学习到的动态空间关系与地理位置融合,利用图卷积网络提取区域的空间关系。Guo K等8提出基于动态图卷积的交通流量预测模型DGCN,将城市抽象成图,构造随时间变化的动态城市图的拉普
15、拉斯矩阵,使用图卷积神经网络获得区域间的邻接空间关系,进一步提升预测流量的准确度。AGCRN9学习城市中每个节点具体的流量特点,并利用节点特征自适应地学习城市图,有利于根据任务自适应学习时空关系,捕获更准确的时空特征。1.2 跨管辖域的异构数据统一建模异构数据统一建模是从多个信息源获取数据,利用模型提取不同数据的特征,2023042-3BIG DATA RESEARCH 大数据72并将特征融合获得更高阶有效的信息,以实现异构数据间的信息互补10-15。异构数据统一建模的难点在于多源异构数据的融合,不同数据有自己独有的特征,解决不同特征空间的差异并充分融合特征,有利于获得更全面的信息。多源数据融
16、合主要利用联合架构、协同架构、编解码架构实现模态之间的融合。联合架构是将每个模态的特征联合映射到一个公共子空间,常见的方法有加法融合和乘法融合。协同架构是寻找公共子空间中模态间的关联关系,主流的协同方法是交叉模态相似性方法,目的是学习一个子空间使不同模态的相关性最大化。编解码架构是编码器将源模态映射成中间状态,解码器将中间状态映射到与融合特征相同的子空间。大部分交通流量预测模型在针对不同的异构数据时使用不同的方法融合数据16-19。ST-ResNet使用联合架构融合方式,将小时、天、周3个维度的流量特征按权重相加融合为整体的时间特征,并与天气、工作日、假期等实时特征权重相加融合;ASTGCN、
17、DGCN把流量特征输入图卷积网络,根据地理位置关系聚集每个节点邻居的流量特征,将流量特征和空间关系融合;DeepSTN+20模型使用卷积网络提取城市区域的POI特征,并使用按位相加的方法融合POI特征和时间特征。本模型联合考虑流量、地理位置关系、天气、假期、工作日、POI等多种时空数据,使用多种方式将其融合为时空特征。首先利用拼接方式将天气、假期、时间的实时数据融合,使用卷积网络将实时数据和POI数据融合为外部特征;使用联合架构中权重相加的方式,将小时、天、周3个维度的时间特征融合,并将流量特征和外部特征相加融合为高阶特征;将提取的流量特征传入图卷积网络,根据地理位置关系提取城市空间关系。同时
18、本模型使用K-Means学习一个新的模态数据,根据城市区域的流量变化获得不同的交通模式,并使用软聚类的方式把流量特征映射到交通模式空间,使用注意力机制与交通模式融合。因此,本模型对过去流量、区域地理位置关系、流量模式、天气、POI等多源时空数据统一建模,使用多种方法充分融合多源时空数据,实现数据之间的互补,共同预测未来时刻的流量。2 问题定义根据经纬度将城市划分为IJ的均分网格,如图2所示,每个网格代表城市的一个区域,位置(i,j)表示第i行第j列的区域,共有N=IJ个区域。将城市表示成一个无向图G=(V,E,A),节点V代表城市区域,E代表区域之间的边,邻接矩阵A表示区域之间的邻接关系。每
19、个 时 刻 的 城 市 流 量 表 示 为2 I Jt XR,第 一 维in,0,()i jjtit=XX表 示从其他区域到(i,j)区域的入流,第二维out,1,()i jjitt=XX表示从(i,j)区域出去的流量。由于交通流量具有周期性,前几个时刻的流量趋势影响着当前时刻的流量,并且前几天、前几周同一时刻的流量与当前时刻的流量具有相似的关系。因此,本方法结合前几个小时Xh、前几天Xd、前几周Xw的流量共同预测未来时刻的流量Xt,其分别表示为:2(1)1,hhhlI Jht ltlt =XXXXR(1)2(1),dddlI Jdt ldtldt d =XXXXR(2)2(1),wwwlI
20、Jwt lwtlwt w =XXXXR(3)其中,lh、ld、lw是从小时、天、周3个维度获得时间片段的个数,小时数据每个流量间隔1个时间段,天数据间隔d个时间段,周2023042-473TOPIC 专题数据间隔w个时间段。输入数据如图3时间轴所示,预测1月30日早晨9点的流量,小时维度输入当天早晨6点到8点半的流量,天维度输入前两天早晨9点到9点半的流量,周维度输入前两周即16日和23日早晨9点到9点半的流量,利用3个时间维度的流量共同预测未来时刻的流量。因此,本问题可以表达为:weaweekholpoi(,;)hdwtF=XXXXXXXXG (4)其中,F是预测模型,对过去时刻的流量hX、
21、dX、wX、天气weaX、工作日weekX、假期holX、POI信息poiX、城市地理位置关系G等多源时空数据统一建模,充分融合异构时空特征,捕获城市流量的时空关系,预测未来t时刻的流量tX。3 基于多源异构时空数据融合的交通流量预测模型MHF-STNet本节首先介绍MHF-STNet的整体框架,然后介绍利用聚类学习交通模式的具体方法,最后详细介绍流量特征、外部特征、交通模式和空间特征的融合方法。3.1 总体框架由于交通流量的多元复杂性和时空相关性,本文提出一种基于多源异构时空数据融合的交通流量预测模型MHF-STNet,整体框架如图4所示,主要由4个部分组成。首先,利用K-Means算法将具
22、有相似流量变化的区域聚类获得不同的交通模式;之后使用残差网络从小时、天、周3个维度提取流量的时间特征,与天气、假期、POI等外部特征权重相加融合;其次利用软聚类方法将流量特征映射到交通模式空间,使用注意力机制融合交通模式,再利用图卷积网络捕获城市的空间关系,最后使用卷积网络预测下个时刻城市区域流量。3.2 利用K-Means算法学习交通模式由于城市区域的功能性不同,属于相似功能区的区域流量比较相似,而属于不同功能区的区域流量大概率呈现不同的交图 2城市区域网格图图 3模型输入小时、天、周 3 个维度的数据2023042-5BIG DATA RESEARCH 大数据74通模式。例如主干车道的流量
23、比较大,商场的流量在下午及晚上比较大。因此使用K-Means算法将具有相似流量变化的区域聚类,获得不同的交通模式。首先在训练过程开始之前,对所有数据聚类获得城市区域的交通模式特征。每个区域的特征由这个区域所有时刻的流量数据构成,过程如图5所示。首先将每一天相同时刻的流量求平均值作为这个时刻的特征,每个区域特征由这个区域一天中不同时刻的平均流量构成。使用K-Means对城市区域聚类,利用轮廓系数确定类别个图 4MHF-STNet 模型整体框架图 5使用 K-Means 算法获得交通模式的过程2023042-675TOPIC 专题数M,将类别中心作为不同交通模式特征M DPR,共有M个交通模式,每
24、个交通模式的特征维度D=2T,其中T是一天的时刻个数。3.3 相加融合流量特征和外部特征根据交通流量的周期性,从小时、天、周3个维度提取交通流量的时间特征,每一维度使用相同的网络结构。以小时数据为例,首先将流量从时间维度拼接为2hlI Jh XR,使用残差网络提取城市流量的时空特征。共有L层残差结构21,每一层表示为:1(;),0,1llllflL+=+=XXX (5)其中f是残差函数,其结构如图6所示,由2层ReLU激活函数和卷积核为33的卷积操作构成。第一层输入hX,利用L层卷积网络聚集时间特征和局部空间特征,捕获局部的时空相关性,输出流量特征LC I J XR。小时、天、周3个维度分别用
25、残差网络提取时间特征,获得输出LhX、ldX、lwX。由于3个时间维度对不同区域流量的影响不同,利用联合结构中权重相加的方法融合不同时间的特征:resLLLhhddww=+XWXWXWX(6)其中,表示哈达玛积,将不同特征按照权重相加,表示不同特征对城市每个区域的不同影响。交通流量与天气weaX、工作日weekX、假期holX等实时属性有关。天气好时出行人数增多,工作日到办公区的流量大。首先利用拼接方法把城市实时属性融合为实时特征TlTXR,使用多层感知机提取实时特征,之后变换形状使维度与时间特征相同timeC I J XR:weaweekholconcat(,)T=XXXX(7)time21
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多源异构 时空 数据 融合 交通 流量 预测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。