T_CI 154-2023 深度学习驱动的智慧交通数据挖掘预测技术规范.docx
《T_CI 154-2023 深度学习驱动的智慧交通数据挖掘预测技术规范.docx》由会员分享,可在线阅读,更多相关《T_CI 154-2023 深度学习驱动的智慧交通数据挖掘预测技术规范.docx(12页珍藏版)》请在咨信网上搜索。
1、ICS35.240.99CCSL 73 团体标准T/CI 1542023深度学习驱动的智慧交通数据挖掘预测技术规范Deep learning driven data mining and predictive technology specification for intelligent traffic2023 - 09 - 28 发布2023 - 09 - 28 实施中国国际科技促进会发 布目次前言II1 范围12 规范性引用文件13 术语和定义14 缩 略语15 智慧交通数据挖掘预测技术26 数据采样与预处理27 基于深度学习的挖掘算法38 智慧交通应用场景69 数据挖掘预测性能评估指标
2、7前言本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由南方科技大学提出。 本文件由中国国际科技促进会归口。 本文件起草单位:南方科技大学、长春理工大学、中国第一汽车集团有限公司、北京大学、华为技术有限公司、浪潮集团有限公司、同济大学、天津大学、华南理工大学、北京交通大学、重庆大学、北京嘀嘀无限科技发展有限公司、北京高科中创科学技术中心、西南交通大学、桂林电子科技大学、中国检验认证集团深圳有限公司、深圳市骏嘉科技发展有限公司、深圳市铠硕达科技有限公司、深圳浑沌数字
3、化实验室科技有限公司、深圳树米网络科技有限公司、汕头大学、吉林省卡思特科技有限公司、吉林省中云数讯股份有限公司、超智研发中心(深圳)有限公司、碳猎研发中心(深圳)有限公司、深圳安视信息技术有限公司、苏州奇盈半导体科技有限公司、维旭长电科技(深圳)有限公司。 本文件主要起草人:宋 轩、尹 渡、张博渊、邓捷文、邓锦亮、张凌宇、胡清华、张智军、金 一、李浥东、贾云健、滕 飞、吴国斌、梁 舰、王 涛、张 昕、宋小龙、刘 妍、周时莹、李长龙、孙宗姚、王中一、谢 奕、高 亮、陈 欣、陈 瑶、袁 飞。 深度学习驱动的智慧交通数据挖掘预测技术规范1 范围本文件规定了智慧交通数据挖掘预测技术的数据采样、数据预处
4、理、挖掘算法,描述了智慧交通应用场景,提出了数据挖掘预测性能评估指标要求。 本文件适用于基于深度学习的智慧交通数据挖掘预测。 2 规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T 5271.34-2006 信息技术 词汇 第34部分:人工智能 神经网络GB/T 34678-2017 智慧城市 技术参考模型 GB/T 35295-2017 信息技术 大数据 术语GB/T 37043-2018 智慧城市 术语 GB/T 41867-202
5、2 信息技术 人工智能 术语 3 术语和定义GB/T 5271.34-2006、GB/T 34678-2017、GB/T 35295-2017、GB/T 37043-2018、GB/T 41867-2022界定的以及下列术语和定义适用于本文件。 3.1邻接矩阵 adjacent matrix用以表示交通图数据中不同节点的空间相关性权重的二维正方形矩阵。 3.2欧式 euclidean符合现实物理世界定义的距离评判标准。 3.3膨胀卷积 dilated convolution具有存在间隙的内核的卷积,为时间卷积网络的重要组成部分。 3.4损失函数 loss function算法模型输出和观测结果
6、之间的概率分布差异。 3.5道格拉斯-普克算法 douglas-peucker algorithm将曲线近似表示为一系列点,并减少点的数量的一种算法。 3.6卡尔曼滤波 kalman filtering一种利用线性系统状态方程,通过系统输入输出观测数据,对系统状态进行最优估计的算法。 4 缩略语下列缩略语适用于本文件。 GPS: 全球定位系统(Global Positioning System) APP:应用程序(Application) OD: 起止点(Origin Destination) 注意力机制(Attention) GCN: 图 卷 积 网 络 (Graph Convolution
7、al Network) TCN:时间卷积网络(Temporal Convolutional Network) POI:兴趣点位置(Point of Interest) 5 智慧交通数据挖掘预测技术深度学习驱动的智慧交通挖掘预测技术规范中包含了数据采样层、数据处理层、挖掘算法层、应用场景层,具体见图1。从智慧城市自身出发,首先通过各类传感器在城市间进行数据采集,并对此进行妥善的数据处理,利用先进的深度学习算法对预处理好的数据进行特征提取,挖掘规律,并最终根据城市中的实际应用场景提供重要的算法支撑。完整的规范与标准能够为智慧城市的建设和优化提供交通数据采集、预处理、挖掘算法计算特征、根据场景输出高
8、精度高可靠性的解决方案,以此给智慧城市各个层面所面临的挑战与困难提供智能化和科学化的赋能支撑。 图1 深度学习驱动的智慧交通挖掘预测架构6 数据采样与预处理6.1 数据采样来源6.1.1 传统交通数据包括控制信号数据和路网数据等已结构化的数据。 6.1.2 开放数据如公交卡数据和车载GPS数据,具体为包括OD流和交通时间公交卡数据,其中应包括车辆的位置、密集度和速度的车载GPS数据。 6.1.3 监控设备数据数据形式为视频,数据内容应包括车辆的位置、密集度和速度,还有对车辆的识别。 6.1.4 传感器数据路边传感器数据、流动车辆传感器数据和广域传感器数据。传感器数据内容应与监控设备的数据内容相
9、同。 6.1.5 APP 数据包括了出行软件数据和社交媒体数据,其中社交媒体数据即在社交媒体中发布的地理信息。 6.1.6 其他数据如天气数据、节假日数据等。 6.2 数据预处理6.2.1 轨迹压缩为减轻通信、计算和数据存储的成本损耗,对收集的轨迹进行压缩处理是常见的处理手段。轨迹压缩任务可以选择离线执行,也可以在线执行。离线时可采用Douglas-Peucker等最短路径算法;在线时可采用滑动窗口等算法。使用轨迹压缩前需根据情况规定误差范围,并明确压缩后的目标数据量大小。 6.2.2 数据清洗数据清洗主要针对以下问题进行处理:数据缺失,数据噪声,数据异常,和数据不均衡。数据缺失与修复:数据缺
10、失问题广泛存在,早期的处理方法是用固定值或上下文均值进行填充,现在多用RNN、HMM以及矩阵补全等机器学习方法填充修复;数据噪声:指与原数据无关的额外数据,应通过时域和频域的滤波方法(如卡尔曼滤波)来过滤噪声;数据不均衡:包括数据在分布和标签中存在的不均衡,如不同路段车流量在数据分布上的不均衡,和人与车辆标签在数据标签上的不均衡。应采取过采样、欠采样等采样技术解决。 6.2.3 地图匹配地图匹配是将位置数据关联到路网上的技术,是预处理中不可或缺的一步。地图匹配目前包含以下两大类技术:基于采样点的技术和添加额外信息的技术。基于采样点的技术包括点距离方法和路径距离方法,添加额外信息的技术包括添加几
11、何、拓扑、概率、模型等方法。在进行地图匹配步时,应至少选用上述任一方法或类似的方法。 6.2.4 信息提取轨迹中针对信息的预处理包括停驻点识别和轨迹分割。停驻点识别通常通过时间信息确定,也可使用相应的停驻点检测算法。轨迹分割包括以时间信息、空间信息以及停驻点进行分割。如果下游任务有此类需要,则在数据预处理中需要进行此步骤。 7 基于深度学习的挖掘算法7.1 空间挖掘算法7.1.1 卷积神经网络,因世界定的非欧和空算被习策意力得长态影续学复杂度和之间者平信息,7.2 7.27.2.1 循环神经网络循环神经网络RNN和它的变体LSTM,GRU等神经网络被设计以应对序列数据。为了提取交通数据中的非线
12、性特征,循环神经网络可以从长时间序列中提取多时间步长周期的特征信号并且支持针对其中隐藏特征传递单元,遗忘单元等各个组合构件进行改造。循环神经网络的可塑性极高,支持跟各种其他方法论组合出新的模块,因而至今都在继续迭代。 7.2.2 时间卷积网络时间卷积网络TCN本质上是堆叠的多层CNN层,不同于RNN等循环神经网络需要等待时间片一个个计算特征,TCN可以并行计算所有时间步的数据特征,而后通过膨胀卷积堆叠连接,加速计算速度的同时也保持有较长的感受野,可以输入任意步长的时间序列。 7.2.3 时间注意力类似于空间注意力机制,但将空间注意力机制中的特征纬度与空间维度拉平替换为特征纬度与时间纬度拉平计算
13、分数,获得不同时间片的时间特征,聚合后由多头机制求和加权或者平均化来得到最终的时间特征。 7.3 基于架构的挖掘算法7.3.1 基于循环类的架构循环类架构指的是在RNN的基础上,加入各种变体单元如GCN,Gated CNN,Attention等,尽管依赖于不同的模块,但是都具备递归循环的隐藏单元和传递单元。 7.3.2 基于堆叠类的架构堆叠类架构指的是堆叠的门控卷积,在因果卷积连接上下层时可以加入各种变体单元如GCN,Gated CNN,Attention等,因此可以作为框架来包含其他时空模块和方法策略。 7.3.3 基于编码器解码器的架构适用于序列数据的编码器解码器架构,在同样为序列数据的交
14、通时序数据上被广泛使用。使用编码器提取序列特征,使用解码器做预测,在编码器和解码器中设计组合各种时空特征提取模块。 7.3.4 基于 Transformer 的架构Transformer类模型不仅在计算机视觉和自然语言处理中火热发展,交通数据挖掘预测领域中同样衍生出许多变体模型。集成了多头注意力机制,注意力计算,编码器解码器和反向回馈层的Transformer 架构,可以在其中各个组件中改造或者加入串并联方式的其他特征提取单元。 7.3.5 基于生成对抗网络的架构生成对抗网络同样适用于交通预测问题,由于交通路网复杂,通过生成出不确定的复杂状态,在判别模型中优化。将各类时空挖掘单元嵌入至生成对抗
15、网络中,为之设计任务驱动的预测器,进行交通预测。 7.3.6 基于迁移学习的架构有部分交通预测场景会存在地区A数据充足,地区B不充足的情况,使用迁移学习架构在城市A中预训练得到模型,然后切换到地区B使用地区B的数据继承训练或微调。 7.3.7 基于联邦学习的架构考虑到隐私保护的需求存在,使用联邦学习架构,利用众包节点独立训练模型,最终预测全域的未来交通状态。再可以合理高效地在保护隐私安全的同时,维持模型的预测性能。 7.4 特征挖掘算法7.4.1 特征分解与组合等同于自回归移动平均方法,许多深度学习方法将序列特征分解为周期,趋势等统计特征,进行学习、组合与预测。这类方法结合了深度学习和统计学的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- T_CI 154-2023 深度学习驱动的智慧交通数据挖掘预测技术规范 154 2023 深度 学习 驱动 智慧 交通 数据 挖掘 预测 技术规范
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Fis****915】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Fis****915】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。