基于情境感知注意机制的出租车需求深度学习预测模型.pdf
《基于情境感知注意机制的出租车需求深度学习预测模型.pdf》由会员分享,可在线阅读,更多相关《基于情境感知注意机制的出租车需求深度学习预测模型.pdf(10页珍藏版)》请在咨信网上搜索。
1、第 卷第 期计算机应用与软件 年 月 基于情境感知注意机制的出租车需求深度学习预测模型樊云阁吕玉辉韩红旗(河南农业职业学院信息工程学院河南 郑州 )(洛阳理工学院计算机学院河南 洛阳 )(中国科学技术信息研究所北京 )收稿日期:。国家自然科学基金项目()。樊云阁,实验师,主研领域:计算机应用技术。吕玉辉,教授。韩红旗,教授。摘要针对出租车需求预测方法中由于未充分挖掘数据导致的预测精度较低问题,提出一种基于情境感知注意机制的递归卷积神经网络出租车需求预测方法。根据城市路网划分出一组细粒度区域,得到出租车需求的三个时空依赖性预测结果。设计由局部卷积层和门控神经单元组成的即时时空模块,提取相邻区域和
2、函数相似区域之间的空间相关性,以及连续时隙中的时间相关性。基于循环神经网络提出一种新的情境感知注意机制,将每个区域的三个预测合并在一起,将情境因素输入到完全连接层中来学习分配给每个预测的权重。以纽约市和成都市的实际数据集为基础进行综合实验,结果表明所提出方法有较高的预测精度以及运行时间优势。关键词需求预测出租车循环卷积神经网络情境感知注意中图分类号 文献标志码 :(,)(,)(,),计算机应用与软件 年 引言城市出租车作为一种绿色公共交通工具,为广大乘客提供舒适、便捷的服务 。然而,出租汽车服务中存在的一个主要问题是搭乘服务供给与乘客需求之间的时空平衡。为了保持城市道路交通供给与乘客需求的平衡
3、,准确预测城市出租车需求具有重要意义 。出租车需求与包括道路网、兴趣点、气象及假日资料等数据之间的相关性已经得到了很好的研究,但是,要做出准确的预测还存在一些挑战 。首先,出租车需求具有高度的动态性,即随着时间的推移变化迅速且有一定的随机性;第二,城市不同功能区的出租车需求变化趋势存在显著差异;第三,出租车需求受一些外部因素的影响较大,如景点、天气状况和节假日等 。为了预测出租车需求,学者们提出了一系列方法。例如,利用自回归综合移动平均()及其改进方法,将出租车需求预测问题建模为时间序列预测 。文献 提出一个具有高维特征的统一线性回归模型来预测各地区的出租车需求。由于缺乏非线性建模能力,这些方
4、法通常预测精度较低。近年来,深层神经网络()被引入到出租车需求预测中,它提取了复杂的时空相关性,并利用外部因素辅助预测。例如,文献 提出了一种基于长短时记忆()网络的序列学习框架,利用瞬时空间相关性,将卷积运算与 相结合。文献 同时提取空间相关性和时间相关性,利用外部因素进一步提高预测精度。等 利用模型训练过程中学习到的固定参数矩阵,尝试将时空相关性和外部因素结合起来。以上现有研究成果都局限于将不同的时空特征和外部因素结合在一起,这是因为在没有考虑到情景信息的影响下对参数设置了固定的值,仅限于通过理想化的出租车需求多视角特征以及单纯外部因素的情境感知情形下,才可以简单地确定网络中的可学习参数,
5、所以并未充分挖掘数据中蕴含的信息,并且适用范围也有限。为解决上述问题,本文提出一种基于改进递归神经网络的情境感知注意预测算法,用于预测城市出租车需求。通过纽约市的多个实际数据集实验验证了本文方法能够有效提升预测精度,方法更具一般性。问题描述定义 (道路网络)市区的路网由一组路段组成,每个路段都有两个终点,即十字路口的交叉点相关联,并通过共享相同的终点与其他路段相连,所有路段均以图形格式构成道路网络。为了在空间和时间维度上更完善地描述细粒度的出租车需求,将时间离散化为一组等间隔的时间段,用 ,表示,其中 表示当前时间段。还根据其道路网络将整个市区划分为不相连的区域。每个区域都是被多个路段包围的不
6、规则多边形。区域集由 ,表示,其中 代表第几个区域。根据时间段和区域的定义,进一步提出了出租车的细粒度需求的正式定义如下。定义 (出租车需求)使用 ,表示在时间段为、区域为 的出租车乘客人数。然后,将在时间段 的出租车需求定义为 ,。定义 (出租车行程记录)用 表示一组出租车历史行程记录。每个记录 包含上下车的位置和具体时间,可以用元组 (,)表示。在此元组中,用纬度和经度表示上车地点 和下车地点 ,而用年月日、小时和分钟的形式表示具体的上车时间 和下车时间 。为了预测未来的出租车需求,首先从定义 中的历史出租车行程记录中提取出历史时间段的出租车需求。给定一个市区出租车行程记录的数据集,可以根
7、据某区域 和某时间点 的历史出租车需求,近似估计得到出租车的乘客数量,公式如下:,()式中:和 分别代表记录 在区域 与时间段 的具体乘车地点和乘车时间;函数 表示集合的基数。定义 (兴趣点)兴趣点()即位于市区的场所,如购物中心。每个兴趣点 与一个位置 和一个范畴 相关联,表示类别集。由于兴趣点在不同类别中的分布反映了一个区域及其客流的函数,因此为每个区域 构造一个向量 ,来表示其兴趣点的分布。特别注意,向量的每个元素 是区域 中特定类别 中的 数值,即 ()式中:表示 的 位于区域。此外,还为每个区域 定义了一组邻域集合 ,该区域由相邻区域组成。定义 (出租车需求预测问题)考虑通过道路网络
8、将市区划分为不相交的区域 。给定从历史出租车行程记录中提取的过去时间段 ,中的出租车需求,尝试预测下一个时间段的出租车需求。预测结果表示为 ,。第 期樊云阁,等:基于情境感知注意机制的出租车需求深度学习预测模型 数据描述与分析 道路网络数据本文采用了 年调查的纽约市道路网络的数据集 ,该数据集包含 个十字路口和 个路段。每个交叉点都是矢量,按其纬度和经度定位。利用文献 中提出的基于形态学的地图分割方法,根据路网将纽约市的整个区域划分为 个不相交的区域。出租车行程数据纽约市的出租车和轿车委员会已经开放了纽约市出租车出行记录的数据集 ,其中包含出租车的详细驾驶信息,例如每辆出租车的上下车地点和具体
9、时间。年 月 日至 年 月 日(个工作日和 个周末)的出租车行程数据记录了 次旅行,覆盖纽约市的 个地区。图 分别描绘了三月和四月各地区工作日和周末的出租车平均需求量。一个地区的颜色越深,该地区的出租车需求就越多。可以发现,不同地区的出租车需求之间存在严重的不平衡。此外,工作日和周末的出租车需求有显著差异。()工作日()周末图 纽约市平均出租车需求量图 和图 分别显示了短期(一天)和长期(一周)出租车需求的周期性,其中分别绘制了格林威治村和中央公园两个地区的出租车需求。()格林威治村()中央公园图 每周四天内每小时出租车需求的变化()格林威治村()中央公园图 三周内星期三出租车需求的变化尤其是
10、图 显示了三月中不同的四天中(包含两个工作日和两个周末)每小时出租车需求变化。不难发现,周三和周四两个地区的出租车需求具有相似的变化趋势,而周六和周日也是如此。这表明每个地区的出租车需求在短期内具有较强的周期性。此外,由于人们在工作日和周末的出行方式不同,各地区在工作日和周末的周期变化趋势显然也不一样。同样,从图 中可以看出,由于两个地区每周三出租车需求的变化趋势相似,因此出租车需求在长期内具有较强的周期性。短期和长期周期性的存在可以帮助预测未来每个地区的出租车需求。数据 中包含的信息,如一个区域中不同类别的 数量,反映了该区域的社会功能,这也与出租车需求相 计算机应用与软件 年关。在纽约使用
11、了一个有 个 的 数据集,分为 个不同的类别,如表 所示。表 兴趣点的类别类别说明类别说明类别 艺术和娱乐类别 家乡和家庭类别 汽车和其他交通工具类别 法律和金融类别 不同企业间对比类别 食品与餐饮类别 计算机和技术类别 教育类别 房地产和建筑类别 宗教类别 专业人员和服务类别 购物类别 体育与娱乐类别 健康和美容类别 政府和社区类别 旅行图 ()和图 ()分别描绘了艺术与娱乐类 的地理分布以及周六中午 点至下午 点的出租车需求。可以发现,在某些地区(虚线圆圈标出部分),某些类别的 数量与某些时期的出租车需求有很强的相关性。():艺术娱乐()上午 点至下午 点出租车需求图 和出租车需求分布为了
12、进一步探索出租车需求与 之间的关系,以两个标志性建筑为例:哥伦比亚大学(位于 号区域)和纽约城市大学(位于 号区域)。将 的比例分为六个类别,即不同企业间对比、专业人员和服务、家乡和家庭、食品与餐饮、教育、购物,跟踪出租车需求在一天内的变化如图 所示。可以发现这两个地标具有相似的 分布和相似的出租车需求变化趋势。通过这种观察,可以利用 数据来辅助预测出租车需求。()比例()一天的出租车需求图 比例与出租车需求的相关性研究 气象和假期数据除 之外,出租车需求还受到其他外部因素的影响,例如天气状况和节假日。还在工作中使用了 年 月 日至 年月 日的气象记录数据集,其中包含每六小时记录的天气状况,例
13、如,晴天和阴雨、温度、风速和湿度等信息。图 描绘了纽约市在不同天气下一天的总体出租车需求,这表明天气状况对出租车需求有很大的影响。特别地,从图 ()中可以发现,暴风雪后出租车需求显著减少。相反,图 ()显示了当早上 点到 点下雨时,更多的人会选择乘坐出租车。第 期樊云阁,等:基于情境感知注意机制的出租车需求深度学习预测模型()下雨和下雪()晴和下雨图 天气状况对出租汽车需求的影响 模型设计 模型概述图 提供了前文提出的深度神经网络模型的概述,该模型包含四个模块。图 深度神经网络模型结构()实时时空模块。该模块由一系列局部卷积()层和门控循环单元()组成,这两个层用于在封闭时段内提取出租车需求的
14、时空相关性。特别地,它以 个连续时间段中的出租车需求为输入,由 ,表示,并预测出下一个时间段 中出租车需求。()短期周期模块。该模块根据短期周期的出租车需求进行预测。通过 来学习短期周期性,以 为周期性时段中的出租车需求序列、间隔 作为输入,即 ,(),。此外,该模块还考虑了一些外部因素,如天气和假日对周期性的影响。将 中的外部因素的特征表示为向量 ,并将其与出租车需求连接起来作为 的输入。在此基础上,预测出了出租车需求 。()长期周期模块。该模块绘制了长期(如几周)周期性模式的出租车需求。与最后一个模块类似,将出租车需求序列 ,(),与外部因素的特征相结合输入 ,并预测出时刻 处的出租车需求
15、,用 表示。()情景感知注意模块。利用此模块将上述模块的输出合并到最终的出租车需求预测中,这是一种新的尝试。特别地,此模块可以根据天气信息、时刻索引和区域功能等上下文信息,为每个区域的预测分配不同的权重。实时时空模块该模块的结构基于局部卷积层和 ,用于提取区域内的潜在空间相关性和特定周期内的时间相关性。出租车需求序列 首先被送入 层。在每一层中进行局部卷积运算,用 卷积核提取高维空间特征。特别地,以第 ()层为例进行了详细的说明。将该层的输入表示为 ,这也是第()层的输出。首先,通过提取 中的一些列向量构造区域 的子矩阵 ,(),该子矩阵包含与其他区域空间相关性最强的列。特别考虑了相邻区域和功
16、能相似区域,根据区域 的相邻区域,提取它们在中对应的列,并将其填充在一起。构造具有 列的子矩阵部分,其中 。将列复制到 中,对应于()并将其填充到其相邻区域列的左侧。根据区域 的功能相似区域,首先说明如何度量两个区域之间的功能相似性,如定义所示。定义 (功能相似性)考虑两个区域 和,其 分布分别由 和 表示。首先按不同类别的 发掘每个区域(例如商业区或居民区)的功能。特别地,为每个区域定义一个函数向量,即 ,其中每个元素表示特定类别 中 的重要性,用词频 逆向文档频率()来衡量,即:()计算机应用与软件 年然后,基于 和 的函数向量,计算了它们之间的函数相似性。特别使用了两个向量的加权余弦值来
17、度量相似度,即:,()(,)()式中:()表示给定区域的面积。式()表明,在出租车需求预测中,密度较高的区域对其功能相似区域的影响更大。然后,用 列构造子矩阵 ,的另一部分,方法是在 填充到与 的 个最相似区域对应的列。通过将与相邻区域和功能相似区域相对应的两个部分串联起来,得到具有 列的子矩阵 ,。其次,分别对每个 ,进行卷积运算。使用大小为 ()的卷积核对每行 ,进行扫描,每个核输出一个 向量作为。在每个 层后加入批处理归一化(),以加快训练速度。通过连接所有区域的 个内核的输出,得到第 层的输出,这也是第()层的输入。在第 个 层之后,对高维空间特征进行 卷积运算压缩,并得到一个高层次表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 情境 感知 注意 机制 出租车 需求 深度 学习 预测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。