一种基于多源数据验证的手机...据分析结果不确定性研究方法_韩钰.pdf
《一种基于多源数据验证的手机...据分析结果不确定性研究方法_韩钰.pdf》由会员分享,可在线阅读,更多相关《一种基于多源数据验证的手机...据分析结果不确定性研究方法_韩钰.pdf(5页珍藏版)》请在咨信网上搜索。
1、第 48 卷第 1 期2023 年 2 月Vol.48 No.1Feb.2023测绘地理信息Journal of Geomatics一种基于多源数据验证的手机信令数据分析结果不确定性研究方法韩钰1 史文中2 涂伟31 武汉大学遥感信息工程学院,湖北 武汉,4300792 香港理工大学智慧城市研究院,香港,9990773 深圳大学建筑与城市规划学院城市空间信息工程系,广东 深圳,518061An Uncertainty Research Method of Mobile Phone Signaling Data Analysis Results Validated by Multi-source
2、 DataHANYu1 SHIWenzhong2 TUWei31 School of Remote Sensing and Information Engineering,Wuhan University,Wuhan 430079,China2 Smart Cities Research Institute,Hongkong Polytechnic University,Hong Kong 999077,China3 Department of Urban Spatial Information Engineering,School of Architecture and Urban Plan
3、ning,Shenzhen University,Shenzhen 518061,China摘要:手机信令数据被广泛应用于城市人群的动态特征分析,但其分析结果的不确定性尚不明确。因此,提出一种多源数据验证的不确定性分析方法。将从手机信令数据中提取的分布特征与多源数据进行对比,用人群代表性、转移覆盖率、聚集一致性 3个指标评价分析结果的不确定性。并基于深圳市手机信令数据,选取了城市感知中人群分布、区域流动、热点识别 3个典型城市动态特征,用人口网格分布、营运车辆 GPS 数据、高德兴趣点(point of interest,POI)等数据集对手机信令数据的分析结果进行验证,得出该区域手机信令数据
4、分析结果的不确定性特征。关键词:手机信令数据;不确定性;多源数据;城市感知中图分类号:P208文献标志码:AAbstract:Mobile phone signaling data(MPD)are widely used to analyze the dynamic characteristics of urban population.However,the uncertainty of the analysis results is not clear.Therefore,we propose an uncertainty analysis method verified by multi
5、-source data.We compare the distribution characteristics extracted from the mobile phone signaling data with multi-source data,and evaluate the uncertainty of the analysis results by representativeness of population,coverage rate of transfer and consistency of aggregation.Based on the mobile phone s
6、ignaling data in Shenzhen,we select three typical urban dynamic characteristics in urban sensing(population distribution,regional flow and hot spot identification),and verify the uncertainty of the analysis results obtained by mobile phone signaling data with data sets including distribution data of
7、 population grid,GPS data of operating vehicles,and point of interest(POI)data from Amap to get the uncertainty characteristics of analysis results obtained by the mobile phone signaling data in the study area.Key words:mobile phone signaling data;uncertainty;multi-source data;urban sensing当前智慧城市发展进
8、程不断加快,空间大数据使实时精细的时空感知成为可能1。空间大数据的不确定性对地理分析结果至关重要,对其不确定性的客观认识及针对性改善有利于提升空间大数据分析结果的可靠性2。手机信令数据覆盖范围广、样本数据量大,已被广泛用于城市人口调查、空间格局感知等领域3-5。但其定位原理存在固有缺陷,导致手机信令数据空间分辨率较低且存在区域差异。同时,通信运营商市场份额不均匀导致手机信令数据的人群覆盖不均匀,给基于手机信令数据的空间分析带来了较大不确定性6。不确定性本身无法避免,但可以通过认知分析中存在的不确定性,采取相应对策减轻负面影响,使分析结果更加可靠。由于缺乏真实地面数据集的验证,手机信令数DOI:
9、10.14188/j.2095-6045.2021217文章编号:2095-6045(2023)01-0044-05引用格式:韩钰,史文中,涂伟.一种基于多源数据验证的手机信令数据分析结果不确定性研究方法 J.测绘地理信息,2023,48(1):44-48(HAN Yu,SHI Wenzhong,TU Wei.An Uncertainty Research Method of Mobile Phone Signaling Data Analysis Results Validated by Multi-source Data J.Journal of Geomatics,2023,48(1):
10、44-48)基金项目:国家重点研发计划(2019YFB2103102);国家自然科学基金与欧洲城市化联合研究计划合作研究项目(71961137003)。第 48 卷第 1 期韩钰等:一种基于多源数据验证的手机信令数据分析结果不确定性研究方法据不确定性评估多从应用效果出发7,分微观和宏观两个角度。在微观层面,针对个体流动探究手机数据集特征对人类移动性指标的影响8。在宏观层面,多将从手机信令数据中提取的人群流动特征与官方统计的旅行日志进行对比9。少量研究通过外置 GPS设备采集定位数据,以此为基准测量手机信令数据的定位偏差10,但该方法的样本区域远小于手机信令数据的覆盖范围,缺乏推广应用的潜力。本
11、文将一组由原始手机信令数据预先编译生成的起讫点(origin-destination,OD)数据应用于分析城市人口分布、区域间流动及识别城市热点,并结合多源数据对分析结果进行验证,研究手机信令数据在城市空间分析中的不确定性,以了解手机信令数据在城市感知领域的优势和局限性,提高手机信令数据分析的可靠性。1 研究区域和数据源本文研究区域为广东省深圳市。深圳市近年来发展迅速,城市现代化程度很高,截至 2018年末,常住人口有 1 302万人,人口密度达 6 484人/km2,位居全国前列。实验数据是 2019年某工作日的手机信令 OD数据,数据汇集网格大小为 250 m,时间窗口为 1 h。研究区域
12、及数据分布密度如图 1所示。实验及验证数据集详情如表 1所示。2 多源数据验证的不确定性分析方法为了分析手机信令数据在城市感知应用中的不确定性,本文以人口网格数据、营运车辆 GPS 数据及高德兴趣点(point of interest,POI)数据为参考数据集,首先分别提取实验数据集和验证数据集中对应的分析特征,然后对提取出的分析特征进行对比验证,定义人群代表性、转移覆盖率、聚集一致性 3个指标分别对分布、转移、聚集 3个分析特征进行评价,得出不确定性分析结果,提出改善方法。2.1分析特征提取1)时空分布特征。以往研究使用手机信令数据估计城市人口分布时,通常假设手机通信活跃量与人口分布成正比,
13、但由于现实中通信活跃量有时空差异,用手机数据分布推断人口分布存在一定偏差。本文提取手机信令数据的时空分布特征,以探究该偏差的具体表现。验证数据集为 WorldPop 人口网格数据11,网格大小为 100 m,通过重采样将数据匹配到与手机数据相同的 250 m网格中。2)区域转移矩阵。手机 OD 数据集可被用于分析城市区域间的人群流动,对应的分析特征为转移矩阵。首先将 OD 数据集中的起点和终点对应到深圳市的 10个行政区中,删除起点和终点在相同区的记录;然后构建10 10的转移矩阵,矩阵值是以纵轴为起点,横轴为终点的记录数。该矩阵按照同一起点进行标准化。用于验证的营运车辆 GPS 数据包括出租
14、车、公交车、货车等营运车辆定时上传的GPS 数据,经过起点-终点提取后,采用与实验数据相同的方法提取区域转移矩阵。3)聚集热点。手机信令数据可被用于识别城市职住空间分布,一般用手机信令数据密度分布进行空间聚类与密度分级,识别居住和就业功能区12。分别对上班时段(07:0010:00)、下班时段(17:0020:00)OD数据集中的起点与终点进行具有噪声的基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN),提取聚类中心。验证数据集为高德 POI数据,提取 POI中类别为住宅和公司企业的数据,利
15、用 DBSCAN 对其进行聚类,并在ArcGIS中进行核密度分析,提取POI热点。2.2验证方法及指标1)人口分布。以往研究通常利用手机信令数据模拟城市人口分布,但很少将其与实际人口进行对比。本文选取 3个模型探究手机信令数据通信量与参考人口数据间的关系:P=V+(1)P=i=0kiVi(2)lgP=lgV+(3)式中,P为因变量,表示将参考人口数据重采样到实验网格后,每个网格包含的人口总量;V为自变量,表示每个网格内的通信总量,包含该网格内的起点图 1研究区域Fig.1The Study Area表 1实验数据及验证数据详情Tab.1Details of Experimental Data
16、and Validation Data数据名称手机信令数据WorldPop人口网格数据营运车辆 GPS数据高德 POI数据数据类型实验数据验证数据验证数据验证数据格式csvtiffcsvcsv时间节点2019年初2019年2018年底2019年样本数量4 816 903-2 133 6961 334 38845测绘地理信息2023 年 2 月和终点记录;、分别为自变量系数和常数项。手机数据时间窗口为 1 h,共 24个时间窗口,将每个小时的手机数据作为自变量,每个模型产生 24组参数。将全天的手机数据总量作为自变量,每个模型产生 1组参数。用 Spearman相关系数与均方根误差(root m
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 数据 验证 手机 分析 结果 不确定性 研究 方法 韩钰
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。