2017年全国大学生数学建模竞赛国家一等奖论文 D题基于统计分析的公共自行车服务系统评价模型研究..docx
《2017年全国大学生数学建模竞赛国家一等奖论文 D题基于统计分析的公共自行车服务系统评价模型研究..docx》由会员分享,可在线阅读,更多相关《2017年全国大学生数学建模竞赛国家一等奖论文 D题基于统计分析的公共自行车服务系统评价模型研究..docx(94页珍藏版)》请在咨信网上搜索。
1、基于统计分析的公共自行车服务系统评价模型研究摘要本文针对温州市鹿城区公共自行车管理中心提供的数据, 首先对所给数据进 行预处理,建立了相关统计模型,运用SPSS20.0、 matlab等软件进行统计分析, 最后应用关联度分析法对系统进行评价,并提出改进建议。针对问题一: 在已处理好的数据基础上, 建立了频率与频数、 用车时长的统 计模型, 利用SPSS软件分别统计各站点20天中每天及累计的借车及还车频次, 得 到每天和累计的借车和还车频次(见表五和表六);并对所有站点按累计的借车 和还车频次排序(见表七和表八) ;对每次用车时长的分布情况进行统计分析,画出其分布图(见图一和图二),由图可知:每
2、天用车时长分布形状非常相似且 近似服从 2 分布。针对问题二: 在已处理好的数据基础上, 建立了使用公用自行车的不同借车 卡数量的统计模型,利用 SPSS 统计 20 天中每天使用不同借车卡数量,其中最大 的为第 20 天的 19885;统计了每张借车卡累计借车次数的分布图(见图三),对 图形分析可得:借车次数在 10 次以内的占 54.86% ,借车次数在 10 至 30 次占 35.88% ,借车次数在 30 至 50 次占 7.51% ,借车次数在 50 以上占1.75% ,最大 借车次数高达182 次。针对问题三: 根据问题一的分析, 已给站点累计所用公共自行车次数最大的 一天是第 2
3、0 天。 对于第一小问: 利用第 20 天数据, 运用 floyd 算法求得两站点 间最短时间, 将站与站间的距离定义为两站间的最短时间与自行车速度之积, 同 时考虑到了速度和时间的随机误差影响;利用距离的定义,通过 matlab 计算得 两站点最长距离为: 675 ,最短距离为: 0.08 。利用问题一中的频数模型,对借还 车是同一站点且使用时间在1分钟以上的借还车情况进行统计,得借车频次表 (见表十一)和用车时间分布图(见图四)。对于第二小问:根据问题一的统计, 第 20 天的借车和还车频次最高的站点分别为 42(街心公园)和 56(五马美食林), 利用 SPSS 统计出两站点借、还车时刻
4、和用车时长的分布图(见图五,图六,图 七),由图形分析可知:借还车的高峰期与人们上下班的时间非常吻合,在借还 车时间上大体都在一小时以内。第三小问:将第 20 天数据从6点到 22 点每半小 时作为一时段,分别统计各站点各时段借还车频数,利用 matlab 编程求出借还 车高峰时段(见表十二),并对具有借车高峰时段与还车高峰时段的站点进行归 类。 (见表十四)针对问题四: 根据前三个问题的统计结果, 结合公共自行车服务指南, 确定 评价公共自行车服务系统站点设置和锁桩数量的配置的主要指标有:借车频数、 还车频数、可借比例、可还比例、锁桩数目,建立了基于灰色关联分析法和聚类 分析的公共自行车服务
5、评价模型,得到评价结果: 180 个站点分成有优劣之分的 三个类(见表十五)。针对问题五: 通过查阅相关资料知: 公共自行车的其他运行规律主要是借还 车时间有限制,用车时间集中在短时间内等。针对此问题提出了相关建议。关键词: 公共自行车服务系统 统计分析 灰色关联度分析 聚类分析1一、 问题重述1.1 问题背景公共自行车作为一种低碳、环保、节能、健康的出行方式,正在全国许多城 市迅速推广与普及。 在公共自行车服务系统中, 自行车租赁的站点位置及各站点 自行车锁桩和自行车数量的配置, 对系统的运行效率与用户的满意度有重要的影 响。1.2 问题提出了解公共自行车服务模式和使用规则的基础上, 根据附
6、件提供的数据, 建立 数学模型,讨论以下问题:1. 分别统计各站点 20 天中每天及累计的借车频次和还车频次,并对所有站 点按累计的借车频次和还车频次分别给出它们的排序。 另外, 试统计分析每次用 车时长的分布情况。2. 试统计 20 天中各天使用公共自行车的不同借车卡 (即借车人) 数量, 并 统计数据中出现过的每张借车卡累计借车次数的分布情况。3. 找出所有已给站点合计使用公共自行车次数最大的一天,并讨论以下问 题:(1)请定义两站点之间的距离,并找出自行车用车的借还车站点之间(非 零) 最短距离与最长距离。 对借还车是同一站点且使用时间在 1 分钟以上的借还 车情况进行统计。(2)选择借
7、车频次最高和还车频次最高的站点,分别统计分析其借、还车 时刻的分布及用车时长的分布。(3)找出各站点的借车高峰时段和还车高峰时段,在地图上标注或列表给 出高峰时段各站点的借车频次和还车频次, 并对具有共同借车高峰时段和还车高 峰时段的站点分别进行归类。4. 请说明上述统计结果携带了哪些有用的信息,由此对目前公共自行车服 务系统站点设置和锁桩数量的配置做出评价。5. 找出公共自行车服务系统的其他运行规律,提出改进建议。二、问题分析题目提供了 20 天公共自行车借车和还车等原始数据,本文的关键就是通过 分析处理所给数据, 建立数学模型来研究公共自行车服务系统, 并对公共自行车 服务系统进行评级及提
8、出改进建议。2.1 问题一分析要统计各站点 20 天中每天和累计的借车和还车频次,查阅资料知1 ,频数 为频率和频数,对于借车与还车频数,可引入 0- 1 变量表示各站第 i 天借车和还 车在 j 次记录中出现的频数, 各站每天和累计的借车频数就是借出车站号在每天出现的次数和总天数的借车频数和, 各站每天的借车频率是借出车站号在每天出 现的次数与每天的有效数据,累计的借车频率是累计借车的频数比上总有效数 据, 对于借车每天及累计的频数类似, 从而可建立相应的统计模型。 根据以上分 析,可统计出各站点 20 天中每天和累计的借车和还车频次,进而可对所有站点2累计的借车和还车频次排序。 分析每次用
9、车时长的分布情况, 可运用相关软件将 分布情况作出。2.2 问题二分析要统计 20 天每天使用公共自行车的不同借车卡的数量,对于各天的借车人 数相当多, 为此先用相关软件对有效数据进行处理, 即将重复的借车卡, 累计到 不同借车卡的一行中, 可得到没有重复的不同借车卡数据, 引入 0- 1 变量表示第i 张卡第 j 个数据中出现的情况,累计求和,就可得到各天不同借车卡的数量,即得相应统计模型,再运用相关软件分析每张借车卡累计次数的分布情况。2.3 问题三分析(1)由于站点之间的实际距离很难得到,且城市里人流量较大,自行车行 驶速度不可能很大, 应比较均匀, 所以定义两站点之间的距离, 可根据物
10、理中距 离与时间和速度的关系定义距离, 其中时间的获取可通过数据中所给的站与站之 间的用时加以处理后得到。 该定义的距离会应不同的骑车速度和时间, 导致两站 点距离不同,因此速度和时间需要引进误差,且将两相同站点的距离定义为 0, 为此可得到距离的定义。对于借还车是同一站点且用时一分钟以上的借还车情况 直接利用 SPSS 进行统计即可得出相应结果。(2)根据问题一得到结果,可找到所有站点使用自行车次数最大一天,借 车频次高和还车频次最高的站点, 根据相应站点的数据, 可应用相关软件将各站 点的借、还车时刻的分布及用车时长的分布求出。(3)题中给出数据的借车还车时间段为 6: 00 21: 00
11、, 要求各站点借车还车 的高峰时段, 可对总的时间段进行划分, 考虑到数据量以及统计的精确度, 可采 用一定时间间隔作为一个时间段, 分别统计各个站点在每个事件段内的借车频数 以及还车频数, 则最高借还车频数对应的时间段即为高峰时段, 进而能得出高峰 时段各站点的借车频次和还车频次, 此处统计工作量可能较大。再对其整体分析, 即能得到具有共同借车高峰时段和还车高峰时段的站点的归类情况2.4 问题四分析要对目前公共自行车服务系统站点设置和数量的配置做出评价, 要根据前几 问统计的数据, 找出相应的指标, 根据问题一, 可让借车频数和还车频数作为其 中指标, 从数据的初步分析来看, 借车、 与还车
12、频数可能大, 说明车流量比较多, 从这方面, 也可根据题目所提供的站点地理位置, 可以知道各个站台的得可借比 例(可借车位比上总车位)和可还比例(可借车位比上总车位),作为其中指标, 对于数量的配置, 根据各站锁桩的数量等作为其中指标, 为此可得到相应指标对 自行车服务系统进行评价, 运用灰色关联分析法, 求出各个站点的关联度, 进行 排序,可再用 SPSS 聚类分析分成三类,求出每一类的均值,从而进一步确定出 类别间的优劣。2.5 问题五分析要找出自行车服务系统的其他运行规律并提出改进意见, 要先对问题中所有 数据的一个时间分布情况、 借车高峰、 还车高峰、 以及站点中桩位设置的合理性, 进
13、行改进。 而改进的方法可能从现有数据和系统流程不能解决, 因此可通过查找 其他服务系统中号的服务规则进行改进。3三、符号说明4y (i = 1 181)iN (k = 1,2 20)kZijHidijtij第 i个站的频数第 k 天数据记录的有效总数(剔除后的数据)第t 个时间在第 j 次记录中的出现次数i第i 张卡出现的频数第i个站到第 j 个站的距离第i个站到第 j 个站的所用最短时间12piZkn (k = 1,2 C2 )k 181v 时间合成误差速度随机误差第i 个站点的频率第 k 天借记卡总数第i 个站到第 j 个站在数据中出现的次数人骑自行车的平均速度t ijt jiA, B第i
14、个站到第 j 个站的时间集中数据第个 j 站到第i个站的时间集中数据测量数据时的不确定度四、模型假设1、以自行车车站号做为借车车站的唯一标识2、附件中所给的数据能准确描述公共自行车系统管理与运营状况3、自行车行驶的过程中,以匀速行驶,行驶过程中不会停留4、异常数据的剔除,不影响数据的整体性五、数据预处理观察整个数据发现有许多异常数据,对任意一天的数据统计发现共提供了 181 个站点, 但是 108 号站点是空缺值。 根据用车时间、 用车方式、 换车锁桩号、 温州鹿城公共自行车服务指南等信息剔除一些不合理数据。1 剔除部分用车时间在 0 2 分钟:对于数据中用车时间 0 的, 借车者从用一车站借
15、出、 同一车站还回, 而且借 还车桩号基本相同, 其可能原因是车辆发现自行车有问题就立即还回和在借车成 功后 20 秒内自行车未推出,则 20 秒后自动锁上(温州鹿城公共自行车服务指南), 这样的情况自行车都属于没有使用; 对于数据用车时间 1 和 2 的, 可剔除同一车 站提出同一车站还回, 可能原因为车有问题立即还回, 车是没有使用的, 系统有 计算出了该类车的用车时间, 因此可以剔除这样的情况的数据, 但该数据中有借 还车地点不一样不能剔除,因为可能两站之间距离很小能在1 2 分钟左右完成。 以下表(表一)为例:表一:用车时间为 0 2借车锁 还车车站号 还车锁的数据借出车站号94169
16、13421955用车时间00112298541911884101919416913421955用车方式 会员卡借车 会员卡借车 会员卡借车 会员卡借车 会员卡借车 会员卡借车1 剔除部分用车时间在 3 5 分钟:根据温州鹿城公共自行车服务指南无法借、 还车处理办法第四条, 即借车时 听到语音提示“通讯故障暂停使用”,请等待 3 5 分钟后,换桩借车。可以知 道在同一车站提出同一车站还回借还车桩一样的,且用车时间在 3 5 分钟内这 样的数据, 自行车可能是无法使用, 但系统又在计算用车计时, 对于这样的数据 可以剔除。以下表(表二)为例:表二:用车时间为 3 5借车锁 还车车站号 还车锁借出车
17、站号131814970164用车方式 会员卡借车 会员卡借车 会员卡借车 会员卡借车 会员卡借车 会员卡借车的数据用车时间1202020111318149701641202020113344551 剔除还车桩桩号为 0 的数据:数据中有极少数的车桩号为 0,而且车桩号为 0 的同时,用车时间也为 0 , 该原因可能为借车者没有还车而导致或该桩号的车被盗, 这样的数据是没有意义 的,理应剔除。以下表(表三)为例:表三:还车桩桩号为 0 的数据借出车站号 借车锁 还车车站号 还车锁 用车时间 用车方式82 11 0 0 0 会员卡借车99 14 0 0 0 会员卡借车1 剔除用车方式为还车故障的数
18、据:在所有数据中有极少的数据借车时间和还车时间差值并不等于用车时间, 在 用车方式上写了还车故障, 这一部分数据也会影响结果因当剔除, 以下表 (表四)5p = yi (k = 1 20,i = 1 n)i Nij l0 第i站在第j次记录中不出现为例:表四: 用车方式为还车故障统计表借出车站号 借车锁 还车车站号 还车锁 用车时间 4 4 47 8 071 14 44 19 0用车方式 还车故障 还车故障1 剔除数据还车车站号不存在的数据:根据温州鹿城公共自行车站点地图可以知站号最大号为 6055,但有些数据 还车车站号不存在,该类数据有 2 个分别是在第 5 天中的借出车站号为 9,还车
19、车站号为 29999 (不存在)和第 7 天中借出站号为 43,还车车站号为 29999 的, 这一类型的数据对研究没有意义应当剔除。1 剔除调试站的数据在 20 天的数据整理中,发现有 4 天中出现了调试站,这些调试站分别在第 8,9,15,16 天中。 调试站借车桩位和还车桩位都为 1000, 而且一直都在桩位上用 车时间为 0 ,因此对数据的研究没有意义应当剔除。剔除的所有数据详见附录 1。六、模型的建立与求解6.1 问题一的解答6.1.1 模型一的建立需要统计各站点 20 天中每天和累计的借车频次,查阅资料知频次为频率和频数1 ,分别建立频率与频数的模型。设 x 为 0- 1 变量,即
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2017年全国大学生数学建模竞赛国家一等奖论文 D题基于统计分析的公共自行车服务系统评价模型研究. 2017 全国大学生 数学 建模 竞赛 国家 一等奖 论文 基于 统计分析 公共 自行车 服务 系统
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【鱼**】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【鱼**】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
链接地址:https://www.zixin.com.cn/doc/806690.html