基于CSI和K-means...VR的多指纹库室内定位方法_王逸.pdf
《基于CSI和K-means...VR的多指纹库室内定位方法_王逸.pdf》由会员分享,可在线阅读,更多相关《基于CSI和K-means...VR的多指纹库室内定位方法_王逸.pdf(5页珍藏版)》请在咨信网上搜索。
1、2023-05-10计算机应用,Journal of Computer Applications2023,43(5):1636-1640ISSN 1001-9081CODEN JYIIDUhttp:/基于CSI和K-means-SVR的多指纹库室内定位方法王逸1,裴生雷1,2*,王煜3(1.青海民族大学 物理与电子信息工程学院,西宁 810007;2.人工智能应用技术国家民委重点实验室(青海民族大学),西宁810007;3.天津大学 智能与计算学部,天津 300350)(通信作者电子邮箱)摘要:传统的Wi-Fi室内定位方法需要与所有指纹数据库中的指纹数据进行匹配后才能定位,导致人群聚集区域定位
2、效率不高,体验较差。提出一种基于信道状态信息(CSI)、K均值(K-means)聚类算法与支持向量回归(SVR)算法相结合的多指纹库室内定位方法。该方法首先根据CSI的簇分布特点,利用K-means算法对所有定位点内的CSI数据聚类后得到多个簇的CSI数据;然后,基于多个簇分别建立多个指纹库,并将CSI数据分别存入多个指纹库,进而在每个指纹库中分别训练SVR模型用于Wi-Fi定位。相较于传统的支持向量机(SVM)定位方法,所提方法在离线阶段需要的训练样本更少,定位效率更高;在线阶段,该方法既降低了匹配的复杂度,也提高了定位的精度。由于使用了多指纹库,Wi-Fi定位系统可以根据人流量实时调整资源
3、分配策略,提高服务器运行效率和定位服务体验。关键词:位置服务;室内定位;K均值聚类算法;支持向量回归;多指纹库;信道状态信息中图分类号:TP391 文献标志码:AIndoor positioning method of multi-fingerprint database based on channel state information and K-means-SVRWANG Yi1,PEI Shenglei1,2*,WANG Yu3(1.School of Physics and Electronics Information Engineering,Qinghai Minzu Univ
4、ersity,Xining Qinghai 810007,China;2.Key Laboratory of Artificial Intelligence Application Technology,National Ethnic Affairs Commission(Qinghai Minzu University),Xining Qinghai 810007,China;3.College of Intelligence and Computing,Tianjin University,Tianjin 300350,China)Abstract:The traditional Wi-F
5、i indoor positioning methods need to match all fingerprint data in the fingerprint database before positioning,resulting in low positioning efficiency and poor experience in the crowd gathering area.Therefore,a multi-fingerprint database indoor positioning method based on Channel State Information(C
6、SI),K-means clustering algorithm and Support Vector Regression(SVR)algorithm was proposed.Firstly,according to the cluster distribution characteristics of CSI,K-means algorithm was used to cluster the CSI data in all positioning points to obtain the CSI data of multiple clusters.Then,multiple finger
7、print databases were established based on multiple clusters,and the CSI data was stored in multiple fingerprint databases.After that,SVR models were trained in each fingerprint database for Wi-Fi positioning.Compared with the traditional Support Vector Machine(SVM)positioning method,the proposed met
8、hod needs less training samples in the off-line stage,which improves the positioning efficiency;in the online stage,this method not only reduces the matching complexity,but also improves the positioning accuracy.Due to the use of multi-fingerprint database,the Wi-Fi positioning system can adjust the
9、 resource allocation strategy in real time according to the traffic,so as to improve the server operation efficiency and positioning service experience.Key words:location service;indoor positioning;K-means clustering algorithm;Support Vector Regression(SVR);multi-fingerprint database;Channel State I
10、nformation(CSI)0 引言 随着新一轮智慧城市的兴起,公众Wi-Fi作为一项惠民工程,几乎普及到了我们周围的各个角落。尤其是在旅游景点中,绝大部分都已经实现了Wi-Fi全覆盖,当游客的智能设备连接到景点的Wi-Fi后,就能充分体验景点的各种个性化服务,如地图导览、景点介绍、实时讲解等。在游客享受更好服务的同时,景点也可以通过Wi-Fi收集数据,包括每天服务人数、游客景点内轨迹分析、游览时间喜好、享用服务频次、游览时长等。通过分析这些数据,可以大幅提高景点的服务文章编号:1001-9081(2023)05-1636-05DOI:10.11772/j.issn.1001-9081.20
11、22081162收稿日期:2022-08-29;修回日期:2023-03-01;录用日期:2023-03-03。基金项目:青海省应用基础研究计划项目(2019-ZJ-7017);天津大学-青海民族大学自主创新基金资助项目(2021-TQ-07)。作者简介:王逸(1999),男,陕西延安人,硕士研究生,主要研究方向:机器学习;裴生雷(1980),男,山东潍坊人,教授,博士,主要研究方向:机器学习、数据挖掘、智能决策系统;王煜(1991),男,天津人,助理研究员,博士,CCF会员,主要研究方向:复杂场景多粒度建模、动态开放环境机器学习。第 5 期王逸等:基于CSI和K-means-SVR的多指纹库
12、室内定位方法质量和应急响应能力。与蜂窝信号相比,Wi-Fi信号传输速率更快、成本更低,并且使用频段在全球范围内都不受限制1,所以景点全覆盖的 Wi-Fi网络将会受到更多游客的青睐。景点若想使用Wi-Fi数据获取游客的游览轨迹、游览时长、游览喜好等数据,就要使用Wi-Fi定位技术获取游客的位置。虽然室外定位技术非常成熟,如北斗定位系统2和蜂窝定位系统3,都能实现非常精准的定位。但是,国内有许多重要的景点并不在室外,如故宫、兵马俑、黄鹤楼等,还有全国各地的生态、文化景点,游客更加需要旅游导览、实时讲解等服务,所以更需要室内定位来确定游客的位置,为游客提供更好的服务。但室内定位技术发展并不迅速。与外
13、部环境不同,室内环境因有许多障碍物,导致北斗卫星信号的强度在室内也会大幅下降;而且为了保护历史古迹,许多古迹景点的蜂窝信号强度并不理想,尤其是在绝大部分Wi-Fi覆盖的景点,Wi-Fi信号强度要远强于蜂窝信号,所以在这些景点使用Wi-Fi定位将会更加精准。传统的 Wi-Fi 室内定位使用接收信号强度(Received Signal Strength Indication,RSSI)数据,相较于传统的 RSSI室内定位4-7,信道状态信息(Channel State Information,CSI)数据不仅在时间上具有稳定性,并且不同位置CSI数据的特性变化明显,因而受到了广大学者的关注8-10
14、。Wang等11提出了 RSSI与 CSI相结合生成的混合指纹库的定位方法。孟俊剑 等12用 序 列 最 小 优 化(Sequential Minimal Optimization,SMO)算法建立降维特征与相应位置的回归模型,并对位置进行预测。Dai等13提出了基于K近邻(K-Nearest Neighbor,KNN)算法的 CSI室内定位,但是每次定位都需要在线和指纹库的所有数据进行逐个对比匹配,定位效率不高。田广东等14利用了 CSI 成簇分布的特性,使用了 K 均值(K-means)聚类算法对 CSI 数据进行特征提取,然后使用 KNN 算法定位。党小超等15提出了 CSI 的支持向量
15、机(Support Vector Machine,SVM)回归的室内定位方法。这些基于CSI的室内定位方法都分为离线阶段和在线阶段,其中离线阶段建立指纹库16,在线阶段进行指纹匹配,最终实现定位。Rao等17提出了DFPhaseFL系统,首先从信道状态信息测量中提取原始相位信息,然后去除相位偏移,得到滤波后的校准相位信息,最后进行定位。然而,上述方法在两个阶段中采取的策略各有优缺点,尤其是离线阶段都使用单指纹库导致模型训练复杂度提高;而在线阶段,预测点数据需要与指纹库中所有数据进行匹配,定位效率不高。Wi-Fi室内定位应用场景多样,但是对于旅游景点等复杂场景下的应用,会受到时间段等因素的影响,
16、导致人流量在不同时间、不同区域骤增或骤减。面对这些情况,传统的室内定位方法因受单指纹库的影响,无法充分利用系统资源。尤其是在线定位阶段,使用传统定位方法定位时需要与每个指纹点进行匹配,即使是闲置指纹点也要进行多次匹配,导致指纹库运行缓慢、延迟较高、体验较差。本文将K均值聚类算法与支持向量回归(Support Vector Regression,SVR)算法相结合,提出了一种多指纹库定位方法。根据不同位置CSI信号的簇分布特点,将定位指纹点存入多个指纹库,进而在多指纹库中分别建立模型,实现位置预测。该方法不仅能提高定位精度,而且能有效提高定位效率,每次定位都无须与所有指纹库中的数据进行匹配,可以
17、把闲置的指纹库所使用的系统资源分配给繁忙指纹库,避免了系统资源的浪费。1 指纹定位系统 在 Wi-Fi 室内定位场景中,通过收集 CSI 信息和对象位置坐标实现指纹定位系统,进而为用户提供位置服务,满足用户在特殊场景下的位置需求。根据指纹定位系统在不同场景的应用需求,本文提出的多指纹库定位方法具体流程如图1所示。首先,基于CSI成簇分布的特点,利用K-means算法对训练样本进行聚类以获取k个簇的CSI数据,进而基于k个簇分别建立指纹库;然后在k个指纹库中分别训练 SVR模型;最后,由 SVR进行位置精准预测。2 CSI原始数据处理 2.1CSI数据描述CSI作为定位系统的数据源,其原始数据以
18、复数矩阵的形式存在。采用CSI Tool18读取CSI数据,每个CSI数据包所能提取的CSI子载波个数为30,并可以用矩阵H表示CSI信息。每个 CSI 数据为p q 30,其中:p为发射天线数量,q为接收天线数量,子载波个数为30。H=|h11h21hp1h12h22hp2h1qh2qhpq|(1)为了有效利用CSI数据,通过数据结构分解得出相应的数据。将CSI信号定义为:ij=H1,H2,Hk(2)若第k个子载波上的幅度表示为Hk,相位表示为Hk,那么每一个子载波上的CSI可表示为:Hk=Hke jHk(3)由于相位信息受频偏影响不能精确提取,本文方法仅提取幅值作为指纹信息:Hk=H1,H
19、2,Hk(4)CSI的幅值在距离无线接入点(Access Point,AP)点不同的位置时,有不同的特性。如图2所示,横坐标表示3条链路图1定位流程Fig.1Flow of positioning1637第 43 卷计算机应用的子载波索引,纵坐标为它们的幅值,3条线代表3根天线接收到的CSI数据,当靠近AP点位置测量CSI数据,3根天线的信号表现出了相似的特性;但当在距离AP较远的位置进行测量时,3条链路的曲线不再相似,并且链路之间的差异性变大;即使是同一条链路,幅值也有很大的变化,这说明CSI幅值对于位置的变化非常敏感。2.2数据预处理采集数据后会生成一个样本维度为Ntx Nrx N的 CS
20、I数据,其中:Ntx为发射天线数,Nrx为接收天线数,N为子载波数量。由于原始数据中有1根发射天线、3条链路,每条链路上的子载波数量为30,所以每个CSI信号的维度为1330。为 了 获 取 有 效 的 高 维 信 息,使 用 主 成 分 分 析(Principal Component Analysis,PCA)算法将数据的 N 维信息通过线性变换投影到K1维空间中,其中N维是数据本身的维度,K1维是低维。通过该方法,实现了Ntx Nrx N列的数据降维,获取了有效的CSI信息,保证了数据质量。3 结合K-means和SVR的定位方法 3.1基于CSI数据簇分布特点的聚类分析依据文献 19 的
21、实验分析,CSI数据呈现成簇分布的特点,并且认为超过80%的CSI幅值向量只存在4个以内的分簇。因此考虑应用 K-means算法实现 CSI数据分簇,该算法采用距离来衡量样本之间的相似性,将降维后的CSI数据划分成k个簇,其中,i是簇Ci的均值向量:i=1|Cix Cix(5)K-means算法的本质就是寻找k个质心来最小化平方误差E,E越小说明数据相似度越高,将CSI幅值相似度较高的样本进行聚簇。E=i=1K x Cix-i22(6)3.2建立多指纹库经 过 K-means 得 到k个 类 别,构 建k个 指 纹 库 R1,R2,Rk,每个指纹库包含F个样本的 CSI 指纹。设F=r1,r2
22、,rn,n是指纹信息的个数,CSI数据经过PCA降维后,指纹属性集为 1,2,i。将F个样本包含的 CSI指 纹 属 性 分 别 与 坐 标 对 应,对 应 坐 标P=(x1,y1),(x2,y2),(xn,yn),对应后建立多指纹库 R1,R2,Rk,其中:Rk=(r1,(x1,y1),(r2,(x2,y2),(rn,(xn,yn)(7)3.3构建基于多指纹库的SVR模型建立多个指纹库后,每个指纹库里都存入了不同位置的CSI样本数据,然后在每个数据库中分别建立SVR回归模型进行定位。基于SVR回归算法的核心思路在于用回归的想法找出CSI幅值和位置的关系20。在高维空间中,用非线性映射的方法寻
23、找一个最优超平面,以此来替换原本的非线性关系。建立了k个指纹库后,分别使用每个指纹库的数据集,(ri,xi)|i=1,2,n和(ri,yi)|i=1,2,n。基于 SVR 算法,利用 CSI 的幅值信息与坐标信息的关系,建立函数fx和fy。在x轴上建立线性回归估计函数:x=w,(r)+b(8)其中:w为权值向量;(r)将低维度的CSI指纹信息映射到高维空间;b是定值。SVR 的标准形式为-SVR,其中为不敏感损失函数。SVR 的风险泛化函数R(w)如式(9)所示,其中CSIam是幅值的特征信息。R(w)=max()|f(CSIam,w)-x-,0 dF(CSIam,x)(9)确定参数w和b时为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 CSI means VR 指纹 室内 定位 方法 王逸
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。