基于不确定场定义模糊贡献度的多源测绘信息数据挖掘研究.pdf
《基于不确定场定义模糊贡献度的多源测绘信息数据挖掘研究.pdf》由会员分享,可在线阅读,更多相关《基于不确定场定义模糊贡献度的多源测绘信息数据挖掘研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、现代电子技术Modern Electronics TechniqueSep.2023Vol.46 No.182023年9月15日第46卷第18期DOI:10.16652/j.issn.1004373x.2023.18.014引用格式:梁科.基于不确定场定义模糊贡献度的多源测绘信息数据挖掘研究J.现代电子技术,2023,46(18):7176.基于不确定场定义模糊贡献度的多源测绘信息数据挖掘研究梁 科1,2(1.娄底市地理信息中心,湖南 娄底 417000;2.中南大学,湖南 长沙 410000)摘 要:地理测绘信息来源具有多源性,不同数据源下的数据需要大量模糊语言描述,但缺少精准定义不同来源测
2、绘信息的特征属性。针对不同来源的数据关系挖掘精准度差的问题,文中设计一种基于不确定场定义模糊贡献度的多源测绘信息数据库相似关系挖掘算法。使用 Kmeans算法划分测绘多源数据类型,把划分结果作为训练数据集并转变为矩阵模式,代入反向传播(Back Propagation,BP)神经网络中训练,并清洗多源信息数据。利用数学中的不确定场模型定义测绘多源信息的模糊贡献度,获得数据库多源信息模糊水平。在遗传算法基础上引入兴趣度概念,定义两个测绘信息同时存在的信息量,调节染色体适应度,将杂交概率与染色体相似度的耦合关联作为多源信息模糊相似关系输出值,完成预期数据挖掘工作。实验结果表明,所设计的挖掘算法模糊
3、相似关系挖掘时间约为7.5 s,方差值在6以内,数据挖掘结果的精准度在85%以上,可为地理测绘数据的正确应用提供可靠借鉴。关键词:地理测绘多源信息;模糊贡献度;模糊相似关系;数据挖掘;不确定场;遗传算法中图分类号:TN91934;TP391 文献标识码:A 文章编号:1004373X(2023)18007106Multisource surveying and mapping information data mining based on fuzzy contribution degree of uncertainty field definitionLIANG Ke1,2(1.Loudi
4、Geographic Information Center,Loudi 417000,China;2.Central South University,Changsha 410000,China)Abstract:The sources of geographic surveying and mapping information are multisource.The data under different data sources need a large number of fuzzy language descriptions,and there is a lack of accur
5、ate definition of the characteristics of surveying and mapping information from different sources.In allusion to the poor accuracy in mining data relationships from different sources,a mining algorithm of similarity relationship in multisource mapping information database based on fuzzy contribution
6、 degree defined by uncertainty field is designed.The Kmeans algorithm is used to divide the types of multisource surveying and mapping data,and the division results are taken as the training data set and transformed into the matrix mode,which is then substituted into the BP(back propagation)neural n
7、etwork for training,and the multisource information data is cleaned.The uncertainty field model in mathematics is used to define the fuzzy contribution degree of multisource surveying and mapping information to obtain the fuzzy level of multisource information in database.On the basis of genetic alg
8、orithm,the concept of interest degree is introduced to define the amount of information that two mapping information exist at the same time,the chromosome fitness is adjusted,and the coupling association between the hybridization probability and the chromosome similarity is used as the output value
9、of the fuzzy similarity relationship of multisource information to complete the expected data mining.The experimental results show that the mining time of the designed mining algorithm for fuzzy similarity relations is about 7.5 s,the variance is within 6,and the accuracy of the data mining results
10、is above 85%,which can provide a reliable reference for the correct application of geographic surveying and mapping data.Keywords:geographic surveying and mapping multisource;fuzzy contribution degree;fuzzy similarity relationship;data mining;uncertainty field;genetic algorithm收稿日期:20230109 修回日期:202
11、30228基金项目:湖南省科技项目(202000560001)7171现代电子技术2023年第46卷0 引 言高精度地理测绘数据是城市规划和施工建设的重要保障。在地理测绘数据库中,某些定性自然语言空间与定量图形空间之间存在映射12。在规范的数据库建设标准中,相同测绘目标伴随尺度的改变,会保持一种相似关系,这类相似关系被称为模糊相似关系。要想完成优质的城市规划设计,恰当利用国土地理资源34,则需要精准挖掘不同来源测绘数据的模糊相似关系,帮助相关工作人员更好地实现国土监测任务。不同来源的数据挖掘问题一直是数据挖掘领域研究的重点。李瑞峰等人通过森林预测概率设置权重因子,将权重因子看作级联层中每个森林
12、的权重,依照数据样本分布差异计算类密度与局部孤立因子,得到数据离群水平,并完成数据挖掘5。李莉使用agent判断目标类可能性,引入逻辑和社会选择理论,采用判断聚合模型得到全局分类结果6。但上述两种方法都存在挖掘精准度低的问题,数据挖掘效率无法满足当前工作需求。以上方法在地理测绘信息中应用后,存在明显弊端。因为地理测绘信息来源具有多源性,不同数据源下的数据需要大量模糊语言描述,但缺少精准定义不同来源测绘信息的特征属性。针对不同来源的数据关系挖掘精准度差的问题,本文设计一种基于不确定场定义模糊贡献度的多源测绘信息数据库相似关系挖掘算法。利用 Kmeans算法和 BP 神经网络进行数据清洗,去除数据
13、库中的无效信息;采用不确定场模型综合判断多源信息模糊水平;使用遗传算法得到最优的模糊相似关系挖掘结果。最后在实验分析中验证了本文方法的实用性。1 地理测绘多源信息数据清洗地理测绘多源信息之间具备一定相关性,无法从单一方面证明某个数据为异常值。为检查数据库中的信息是否具备一致性,利用 BP神经网络完成数据清洗工作。BP神经网络拥有良好的非线性映射,但在样本庞大、复杂度高的环境下会产生较大误差。为弥补其性能缺陷78,使用 Kmeans 算法划分地理测绘多源信息类型,将划分结果作为训练数据集,引入 BP神经网络中,完成可靠的数据清洗。采用欧氏距离9评估多源地理测绘信息样本和聚类中心之间的关联度,假设
14、a1、a2、a3多源地理测绘数据集的原始聚类中心是d1、d2、d3,那么地理测绘数据bi和聚类中心ej之间的相似水平为:()bi,ej=i=1c|bi-ej2 (1)式中c代表样本维数。更新地理测绘数据集的聚类中心,过程为:el=i=1ghig (2)式中:g为地理测绘数据集内的样本数量;hi是数据矢量。本文将地理测绘多源信息类型划分过程定义为式(3),并把输出结果融合为若干数据集。()ej,el=i=1c|eji-eli2 (3)BP神经网络中包含输入层、隐含层与输出层,每个层级之间为全连接状态,各连接弧衔接两个神经元,并赋予一定权值,权值即为上一层神经元对下一层神经元的影响程度1011,各
15、层的随机两个节点互不相连。网络训练过程分为正向、反向两步流程,其中隐含层拥有一定抽象作用,可以在输入信息中提取数据特征,完成网络非线性映射。将地理测绘数据集转变成矩阵模式,归一化输入矩阵A,得到:Ai=A-min()Amax()A-min()A (4)式中,max()A、min()A依次为矩阵中的最大与最小值。若网络内涵盖k个输入样本,第i个输入地理测绘样本是ki,将ki引入网络后,输出结果的误差总值为:Bc=12i=1c()mi-mi2 (5)式中:mi是网络真实输出值;mi是预期输出值。BP 神经网络调节权值时,为避免训练过程产生振荡,导致收敛速率变慢,在权值中代入动量项12。假如uj是第
16、j层权值矩阵,j为第j层输入矢量,那么包含动量项的权值调节矢量解析式为:uj()t=qj+uj()t-1(6)式中:q代表学习率;是神经元误差输出信号;是动量指数。执行完以上操作后,分组训练多源数据集,奇数组是训练样本,偶数组是检测样本,最终的输出值即为地理测绘数据清洗结果。2 基于不确定场定义地理测绘数据模糊贡献度地理测绘空间信息本身具有模糊性,为提升模糊相似关系挖掘的准确性,需要预先对信息模糊水平进行分析,了解不同信息元素的模糊贡献度1314。本文设计一种基于不确定场模型的模糊信息模糊72第18期水平评估方法。此模型把数学中的欧几里得全部空间作为一个持续的场,将r()x,y拟作不确定场()
17、x,y位置的概率密度函数。设定地理空间中的测绘数据支持集是C,为便于计算,采用栅格架构离散化处理支持集C,关于各栅格()i,j,将其记作:D()i,j=glr()x,y dxdy (7)式中:D代表栅格点()i,j的覆盖范围;gl表示覆盖系数。地理测绘参照对象拥有一定空间范围1516,测绘初始点匀称分布于参照对象内。针对参照对象E,初始点的概率分布函数为:r()x,y=1 Q()h,()x,y h0,()x,y h (8)式中:Q()h是参照对应面积;h表示测绘高度。关于测绘多源信息的方位关联,使用 8圆锥模型,把测绘目标的欧几里得平面划分成8个方向,在各圆锥内,依照距离中轴线越近概率越高的定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 不确定 定义 模糊 贡献 测绘 信息 数据 挖掘 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。