应用基于密度聚类的频繁模式增长算法进行煤层气产能分析.pdf
《应用基于密度聚类的频繁模式增长算法进行煤层气产能分析.pdf》由会员分享,可在线阅读,更多相关《应用基于密度聚类的频繁模式增长算法进行煤层气产能分析.pdf(4页珍藏版)》请在咨信网上搜索。
1、SCIENCE&TECHNOLOGY INFORMATION科技资讯 2023 NO.16 能 源 与 环 境科技资讯SCIENCE&TECHNOLOGY INFORMATION应用基于密度聚类的频繁模式增长算法进行煤层气产能分析吕茵1,2 王杨 2 高永伟 1(1.河南省地震局 河南郑州 450018;2.西南石油大学计算机科学学院 四川成都 610500)摘要:由于传统的煤层气产能分析算法存在影响因素不够全面,运行效率低和人为设置聚类参数缺乏说服力的问题。因此,该文在煤层气产能分类的基础上,对分类结果进行回溯,挖掘煤层气产能影响因素的规律,将基于密度聚类算法(Density-Based S
2、patial Clustering of Application with Noise,DBSCAN)与频繁模式增长算法(Frequent-Pattern Growth,FP-Growth)关联度分析算法优化结合,提出新的基于DBSCAN的FP-growth煤层气产能分析模型,找出影响煤层气产能的关键因素及其对应的参数范围。该文是深度学习与煤层气开发交叉学科的应用与研究,致力于煤层气产能分析评价体系的构建,为提高煤层气单井产气量,提升措施选井的决策效率有积极影响。关键词:煤层气产量 DBSCAN聚类 FP-Growth关联度分析算法 频繁项集 措施选井中图分类号:TE-9文献标识码:A 文章编
3、号:1672-3791(2023)16-0181-04Analysis of CBM Productivity by Using FP-Growth Based on DBSCANLYU Yin1,2 WANG Yang2 GAO Yongwei1(1.Henan Earthquake Agency,Zhengzhou,Henan Province,450018 China;2.School of Computer Science,Southwest Petroleum University,Chengdu,Sichuan Province,610500 China)Abstract:The
4、traditional analysis algorithm of CBM productivity has the problems such as the incomplete influence factors,low operation efficiency and unconvincing artificial setting of clustering parameters,so based on the classification of CBM productivity,this paper traces classification results,excavates the
5、 laws of the influence factors of CBM productivity,optimizes and combines the correlation analysis algorithm based on DBSCAN and FP-Growth,puts forward a new analysis model of FP-Growth CBM productivity based on DBSCAN,and finds out the key factors affecting CBM productivity and their corresponding
6、parameter range.This paper is the application and research of deep learning the interdisciplinary of CBM development,and is committed to constructing the analysis and evaluation system of CBM productivity,which has a positive impact on improving the gas production of the single CBM well and promotin
7、g the decision-making efficiency of measure well selection.Key Words:CBM productivity;DBSCAN clustering;FP-Growth correlation analysis algorithm;Frequent item set;Measure well selectionDOI:10.16661/ki.1672-3791.2302-5042-6842基金项目:中国地震局地震应急与信息青年重点任务(项目编号:CEAITNS202324(ITNS)-2023)资助。作者简介:吕茵(1995),女,硕士
8、,助理工程师,研究方向为机器学习、人工智能、大数据、石油工程计算、地震信息化。王杨(1980),女,博士,教授,研究方向为图像处理、石油工程计算、人工智能。高永伟(1991),男,硕士,工程师,研究方向为信息安全、数据挖掘、地震信息化。181SCIENCE&TECHNOLOGY INFORMATION科技资讯能 源 与 环 境 2023 NO.16 SCIENCE&TECHNOLOGY INFORMATION科技资讯目前,传统能源日益紧缺引发了全世界的能源竞争,加快能源发展已经成为世界各国共识。煤层气作为非常规天然气之一,其发展受到全世界各个国家的高度重视1。我国的煤层气地质资源量排名在美国与
9、俄罗斯之后,约占全球的1/7,但我国煤田地质条件复杂,治理和利用瓦斯难度大,在理论和技术方面都存在许多关键性难题,基础理论研究和技术创新仍然存在短板2。为了促进我国的生态文明建设,使生态能源朝着绿色、环保、安全的标准发展,近年来,国家对煤层气的勘探开发高度重视,通过科学手段归纳总结煤层气产气规律为创新煤层气开采方式,提升煤层气开采效率,对推动能源高质量发展有积极影响3。本文基于现有的机器学习方法,在现有方法的基础上加以改进,结合煤层气测井、压裂、排采等真实资料对煤层气的产量值,找出影响高、中、低这3种类别产能对应的参数范围4。本文的主要贡献为提出了基于密度聚类算法(Density-Based
10、Spatial Clustering of Application with Noise,DBSCAN)的频繁模式增长算法(Frequent-Pattern Growth,FP-Growth)煤层气产能分析模型,使用DBSCAN基于密度的聚类算法筛选出重要特征,将聚类的结果做一标记,最终使用FP-Growth关联度分析算法完成产能影响因素的评价5。1 应用方法分析1.1 DBSCAN算法DBSCAN是以密度作为评价标准的空间聚类。该算法有效地规避了数据中的噪声,并且将密度值大于某一阈值的数据自动聚为一类,DBSCAN算法可以聚成任意形状的簇,其中簇指的是密度相连的最大点的集合6。DBSCAN算
11、法实现过程中用到两个参数,分别为扫描半径(eps)和最小包含点数(minPts),通常在二维空间聚类中,minPts的取值为4,本次实验minPts的取值亦为47。1.2 FP-Growth算法关联分析,又被称作关联规则挖掘,是指从看似毫无关联的数据中挖掘出其相关联的规则信息。该算法最早是在20世纪90年代初由AGRAWAL R等学者提出8,关联分析的主要任务是在大规模数据集中寻找关联关系。支持度(support):定量评估频繁项集(k-项集)频繁共现度(即覆盖度)的统计量。关联规则支持度的定义为:support(AB)=P(AB)(1)置信度(confidence):用具体的数值来评估一个频
12、繁项集的准确度的值。关联规则用表达式来具象地表示,其中A和B是两个互不相交的项集,即AB=。关联规则的置信度定义如下confidence(AB)=P(B|A)=support(AB)support(A)(2)FP-Growth 算法是对 Apriori 算法的优化9,FP-Growth算法与Apriori算法的不同是FP-Growth算法使用了特殊的数据结构,这样可以降低对数据库扫描的次数从而减少了一定程度的浪费,加快了算法运行的速度。设M=M1M2Mn是数据集中所有不同项的集合,事物T是M的非空子集,即TM。而数据集D是事务集合,且事务数为N。以表1的事务集为例。(1)通过扫描表1,可以得到
13、一个频繁项集及其支持度的数目。接下来,将得到的频繁项集按照从大到小排列如下式的集合L所示,设支持度为2,则有L=M2:7M1:6M3:6M4:2M5:2(3)(2)建立FP-Tree10,基于此,以null为根节点创建一条路径,第二次扫描表1,以TID为001的事物为例,共包含3项,根据L的排列顺序,得到一条路径。(3)遍历表中的项,得到所有事务的路径。若路径的节点相同,那么将相同节点的计数加1,创建频繁项头表。(4)挖掘FP-Tree,对频繁项头表以降序排列,通过由小及大遍历频繁项头表得到条件模式基,并获得最终的频繁项集11-12。综上,FP-Growth算法主要为以上4个步骤,即创建FP-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 基于 密度 频繁 模式 增长 算法 进行 煤层气 产能 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。