基于EMD距离度量的小样本矿物图像分类.pdf
《基于EMD距离度量的小样本矿物图像分类.pdf》由会员分享,可在线阅读,更多相关《基于EMD距离度量的小样本矿物图像分类.pdf(8页珍藏版)》请在咨信网上搜索。
1、第 55 卷第 6 期郑 州 大 学 学 报(理 学 版)Vol.55 No.62023 年 11 月J.Zhengzhou Univ.(Nat.Sci.Ed.)Nov.2023收稿日期:2022-06-25基金项目:国家自然科学基金联合基金项目(U20A2093);东北石油大学引导性创新基金项目(2020YDL-04)。第一作者:杜睿山(1977),男,副教授,主要从事人工智能、机器学习研究,E-mail:ruishan_du 。基于 EMD 距离度量的小样本矿物图像分类杜睿山1,2,张轶楠1,孟令东2,张桐3(1.东北石油大学 计算机与信息技术学院黑龙江 大庆 163318;2.东北石油大
2、学 油气藏及地下储库完整性评价黑龙江省重点实验室黑龙江 大庆 163318;3.大庆油田有限责任公司 勘探开发研究院黑龙江 大庆 163318)摘要:在复杂的地质勘探条件下准确完成矿物识别是一项重要的任务。基于数据驱动的深度学习模型能精确识别各类岩石矿物,但需要构建庞大且完备的数据集,在实际情况下难以应用。针对此问题,结合小样本学习、度量学习以及元学习训练策略,使用 EMD 距离度量计算图像之间的结构距离,构建一种适应于小样本矿物的图像分类模型。核心思想在于利用图块级别度量并引入交叉参考权重机制,有效减少同类差异大和背景杂乱带来的影响,优于图与图判定分类的模型。在 mini-ImageNet
3、数据集上,5-way 1-shot 和 5-way 5-shot 设置的分类准确率分别提高至55.91%、67.58%;将算法应用于小样本黏土矿物数据集上,5-way 5-shot 设置的分类准确率为 92.65%。实验结果表明,利用度量学习方法的分类精度高于其他小样本学习方法。关键词:小样本学习;度量学习;EMD 距离;特征增强;矿物识别中图分类号:TP391文献标志码:A文章编号:1671-6841(2023)06-0063-08DOI:10.13705/j.issn.1671-6841.2023176 Few-shot Mineral Image Classification Based
4、 on EMD Metric LearningDU Ruishan1,2,ZHANG Yinan1,MENG Lingdong2,ZHANG Tong3(1.Department of Computer and Information Technology,Northeast Petroleum University,Daqing 163318,China;2.Key Laboratory of Oil and Gas Reservoir and Underground Gas Storage Integrity Evaluation,Northeast Petroleum Universit
5、y,Daqing 163318,China;3.Exploration and Development Research Institute,PetroChina Daqing Oilfield Limited Company,Daqing 163318,China)Abstract:Mineral identification is an important task of geological survey,which could be a big challenge in complex geological conditions.Data-driven deep learning mo
6、del could accurately identify all kinds of rocks and minerals,but large and complete datasets should be constructed,and it was difficult in practi-cal situations.Aiming at the problems,herein,an image classification model adapted to small sample minerals was proposed.It adopted the earth movers dist
7、ance(EMD)as a metric to calculate the struc-tural distance between images,which combined the small sample learning,the metric learning and meta-learning training strategy.The core idea of the method was to use the measure of graph block level and introduce the cross-reference weight mechanism,which
8、could effectively reduce the influence caused by the large difference of the same class and the clutter of the background,which was better than the model of graph to graph direct decision classification.The results of 5-way 1-shot and 5-way 5-shot classification experiment on mini-ImageNet showed th
9、at the classification accuracy of 5-way 1-shot and 5-way 5-shot settings was improved to 55.91%and 67.58%.When the algorithm was applied to a Few-shot clay min-eral data-set,the classification accuracy in 5-way 5-shot setting reached 92.65%.The experimental re-sults showed that the classification ac
10、curacy of metric learning method was higher than other few-shot 郑 州 大 学 学 报(理 学 版)第 55 卷methods.Key words:few-shot learning;metric-learning;earth movers distance;feature enhancement;mineral identification0引言黏土矿物是一种含水的硅酸盐或铝硅酸盐矿物,其颗粒结晶极细,小于 2 m,大小和形态需用扫描电子显微镜(scanning electron microscope,SEM)进行测定1。常见的
11、黏土矿物大多分布在各种沉积物和沉积岩中,主要包括伊利石、蒙脱石、高岭石、绿泥石、伊利石/蒙脱石混层等2。通过分析沉积物以及土壤中黏土矿物的类型和含量可以分析出当时的气候特点3。黏土矿物的组合、成分、结构也为揭示古环境演化过程提供了信息4。在地球科学领域中,黏土矿物图像数据获取时间周期长,数据采集、处理和标注通常消耗大量的人力、物力,传统的黏土矿物图像分类也大都是以人眼观察和经验划分为主。因此,进行矿物智能分类是此领域热门研究问题。随着深度学习的飞速发展,利用深度学习进行矿物智能识别逐渐火热起来。Liu 等5运用深度卷积神经网络进行化石智能鉴定。Li 等6比较了五种机器分类算法和一种深度学习算法
12、对扫描电镜-能量色散 X 射线光谱图像(SEM-EDS)像素级矿物分类 目 标 的 性 能。研 究 使 用 了 线 性 支 持 向 量 机(SVM)、K 最近邻(K-NN)和随机森林(RF)等五种模型,实验效果十分优异。但这些工作均需要庞大的数据样本量支撑,才能够训练出一个能较准确表达数据分布的预测模型。利用扫描电子显微镜获取黏土矿物图像,虽然可以直接观察到矿物表面的形貌,但由于成像为灰度图像、矿物类别繁杂、背景影响因素较大等问题,导致电镜图像质量不高,可用作类别判定的图像占所收集图像的百分之十不到。在该问题基础上,数据集样本较少,人工对于电镜图像的识别又存在一定偏差,导致每一类标签样本较少,
13、难以使用基于数据驱动的深度学习方法。近年来,小样本学习应用于图像分类发展飞速,基于度量学习的小样本学习弱化了数据层面稀缺的问题,转而直接计算测试图像与训练图像的距离。但当存在背景杂乱、类间相似和类内差异较大等问题时,会导致在特征提取后生成的嵌入空间中同一类图像的计算距离较远,不可避免地影响图像分类准确度。已有的基于度量学习的小样本分类方法大多采用图与 图直接比较,如孪生 网 络7、原 型 网络8等,却忽略了局部特征的重要性。一张图片各个部分重要性有高有低,所以应构建更加灵活的度量学习算法。对于整体分类特征计算贡献较小,不相关的区域分配较小的权值,而包含图像特征较为丰富、具有高级语义的区域分配较
14、大的权值,这样的计算方式才更符合实际情况。本文将小样本学习问题形式化为最优匹配问题,借助度量学习的思想选择 EMD 距离(earth mov-ers distance)度量函数,来计算测试图像之间的结构距离,最后进行分类预测。针对地层下采集的少量黏土矿物图像样本,构建一个能快速准确判定类别的分类器。1相关工作1.1小样本学习在图像分类领域,小样本学习大致可分为基于模型、度量和优化三大方向9。小样本学习模型和参数优化的方法源自元学习,但模型无关元学习10只是将模型的参数做随机初始化,简单地通过梯度下降法更新模型。根据不同的模型构建方式,小样本图像分类算法可分为基于卷积神经网络模型和图神经网络模型
15、两大类11。随着图像分类网络的不断优化,基于度量学习的方法通常使用卷积神经网络来学习图像特征表示,用距离函数代替全连接层进行分类预测。通过神经网络层工作后生成嵌入空间,在该空间内如果特征向量所属类别一致,距离较近,反之则距离较远。通过计算样本特征向量的距离判别样本所属的类别。较为经典的网络有孪生网络、原型网络、关系网络12和匹配网络13等。孪生网络构建两个结构相同、参数共享的网络,网络输入为样本的任意两幅图像,并进行训练,通过比较距离来判定结果;原型网络通过生成一个嵌入空间,在这个空间内比较测试样本和训练样本各个类别的特征均值之间的欧氏距离,从而预测图像类别;关系网络由嵌入函数和关系函数组成,
16、通过构建神经网络来计算两个样本之间的距离从而分析匹配程度。这些方法都是采用图与图直接衡量比较,将一幅图像直接压缩为一个高度抽象的特征向量,忽46第 6 期杜睿山,等:基于 EMD 距离度量的小样本矿物图像分类略了图像局部特征的重要性14-15。1.2度量学习度量学习16的目标是学习一个成对相似性度量,在该背景下,类似的样本对可获得更高的相似分数,反之则得到较低的相似分数。度量学习包括嵌入模块和度量模块。在深度学习中,通常采用欧氏距离、马氏距离和余弦相似度等17作为距离函数。度量学习运用到小样本学习方法中时,首先将样本集通过嵌入模块嵌入向量空间;然后根据度量模块给出相似度得分,并根据元学习算法思
17、想,将在各种任务中学习到的相似性度量进行转移并推广至全新小样本学习任务中。采用度量学习策略的小样本学习方法主要有两种:一是采用固定的度量;二是采用可学习的度量18。2本文方法2.1黏土矿物的小样本分类2.1.1黏土矿物的分类本文选取高岭石、蒙脱石、石英、伊利石以及绿泥石五种黏土矿物进行分类任务。在扫描电镜下,蒙脱石可见片状晶体,多为细小鳞片状、纤维状;伊利石是由一些丝状边缘的片状、束状或发丝状、粗糙的晶体组成,常呈不规则的极细小鳞片状集合体,类似蒙脱石;高岭石为块状到局部蠕虫状的聚集物,晶层间连接紧密;绿泥石作为独立的形态晶体生长,是板状的;石英通常呈粒状、块状或晶簇、晶腺等。五种黏土矿物在扫
18、描电镜下形态如图 1 所示。2.1.2小样本图像分类本文采用小样本学习方法,小样本分类任务定义如下。给定支持集(support set):类似训练集,包含 N 个分类标签,每个标签有K 张图片。查询集(query set):类似测试集,包含 Q张未分类图片。该任务是在已有支持集的基础上,达到对查询集中的图像准确分类的目的,将这样的任务称为 T:N-way K-shot 图像分类任务,小样本图像分类任务中 K 小于 10。2.1.3元学习训练Thrun 等指出,如果某算法的性能在一个待办任务中随着经验累积而逐步提升,那么称该算法正在学习;如果在一组待办任务中,算法的性能在每一项任务里都可以随着经
19、验增加而提升时,那么认为该算法能够学会如何学习(learning to learn),将这样的算法称为元学习算法19。它利用多次学习不同任务积累的经验提升性能,而不仅仅只针对一个特殊任务。每多处理一个新任务它的经验越充足,也就是说当通过元学习算法处理任务图 1五种黏土矿物 SEM 图Figure 1SEM images of five clay mineralsT 时,需要在一组任务Ti中进行训练。元学习算法在尝试解决这些任务的过程中获得经验,从而最终解决任务 T。黏土矿物和岩石矿物是分割不开的,且其组成相辅相成,本文将多种岩石矿物图像数据也加入模型训练中,填补黏土矿物分类中不可或缺的信息,组
20、成元学习训练作为本文训练方法。2.2EMD 距离学习在小样本学习任务中,基于度量学习的方法旨在找到一个好的特征嵌入空间和距离度量函数来表示、计算图形间的相似性,并进行分类预测。与之前提到的经典网络不同,本文方法将图形分成一个个图块,一张图像提取出一组特征向量,并使用两幅图像结构间的最优转换代价表示图像相似性。文献20证明了生成器的参数如果连续,那么EMD 距离度量作为损失函数也是连续的,比较适用于优化神经网络。考虑到这一点,本文选用 EMD 距离度量来计算图像相似性。EMD 是两组加权物体或分布之间的距离度量,最初是为图像检索而提出的。在给定所有元素对之间的距离的情况下,EMD可以获得成本最小
21、的两种结构之间的最优匹配流。它也可以解释为用另一个结构表示重建一个结构表示的最小成本。假设一组供应商 S=sii=1,2,m,需要将货物运输到指定的一组目的地D=djj=1,2,n,其中:si表示第 i 个供应56郑 州 大 学 学 报(理 学 版)第 55 卷商;dj表示第 j 个目的地。从供应商到目的地的单位成本为 aij,运输的单位数量为 xij。目标为在供货商与目的地之间寻找一个耗费成本最少的货品流X=xiji=1,2,m,j=1,2,n。经过多次运输存储,得到工作量总和 W 的最小值,di、xj作为权重控制着货品流 X,所用公式为W=mi=1nj=1aijxij min,s.t.xi
22、j 0,(1 i m,1 j n),nj=1xij=di(1 i m),mi=1xij=xj(1 j n)。(1)2.3本文模型本文模型主要由特征提取模块和距离度量分类模块组成。前者学习、提取图像组特征向量;后者使用学习过的描述符计算距离度量判定类别。这两个模块集成到一个统一的网络中,并以端到端方式进行培训。2.3.1特征提取模块 该模块用于学习查询集和支持集的特征表示。可以使用任意标准卷积神经网络,但不包括全连接层,因为需要局部特征向量来进行距离度量的计算。由于深度神经网络(deep neu-ral network,DNN)往往使用少量样本会过拟合,小样本学习通常使用浅层神经网络(shall
23、ow neural net-work,SNN)21。为了便于与目前先进的小样本图像分类方法进行比较,本文采用了一种常用的四层卷积神经网络作为嵌入模块。它包含四个卷积块,每个卷积块由 33 卷积层、批处理归一化层、Leaky ReLU 层组成。除此之外对于后两个卷积块分别取消了 22 最大池化层,可以更好地聚焦局部特征信息。浅层卷积网络结构示意图如图 2 所示。图 2浅层卷积神经网络结构图Figure 2Structure of SNN部署网络模型生成图像嵌入空间 u RH W C,其中:H 和 W 表示特征图的空间大小;C 表示特征维数。每个图像包含一个局部特征向量集合 u1,u2,uHW,每
24、个矢量被视为集合中的一个节点。因此,两幅图像的相似度可以表示为两组向量之间的最优匹配代价。2.3.2基于 EMD 距离度量分类模块经过特征提取模块后,两幅图像的相似度可以表示为两组向量之间的最优匹配代价。用公式(1)计算两个图像特征的嵌入节点 ui、vj的成对距离,得到单位成本dij=uTivjuivj。(2)其中具有相似表示的节点在彼此之间产生较少的匹配成本。获得最佳匹配流 X之后,可以计算图像表示之间的相似性得分,a(U,V)=HWi=1HWj=1(1-dij)xij,(3)从公式(1)可以看出,一个重要的问题参数是每个节点的权重,权重较大的节点在两个集合的比较中起着更重要的作用,而权重很
25、小的节点无论与哪个节点匹配都很难影响整体距离。在采用 EMD进行基于颜色的图像检索22工作中,使用直方图作为基本特征并对所有像素进行特征聚类来生成节点,每个节点的权重设置为对应集群的大小。对于基于颜色的图像检索,应该给予具有更多像素主色较大的权重,这样检索的图像在视觉上可以接近查询图像。然而,对于小样本图像分类任务,用于分类的特征通常需要具有高级语义,像素的数量不一定反映其重要性。在黏土矿物分类数据集中,矿物繁杂背景或噪声经常掩盖需要判定的目标图像数据。本文采用文献23 的 EMD 度量学习方法(Deep-EMD),其引入了一种交叉参考权重机制,对于背景区域比目标区域大的图像数据,局部特征表示
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 EMD 距离 度量 小样 矿物 图像 分类
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。