多尺度改进Xception的花卉图像分类方法.pdf
《多尺度改进Xception的花卉图像分类方法.pdf》由会员分享,可在线阅读,更多相关《多尺度改进Xception的花卉图像分类方法.pdf(7页珍藏版)》请在咨信网上搜索。
1、第 29 卷第 2 期2023 年 5 月Vol.29 No.2May 2023数学与计算机技术多尺度改进 Xception 的花卉图像分类方法*赵正伟,朱宏进(广西民族大学 电子信息学院,广西 南宁 530006)摘 要:针对传统图像分类方法在花卉图像上存在分类效果不佳的问题,提出一种改进Xception网络的方法。首先结合 Res2net中的多尺度模块来提高模型特征信息的丰富度,提出 Multi_Xception 网络,接着使用 11 卷积核对多尺度深度可分离卷积模块的输入特征图进行信道压缩,减少模型参数的同时进一步丰富模型特征信息,提出 Multi2_Xception 网络。将改进模型应
2、用于 Flowers Recognition 花卉数据集分类,实验结果表明,该方法相较于原算法分类准确率提升了 1.64%,F1-score提升了 0.018,验证了多尺度 Xception网络的有效性。关键词:花卉图像分类;深度学习;卷积神经网络(CNN);多尺度 Xception中图分类号:TP391.4 文献标识码:A 文章编号:1673-8462(2023)02-0090-070引言近年来,随着社会经济水平的快速发展与科技水平的不断提高,人工智能作为一种新兴技术已经渗透进各个领域中,其中在农林牧渔等行业,人工智能拥有着多元化的应用场景。花卉产业作为一种传统行业,随着国民消费水平的不断提
3、高以及国民精神需求的增加,中国的花卉产业得以迅速发展,2016 年花卉销售额达到 200 亿欧元。1目前,我国的花卉产业还存在技术水平较低的特点,这对花卉产业的发展造成了一定的阻碍。花卉种类的鉴别是花卉产业中的一个重要环节,在信息化时代,花卉的种类繁多,通过传统的人工分类方法,需要花费大量的人力,且易受到花卉形态多样性的影响,造成图像分类错误率的增加。因此,如何对花卉图像进行种类的快速识别,对于花卉产业有着一定的研究意义。目前,深度学习中的卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉领域取得了巨大的成功,因其可以自动进行特征的提取,被研究人员应
4、用在花卉图像识别领域,且取得了不错的效果。吴迪等人2对 InceptionV3 中的激活函数进行改进,使用 Tanh-ReLU 激活函数代替 ReLU 激活函数,并且使用迁移学习的方法,在 Oxford flower-102 数据集上达到了 92.85%的准确率。吴丽娜等人3提出一种改进LeNet-5 模型的方法,该方法将原模型中的池化操作设置为均值池化与最大池化,并且使用随机梯度下降与 Dropout4层来防止过拟合,在 Oxford-17 数据集上 收稿日期:2023-04-11.*基金项目:广西混杂计算与集成电路设计分析重点实验室开放课题一般项目(HCIC201511);广西民族大学高等
5、教育改革项目(2020XJGY41)。*作者简介:赵正伟(1980-),男,湖南益阳人,硕士,广西民族大学高级实验师,研究方向:物联网技术,图像处理。*通信作者:朱宏进(1998-),男,湖南长沙人,广西民族大学电子信息专业硕士研究生,研究方向:位计算机视觉。广西民族大学学报(自然科学版)JOURNAL OF GUANGXI MINZU UNIVERSITY(Natural Science Edition)902023 年第 2 期数学与计算机技术赵正伟,朱宏进/多尺度改进 Xception的花卉图像分类方法达到了 96.5%的准确率。杨旺功等人5使用 VGG16模型,提出一种基于多层特征融合
6、及兴趣区域的花卉图像分类方法,利用全局池化代替全连接层,采用改进的 pre_softmax 函数完成分类任务。张求颖等人6使用AlexNet、VGGNet、GoogLeNet 三种卷积神经网络模型在自制的花卉数据集上进行实验,与传统的图像分类方法相比,大幅度提高了图像的分类准确率。SM Omer 等人7通过对卷积神经网络中的激活函数与池化方式进行实验,所提出的 CNN 模型的识别率为94.61%。M Turkoglu等人8提出一种将花卉图像分成n n块,使用卷积神经网络对各块区域提取深度特征的方法构建植物识别系统,取得了不错的效果。从上述研究可以发现,使用卷积神经网络进行花卉图片的分类研究,主
7、要有几个方面的改进,如更改激活函数与损失函数、筛选特征信息等。但是没有从丰富特征提取的角度考虑,因此基于深度学习的花卉图像分类仍是一个具有价值的问题。为了丰富特征的提取,提高图像分类准确率,本文在深入研究不同卷积神经网络模型的基础上,提出一 种 融 合 Res2Net 与 Xception 的 CNN 模 型 Multi2_Xception。Multi2_Xception 使用 33 卷积核进行组合的方式,提高了模型提取特征的能力,并且对输入特征图进行通道压缩处理,进一步提高了模型的性能。1Xception 网络简介由于花卉数据集的样本较少,本研究的模型选择基于具有一定网络深度且对小样本识别效
8、果较好的Xception9网络进行搭建。Xception网络结构主要由 14个模块构成,分成 3个部分,总共包含 36个卷积层,其中 213 个模块都使用了 ResNet10中的残差连接,在残差连接中通过使用 11 卷积核来进行通道特征降维。与使用标准卷积不同的是,Xception大量使用将通道信息和空间信息分开来处理的深度可分离卷积进行特征提取,简化的 Xception模块如图 1所示。2基于多尺度改进 Xception2.1模型整体结构本文所设计的 Multi_Xception 与 Multi2_Xception模型框架是基于 Xception构建,整体结构如图 2所示,模型框架由输入层、
9、中间层、输出层 3 个部分组成,其中,中间层由 8 个相同的模块构成。从图 2 可以看出,改进后的模型是将 Xception模型中的深度可分离卷积替换为改进后的多尺度深度可分离卷积,同时保持模型的前两个标准卷积层与最后的全局平均池化层和全连接层不变。与原始模型相比,Multi_Xception 模型中的多尺度可分离卷积由于一部分输入特征图采用直连的方式,因此减少了一定量的参数,Multi2_Xception 模型因为在 Multi_Xception 模型的基础上增加了11的卷积运算,所以模型的参数量和计算量有所增加,几种模型的参数量如下:模型 Xception:20.82106;模型 Mult
10、i_Xception:20.77106;模型 Multi2_Xception:25.24106。图 1 简化的 Xception模块(a)输入层912023 年 5 月 第 29 卷广西民族大学学报(自然科学版)数学与计算机技术2.2改进 Multi_Xception网络模型由于使用常规卷积操作的神经网络中存在大量需要进行训练的参数,这意味着训练这类网络很难在移动端实现,为了在保持模型性能的同时减少训练的参数量,2013年来自 Google Brain的 Laurent提出了一种将卷积层的通道相关性和空间相关性分开映射的操 作,即 深 度 可 分 离 卷 积,并 且 在 Xception 与
11、Mobilenet系列模型上得到应用,取得了很好的效果。深度可分离卷积具体过程主要分为 2个部分。1)首 先 对 输 入 特 征 图 进 行 逐 通 道(Depthwise,DW)卷积(特征图的每一个特征通道单独使用 33卷积核进行卷积)。2)接着逐点(Pointwise,PW)卷积,使用 11的标准卷积来进行不同特征通道间的信息交互,并且调整特征通道的数量。在花卉图像分类中,视觉模式多以多尺度形式出现,感知来自不同尺度的信息对于视觉任务来说至关重要。11-12Xception 模型中使用的初始深度可分离卷积(如图 3(a)所示),其 Depthwise 卷积仅仅使用单一尺寸的 33卷积核进行
12、特征提取,由于单一尺度大小的卷积核仅仅具有单一的感受野,并不能充分提取图像中的细节信息,在一定程度上降低了特征信息的丰富度,从而限制了 Xception模型的分类精度。为了进一步提高动植物图像的分类准确率,经过分析,对 Xception 模型中使用的深度可分离卷积进行改进,结合 Res2Net13中的多尺度模块,提出了一种具有多尺度特征提取能力的深度可分离卷积。该多尺度深度可分离卷积以更加简单高效的方式在图像的粒度级别上表示了多尺度的特征信息,同时扩大了神经网络每层的感受野。本研究将 Xception 模型中的深度可分离卷积全部替换为具有多尺度特征提取能力的多尺度深度可分离卷积,得到一种名为
13、Multi_Xception的新模型,该方法增加了特征信息的丰富度,提升了模型对动植物图像的分类准确率。Multi_Xception 的多尺度可分离卷积如图 3(b)所示,该操作有以下 4个步骤:(1)将输入特征图在通道维度上平均分割成 4 部分,假设输入特征图通道数为c,经过平均分割后得到4个通道数为c/4的特征图;(2)对 4 个具有相同空间大小与通道数量的特征图使用不同数量组合的卷积核进行多尺度的特征提取,与 Res2Net中的多尺度模块相比,本文所提改进有2 个不同:使用 33 的 Depthwise 卷积代替 33 的标准卷积;根据实验结果对比在 33 的 Depthwise卷积后没
14、有进行 ReLU 非线性操作;(3)为了能更好地融合不同尺度上的特征信息,对经过以上操作后得到的四个输出特征图在通道维度上进行拼接操作,进一步融合特征图不同通道之间的特征;(4)使用 11的 pointwise卷积进行输出特征图通道数的调整,完成多尺度特征的传递输出。上述过程可以表示为:x1,x2,x3,x4=split(X)(1)yi=xi,i=1 DW()xi,i=2 DW()xi+yi-1,2 2时,每一个 33 卷积的输入(b)中间层和输出层图 2 多尺度 Xception模型结构922023 年第 2 期数学与计算机技术赵正伟,朱宏进/多尺度改进 Xception的花卉图像分类方法是
15、由当前特征图xi与上一个输出特征图yi-1组成,因此 33的深度卷积操作有可能从多个子特征图中提取特征信息,(3)式中Y R(N,H,W,C)表示经过多尺度特征提取步骤后得到的特征图yi R(N,H,W,C/4),i=1,2,3,4在通道维度上经过 concat操作后得到的特征图;(4)式中Dr(*)(i,j)表示输出特征图中第r个通道中位置(i,j)的值,Wm表示 11 卷积核第m个通道,Y(i,j,m)为经过多尺度的特征提取后得到的特征图中第m个通道位置(i,j)的值,M为输入特征图通道数。上述所提出的多尺度深度可分离卷积,通过多尺度的方式处理输入特征图,其输出特征图包含由不同数量与尺度的
16、感受野组合所提取的特征信息。与深度可分离卷积相比,由于使用多尺度可分离卷积后,模型最后获得的特征信息融合了不同尺度的特征信息,因此,在需要充分提取细节信息的花卉图像上,可以获得更佳的分类准确率。2.3改进 Multi2_Xception网络模型经过对本文所提出的 Multi_Xception 模型分析发现,为了减少模型的运算量,在多尺度深度可分离卷积中存在 1/4的输入特征图在没有经过卷积操作直连到输出特征图,这在一定程度上降低了模型提取到的特征信息的数量。因此为了进一步提高新模型的性能,在 Multi_Xception 模型中的多尺度可分离卷积进行多尺度的特征提取之前对输入特征图进行特征通道
17、的压缩,得到 Multi2_Xception模型。Multi2_Xception 模型中的多尺度深度可分离卷积如图 4所示,与 Multi_Xception模型中的多尺度深度可分离卷积不同的是,该多尺度深度可分离卷积首先使用数量为原输入特征通道数 1/4 的 11 卷积核对输入特征图进行特征通道的降维操作,这主要有两个作用,一是减少模型的参数量,加快模型训练的速度,通过控制每个输入特征图的信道数,便于下一步经过33 Depthwise卷积后得到的不同特征图进行相加运算。二是为了 33 Depthwise 卷积可以从所有的输入特征图中提取特征信息,从而丰富模型提取的特征信息。经过使用 11 卷积
18、核进行特征降维后得到与图 3(b)中相同大小的特征图,接着执行与图 3(b)中相同的多尺度特征提取与特征输出操作,上述特征通道降维可以表示为:xi=con v1 1(X)(5)其 中,X R(N,H,W,C)表 示 原 始 特 征 输 入 图,xi R(N,H,W,C/4),i=1,2,3,4表示原始特征图经过 11的标准卷积操作后得到的 4个具有相同空间大小和通道数量的子特征图,子特征图具有与原始输入特征图相同的空间大小,但是通道数为原特征图的 1/4。图 4 Multi2_Xception模型多尺度深度可分离卷积结构图(a)深度可分离卷积结构图(b)Multi_Xception模型多尺度深
19、度可分离卷积结构图 3 Res2Net模块结合深度可分离卷积932023 年 5 月 第 29 卷广西民族大学学报(自然科学版)数学与计算机技术与 Multi_Xception 模型相比,Multi2_Xception 模型通过对输入特征进行降维压缩卷积,在不增加过多计算量的同时,不仅增加了特征信息的数量而且提升了网络的深度,因此,在图像分类任务上可以获得更佳的性能。3实验与结果分析3.1数据集本研究采用 Flowers Recognition 数据集作为实验数 据 集。Flowers Recognition 数 据 集 由 Alexander Mamaev提供。数据集包含五类常见花卉图片,分
20、别为daisy、dandelion、rose、sunflower、tulip,每类图片大概800 张,总共包含 4317 张图片,部分图片如图 5 所示。每张图片具有不同大小的尺寸,本研究按 4 1 的比例划分训练集与测试集,随机选取其中的 3458张划分为训练集,859张划分为测试集。3.2实验硬件平台与超参数设置本实验使用 Pytorch 深度学习框架搭建文中所使用的网络模型,硬件环境:CPU 为英特尔 Xeon(至强)Silver 4210 2.00 GHz,GPU 为适用专业台式工作站的 NVIDIA Quadro p4000 8 GB。模型在训练过程中超参数设置如下:优化器使用可以快
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 尺度 改进 Xception 花卉 图像 分类 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。