基于深度迁移学习的垃圾分类研究.pdf
《基于深度迁移学习的垃圾分类研究.pdf》由会员分享,可在线阅读,更多相关《基于深度迁移学习的垃圾分类研究.pdf(12页珍藏版)》请在咨信网上搜索。
1、Journal of Image and Signal Processing 图像与信号处理图像与信号处理,2023,12(3),290-301 Published Online July 2023 in Hans.https:/www.hanspub.org/journal/jisp https:/doi.org/10.12677/jisp.2023.123029 文章引用文章引用:封皓元,段勇,胥程琪.基于深度迁移学习的垃圾分类研究J.图像与信号处理,2023,12(3):290-301.DOI:10.12677/jisp.2023.123029 基于深度迁移学习的垃圾分类研究基于深度迁移
2、学习的垃圾分类研究 封皓元,段封皓元,段 勇,胥程琪勇,胥程琪 沈阳工业大学信息科学与工程学院,辽宁 沈阳 收稿日期:2023年6月19日;录用日期:2023年7月10日;发布日期:2023年7月21日 摘摘 要要 针对垃圾分类人工检测环境差,易出错,难度大,效率低的问题,提出一种利用深度迁移学习对生活垃针对垃圾分类人工检测环境差,易出错,难度大,效率低的问题,提出一种利用深度迁移学习对生活垃圾分类的方法。首先,构建垃圾分类的图像数据集,同时数据增强,其次,搭建深度卷积神经网络圾分类的方法。首先,构建垃圾分类的图像数据集,同时数据增强,其次,搭建深度卷积神经网络ResNeXt和和MobileN
3、etV2,微调网络迁移参数以适应垃圾分类任务,最后,在基于深度迁移学习的卷积神经网络,微调网络迁移参数以适应垃圾分类任务,最后,在基于深度迁移学习的卷积神经网络下,探索了网络冻结层数和学习率对不同量级的网络结构造成的影响。结果表明,下,探索了网络冻结层数和学习率对不同量级的网络结构造成的影响。结果表明,ResNeXt受到学习率受到学习率的影响更强,的影响更强,MobileNetV2受到网络冻结层数的影响更多,两者的最佳网络冻结层分别是受到网络冻结层数的影响更多,两者的最佳网络冻结层分别是50层和层和80层,层,最佳学习率分别是最佳学习率分别是0.0003和和0.0001,有效提升模型准确率,实
4、现了对多种常见垃圾的有效分类,有效提升模型准确率,实现了对多种常见垃圾的有效分类。关键词关键词 深度迁移学习,卷积神经网络,网络冻结,学习率,垃圾分类深度迁移学习,卷积神经网络,网络冻结,学习率,垃圾分类 Deep Transfer Learning-Based Waste Classification Research Haoyuan Feng,Yong Duan,Chengqi Xu School of Information Science and Engineering,Shenyang University of Technology,Shenyang Liaoning Receiv
5、ed:Jun.19th,2023;accepted:Jul.10th,2023;published:Jul.21st,2023 Abstract To address the problems of poor manual detection environment,error-prone,difficulty and low efficiency of garbage classification,a method of domestic garbage classification using deep trans-fer learning is proposed.Firstly,imag
6、e datasets for garbage classification are constructed while data augmentation,secondly,deep convolutional neural networks ResNeXt and MobileNetV2 are built to fine-tune the network transfer parameters to suit the garbage classification task,and fi-nally,the effects of network freezing layers and lea
7、rning rate on the network structure caused by different magnitudes are explored under the convolutional neural networks based on deep migra-封皓元 等 DOI:10.12677/jisp.2023.123029 291 图像与信号处理 tion learning.The results show that ResNeXt is more strongly influenced by the learning rate and MobileNetV2 is
8、more influenced by the number of network freeze layers,and the best network freeze layers for both are 50 and 80 layers,respectively,and the best learning rates are 0.0003 and 0.0001,respectively,which effectively improve the model accuracy and achieve the effective classification of many kinds of c
9、ommon garbage.Keywords Deep Transfer Learning,Convolutional Neural Network,Network Freezing,Learning Rate,Garbage Classification Copyright 2023 by author(s)and Hans Publishers Inc.This work is licensed under the Creative Commons Attribution International License(CC BY 4.0).http:/creativecommons.org/
10、licenses/by/4.0/1.引言引言 伴随经济生活水平的不断提高,垃圾数量呈现爆炸式的增长,目前虽然提倡从源头开始分类,然而实际操作中依旧利用人工分拣海量的垃圾,工作环境差,分类效率低,社会的真实需求无法满足。近年来,人工智能迅速发展,有效推进了图像识别在计算机视觉领域的应用,针对垃圾分类的智能识别技术应运而生。传统的垃圾分类以机器学习为主,利用特征工程对目标数据进行特征提取,寻找数据内部之间存在的关系和潜在的规律。黄浩然1等利用几何矩尺度不变性、平移等属性优势,利用 7 个 Hu 不变矩和多颜色空间特征,采取关键信息作为特征向量,通过构建一个相似性度量方法得到衡量标准以获取分类结果。
11、申新杰2等采用 AGAST 二叉树角点域的算法,使用非极大值抑制法对角点进行处理,获得 AGAST特征点,通过特征点匹配实现对特定垃圾的识别。潘丽3等采用 BRISK 特征提取算法实现对图像的监测,实现了高准确率的垃圾识别。李勇4利用灰色预测模型预测产生量,设计朴素贝叶斯分类器对数据训练,实现更高效的垃圾分类。黄兴华5等将局部二值模式(LBP)改进,再与 Uniform LBP 融合得到 AD-LBP,将 AD-LBP 与梯度方向直方图算法对图像进行特征提取。然而传统技术直接将数据输入模型,难以获取正确的规律,导致分类精度低,同时浪费人工成本和时间成本。伴随 2012 年 AlextNet 6
12、的诞生,深度学习重新引起广泛的关注,许多学者将其应用到垃圾分类中。Wang H 7利用 VGG16 卷积网络,嵌入 Batch Normalization 以加快收敛速度、保证垃圾的识别精度。Sultana 8通过 AlexNet 进行多次实验,分别实现了对室内垃圾与室外垃圾的分类。迁移学习9 10同样被引入到网络模型中实现对废弃物的分类,以减少模型训练时间。Adedeji 11等提出一种将 ResNet与 SVM 相结合的方式对城区固体废物进行分类,通过 ResNet 提取图像特征,将特征放入 SVM 中进行训练以获得结果。陈牧图12等也讨论了深度学习相关方法并实现了对垃圾的自动化识别。高静
13、13等设计一种基于 Xception 的轻量型模型,引入锯齿状扩张卷积且结合预热与余弦退火的方式控制学习率,实现了学习率的凸变化,加快了模型的收敛效率,提高识别的精度。在以上学者的研究中,深度学习在图像分类的实际应用中普遍高于传统机器学习方法,通过卷积神经网络实现自动化的特征提取,摆脱了繁琐的特征工程,利用反向传播不断训练网络模型,使得模型的分类准确率不断提升,超越了机器学习模型。在深度学习模型中 ResNeXt 14和 MobileNetV2 15正是图像分类任务中,两种不同量级、性能突出的模型。同时迁移学习实现了对已有知识的复用,加快了模型Open AccessOpen Access封皓元
14、 等 DOI:10.12677/jisp.2023.123029 292 图像与信号处理 训练的效率,利用微调与冻结的迁移方法,能够进一步提升模型分类的准确率。基于此,本文研究了基于迁移学习的深度学习模型并应用于垃圾图片分类的问题。首先,构建垃圾分类数据集,分别采用位置和颜色两种不同维度的数据增强方式,提高模型的泛化能力,避免模型过拟合。其次,通过 ImageNet 数据集构建了 ResNeXt 与 MobileNetV2 两种预训练网络模型,微调模型的网络结构以适应垃圾分类任务,不断调整模型参数以提升图像分类准确率,最后采用迁移学习的冻结方法与调整学习率的方式,探究网络冻结层数和学习率在不同
15、量级的网络结构中,对图像分类结果的影响,同时获取分类效果最佳的网络冻结层数和学习率。2.图像分类模型图像分类模型 2.1.ResNeXt 图像识别的基础是提取具有代表性的语义特征和细节特征,网络模型的深度和宽度决定着网络模型提取特征的性能。然而,伴随模型容量的不断增加,设计难度和计算开销在逐渐增大,网络深度和宽度带来的收益在逐渐降低,为此,本文采用 ResNeXt 深度学习模型作为垃圾图像分类模型之一以缓解收益降低的问题。ResNeXt 模型的网络结构打破了深度和宽度对模型性能提升的局限,采用高度模块化的设计,改进了 ResNet 网络结构,通过融合 VGG 网络堆叠、ResNet 网络的残差
16、模块以及 Inception 网络的拆分变换聚合的思想,其模型设计涵盖两个优点:1)堆叠相同的拓扑结构,减少了超参数的自由选择,降低超参数对特殊数据集产生过拟合的风险。2)将网络拆分成若干小模块,经过不同滤波器变换,沿通道维度以串联的方式聚合,实现减少计算开销,增强模型提取特征的性能。拆分变换聚合思想的公式如式(1)所示:()()1CiiR xxT x=+(1)其中,x 是输入向量、Ti是能把 x 投影到子空间进行变换的函数,C 是具有相同拓扑结构分支的数目,称为基数,可以取任意值,本文将 C 取值为 32,其 ResNeXt 基本模块如图 1 所示。图中 Path 是一个基数,代表一个 Re
17、sNeXt 模块,每一层的显示值由上到下分别表示为输入通道、滤波器大小和输出通道。Figure 1.ResNeXt module(base C=32)图图 1.ResNeXt 模块(基数 C=32)基数为网络模型引入一个度量,实验证明,基数的增加比深度或宽度更有效,有效减少模型对深度和宽度的依赖,模型提取特征的能力得到有效提升。封皓元 等 DOI:10.12677/jisp.2023.123029 293 图像与信号处理 2.2.MobileNet-V2 MobileNetV2 深度学习模型是 MobileNetV1 基础上改进的轻量级网络结构,其保留原有 MoblieNet架构使用深度可分离
18、卷积代替普通卷积的特性,同时利用逆向残差结构和线性瓶颈结构的特点提升模型的性能。因此,本文使用 MobileNetV2 作为验证分类结果的轻量级网络,同时探究轻量级网络在不同网络冻结层数及学习率下所受到的影响。深度可分离卷积是由深度卷积和点卷积组合构成,深度卷积与普通卷积不同,而点卷积就是 1 1 的普通卷积,在输入特征图时,先利用深度卷积对输入图进行过滤,再通过点卷积对过滤特征线性组合,达到缩减模型参数量、减少计算量的目的。逆向残差结构借鉴了残差结构的思想,改变了传统残差结构先降低通道维度,再提取特征,最后扩大通道维度的顺序。通过先利用点卷积升维,再利用深度卷积提取特征,最后使用点卷积降维的
19、顺序,解决由于模型参数量减少,导致提取特征信息不足的问题,保证了模型提取特征的性能。其基本模块如图 2 所示,图中 Conv 表示点卷积,Dwise 表示深度卷积,Relu6 表示激活函数,Linear 表示线性激活函数,此外,模块仅在步长为 1 时,才有残差结构,而步长为 2 时,直接使用串联结构。Figure 2.MobileNetV2 module 图图 2.MobileNetV2 模块 线性瓶颈结构是将激活函数更换成 ReLu6,同时将最后一步点卷积的激活函数替换成线性激活函数,进一步保留更多的特征信息。3.基于深度迁移学习的分类模型基于深度迁移学习的分类模型 3.1.深度迁移学习深度
20、迁移学习 迁移学习的思想是利用数据、任务、模型之间的相似性,将在旧领域学习到的知识转移到新领域,进而完成任务的学习过程。依据方法分类,迁移学习分成基于实例、特征、模型、关系的学习方法。本文采用基于模型的迁移学习方法,通过共享模型的权重、偏置等网络参数训练模型,完成从现有数据集转移至垃圾数据集的分类任务,深度学习与迁移学习的结合可以有效减少模型的训练时间,加快模型的收敛速度,提高训练模型的效率。封皓元 等 DOI:10.12677/jisp.2023.123029 294 图像与信号处理 3.2.模型分类流程模型分类流程 本文提出的基于深度迁移学习的垃圾图像分类模型流程主要分成两个部分,一部分是
21、对数据的数据增强处理,防止过拟合问题的产生,提升模型的泛化能力。另一部分是针对垃圾分类的任务,利用对预训练模型结构的修改与参数的引用以训练模型,提取图像的特征信息,实现垃圾分类。本文数据增强采用多种处理方式,位置部分采用随机裁剪、水平/垂直翻转、随机旋转的处理方式,颜色部分采用调整色度、对比度以及饱和度的处理方式,图像数据增强示例如图 3 所示,为一次性快餐盒图像原图与其进行数据增强的 16 个处理结果的示例。(a)原图 (b)数据增强图像 Figure 3.Data augmentation example 图图 3.数据增强示例 本文提出的算法主要分成两个部分,一部分是构建预训练模型,利用
22、迁移学习的优势,将迁移参数代表的具体特征和抽象特征,提升模型的训练效率,另一部分是数据集的处理,采用多维度的处理方式进行数据增强,防止过拟合。最终,分别调整冻结层数和学习率,实现对垃圾图像的高准确率分类,基于深度迁移学习的详细分类流程如图 4 所示。1)将 ImageNet 数据集作为源域数据,使其训练参数加载到 ResNeXt 和 MobileNetV2 的预训练模型中,以便提升模型训练的效率,以预训练模型为基准,通过去除原有结构中末尾的全连接层,添加全新的全连接层以适应 20 分类的垃圾分类任务,使模型能够在迁移学习的微调方式中,实现对模型训练参数的调整。2)将垃圾数据集作为目标域数据,将
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 迁移 学习 垃圾 分类 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。