基于卷积神经网络的面料检索系统.pdf
《基于卷积神经网络的面料检索系统.pdf》由会员分享,可在线阅读,更多相关《基于卷积神经网络的面料检索系统.pdf(5页珍藏版)》请在咨信网上搜索。
1、针对目前市场上纺织面料图像种类多、视觉特征复杂、数据量大的特点,为解决传统图像检索方法存在的检索速度慢、检索精度低的问题,提出一种基于深度学习的面料检索方法。该方法采用迁移学习,微调 VGG16 网络的结构,加入BN 层提高模型的泛化能力,调整 FC 层神经元的数量减少计算量。同时优化损失函数以约束模型学习相似或相同的面料的特征也相似。以纺织企业提供的面料为数据集训练模型,得到提取面料特征的网络模型。进行在线面料检索时,使用faiss 向量检索工具,快速计算待检索的面料的特征与特征库的相似度,得到相似度 top-k 的检索结果。经过实验证明,在企业面料数据集上,该系统检索 mAP 可达到 0.
2、892,检索时间仅为 0.012 s,均优于以往的算法,从而验证了其可行性。关键词:迁移学习;VGG16;损失函数;faiss;面料检索中图分类号:TP391.41摇 摇 摇 摇 摇 摇 文献标识码:A摇 摇 摇 摇 摇 摇 文章编号:1673-629X(2023)09-0052-05doi:10.3969/j.issn.1673-629X.2023.09.008Fabric Retrieval System Based on Convolutional Neural NetworkWANG Biao,WU Tao(School of Computer Science,Xi爷an Polyte
3、chnic University,Xi爷an 710600,China)Abstract:Aiming at the characteristics of many types of textile fabric images on the market,complex visual features and large amount ofdata,in order to solve the problems of slow retrieval speed and low retrieval accuracy of traditional image retrieval methods,a f
4、abricretrieval method based on deep learning is proposed.It adopts transfer learning,fine-tunes the structure of the VGG16 network,adds theBN layer to improve the generalization ability of the model,and adjusts the number of neurons in the FC layer to reduce the amount ofcomputation.At the same time
5、,the loss function is optimized to constrain the model to learn the characteristics of similar or the samefabrics are also similar.Using the fabric provided by the textile enterprise as the data set to train the model,the network model forextracting fabric features is obtained.When conducting online
6、 fabric retrieval,the faiss vector retrieval tool is used to quickly calculate thesimilarity between the characteristics of the fabric to be retrieved and the feature library,and obtain the retrieval result of similarity top-k.Experiments show that on the enterprise fabric data set,the retrieval mAP
7、 of this system can reach 0.892,and the retrieval time is only0.012 seconds,which is better than that of the previous algorithm,thus verifying its feasibility.Key words:transfer learning;VGG16;loss function;faiss;fabric retrieval0摇 引摇 言近些年来,随着互联网经济的快速发展,电子商业也进入了蓬勃发展的阶段,消费者对于以纺织面料为原材料的商品,如服装、鞋等的需求量大大
8、增加。面料生产企业为了能满足市场需求,不得不研究生产新的面料,这样也就导致市场上的面料种类越来越多,从而给面料生产企业带来了一个新的问题,即如何从种类繁杂的面料中快速、精准地检索到目标面料1。传统的纺织企业在进行面料检索时,一般都是采取人工的方式进行。该方式不仅费时费力,检索结果还附带主观性的影响,不能达到用户对检索速度和准确度的要求2。市场上虽然存在成熟的图像检索方法和系统,但是由于面料图像的特殊性,并不适用于面料图像的检索需求,需要进行较大的改进。在图像检索领域,主要存在两种技术:基于文本的图像检索(Text-Based Image Retrieval,TBIR)和基于内容 的 图 像 检
9、 索(Content-Based Image Retrieval,CBIR)3-6。TBIR,需要人为地对图像进行文本标注,具有效率低、查找不准的缺点。CBIR,提取图像的浅层视觉特征或深层语义特征,结合相似度度量方法,从第 33 卷摇 第 9 期2023 年 9 月摇 摇 摇 摇 摇 摇 摇 摇 摇 摇计 算 机 技 术 与 发 展COMPUTER TECHNOLOGY AND DEVELOPMENT摇 摇 摇 摇 摇 摇 摇 摇 摇 摇Vol.33摇 No.9Sep.摇 2023数据库中检索出最为相似的 top-k 张图片,这是目前国内外研究的热点7。徐佳等人8提出一种基于全局和局部相位特
10、征相融合的图像检索算法。王妙9提出基于深度学习的印花织物图像检索系统设计,采用哈希算法的粗检索和卷积神经网络的细致检索相结合的分级检索,在提高精度的基础上进一步提高了速度。Xia 等人10提出的 CNNH 通过对相似度矩阵进行分解,得到样本的哈希码,再利用卷积神经网络对哈希码进行拟合。Lai 等人11提出 DNNH。该方法对网络结构做了针对性的设计:用部分连接取代全连接,引入分段量化函数。Zhang 等人12提出的 DRSCH 用加权的汉明距离代替普通的汉明距离,这种方法可以提高计算距离的效率和精度,但是时间复杂度也会增加。Lin等人13在 AlexNet 的 F7 和 F8 之间加入一个全连
11、接层,基于由粗到细的策略,利用学习到的类哈希二进制码和 F7 层特征,实现图片检索。该方法降低了特征匹配的计算量,加速了检索速度,但是不能保证哈希码相似的图像在语义上也相似,因此检索精度不高。何彬等人1提出了一种基于 InceptionV3 迁移学习的面料图像特征提取算法。该算法在 Inception 中加入哈希编码层,并优化了损失函数,将模型输出的哈希编码作为面料图像的特征向量,采用分级检索的策略进行检索。该方法虽然在精度和时间上优于一般的检索算法,但是由于采用的暴力检索策略,在速度上仍有较大的提升空间。刘瑞昊等7通过改进 LresNet50E-IR 网络结构,将其迁移学习到面料检索上,结合
12、 faiss 进行面料图像检索可以取得很好的效果。但是算法采用的损失函数只能限制模型具有较好的分类效果,不能保证相似的面料图像的特征也相似。该文主要针对目前面料图像检索领域存在的“找料慢冶“找料难冶等问题14,通过结合深度学习和 faiss向量检索解决以上问题,为纺织企业提供高效的面料管理策略。1摇 面料检索系统框架1.1摇 检索系统模块面料图像的检索是以纺织企业的实际需求为依据,利用卷积神经网络对面料图像进行特征学习、表示和匹配,从面料数据库中检索出相似面料图像。系统分为模型训练、构建面料特征数据库和面料检索 3 个模块。模型训练是对 VGG1615网络结构进行微调,同时优化损失函数,以企业
13、提供的面料作为训练数据训练模型参数,以表达面料图像的特征;构建面料特征数据库是用训练好的模型提取面料特征,以向量的形式保存下来;面料检索是将待检索的面料和数据库中图像进行相似度匹配,排序输出检索结果。1.2摇 检索整体流程基于 CNN 的面料检索系统框架结构如图 1 所示。CNNCNN图 1摇 面料检索整体框架流程该系统首先以企业提供的面料为训练集对模型进行训练,得到提取面料特征的模型,对所有的面料图形进行特征提取,将特征向量保存在本地作为特征向量库;然后将待检索的面料送到检索系统中,提取其特征,以余弦相似度作为特征向量之间相似度的度量,将相似度最高的 top-k 检索结果返回,完成一次检索过
14、程。2摇 相关工作2.1摇 准备数据集企业提供真实的面料样本,通过图像采集设备获得每一张面料的图像,一共有 37 002 张,部分面料图像见图 2。根据不同纺织机机型,对面料进行批量的归类,一共分为 10 类,分别是 12E、14E、16E、18E、20E、22E、24E、26E、28E、36E。按照 8 颐 2 的比例,将数据集划分为训练集和测试集,其大小分别是 29 602 和7 400。12E16E18E22E24E图 2摇 部分面料35摇 第 9 期摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 王摇 彪等:基于卷积神经网络的面料检索系统在模型训练阶段,考虑到检索情景的多样性,提高模型的泛化能
15、力,使检索系统具有较强的鲁棒性,对训练集进行随机水平翻转、随机颜色抖动等数据增强操作。2.2摇 模型选择面料特征的提取是整个面料检索系统最核心的环节。优秀的模型提取出的特征向量可以很好的表示图像,也是后续进行特征匹配的关键,所以模型选择至关重要7。2.2.1摇 VGG16 网络结构VGG 网络是2014 年 ImageNet 大规模图像识别大赛的亚军,VGG16 是其中的一类模型,常用于图像分类、目标检测和图像分割等任务,其结构如图 3 所示。VGG16 一共有 16 层,包括卷积层、池化层和全连接层。3x3Conv 64Input3x3Conv 64Max-Pool3x3Conv 1283x
16、3Conv 128Max-Pool3x3Conv 2563x3Conv 256Max-Pool3x3Conv 2563x3Conv 5123x3Conv 512Max-Pool3x3Conv 5123x3Conv 5123x3Conv 5123x3Conv 512Max-PoolFC 4 096FC 4 096FC 1 000OutputSoftmax图 3摇 VGG16 网络结构VGG16 在卷积层采用 3伊3 的小卷积核,减少了参数量,同时加快了模型的训练速度。在每个卷积层之后使用 ReLU 激活函数对特征图进行非线性映射以提高模型的表征能力。池化层的池化窗口大小为 2伊2,步长为 2,在
17、不减少特征图数量的前提下,缩小了特征图的尺寸,压缩了参数量。网络最后是 3 层全连接层,融合了卷积层提取的局部特征,表达了输入图像的全局特征。2.2.2摇 改进 VGG16虽然使用 3伊3 的卷积核减少了参数量,但是模型还是很复杂,有可能会出现过拟合的问题;在检索过程中计算两个面料的特征向量的相似度时,由于特征向量维度过高,带来较大的计算量;交叉熵损失函数是用来分类的损失函数,只能保证模型能够对图像进行正确的分类,不能让模型学习相似的面料图像的特征向量也相似。本面料检索系统以 VGG16 为基础网络,迁移学习其网络结构,对其做出以下改进:为了避免模型发生过拟合,提高模型的泛化能力,在卷积层之后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 卷积 神经网络 面料 检索系统
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。