服装风格图像的识别分类研究进展.pdf
《服装风格图像的识别分类研究进展.pdf》由会员分享,可在线阅读,更多相关《服装风格图像的识别分类研究进展.pdf(8页珍藏版)》请在咨信网上搜索。
1、服装风格图像的识别分类研究进展摘要:针对服装风格识别与分类,从服装相关数据集、服装图像特征提取、应用场景3个方面综述了该领域的研究进展。服装图像分类数据来源主要包含社交网站、购物网站以及时尚资讯媒体,从季节、时尚风格、服装信息等服装属性归纳数据集特点,围绕图像处理技术对其应用于服装领域最广泛的特征提取方法加以介绍,详细综述了传统特征提取方法、卷积神经网络(CNN)、图卷积神经网络(GCNN)、无监督学习方法在服装领域的相关研究及其模型优化效果、优缺点等。最后分析讨论了服装风格识别分类在时尚风格流行趋势预测、服装搭配推荐方面的发展趋势、关键技术及应用前景。研究认为,未来可以在人体相关特征提取、多
2、角度时尚趋势预测、服装推荐主观评价等方向进一步研究。关键词:深度学习;服装风格;卷积神经网络;特征提取中图分类号:TS941;TP391.4文献标志码:A文章编号:1005-9350(2023)09-0001-08Abstract:For clothing style recognition and classification,the research progress in this field is summarized fromthree aspects:clothing-related data sets,clothing image feature extraction,and a
3、pplication scenarios.The data sourcesfor clothing image classification mainly include social networking sites,shopping sites,and fashion information media.The characteristics of the data set from clothing attributes such as seasons,fashion styles,and clothing information aresummarized.The most widel
4、y used feature extraction method in the clothing field is introduced around image processingtechnology,and the relevant research on traditional feature extraction methods,convolutional neural networks(CNN),graph convolutional neural networks(GCNN),and unsupervised learning methods is summarized in d
5、etail.Then,the optimization effect,advantages and disadvantages of these models are summarized.Finally,the development trend,key technologies and application prospects of clothing style recognition classification in fashion trend prediction and clothing collocationrecommendation are analyzed and dis
6、cussed.The study believes that in the future,it can develop in the direction of human body-related feature extraction,multi-angle fashion trend prediction,and subjective evaluation of clothing recommendation.Key words:deep learning;clothing style;convolutional neural network;feature extractionResear
7、ch progress in recognition and classification ofclothing style images收稿日期:2022-12-13基金项目:浙江省一般软科学研究计划项目(2022C35099);浙江省丝绸与文化艺术研究中心培育项目(ZSFCRC20204PY)作者简介:张琦妍(1998),女,江苏扬州人,硕士研究生,主要研究方向为服装风格图像识别。通信作者:支阿玲(1979),女,高级实验师,助理导师,主要研究方向为服装数字化技术,E-mail:。张琦妍1,支阿玲2,罗戎蕾3,4(1.浙江理工大学服装学院,浙江杭州310018;2.浙江理工大学国际时装技术
8、学院,浙江杭州310018;3.浙江理工大学浙江省丝绸与时尚文化研究中心,浙江杭州310018;4.浙江凌迪数字科技有限公司,浙江杭州310018)ZHANG Qiyan1,ZHI Aling2,LUO Ronglei3,4(1.School of Fashion Design Engineering,Zhejiang Sci-Tech University,Hangzhou 310018,China;2.School of International Fashion Technology,Zhejiang Sci-Tech University,Hangzhou 310018,China;3
9、.Silk and Fashion Culture Research Center of Zhejiang Province,Zhejiang Sci-TechUniversity,Hangzhou 310018,China;4.Style 3D,Hangzhou 310018,China)染整技术Textile Dyeing and Finishing JournalVol.45 No.9Sep.2023第45卷第9期2023年9月专论与综述染整技术45卷在大数据时代,图像逐渐取代文字成为互联网的主要内容,服装图像的时尚风格分析已经成为计算机视觉中的重要研究领域。近年来,由于计算机视觉领域在
10、服装建模、识别、风格分析、趋势预测、搭配推荐等方面取得较大的进展,该技术对实现服装从设计到电子零售的应用至关重要。研究初期,服装风格分类方法过多依赖于专业知识背景1,根据专家访谈信息对服装风格特征量化,确定服装各部件剪裁造型与整体风格间的联系2,根据风格特征完成服装风格分类3。传统的服装风格分类方法得到风格的量化标准后,基于图像处理技术通过预测服装属性和特征点学习服装特征4。同时,部分学者针对服装风格提出个性化分类问题,运用无监督学习对无标签的服装图像样本进行服装风格分类的尝试。基于深度学习的服装风格分析方法,由于其具有强大的特征学习能力,在国内外时尚风格分析领域都取得了较好的效果。本研究立足
11、于服装图像风格分类,总结归纳了服装风格识别与分类的主要方法与应用前景。首先以时间维度研究总结了服装数据集的研究现状,并归纳其数据来源与数据特点。进而研究服装风格特征的提取方法,综述传统特征提取和基于深度学习特征提取的优缺点。最后讨论分析了服装风格识别分类在时尚风格流行趋势预测、服装搭配推荐方面的应用与发展前景,提出服装视觉领域未来的发展趋势和研究方向。1服装风格数据集当前已有的公开数据集中,较大部分数据集图像来源于时装秀(图像或视频)5、时尚博主社交网站(C、Instagram)6、购物网站7以及街头时尚网站(Chictopia2)8-9等。数据集中所含标签包括当前季节、场合、时尚风格、服装属
12、性、地域、年份等信息,多样的标签可用于分析包含季节、地域等属性的服装风格流行趋势预测。Liu等4建立的DeepFashion数据集应用最广泛,此数据集拥有超过80万张不同的服装图像,并被标记为50个类别,1 000个描述性属性和服装特征点,属性标签包含质地、面料、形状、部分和风格。部分学者也将 ImageNet 数据集10中的服装分类部分进行迁移学习,重新分类标注,将其运用于服装分类识别、服装检索等。服装分类数据集总结如表1所示。数据集名称或作者Fashionista dataset6Hipster Wars11Hidayati等5Fashion 144k12Chen等8Online Shop
13、ping7DeepFashion4Gu等9GS Fashion13Geostyle14FashionKE15Fashionpedia16Fashion IQ17发表年份2012201420142015201520162016201720172019201920202021图像数量/张158 2351 8933 276144 1697 9141 04630 000800 000293 105400 8227.7M80 62948 825主要特征社交网站服装搭配图片波西米亚风、哥特风格、时髦风格、学院风和海报女郎5种风格9家时装设计公司在过去10季纽约时装秀中的走秀造型时尚网站收集的帖子纽约时装秀
14、和街头时尚图像在线购物网站图像全面注释的大规模服装数据集,包含大量属性、服装特征以及场景信息街头风格时尚(SFS)数据集,标签包含季节、场合、时尚风格、服装信息、地理和年份信息45个全球主要城市时尚图片,标签包含地理位置、品牌名称等6大洲的44个世界主要城市、人体和面部检测包含10种场合下的着装图像,标记多件衣服的类别和属性46个服装对象(27个主要服装和19个服装部件),以及9个类别、294个细粒度的属性包含服装图像、文本描述和产品元数据形式的辅助信息、属性标签。用于交互式对话的服装检索模型来源CGoogle Image SearchFashion TV.comCVFPNB等购物网站 Sty
15、leFlickr100MInstagramUnsplash、Burst by hopify、Freestocks、Kaboompics和Pexelsproduct review dataset表1服装分类数据集总结29期2服装风格图像识别技术2.1基于图像处理的传统特征提取计算机视觉相关的图像处理技术,初步提取的图像特征包括全局特征和局部信息特征,如颜色特征、形状特征、纹理特征、空间关系特征等,早期的服装特征提取通过提取手工设计特征的方法进行服装属性或风格特征的识别18-20。目前,传统图像特征提取算法主要包括以下几种:LBP纹理特征提取、HOG、SIFT、LOG、SURF、Harris角点提
16、取算法等,主要性质如表2所示。算法LBP纹理特征提取HOGSIFTSURFHarris角点提取主要性质局部二值模式、旋转不变性、灰度不变性、光照不变性光照不变性,不具有尺寸和旋转不变性图像的局部特征,旋转、尺度缩放、亮度变化不变性;视角变化、仿射变换、噪声稳定性;多量性、可扩展性SIFT算法的改进,尺度不变性、旋转不变性,具有很强的光照变化和放射变化鲁棒性,运行速度为SIFT的3倍对亮度和对比度的变化不敏感,具有旋转不变性,不具有尺度不变性应用及改进方向纹理特征提取(局部纹理特征),改进算法包括:圆形LBP算子、LBP旋转不变模式、LBP等价模式结合SVM分类器已被广泛应用于图像识别,适用于图
17、像中的人体检测PCA-SIFT,主成分SIFT特征,主要提取了128维特征向量中的20个特征,大大减少了计算量个体识别、图像配准、3D重建、图像拼接等多尺度Harris角点、Harris-Affine表2传统特征提取算法主要性质分析Bossard 等20提取 SURF、HOG、LBP、SSD 和颜色特征等多个特征,输入随机森林和SVM两个更高级别的分类器,完成对上身的分类和描述,随机森林算法准确率达到41.36%。Dei等21运用特征提取SIFT、LBP、HOG和GIST进行服装细粒度属性的识别,每个属性学习单独的分类器,进行服装细粒度属性的分类。纪娟等22通过边缘检测、轮廓提取与筛选得到最外
18、层轮廓图,完成了HOG特征提取和几何特征提取,并提供给 SVM 进行分类。Surakarin等18将服装分为夹克、衬衫、西装、毛衣、T恤、马球衫和背心,提取服装图像的 SURF 和 LBP 特征,应用于后续的 SVM 分类,对服装图像识别的准确率达到73.57%。综上所述,传统特征提取基本实现了服装特征的分类检测任务,但是传统的图像特征提取方法在服装图像的形变、褶皱、遮挡等方面的处理效果较差,并且部分特征易受视角变化、光线变化、背景复杂、目标对象多等因素的影响。2.2深度学习提取算法深度学习在互联网时代的推动下高速发展,更多学者基于深度学习提取图像特征的能力,完成服装图像的检索、识别、分类等任
19、务,进行服装时尚、时尚搭配等方面的探索。深度学习是机器学习(Machine Learning)的一种,是人工神经网络(ANNs)的高级模型,能够通过多层的神经网络学习输入图像特征,挖掘图像中的高级语义信息特征。深度学习因为拥有速度更快、检索性能更优的特点,服装图像的特征提取不再局限于单一的传统特征提取,而是将服装与深度学习相结合,广泛应用于服装方向的数字化发展。2.2.1卷积神经网络卷积神经网络(Convolutional Neural Networks,CNN)由纽约大学的Yann Lecun提出,应用于服装风格识别分类的经典网络模型主要包含:AlexNet、GoogLeNet、VGGNet
20、、ResNet,如表3所示。在图像分类的应用中,网络的输入改变为图像,避免了传统识别算法中复杂的特征提取和数据重建的过程。网络模型AlexNet23VGGNet24GoogLeNet25ResNet26结构图像224224;5个卷积层、3个全连接层反复堆叠33的小型卷积核;22的最大池化层引入Inception结构;11的卷积核进行降维以及映射处理VGG19网络的基础上通过短路机制加入了残差单元算法特征ReLU函数,避免梯度消失;多GPU训练;重叠池化操作;LRN完成局部响应归一化多个小卷积核、小池化核堆叠,多尺度训练,多尺度测试,全连接层转卷积层密集成分近似局部稀疏结构,特征矩阵深度降低,全
21、局平均池化层取代全连接层应用不同大小的卷积核以及不同大小的感受野,进行不同尺度特征的融合主要应用图像分类快速风格迁移,作为目标检测的backbone,提取特征计算图片的感知损失Inception V1、V2、V3、V4,服装款式、图案识别分类服装图像检索,服装风格图像识别分类表3基于卷积神经网络的服装分类经典网络模型张琦妍,等:服装风格图像的识别分类研究进展3染整技术45卷2.2.1.1AlexNetAlexNet是Alex Keizhecsky等于2012年在ILSVRC(ImageNet Large Scale Visual Recognition Challenge)中提出的一种模型,并
22、将图像分类Top-5错误率优化至 15.3%。在图像识别分类问题中,AlexNet 使用 ReLU作为非线性激活函数,避免了梯度的消失问题。同时,正则化(如Batch Norm)在AlexNet中大量使用,加快了运算效率,引入 Drop Out 技术防止过拟合。Lin等27使用微调的AlexNet模型,提出深度卷积神经网络框架,用于服装推荐系统中快速服装检索,与使用CNN和传统图像提取特征搜索相比,从粗到细的搜索分别获得了10倍和50倍的检索速度。2.2.1.2VGGNetVGGNet 出现于 2014 年的 ILSVRC,由牛津大学的研究团队提出。VGGNet通过加深卷积神经网络的深度来提高
23、其性能,成功地搭建了1619层深的卷积神经网络。Liu等4提出FashionNet网络结构将VGG-16最后一个卷积层替换为针对服装设计的卷积层,在细粒度的服装特征处理方面,有效提高了服装分类的准确率。Wang等28基于VGG-16引入双向卷积递归神经网络(BCRNN),有效通过语法拓扑传递信息,使用地标感知注意力和类别驱动注意力来增强服装识别准确率。Wang等29预训练了一个完全卷积网络(FCN)生成注意力图,将注意力图与中间特征图相结合生成用于检索的特征向量。汤清云30提出基于注意力区域递归的多标签分类网络提取局部特征和全局特征,通过VGG-16提取特征图,使检索的正确率提高3%5%。VG
24、G-16模型强大的图像特征提取能力31,相较于传统特征提取方法具有更好的图像特征表示能力。2.2.1.3GoogLeNetGoogLeNet是谷歌团队于2014年在ILSVRC上提出的一种模型。因网络深度加深,导致参数增多,识别结果易过拟合,计算复杂度越大,存在梯度弥散等缺点,研发团队提出Inception(初始模块)的概念,即搭建一个稀疏的高性能计算的网络结构。继 Inception V1模块后,也相继提出了Inception V2、InceptionV3、Inception V4 等模块。李青等32基于 Inception V3算法与迁移学习技术对女式衬衫图案进行分类。侯媛媛等33提出了一
25、种基于 GoogLeNet的多层特征融合方案,充分利用了高层次特征的丰富语义信息和低层次特征的细节信息,形成优势互补,有利于捕获服装的整体风格特征和款式细节特征。2.2.1.4ResNetResNet 在 2015 年被 Kaiming He 提出,之后很多应用于检测、分割、识别等领域的深度学习方法都是建立在ResNet50或ResNet101的基础上。ResNet通过引入残差网络结构(Residual Network),使网络深度加深且能够具有更好的分类结果。Yamamoto等34使用 ResNet50 作为特征提取器,通过 CD-CNN 的全连接层输出和SVM执行分类,并有效提高分类准确率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 服装 风格 图像 识别 分类 研究进展
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。