分销赏收藏举报申诉 / 7

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 一种结构关系一致的对比聚类方法.pdf

一种结构关系一致的对比聚类方法.pdf

上传人：自信****多点

文档编号：757393

上传时间：2024-03-05

格式：PDF

页数：7

大小：2.36MB

《一种结构关系一致的对比聚类方法.pdf》由会员分享，可在线阅读，更多相关《一种结构关系一致的对比聚类方法.pdf（7页珍藏版）》请在咨信网上搜索。

1、h t t p:/ww wj s j k x c o mD O I:/j s j k x 到稿日期:返修日期:基金项目:基础加强计划重点项目(J C J Q Z D )T h i sw o r kw a ss u p p o r t e db yt h eK e yP r o j e c t so fF o u n d a t i o nS t r e n g t h e n i n gP l a n(J C J Q Z D )通信作者:王立松(w a n g l s n u a a e d u c n)一种结构关系一致的对比聚类方法许洁王立松南京航空航天大学计算机科学与技术学院/人工智能学院

2、/软件学院南京 (x u j i e n u a a e d u c n)摘要作为一项基本的无监督学习任务,聚类旨在将无标签的、混杂的图像数据划分成语义相似的类.最近的一些方法通过引入数据增强,利用对比学习方法学习特征表示和聚类分配,关注模型区分不同语义类的能力,可能导致来自同一语义类样本的特征嵌入被分离的情况.针对以上问题,提出一种结构关系一致的对比聚类方法(C o n t r a s t i v eC l u s t e r i n gw i t hC o n s i s t e n tS t r u c t u r a lR e l a t i o n s,C C R),在实例级和聚类级

3、执行对比学习,并且增加关系级别的一致性约束,让模型学习更多来自结构关系的“正数据对”信息,从而减小聚类嵌入被分离所带来的影响.实验结果表明,C C R方法在图像基准数据集上得到了比近年来的无监督聚类方法更优异的结果.模型在C I F A R 和S T L 数据集上的平均准确度比相同实验设置下的最好方法提升了,在C I F A R 数据集上提升了.关键词:无监督学习;聚类;对比学习;数据增强;过度聚类中图法分类号T P C o n t r a s t i v eC l u s t e r i n gw i t hC o n s i s t e n t S t r u c t u r a lR e

4、 l a t i o n sX UJ i ea n dWAN GL i s o n gC o l l e g eo fC o m p u t e rS c i e n c ea n dT e c h n o l o g y/C o l l e g eo fA r t i f i c i a l I n t e l l i g e n c e/C o l l e g eo fS o f t w a r e,N a n j i n gU n i v e r s i t yo fA e r o n a u t i c s a n dA s t r o n a u t i c s,N a n j i

5、n g ,C h i n aA b s t r a c t A sab a s i cu n s u p e r v i s e dl e a r n i n gt a s k,c l u s t e r i n ga i m st od i v i d eu n l a b e l e da n dm i x e di m a g e s i n t os e m a n t i c a l l ys i m i l a rc l a s s e s S o m e r e c e n t a p p r o a c h e s f o c u s o n t h e a b i l i t

6、 yo f t h em o d e l t od i s c r i m i n a t eb e t w e e nd i f f e r e n t s e m a n t i c c l a s s e sb y i n t r o d u c i n gd a t aa u g m e n t a t i o n,u s i n gc o n t r a s t i v e l e a r n i n gm e t h o d s t o l e a r n f e a t u r e r e p r e s e n t a t i o n s a n dc l u s t e r

7、a s s i g n m e n t s,w h i c hm a y l e a d t os i t u a t i o n s t h a t f e a t u r ee m b e d d i n g sf r o ms a m p l e sw i t ht h es a m es e m a n t i cc l a s sa r es e p a r a t e d A i m i n ga tt h ea b o v ep r o b l e m s,ac o m p a r a t i v ec l u s t e r i n gm e t h o dw i t hc o

8、 n s i s t e n t s t r u c t u r a l r e l a t i o n s(C C R)i sp r o p o s e d,w h i c hp e r f o r m s c o m p a r a t i v e l e a r n i n ga t t h ei n s t a n c e l e v e l a n dc l u s t e r l e v e l,a n da d d sc o n s i s t e n c yc o n s t r a i n t sa t t h er e l a t i o n s h i p l e v e

9、 l S ot h a t t h em o d e l c a n l e a r nm o r e i n f o r m a t i o no fp o s i t i v ed a t ap a i ra n dr e d u c e t h e i m p a c to f c l u s t e re m b e d d i n gb e i n gs e p a r a t e d E x p e r i m e n t a l r e s u l t ss h o wt h a tC C Ro b t a i n sb e t t e r r e s u l t s t h a

10、 nt h eu n s u p e r v i s e dc l u s t e r i n gm e t h o d s i nr e c e n ty e a r so nt h e i m a g eb e n c h m a r kd a t a s e t T h ea v e r a g ea c c u r a c yo nt h eC I F A R a n dS T L d a t a s e t s i m p r o v e sb y c o m p a r e d t o t h eb e s tm e t h o d s i n t h e s a m e e x

11、p e r i m e n t a l s e t t i n g sa n d i m p r o v e sb y o nt h eC I F A R d a t a s e t K e y w o r d s U n s u p e r v i s e dl e a r n i n g,C l u s t e r i n g,C o n t r a s t i v e l e a r n i n g,D a t aA u g m e n t a t i o n,O v e rc l u s t e r i n g引言近年来,在社交媒体平台、医学图像等领域产生了大量的视觉内容,其中大多数是

12、没有标记的.手动标记这些数据非常耗时,超高的成本必然会给这些数据的共享和使用带来巨大的挑战,同时也导致人们对以无监督的方式有效地管理和使用如此大的数据量的需求增加.聚类是一项基本的无监督学习方法.传统的聚类方法,如K M e a n s、谱聚类、非负矩阵分解聚类等,只关注或过多地关注局部的、像素级的信息,忽略了图像更高层次的语义信息,因而性能有限.深度学习在近年来发展势头非常迅猛,越来越多的研究者将深度学习应用到聚类工作中 .I I C使用图像及其随机增强后的图像组成数据对来训练模型学习聚类结果一致性;P I C A通过最大化分区置信度来学习语义上最可信的聚类解决方案;C C创造性地提出“标签

13、作为表示”的思想,显式地执行实例级和聚类级的对比学习;同样,D C D C也注意到只从一个角度进行对比学习而忽略另一个角度,会导致性能较差,提出了特征级与聚类级相结合的方法.这类方法将图像样本数据看作实例,每个实例分别对应一个类,使用数据增强构建数据对,利用最大化互信息的方式从中学习实例表示一致性和聚类表示一致性.实例表示一致性通过最大化实例表示特征与其增强之间的互信息来实现,有助于减少类内方差.聚类表示一致性通过最大化原始图像集群分配分布与其增强之间的互信息来实现,有助于增加类间方差,实现更具区分性的集群分配.尽管学习不同图像之间的区别有助于模型区分来自不同语义类的图片,但此类方法可能会导致

14、同一类的实例被分离的情况,例如:同一类的实例被实例级损失函数认为是不同的图片而分离,导致聚类嵌入的类内方差较大,违背了“良好的聚类嵌入应该具有较小的类内方差和较大的类间方差”的初衷;同一类的图片被错误地分类,被聚类级损失函数认为是不同类别的图片而分离,这样的错误会给模型带来不稳定性,造成误差的积累.针对以上问题,本文提出了一种结构关系一致的对比聚类方法C C R.具体来说,就是在实例级别和聚类级别的对比损失之外,增加一种新的损失函数来惩罚多个样本数据的结构关系之间的差异,目的是让模型学习更多的“正数据对”信息,减轻实例分离带来的影响.这种损失关注的是多个输出数据之间的结构关系一致性而不是单个数

15、据对本身,如图所示.可将多个数据样本之间的距离视为它们之间的结构关系,由此可以分别得到原始样本和增强样本的结构关系.通过约束原始样本关系与增强样本关系之间的差异,提高模型对同一批样本输出相似的关系矩阵的能力,可以提高模型的鲁棒性.并且,将关系表示损失与双重对比损失结合,可以获得更多的正向鉴别特征和更小的聚类嵌入类内方差,从而得到更好的聚类结果.(a)样本视图(b)类别视图(c)关系视图图样本对、类别对及结构关系对之间的差别F i g D i f f e r e n c e sb e t w e e ns a m p l ep a i r s,c l a s sp a i r s,a n ds

16、t r u c t u r a lr e l a t i o n s h i pp a i r s相关工作如何将不同的图片聚类到不同的簇中这一问题已经有了长期的研究和发展.本章将着重介绍两个方面的相关工作,即深度聚类和对比学习.深度聚类聚类的主要目的是将数据分成具有相似特征的数据点组.理论上,相似的样本会被划分到相同的类别,而不同的样本被划分到不同的类别.深度神经网络因为具有高度非线性转换的特性,被用于将数据转换为更适用于聚类的表示.深度嵌入聚类D E C是第一个被广泛认可的深度聚类方法,X i e等使用删除解码部分的自动编码器提取出的特征表示作为聚类模块的输入,并设计新的聚类损失对网络进行微

17、调.C h a n g等提出了一种基于单级网络的深度自适应聚类方法D A C,基于“成对图像之间的关系是二进制的”的假设,将图像聚类任务转化为一个判断图像对是否属于同一聚类的二分类问题.另一方面,由于数据增强技术增强了模型的鲁棒性,研究人员也将其应用到无监督聚类工作中.D C CM 全面探索了不同样本、几何变换的局部鲁棒性以及同一样本不同层特征之间的相互相关性,提出了特征间的三重互信息.针对大多研究中存在的只从单一视图角度学习聚类的问题,C C(C o n t r a s t i v eC l u s t e r i n g)使用双对比学习框架来学习实例级和

18、聚类级相似性,同时学习鉴别特征并进行在线聚类.而C R L C 引入了一种新的批评家函数 “对数点积”来保证对比损失是最优的.在最新的研究中,S C AN 与S P I C E 取得了优异的结果,但此类多阶段图像聚类范式在实践中麻烦且不具备普遍适用性.因此,单阶段端到端的方法研究仍然是必要的.对比学习对比学习着重于学习同类样本之间的共同特征以区分非同类样本.与生成式学习相比,对比式学习可以忽略样本细节,只在抽象语义级别的特征空间上学习区分不同类别的样本,使模型具有更强的泛化能力.正对之间的相似度被最大化,负对之间的相似度被最小化,从而使正对相互靠近而负对相互远离.现有的方法如D C D C和D

19、 R C 通常选择用样本的增强视图作为其正例,而将其他样本的增强视图作为负例.C C修改了正负数据对的选取规则,使用样本的不同增强视图组成正对,而将不同样本在同一增强及不同增强下的视图作为负对,从而得到更多的正负样本对信息,提高对比学习的性能.在实现时,如何设计最优的对比损失是研究者需要解决的一个重要问题.很多方法使用噪声对比估计(N o i s eC o n t r a s t i v eE s t i m a t i o n,N C E)作为对比损失,其核心思想是通过学习数据分布样本和噪声分布样本之间的区别来发现数据特性.N C E将问题转换成二分类问题,区分数据样本和噪声样本,只适用于简

20、单的分类问题.因此,更通用的对比损失I n f o N C E 被推导出来,现有的对比学习方法大多使用I n f o N C E作为损失函数.近两年,对比学习在计算机视觉领域和自然语言处理领域都取得了很多成果,如M o C o,S i m C L R,C o n S E R T,S i m C S E 等.在C V的一些任务上,基于对比学习思想的模型的表现甚至超过了有监督学习.本文同样使用对比学习来完成端到端的模型训练.结构关系一致的对比聚类方法对比学习的目标在于最大化正对之间的相似性而最小化C o m p u t e rS c i e n c e计算机科学V o l ,N o

21、 ,S e p 负对之间的相似性,其中一项非常重要的任务在于如何设计正负数据对来满足聚类任务的要求,即相似的样本相互靠近而不同的样本相互远离.针对对比学习更加关注区分不同实例而忽略类内表现的问题,本文提出一种结构关系一致的对比聚类方法C C R,同时利用实例特征表示、类别表示和关系表示进行聚类,如图所示.受到S i m C L R 的启发,C C R使用数据增强来构建数据对作为输入.S i m C L R 全面展示了不同的增强策略对下游任务性能的影响,本文选择随机裁剪、

22、水平翻转、色彩抖动和灰度化这种类型的数据增强方法.具体来说,给定一个原始数据,在数据增强方法的作用下,得到其对应的增强数据.神经网络作为深度聚类模型的骨干部分,主要作用是将输入图像数据经过层次化的非线性映射得到新的低维特征表示.为方便与其他已有的工作进行比较,本文采用R e s N e t 作为骨干网络.图关系结构一致的对比学习框架图F i g C o n t r a s t i v e l e a r n i n gf r a m e w o r k

23、w i t hc o n s i s t e n t r e l a t i o n a l s t r u c t u r e神经网络输出图像的分配概率矩阵被视为特征矩阵.自然地,将分配概率矩阵的行(即每张图片的分配概率向量)看作是图像的特征表示,并且根据“标签作为表示”的思想,矩阵的列作为数据分布情况被看作代表不同语义类的聚类表示.而原始图像和增强图像的结构关系矩阵可以通过相应的概率分配矩阵获得.图中虚线框部分展示了C C R所使用到的种损失.在实例级别,最小化原始图像与增强图像之间的相似度,保证原始图像及其增强的特征表示一致性;在聚类级别,最小化原始类与增强类之间的相似度,保证原始图像及

24、其增强的分配一致性(即原始类与增强类之间的聚类表示一致性);在关系级别,最小化原始结构关系与增强结构关系之间的相似度,保证原始图像及其增强的关系表示一致性.种损失共同训练,有助于形成良好的、更鲁棒的聚类.下面将详细介绍模型中涉及的几种损失函数.实例表示损失基于对比学习的思想,C C R方法将原始图像及其增强视为正对,而将原始图像与其他图像的增强视为负对.形式化来说,给定一批大小为N的原始样本Xx,x,xN,其对应的N个增强样本为X x,x,xN,那么对于任意样本xi,xi与N个增强样本总共可以组成N个数据对.本文将该样本与其对应的增强样本组成的数据对(xi,xi)视为正对,将该样本与其他N个增

25、强样本组成的数据对(xi,xj)视为负对.为了减少对比学习带来的信息损失,本文没有直接使用神经网络f()输出的特征,而是使用非线性ML P g()将其映射到概率分配空间中,得到的概率分配被视为实例的特征表示ug(f(x),u g(f(x).原始样本和增强样本本质是同一实例,应当具有相同的类分配概率.为方便起见,本文选择余弦相似度作为评价正样本对的分配概率是否保持一致性的指标,公式定义为:c o s(u,u)uTu uu()其中,代表L归一化.根据I n f o N C E,实例级别的损失可以定义为:Ls a mEl o ge x p(c o s(ui,ui)/Nje x p(c o s(ui,

26、uj)/()其中,是温度参数.聚类表示损失当将某一数据样本投影到维数等于聚类数C的空间时,其特征的第j个元素可以解释为该样本属于第j个类别的概率,特征向量相应地表示其软标签.形式上,与样本级别类似,设原始图像和增强图像分别对应输出概率分配矩阵Vv,v,vCNC和V v,v,vCNC.理想情况下的软标签往往是o n e h o t编码,那么V和V 的列空间即vj与vj可以说明哪些图像被分配给聚类j,也就是说V和V 的第j个列可以被看作是第j个聚类的表示.因此,被归为同一类的聚类可以被看作是正类对,例如,vj实际上是vj的增强,应当是同属一类的,可以将其视为正类对,其聚类表示应当是一致的.同样,这

27、里使用余弦距离来衡量聚类表示对之间的相似性,即c o s(v,v)vTv vv()相应地,对于温度参数,聚类级别的损失就可以定义为:许洁,等:一种结构关系一致的对比聚类方法Lc l uEl o ge x p(c o s(vi,vi)/Cje x p(c o s(vi,vj)/,()关系表示损失本文所说的关系是指不同样本之间的结构关系.当高维的数据投影到不同低维空间中时,样本之间的结构关系应该保持一致.结构关系的表示方法可以有多种,如距离、角度等.为方便起见,本文使用空间中的欧氏距离作为两图像之间的关系表示:(ui,uj)uiuj()其中,是距离的标准化因子.为了关注其他样本对之间的相对距离,将

28、设置为每个b a t c h的数据对集合B中所有数据对之间的平均距离,采用式()计算的取值:|B|(ui,uj)Buiuj()不同增强下的同一批图像,其数据点的距离结构关系应该是一致的.基于此,设计新的损失函数:Lr d(ui,uj)nl(ui,uj),(ui,uj)()其中,l为均方误差.那么,综合以上种损失的总损失函数可以写成:Lt o t a lLs a mLc l uLr d()其中,为权重参数.实验数据集与评价指标本文在个被广泛使用的基准数据集上进行实验.对于C I F A R ,C I F A R 和S T L 数据集,实验时同时使用它们的训练集和测试集,对于T i n y I

29、m a g e N e t数据集,实验中只使用训练集.下面将详细介绍这些数据集的特征.)C I F A R /:C I F A R /C I F A R 数据集分别包含个类和个超类,由张的图像组成,其中张用于训练,张用于测试.)S T L :包含类物品,每类张,其中张用于训练,张用于测试,每张图像大小为 .除此之外,S T L 还包含张无类别信息的图片样本,用于训练.)T i n y I m a g e N e t:它是I m a g e N e t的一个子集,是一个具有挑战性的图像数据集.T i n y I m a g e N e t包含个类,每个类有个训练样本、个验证

30、样本、个测试样本,每个样本的大小为 .在实验评估阶段,本文使用了种流行的聚类评价指标:准确性(A C C)、归一化互信息(NM I)和调整后的兰德指数(A R I).这些指标的值越大,表明聚类性能越好.实现细节本文使用P y T o r c h 来完成所有的实验,并用A d a m进行优化,设置学习速率为固定值 .为方便与其他方法进行公平比较,使用了与大部分方法相同的神经网络R e s N e t 作为骨干网络进行训练.与P I C A等方法一致,本文使用了额外的过度聚类头来增加学习到的特征表示的表达性.对于过度聚类头,本文为T i n y I m a g e N e t设置了个集群,为其他

31、集群设置了个集群.对于模型中涉及的超参数,本文将其设置为固定值,即温度参数,权重参数 .需要注意的是,针对不同的数据集,本文选取了不同的批处理大小,即对于C I F A R 数据集,批处理大小被设置为,C I F A R 数据集的批处理大小被设置为 ,S T L 数据集的批处理大小为,T i n y I m a g e N e t数据集的批处理大小为 .在实验中,每个批次的样本被重复次,并使用相同的数据增强方式.实验使用N v i d i aT I T ANR T X G将模型从头开始训练个e p o c h,与D C D C等方法一致.其结果将在后面展示.实验结果及分析本文采用了个不同的

32、评价指标,在个被广泛使用且具有挑战性的数据集上进行了实验,并与包括传统的聚类方法和深度聚类方法在内的种具有代表性的聚类方法进行了比较,如表所列.这些聚类方法包括K m e a n s、谱聚类(S C)、凝聚聚类(A C)、基于非负矩阵分解的聚类(NMF)、自动编码器(A E)、去噪自动编码器(D A E)、反卷积网络(D e C NN)、变分自编码(VA E)、联合无监督学习(J U L E)、深度嵌入聚类(D E s C)、深度自适应图像聚类(D A C)、不变信息聚类(I I C)、深度综合相关挖掘(D C CM)、分区置信度最大化(P I C A)和双

33、重对比学习(D C D C).表不同聚类方法在个基准数据集上的聚类性能T a b l eC l u s t e r i n gp e r f o r m a n c eo fd i f f e r e n t c l u s t e r i n gm e t h o d so nb a s e l i n ed a t a s e t sM e t h o d sC I F AR A C CNM IA R IC I F A R A C CNM IA R IS T L A C CNM IA R IT i n y I m a g e N e tA C CNM IAR IK m e a n s S

34、C A C NMF A E D A E D e C NN VA E J UN E D E C D A C D C CM I I C P I C A D C D C O u r s(C C R)C o m p u t e rS c i e n c e计算机科学V o l ,N o ,S e p 从表的结果来看,C C R方法始终优于其他的先进方法,特别是本文的灵感来源于D C D C,这表明了本文方法的有效性.具体来说,以聚类平均准确度(A C C)为例,本文的方法在C I F A R 和S T L 数据集上均提升了,在C I F A R 数据集上提升了.在归一化互信息(NM I)方面,本文方法

35、在C I F A R 数据集上提升了,在S T L 数据集上提高了,在C I F A R 数据集上提升了.以上结果可以很好地证明本文方法在无监督聚类方面的有效性.定性研究集群分配可视化为了便于理解无监督聚类的过程以及更好地说明含有关系表示的双重对比深度聚类方法在无监督聚类工作上的有效性,本文利用t S N E编码对C I F AR 数据集的测试集中的张图像在训练过程中不同e p o c h下的特征表示分布进行了可视化,如图(a)图(c)所示.可以看到,在训练未开始时,所有类别的图

36、像混杂在一起,随着模型训练的进行,同一类别的图像彼此逐渐靠近,形成不同的簇,同时不同的簇也彼此逐渐远离.图(d)展示了在 e p o c h时的分配概率,从图中可以看出,虽然仍有少部分图像被错误地分配到了其他类,但总体而言,不同类别的图像被有效地分离.(a)(b)(c)(d)图C I F A R 数据集中的图像在训练过程中的特征分布F i g F e a t u r ed i s t r i b u t i o no f i m a g e sd u r i n gt r a i n i n go nC I F A R d a t a s e

37、t 成功与失败案例研究为了更好地了解模型的性能,本文可视化了C I F A R 数据集中一些成功和失败的案例,如图所示.左边线框中的图片代表模型成功预测其所属集群的案例,右边线框中的图片则代表对应集群中出现的失败案例.可以看出,模型能够将来自同一或不同语义类的具有相似形状或背景的图像聚集到同一集群中.实验中的错误案例往往来自于与正确案例相似的类,比如猫和狗、马和鹿等类别图像间的混淆.例如,第三行中,与鹿具有相似形状的马被错误地聚类到“鹿”集群中,而前两行中,“猫”集群当中的失败案例大多来自于“狗”集群,同样的情况也出现在“狗”集群中.图C I F A R 案例研究F i g C a s e s

38、s t u d i e so nC I F A R 消融研究为了进一步了解本文模型设置及实验设置中的不同选择对实验结果的影响,本文进行了如下消融研究.种损失的影响C C R方法共设置了种不同的损失函数.表列出了这种损失函数对模型的影响.其中I R L表示实例表示损失,C R L表示聚类表示损失,R R L表示关系表示损失.由于关系表示损失是实例表示损失与聚类表示损失的补充,因此不探讨单独使用R R L的情况.表关系表示损失的影响T a b l eE f f e c to nr e l a t i o n s h i pr e p r e s e n t a t i o n l o s sC I

39、 F AR A C CNM IA R IC I F AR A C CNM IA R II R L C R C I R LR R L C R LR R L I R LC R L(D C D C)C C R 从表可以看出,单独使用实例表示损失比单独使用聚类表示损失效果更好,这是由于实例级别的特征表示比聚类级别的特征表示携带了更多的对比性信息.而关系表示损失能够减小来自同一类别的样本嵌入被分离的影响,对于两种级别的对比学习都有一定的提升效果.同时使用聚类级别和实例级别的对比损失,比单独使用两者中的任一级别的效果更好,这是因为两种级别联合使用能够获得更多的鉴别信息.而最终的实验结果表明结

40、构关系级别的对比学习同样能够在两项对比损失的基础上进一步优化模型,得到更优异的结果.方差分析关系表示损失的初衷在于为模型提供更多的正数据对信息,以达到减小类内聚类嵌入方差的目的.本文利用分配概率计算C I F A R 数据集来自个类别(分别编号为)中个样本的聚类结果的类内方差.结果如图所示,可以看出,含有关系表示损失(R R L)的模型相比仅使用聚类表示损失和实例表示损失的模型(D C D C)获得的类内方差更小,聚类表现更优异,也说明了关系表示损失能够减轻同一类别的图像嵌入被分离的影响.许洁,等:一种结构关系一致的对比聚类方法图C I F A R 数据集的类内方差分析F i

41、 g I n t r a c l a s sv a r i a n c ea n a l y s i so nC I F A R 批处理大小的影响目前的对比学习方法认为,在训练时使用大批量的数据总是会获得更好的性能.为了评估批量大小(b a t c h_s i z e)对性能的影响,本文对其进行了不同的赋值,探究在b a t c h_s i z e取 ,时模型在C I F A R 数据集上的性能.实验结果如表所列.表批处理大小对C I F A R 数据集的影响T a b l eE f f e c to fb a t c h_s i z eo nC I F A R d a t a s e tb

42、a t c h_s i z eA C CNM IA R I 从结果中可以看出,对比学习受益于更大批量规模的认识可能并不适用于所有的深度聚类任务.对于类别数量多的数据集,如拥有个类别I m a g e N e t数据集,应用对比学习时,大批量的数据包含更多类别的图像,给图像样本带来更多的负例表示,因此模型可以学习到样本更多更具鉴别性的特征,以此展现出更好的性能.而对于类别数量较小的数据集,仅仅简单地设置更大的批处理大小似乎并不奏效,如本文实验中展示的那样.因此,选取合适的批处理大小可以获得更好的模型性能.过度聚类的影响根据I I C,过度聚类头输出比真实的聚类数更多的聚类预测,能够获取更高维数

43、的聚类和样本表示,增加特征表示的表达性.本文实验同样使用了过度聚类头来帮助模型学习,结果如表所列,过度聚类(O v e r c l u s t e r i n g)对模型的性能有着较大的提升.表过度聚类头的影响T a b l eE f f e c to fo v e r c l u s t e r i n g(O C)C I F AR A C CNM IA R IC I F AR A C CNM IA R IW i t h o u tO C C C R 结束语为了弥补现有的基于对比学习的聚类方法的不足,本文提出了一种结构关系一致的对比聚类方法C C R.与以往的方法不同,本文在实例表示一致性和

44、聚类表示一致性的基础上增加了关系表示一致性的约束,认为同一批样本及其增强应当具有相似的结构关系表示.受益于这种新的约束,本文的方法在个广泛使用的数据集上展现出了良好的性能.但是,在通用数据集上进行的实验仅仅能够得出种约束方式所对应的损失函数能够有效地提升模型的性能,而无法针对性地得出种损失对应的适用场景及其原因.同样,本文所提出的方法仅仅减轻了聚类嵌入被分离所带来的影响,图所示的错误聚类案例仍然没有得到根本的解决.这两个问题的解决方案超出了本文的范围,将在以后的工作中进一步完善.参考文献MA C QU E E NJ S o m em e t h o d s f o r c l a s s

45、 i f i c a t i o na n da n a l y s i so fm u l t i v a r i a t eo b s e r v a t i o n sCP r o c e e d i n g so f t h e f i f t hB e r k e l e yS y m p o s i u mo n M a t h e m a t i c a lS t a t i s t i c sa n dP r o b a b i l i t y ,():Z E L I N I K MAN O RL,P E R ONAP S e l f T u n i n gS p e c t

46、r a lC l u s t e r i n gCA d v a n c e s i nN e u r a l I n f o r m a t i o nP r o c e s s i n gS y s t e m s(N I P S)C A ID,HEX,WAN GX,e ta l L o c a l i t yp r e s e r v i n gn o n n e g a t i v em a t r i xf a c t o r i z a t i o nCT w e n t y f i r s t I n t e r n a t i o n a lJ o i n tC o n f e

47、 r e n c eo nA r t i f i c i a l I n t e l l i g e n c e J I X,HE N R I QU E SJ F,V E D A L D I A I n v a r i a n ti n f o r m a t i o nc l u s t e r i n gf o ru n s u p e r v i s e di m a g ec l a s s i f i c a t i o na n ds e g m e n t a t i o nCP r o c e e d i n g so ft h eI E E E/C V FI n t e r

48、n a t i o n a lC o n f e r e n c eo nC o m p u t e rV i s i o n :HUAN GJ,G ON GS,Z HUX D e e ps e m a n t i cc l u s t e r i n gb yp a r t i t i o nc o n f i d e n c em a x i m i s a t i o nCP r o c e e d i n g so ft h eI E E E/C V FC o n f e r e n c eo nC o m p u t e rV i s i o na n dP a t t e r nR

49、 e c o g n i t i o n :L I Y,HU P,L I U Z,e ta l C o n t r a s t i v ec l u s t e r i n gC AAA IC o n f e r e n c eo nA r t i f i c i a l I n t e l l i g e n c e(AAA I)D ANG Z,D E NG C,YAN G X,e ta l D o u b l yc o n t r a s t i v ed e e pc l u s t e r i n gJ a r X i v:,X I EJ,G I R S H I C KR,F A RH

50、A D IA U n s u p e r v i s e dd e e pe m b e d d i n gf o rc l u s t e r i n ga n a l y s i sCI n t e r n a t i o n a lC o n f e r e n c eo nM a c h i n eL e a r n i n g PML R,:C HAN G J,WANG L,ME N G G,e ta l D e e p a d a p t i v ei m a g ec l u s t e r i n gCP r o c e e d i n g so ft h eI E E EI

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 一种结构关系一致对比方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。