分销赏收藏举报申诉 / 14

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 基于对比学习的全局增强动态异质图神经网络.pdf

基于对比学习的全局增强动态异质图神经网络.pdf

上传人：自信****多点

文档编号：636870

上传时间：2024-01-21

格式：PDF

页数：14

大小：1.96MB

《基于对比学习的全局增强动态异质图神经网络.pdf》由会员分享，可在线阅读，更多相关《基于对比学习的全局增强动态异质图神经网络.pdf（14页珍藏版）》请在咨信网上搜索。

1、基于对比学习的全局增强动态异质图神经网络焦鹏飞1,4刘欢2吕乐3高梦州1张纪林4刘栋31（杭州电子科技大学网络空间安全学院杭州310018）2（杭州电子科技大学计算机学院杭州310018）3（河南师范大学计算机与信息工程学院河南新乡453007）4（数据安全治理浙江省工程研究中心杭州310018）（）Globally Enhanced Heterogeneous Temporal Graph Neural NetworksBased on Contrastive LearningJiaoPengfei1,4,LiuHuan2,LLe3,GaoMengzhou1,ZhangJilin4,andL

2、iuDong31（School of Cyberspace,Hangzhou Dianzi University,Hangzhou 310018）2（School of Computer Science and Technologyy,Hangzhou Dianzi University,Hangzhou 310018）3（College of Computer and Information Engineering,Henan Normal University,Xinxiang,Henan 453007）4（Data Security Governance Zhejiang Enginee

3、ring Research Center,Hangzhou 310018）AbstractGraphneuralnetworks(GNNs)haveattractedextensiveattentioninrecentyearsduetothepowerfulrepresentation capabilities for graph-structured data.Existing GNNs mainly focus on static homogeneous graph.However,complex systems in the real world often contain multi

4、ple types of dynamically evolving entities andrelationships,which are more suitable for modeling as heterogeneous temporal graphs(HTGs).Currently,HTGrepresentation learning methods mainly focus on the semi-supervised learning paradigm,which suffers from theproblemsofexpensivesupervisoryinformationan

5、dpoorgeneralization.Aimingattheaboveproblems,weproposeagloballyenhancedGNNforHTGbasedoncontrastivelearning.Specifically,weuseaheterogeneoushierarchicalattention mechanism to generate proximity-preserving node representations based on historical information.Furthermore,contrastivelearningisusedtomaxi

6、mizethemutualinformationbetweentemporallocalandglobalgraphrepresentations,enrichingtheglobalsemanticinformationofnoderepresentations.Theexperimentalresultsshowthattheself-supervisedHTGrepresentationlearningmethodproposedinthispaperimprovestheAUConthelinkpredictiontaskofmultiplereal-worlddatasetsbyan

7、averageof3.95%.Key words dynamic link prediction；heterogeneous temporal graphs；graph representation learning；contrastivelearning；self-supervisedlearning摘要图神经网络由于其对图结构数据的强大表征能力近年来受到广泛关注.现有图神经网络方法主要建模静态同质图数据，然而现实世界复杂系统往往包含多类型动态演化的实体及关系，此类复杂系统更适合建模为动态异质图.目前，动态异质图表示学习方法主要集中于半监督学习范式，其存在监督信息昂收稿日期：2023-03-

8、31；修回日期：2023-06-01基金项目：浙江省自然科学基金项目（LDT23F01015F01,LDT23F01012F01）)；浙江省属高校基本科研业务费资助（GK229909299001-008）；国家自然科学基金项目（62072160,62003120）ThisworkwassupportedbytheZhejiangProvincialNaturalScienceFoundationofChina(LDT23F01015F01,LDT23F01012F01),theFundamentalResearch Funds for the Provincial Universities o

9、f Zhejiang(GK229909299001-008),and the National Natural Science Foundation of China(62072160,62003120).通信作者：刘栋（）计算机研究与发展DOI：10.7544/issn1000-1239.202330226JournalofComputerResearchandDevelopment60（8）：18081821，2023贵和泛化性较差等问题.针对以上问题，提出了一种基于对比学习的全局增强动态异质图神经网络.具体地，所提网络首先通过异质层次化注意力机制根据历史信息来生成未来的邻近

10、性保持的节点表示，然后通过对比学习最大化局部节点表示和全局图表示的互信息来丰富节点表示中的全局语义信息.实验结果表明，提出的自监督动态异质图表示学习方法在多个真实世界数据集的链路预测任务上的 AUC 指标平均提升了 3.95%.关键词动态链路预测；动态异质图；图表示学习；对比学习；自监督学习中图法分类号TP391网络（network）或图（graph）具有对实体及实体之间关系的通用建模能力，被广泛应用于描述现实世界网络，如社交网络、互联网和交通网络等15.为了捕获图数据中丰富的结构信息和语义信息，图表示学习（graphrepresentationlearning）近年来引起了广泛的研究热忱，并

11、在许多领域展现出其显著的性能优势6，如生物信息、智能交通、推荐系统等79.尽管取得了诸多重要成就，目前大部分图表示学习研究集中于单一节点类型的静态同构图（homogeneousstaticgraph）.然而，现实世界中广泛存在着包含多种类型的动态演化实体及其交互关系的复杂系统.如图 1 所示，学术网络中包含“作者”（A）、“论文”（P）、“会议”（V）3 种类型的节点和“撰写/被撰写”“发表/被发表”等类型的动态交互关系，通过静态同构图结构难以对其进行良好建模.而动态异质图（heterogeneoustemporalgraph,HTG）由于包含动态演化的多种类型的实体及

12、其交互关系，可以自然地对此类包含多节点和边类型的动态复杂系统进行建模10.撰写发表?待预测边A1A2A3P2P1P3P4V1V2A1A2A3P2P1P3P4V1V2A1A2A3P2P1P3P4V1V2G(t1)G(t+1)G(t)G 异质图快照Fig.1Academicnetworkheterogeneoustemporalgraph图1学术网络动态异质图另一方面，当前针对动态异质图的表示学习方法主要采用半监督学习（semi-supervisedlearning）范式11，即结合无标签拓扑结构和标签信息来指导学习.这类方法通过良好学习输入图数据和监督信号之间的映射关系，在特定任务上通常有着较高

13、的准确率.然而，高质量标签数据通常昂贵而稀缺，需要耗费大量的人力资源和领域知识12-13.同时，在动态异质图数据中往往仅包含单一节点类型的静态标签数据，例如，学术网络异质图中通常仅包含“作者”节点的“研究领域”作为标签信息，并且此类静态标签无法反映网络随时间变化的动态性.因此，对于异质语义信息丰富的动态异质图数据，难以通过这类标签数据作为监督信息得到异质图中所有类型节点的动态表示.此外，在半监督学习范式下学习得到的节点表示往往还存在泛化性较差的问题.针对半监督学习的问题，自监督学习（self-supervisedlearning）范式提出通过从数据中产生监督信号来指导

14、学习过程，在计算机视觉、自然语言处理等领域取得了显著成就14-15.其中，对比学习（contras-tivelearning）是自监督学习的一类经典方法，其通过构造正负样本对并最大化正样本对之间的一致性完成自监督学习13.尽管对比学习比自监督学习取得了明显的性能提升，但目前的相关研究仍主要集中于同质图数据，对动态异质图中包含的复杂的异质性和动态性信息进行自监督学习存在 2 点挑战：1）在异质性方面.如何自适应地捕获不同动态异质图中包含的异质性信息是挑战之一11,16-17.对于动态异质图每个快照的异质性信息的挖掘质量将影响最终的动态表示质量.对于单快照的异质图，基于元路径（meta-path）

15、的方法是目前常用的异质语义信息挖掘方式16,11，然而该类方法得到的表示质量严重依赖于元路径的设计，并且往往只能得到单一节点类型的语义相关性.此外，设计能够有效反映语义信息的元路径需要异质图数据的专家经验，对于异质拓扑较复杂的图数据的元路径设计存在一定困难.2）在动态性方面.如何从大量的历史快照中捕焦鹏飞等：基于对比学习的全局增强动态异质图神经网络1809获有价值的历史信息，从而支撑动态预测性任务是另一项挑战1820.真实世界中复杂系统往往存在随时间动态变化的特性，因此对其建模得到的异质图数据随时间而不断发生演化.如图 1 所示，随着学术网络中作者撰写和发表论文的增长，动态异质图数据不断新增边

16、，并且这种动态演化呈现出类型相关的规律性.从动态异质图的历史演化中捕获这种快照间的演化关系对于动态性预测任务至关重要.因此，本文设计了一种基于对比学习的全局增强动态异质图神经网络，其能够自适应地捕获动态异质图数据中存在的丰富异质性，是动态性信息的自监督方法.具体地，为了建模网络的异质性，本文在每个时间快照内通过层次注意力机制聚合每个节点及其邻域的节点特征，即空域消息传递，从而得到在当前时间快照中的局部拓扑表示；为了更好地融合历史信息，在时间维度上通过注意力机制聚合时间窗内的局部表示来捕获多时间快照网络的动态性特征；为了避免节点表示过度关注低阶结构，通过对比学习策略完成时序性局部表示和全局表示的

17、互信息最大化，从而使得节点包含更多的全局性信息；使用一个简单的解码器通过节点表示来生成未来时刻的异质拓扑结构，并与真实的拓扑结构计算重构误差，完成模型的优化.为了验证模型有效性，本文在 3 个真实世界动态异质图数据集上进行了多项实验.实验结果表明，相比于基线模型，本文提出的模型在动态链路预测实验中的 AUC 指标上得到了平均 3.95%的性能提升.总结而言，本文的贡献有 3 点：1）研究了现有表示学习无法综合处理动态性和异质性的问题，提出了一个基于对比学习的动态异质图表示学习方法.2）基于对比学习及层次注意力实现了全局增强动态异质图神经网络模型，其包含扰动图生成、动态异质图编码和生成-对比联合

18、优化 3 个模块.3）在 3 个数据集上进行了全面的实验来验证模型的有效性，实验结果表明本文提出的动态异质图表示方法在动态链路预测任务上相比于基线模型有了明显的性能提升.1相关工作图表示学习旨在学习一个能够将离散的图数据映射为低维嵌入表示的映射函数，使得低维嵌入表示能够良好地反映图数据包含的拓扑结构、原始特征和语义信息6.本节介绍基于图神经网络的方法和基于对比学习的图对比学习方法.1.1图神经网络图神经网络通过将图表示学习与深度神经网络方法相结合，近年来在许多领域展现出了卓越的性能，成为图数据表示与挖掘的主要方式6,21-23.根据图数据中是否存在多种节点和边类型，可以将现有的表示学习方法分为

19、面向包含单一节点和边类型的同质图神经网络和面向多类型的异质图神经网络.在同质图表示学习方面，GCN24提出通过谱图卷积的一阶近似在图结构数据上进行高效逐层传播从而完成图数据的半监督学习.为了进一步提升表达能力，VGAE25提出通过将 GCN 编码器24与变分自编码器26相结合完成图数据的无监督学习.另一方面，GraphSAGE27在图结构中采样指定数目的邻域节点进行消息传递并通过多种方式的聚合操作完成图数据的归纳式学习.为了使模型关注于最相关的邻域节点，GAT28通过注意力机制计算不同邻居的注意力系数来为不同节点分配不同的重要性.在动态图方面，EvolveGCN29通过使用循环神经网络来建模不

20、同时间快照下的 GCN 模型参数.此外，DySAT30提出在每个快照上通过在结构自注意力机制得到的节点表示的基础上，利用时序自注意力机制进行时间维度的节点聚合.然而，此类同质图神经网络假设图结构中节点和边类型均为单一类型，因此无法有效处理类型丰富的异质图数据.在异质图表示学习方面，metapath2vec31提出通过基于元路径指导的随机游走来采样节点的异质上下文信息，并通过 skip-gram32模型进行节点嵌入的学习.为了更好地利用知识图谱异质图中多类型关系的输入特征，R-GCN33通过对不同类型的邻域节点使用不同的权重矩阵进行图卷积聚合.为了能够对异质图数据中不同邻域的节点分配不同的注意力

21、权重，HAN34提出通过元路径将异质图转化为多个元路径图并通过节点级注意力机制进行邻域聚合，并通过语义级注意力机制聚合不同元路径表示从而得到最终表示.为了同时考虑不同边类型的重要程度，HGT35提出为不同节点类型和边类型分别计算注意力权重并进行异质注意力聚合.为了处理包含动态信息的异质图数据，DHNE36通过元路径指导的时序随机游走来采样时域和空域上下文信息并通过 skip-gram32模型来学习节点嵌入.类似地，THINE37同样通过时序随机游走序列来采样动态异质邻域序列，并通过 Hawkes过程和注意力机制聚合随机游走序列得到节点表示.1810计算机研究与发展2023，60（8）DyHNE

22、10通过对不同元路径图的一阶和二阶近似和加权求和来捕获结构和语义信息，并通过扰动更新的方式捕获动态变化.HTGNN38提出通过层次注意力机制来捕获每个时间快照和不同时间的节点表示.目前，异质图神经网络的研究主要关注于静态的异质图数据，这些方法无法从历史演化过程中捕获动态性信息.此外，基于元路径的方法如HAN34、DHNE10等，其有效性较依赖于关于图数据的专家经验和人工设计16，并且此类方法通常只得到单一类型的节点表示，无法完成涉及多类型节点的下游任务.1.2图对比学习图对比学习方法主要关注于不依赖人工标注信息的数据增强策略和代理任务的设计12-13.根据图数据

23、的类型，这里将对比学习方法分为针对同构图数据的方法和针对异质图数据的方法.针对同构图的方法中，GraphCL39通过 4 种图增强方式得到原始图的 2 个增强视图，并分别计算 2 个视图的图表示，最终通过最大化相同原始图表示之间的互信息进行对比学习.DGI40提出通过特征扰动得到负图，并通过以无监督的方式最大化原始图的局部拓扑表示和全图总结表示之间的互信息得到能够反映图结构信息的节点表示.类似地，MVGRL41通过图数据增强得到原始图的 2 个视角，通过最大化图 2 视图之间的互信息完成对比学习.组内注意力组内注意力组内注意力判别器?A1A2A3P2P1P3P4V1V2生成图G(T+1)异构图

24、解码器扰动图节点嵌入H原始图节点嵌入H原始图图嵌入gA2A1A3P1P3P4P2V2V1A1A2A3P2P1P3P4V1V2空域消息传递时域消息传递类内特征打乱动态异构图=G(t)Tt=1扰动图=G(t)Tt=1G(t)G(t)组间注意力时序注意力位置编码p(t)撰写发表?待预测边Fig.2Overallstructureofthegloballyenhancedheterogeneoustemporalgraphneuralnetworksbasedoncontrastivelearning图2基于对比学习的全局增强动态异质图神经网络整体结构尽管上述针对同构图的方法通过自监督学习取得了较高的

25、准确率，但这些方法只能处理节点和边类型单一的同构图数据，无法建模异质图数据中存在的丰富结构和语义信息.针对异质图的对比学习，HDGI42提出通过元路径图以及 2 层注意力机制来得到节点表示，并采用与 DGI40类似的对比策略完成局部表示与全局特征的互信息最大化.此外，HeCo43提出了一种异质图的网络模式与元路径图双视角的对比机制，并最大化2 个视角下共有元路径数较多的样本之间的互信息完成对比学习.上述针对异质图的对比学习方法尽管取得了明显的性能提升，然而它们均通过元路径图建模异质性，其有效性依赖于元路径的设计，在缺乏关于异质图数据的专家经验或面对较复杂的异质图数据时此类方法的性能优势较为有限

26、.此外，此类方法均只建模元路径中较关键的某单一节点类型，因此无法完整指导图神经网络模型学习异质图中所有类型的节点表示.2定义该节阐释了本文所涉及的基本概念定义，本文所使用的符号表示及其含义如表 1 所示.G=V,E,XVEX R|V|DD(v):V A(e):E Rv Ve EAR|A|+|R|2定义 1.异质图.异质图定义为包含多种节点和边类型的图，其中和分别为该异质图中所包含的节点集合和边集合，为节点特征矩阵，为初始特征向量维度.此外，通过映射函数和可以将节点和边映射为其所属节点类型集合和边类型集合，并且节点和边类型集合满足.e=(i,j)r=(i),(i,j),(j)r本文通过“首节点

27、-边-尾节点”三元组的类型进行边类型描述，如对于边，其三元组边类型为，以三元组边类型连接的邻域焦鹏飞等：基于对比学习的全局增强动态异质图神经网络1811Nri节点集表示为.G=G(1),G(2),G(T)T定义 2.动态异质图.动态异质图定义为一系列随时间动态演化的异质图快照序列，其中为时间窗大小，即动态异质图所包含的时间快照个数，动态演化包含节点和边随时间动态增加与删除.f:G HH R|V|d(d D)dG定义 3.动态异质图表示学习.动态异质图表示学习的目标是学习一个将动态异质图映射至低维表示的非线性映射函数，其中为节点的低维表示矩阵，为表示向量维度，并且该节点表示能够捕获动态异质图中

28、包含的拓扑结构、语义信息以及时序依赖信息，从而能够用于完成时序预测式的下游任务.3动态异质图表示方法为了解决现有方法在建模动态异质图时面临的问题，本文提出基于对比学习的全局增强动态异质图表示方法，方法总体结构如图 2 所示.本节首先概述模型的总体流程，然后分别详述模型的 3 个主要模块：扰动图生成、动态异质图编码和生成-对比联合优化.3.1概述G=G(t)Tt=1G=G(t)Tt=1GGLHHreadoutgH本文提出的动态异质图表示方法总体结构采用自动编码-解码架构.1）对于输入的动态异质图，扰动图生成模块根据输入的动态异质图快照生成其扰动图.2）对于原始动态异质图及其对应的扰动图，分别通过

29、层动态异质图编码模块对二者进行编码表示，从而得到原始图和扰动图的动态异质局部节点表示矩阵和.3）使用异质图函数对原始图的局部表示池化得到关GhgDhgH于原始动态异质图的全局表示向量.然后通过互信息最大化对比学习策略，即训练概率判别函数完成局部表示和全局表示之间的互信息最大化，完成对动态异质图表示的全局增强.4）将原始图的动态节点局部表示矩阵输入异质图解码器从而生成未来时刻的异质图拓扑结构并完成预测任务.为了对模型参数进行优化，本文将生成图重构误差最小化与对比学习互信息最大化作为目标函数进行自监督联合优化.3.2扰动图生成G(t)=V(t),E(t),X(t)，1 t TX(t)本节将描述

30、采用的对比学习中扰动图负样本的生成策略.为了使得从动态异质图数据中学习到的节点表示不仅能够捕获低阶的成对拓扑结构，还能包含更多的空域和时域的全局性信息，此处采用了特征扰动的方式得到结构与特征无关的负样本图.具体地，对于动态异质图的每个图快照，对其特征矩阵进行类内特征扰动：T(x(t)i)=x(t)j,i,j,(i)=(j),（1）x(t)i RDijii其中，为节点的原始特征向量，节点为除节点以外同一快照中与节点类型相同的任意节点.G=G(t)Tt=1G(t)=V(t),E(t),X(t)X(t)对每个异质图快照进行式（1）的类内特征扰动后可以得到扰动动态异质图，其中，为扰动后的特征矩

31、阵.为了将分布在不同特征空间的节点投影至同一隐藏空间便于后续运算，此处对不同类型的节点特征分别进行投影：z(t)i=(W(i)x(t)i+b(i)，（2）W(i)RdDb(i)Rd(i)()ReLU其中和分别为关于节点类型的可训练特征转换投影矩阵和偏置矩阵；为非线性激活函数，如.3.3动态异质图编码G=G(t)Tt=1T动态异质图编码模块用于将投影后的节点特征与空域异质拓扑结构和空域时序依赖信息相融合，从而得到包含拓扑结构、语义信息和时序依赖关系的动态异质图表示.具体地，对于输入的动态异质图及其投影后的特征矩阵，本文首先通过空域内的双层注意力消息传递分别得到各快照内的节点表示，然后通过时域注意

32、力机制聚合不同快照间的节点信息.通过动态异质图编码，可以有效融合在个快照的空域一阶邻域特征信息，堆叠多层后即可自适应地捕获包含高阶邻域的动态性表示.3.3.1空域消息传递该模块用于捕获动态异质图快照内部的结构信Table 1Notations and Their Meanings表 1 符号表示及其含义符号含义G,G动态异质图及其扰动图集合G(t)t构成动态异质图的第个异质图快照V,E异质图的节点集合和边集合A,R异质图的节点类型集合和边类型集合(),()将节点和边映射至类型集合的映射函数Nriir节点通过三元组边类型相连的邻域集X,Z,H节点特征、隐藏层表示和输出表示矩阵D(,)局部-

33、全局向量判别函数T()类内特征扰动函数1812计算机研究与发展2023，60（8）息和语义信息.由于异质图快照中节点间通常以异质的三元组边类型相连，即通过多种类型的边与多种类型的邻域节点连接，因此其包含的语义信息存在明显的差异.此外，尽管通过相同三元组边类型连接，同一类型的不同节点对于目标节点也存在不同重要性.因此，对于异质图快照的目标节点，本文以三元组边类型作为划分，通过三元组组内和三元组组间双层注意力机制捕获结构和语义信息.irNri组内注意力机制旨在通过注意力机制为相同三元组连接模式的不同节点分配不同的注意力权重，并通过消息传递机制将邻居节点的特征传递至目标节点.具体地，对于与目标节点

34、通过某三元组边类型相连的邻域节点集，通过组内注意力机制对其聚合为：z(t)i,r=Kk=1jNrii,jWr z(t)j，（3）z(t)i,rz(t)jir=(i),(i,j),(j)Wr RddK()i,jji其中，和分别为目标节点关于三元组边类型的邻域表示；为可训练的转换矩阵；代表拼接运算，代表用于捕获不同方面特征的多头注意力头数；为非线性激活函数；为节点对于目标节点的互注意力系数，其计算公式：i,j=softmax(ei,j),ei,j=(arWr z(t)iWr z(t)j),（4）ar R2dr()LeakyReLU其中，为关于三元组的可学习的转换矩阵；为非线性激活函数.i得

35、到目标节点关于所有三元组边类型邻域的节点表示后，为了区分来自不同三元组边类型的节点表示的重要性，此处通过三元组边类型的组间注意力机制进行聚合：z(t)i=rRi,r z(t)i,r,（5）r Ri,rir其中为异质图包含的三元组边类型集合，为目标节点关于三元组边类型的注意力权重系数，其计算公式为：i,r=softmax(ei,r),ei,r=1|R|rRcr(WR z(t)i,r+bR),（6）cr RdrWR RddbR RdR()tanh其中，为关于三元组边类型的可学习的转换向量；和为所有三元组共享的转移矩阵和偏移向量；为所有三元组边类型构成的集合；为非线性激活函数.在每个时间快照

36、上通过三元组内和组间的双层注意力消息传递，可以自适应地捕获快照内部包含的拓扑结构和语义信息.3.3.2时域消息传递该模块用于捕获动态异质图快照间的时序依赖信息.在动态异质图的快照间，由于动态性会导致拓扑结构的不断演化.这种快照间的演化关系蕴含着某些时序上的依赖信息，为了区分不同快照之间的不同重要性程度从而更好捕获这种时序依赖关系，本文采用时序自注意力机制并进行时域上的消息传递.与循环神经网络依时间推移顺序处理时序数据的方式不同，时序注意力机制可以对动态异质图多个时间快照进行并行处理.为了在并行运算中保持快照之间的时间次序，首先为每个节点在不同快照上得到的表示添加时序位置信息：h(t)i=WT

37、z(t)i+bT+p(t)，（7）WT RddbT Rdh(t)i Rdtp(t)Rdk其中，和为快照间共享的转移矩阵和偏移向量；为添加时序位置编码后的第个时序快照得到的节点表示向量；为时序位置编码向量，其第位的计算公式为：p(t)k=sin(t/10 0002kd),k为偶数;cos(t/10 0002kd),k为奇数.（8）在为节点表示添加时序位置信息后，为了区分不同时序快照得到的节点表示的重要性程度，此处使用时间维度注意力机制完成跨快照的消息传递与聚合：h(t)i=(Tt=1(t)iWVh(t)i),（9）h(t)i RdiWV Rdd()ReLU(t)iit其中，为目标节点通过空

38、域和时域消息传递得到的候选表示；为时域共享的值向量转移矩阵；为非线性激活函数；为目标节点在第时刻快照得到的节点表示的重要性系数，其计算为：(t)i=softmax(e(t)i),e(t)i=WQh(t)iTWKh(t)i,（10）WQ RddWK Rdd其中，和均为时域共享的查询向量和键值向量转移矩阵.3.3.3自适应时空编码iTL通过空域和时域消息传递，可以得到目标节点在个快照中的一阶邻域信息.为得到多阶邻域的语义信息，可以通过堆叠层空域及时域消息传递过程.为了防止图神经网络堆叠过多而产生的过平滑等问题，此处采用门控残差连接机制得到当前层的输出焦鹏飞等：基于对比学习的全局增强动态异质图

39、神经网络1813(i)表示.具体地，通过一个可训练的更新阈值自适应地控制关于该层所得候选表示的更新程度：h(t)i=(i)h(t)i+(1(i)W(i)z(t)i,（11）(i)(i)h(t)i RdiW(i)Rddz(t)iih(t)i其中，为关于类型的更新程度的可学习变量；为目标节点的通过空域和时域消息传递得到的候选表示；为关于上一层输入的节点表示的转移矩阵.在进行下一层空域-时域消息传递时，目标节点将当前层得到的输出特征作为输入特征，从而自适应地捕获空域-时域语义信息.L最终，经过层空域-时域消息传递后通过对所有历史快照编码进行求和：hi=Tt=1h(t)i,（12）hi RdiG

40、=G(t)Tt=1HG=G(t)Tt=1H其中，为目标节点关于输入动态异质图的动态嵌入表示，由所有节点得到的表示矩阵记为.对于扰动图，本文使用共享的动态异质图编码器进行同样的建模过程，其对应的得到的节点表示矩阵记为.3.4生成-对比联合优化(i,j)本节将对动态异质图编码模块的生成-对比联合优化策略进行描述.为了自监督地训练动态异质图编码模块，使得其得到的所有类型的节点表示具有动态预测能力，本文通过一个异质图编码器将节点表示向量生成为未来时刻的异质拓扑结构.具体地，对于节点对，通过其节点对表示计算边概率为：P(hi,hj)=P(i,j)E(t+1)|hi,hj)=(MLP(hi hj)，（1

41、3）MLP()()sigmoid其中，为根据节点对表示向量计算对应边是否存在多层感知机模型函数；代表拼接运算；为计算边存在概率的非线性激活函数.进而，通过动态异质图编码器得到的表示矩阵预测未来时刻拓扑结构的目标函数为：LG=iV(t+1)jN(t+1)ilog(P(hi,hj)+QEkPnlog(P(hi,hk),（14）QPn其中，表示负采样中负样本数相比于正样本数的倍数，为负采样分布.此外，由于动态异质图编码得到的节点表示仅通过未来时刻的拓扑结构进行自监督训练，这样会导致节点表示易于过多关注低阶的成对关系.因此，为了引入全局的高阶信息来增强节点的动态异质表示向量，本文通过对比学习的方式进行

42、局部和全局表示的互信息最大化.readouthihg首先，为了得到关于动态异质图的空域和时域的全局表示，本文通过函数由动态异质编码部分得到的节点表示得到全局表示：hg=readout(H)=1|V(T)|iV(T)hi,（15）V(T)Thii其中，代表第个时间快照下的节点所构成的集合，表示学习得到的节点的向量表示.D(,)为了实现动态异质图局部表示和全局表示互信息最大化，本文引入了一个判别器，通过判别局部表示和全局表示是否来自于同一动态异构图作为代理任务完成互信息的最大化.具体地，对于原始动态异质图和扰动图得到的表示向量与全局表示向量的判别目标函数为：LC=12NNi=1E(G)logD(

43、hi,hg)+Ni=1E(G)log(1D(hi,hg).（16）最终，通过联合生成损失和对比损失得到整体目标函数为：L=LG+(1)LC,（17）其中，为超参数，其用来平衡生成损失和对比损失，关于其取值选择见本文 4.4 节实验分析部分.3.5复杂度分析O(|V|Dd)O(|E|d)O(|R|d)O(|V|Td)O(|E|d)O(|V|d)O(|V|Dd+|V|Td+|E|d)本文提出模型的时间效率较高，其时间开销主要由空域、时域消息传递及损失函数计算产生，其中不同时间快照下的空域消息传递过程可以通过并行计算进行优化.具体地，各部分中特征投影部分的复杂度为，组内注意力机制部分复杂度为，组间注

44、意力机制部分复杂度为，时域注意力机制部分复杂度为，重构损失复杂度为，对比损失复杂度为.总体而言，模型时间复杂度为，与图数据中节点数目和边数目呈线性关系，时间效率较高.4实验 4.1数据集为了验证所提模型的有效性，本文采用了 3 个真实世界数据集进行实验，关于数据集快照数、平均节点数等统计信息如表 2 所示.下面分别介绍本文实验中使用的 3 个数据集：1）Yelp 是一个商家评价平台，本文将用户、商家和评级建模为 3 种类型的节点并按照评价时间构造1814计算机研究与发展2023，60（8）了 9 个动态异质图快照.2）DBLP 是一个记录计算机科学期刊、会议论文等内容的引文平台，本文将作者、论

45、文和会议 3 类节点及其关系构造异质图并按照时间划分为了 12 个异质图快照.3）AMiner 是一个学术搜索引擎，与 DBLP 类似，将作者、论文和会议 3 类节点按照论文发表时间划分为了 12 个异质图快照.本文使用了 8 个基线模型来进行对比.其中包含 4 个同构图神经网络模型 VGAE，GAT，DGI 和 Evol-veGCN，以及 4 个异质图神经网络模型 metapath2vec，R-GCN，HGT 和 HTGNN.为了得到多类型节点的输入特征，本文通过异质图嵌入方法 metapath2vec 学习异质网络嵌入表示并作为初始化特征.对于基线模型中的静态模型，本文将用于训练的动态异质

46、图的多个快照合并至同一图结构中，以此取消其动态特性.对于同质图模型，实验中忽视了动态异构图中的节点及边类型，使其成为仅包含单一节点和边类型的同质图数据，以此取消其异质性.4.2实现细节及参数设置对于动态链路预测及动态新链路预测任务，本文使用了同样的实验设置完成实验.为适应基线模型对于输入数据的要求，对于同质图神经网络基线模型，如 VGAE，GAT，DGI 等，实验中直接去除了图数据中的节点类型及边类型信息；对于静态模型，如GAT，metapath2vec，R-GCN 等，实验中模拟静态图的建模方式，将所有时刻的边数据合并成为一张图完成训练.对于 metapath2vec 模型，单点随机游走次数

47、设为 40，随机游走步长度设为 60，对于学术网络数据集 DBLP 和 AMiner 采用 APVPA,PVAVP,VAPAV作为元路径，对于 Yelp 数据集采用BSUSB,SUBUS,UBSBU作为元路径.为了公平地对比模型性能，本文提出模型和基线模型的表示向量维度均设置为 32.其余参数在实验中均遵循了各方法所报告的最佳配置.LQ本文模型的动态异质图编码层数在 3 个数据集中均设置为 2.对于模型注意力机制，本文在 3 个数据集中设置随机丢弃率 Dropout 为 0.2，注意力头数均设置为 4.在式（14）中，目标函数中的负采样倍数设置为 5.为了优化目标函数，本文使用 Adam

48、优化器进行模型参数的优化，初始学习率和权重衰减系数分别设置为 5E3 和 5E4.为了防止模型训练过拟合，本文设置初始训练轮数为 1000，并根据训练集损失值的变化情况采用训练早停策略防止模型退化及过拟合.本文实验环境的操作系统为 Ubuntu20.04.3LTS，服务器处理器为 IntelXeonSilver4210RCPU2.40GHz，本文实验使用 NVIDIAGeForceRTX3090GPUs 显卡进行训练，其 CUDA 版本为 11.6.本文采用深度学习框架 PyTorch1.12.0 和深度图框架 DeepGraphLibrary(DGL)0.8.2

49、实现模型并完成实验.4.3动态链路预测G=G(t)Tt=1T+1在动态链路预测实验中，本文首先通过提出的模型对动态异质图得到的编码表示来预测时刻的异质图拓扑结构，从而评估模型对异质性和动态性信息的建模能力.在实验中，我们将每个数据集的后 3 个时间快照作为测试集并报告其平均结果，其余快照作为训练集优化模型参数.T+1G=G(t)Tt=1此外，为了进一步探究模型的动态预测能力，本文还评估了模型对于新增链路的预测性能，其中新增链路指存在于时刻且不存在于输入图数据中的边集合.本文重复进行了 5 次动态链路预测和新链路预测实验，本文模型和基线模型得到的 AUC 和 AP 指标的均值和标准差结果如表 3

50、和表 4 所示.通过实验分析，可以得到 4 点结果：1）VGAE，GAT 和 DGI 等面向同构图的方法由于无法对数据中的异质性建模，无法更好地捕获异质图中的结构和语义信息，因此其结果普遍劣于异质图方法.由于引入了邻域注意力机制，GAT 在 2 种链路预测任务的大部分数据集中均有明显的性能提升.2）R-GCN 和 HGT 等异质图方法通过建模异质性信息，性能优于大部分同构图模型.通过引入元路径信息，metapath2vec 方法较于 VGAE 等同构图方法在 Yelp 数据集性能有所提升，然而在 DBLP 和 AMinerTable 2Statistics on Three Real-wor

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 基于对比学习全局增强动态异质图神经网络

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。