分销赏收藏举报申诉 / 11

立即下载 VIP下载

当前位置：首页 > 学术论文 > 论文指导/设计 > 多重注意力指导下的异构图嵌入方法.pdf

多重注意力指导下的异构图嵌入方法.pdf

上传人：自信****多点

文档编号：1231124

上传时间：2024-04-19

格式：PDF

页数：11

大小：3.23MB

《多重注意力指导下的异构图嵌入方法.pdf》由会员分享，可在线阅读，更多相关《多重注意力指导下的异构图嵌入方法.pdf（11页珍藏版）》请在咨信网上搜索。

1、DOI:10.11992/tis.202204006网络出版地址:https:/ 电子与信息工程学院,辽宁葫芦岛 125105）摘要：现有的异构图嵌入学习方法存在两个方面的问题，一是没有考虑不同节点属性间的深层联系，二是通过注意力机制聚合邻居节点来生成目标节点的向量表示，忽略了目标节点的特征在向量表示中起的作用。为解决上述问题，本文提出了一种多重注意力指导下的异构图神经网络，从点线网 3 个角度学习异构节点嵌入向量。使用双向长短期记忆模型(bidirectional long short-term memory networks,Bi-LSTM)挖掘不同节点的属性间的深层关联关系并将其映射

2、到同一向量空间，利用级联网络对单条元路径实例上的邻居节点和目标节点的特征信息进行融合，从而增强嵌入向量对目标节点信息的表达能力，提出一种多重注意力机制来聚合多条元路径实例上的节点信息，生成最终的节点嵌入向量表示。在 3 个大型异构图上的实验结果表明，本文提出的模型在异构图嵌入的效果方面优于现有基线模型，并且对于增强节点属性信息上的表达展现出了良好的性能。关键词：异构信息网络；图表示学习；异构图嵌入；元路径；元路径实例；图注意力；异构图；图神经网络中图分类号：TP18 文献标志码：A 文章编号：16734785(2023)04068811中文引用格式：孟祥福,温晶,李子函,等.多重注意力指导下的

3、异构图嵌入方法 J.智能系统学报,2023,18(4):688698.英文引用格式：MENG Xiangfu,WEN Jing,LI Zihan,et al.Heterogeneous graph embedding method guided by the multi-attentionmechanismJ.CAAI transactions on intelligent systems,2023,18(4):688698.Heterogeneous graph embedding method guidedby the multi-attention mechanismMENG Xiang

4、fu，WEN Jing，LI Zihan，JI Hongzhang(School of Electronic and Information Engineering,Liaoning Technical University,Huludao 125105,China)Abstract:There are two problems in the existing heterogeneous graph embedding learning methods.One is that thedeep relationship between different node attributes is n

5、ot considered,the other is the problem of ignorance of the role ofthe features of the target node in the vector representation when generating the vector representation of the target nodeby aggregating neighboring nodes through attention mechanism.In order to solve above problems,this paper proposes

6、 aheterogeneous graph neural network under the guidance of multiple attentions,which learns the embedding vectors ofheterogeneous nodes from three perspectives of Point-Line-Net.Bi-LSTM is used to mine the deep relationship betweenattributes of different nodes and map them to the same vector space.A

7、 cascaded network is used to fuse the feature in-formation of neighbor nodes and target nodes on a single meta-path instance,so as to enhance the expression ability ofembedded vectors to target node information.A multi-attention mechanism is proposed to aggregate node informationon multiple meta-pat

8、h instances and generate the final node embedding vector representation.Experimental results onthree large heterogeneous graphs show that the proposed model is superior to the existing baseline model in the embed-ding effect of heterogeneous graphs,and shows good performance in enhancing the express

9、ion of node attribute inform-ation.Keywords:heterogeneous information network;graph representation learning;heterogeneous graph embedding;metapath;metapath instance;graph attention;heterogeneous graph;graph neural network 现实世界中，很多数据都是以图结构进行表示的，如社交网络1-3、蛋白质结构、推荐系统4-6等。这些包含多种不同类型边和节点的图称为异收稿日期：20220404

10、.网络出版日期：20230322.基金项目：国家自然科学基金项目（61772249）；辽宁省教育厅项目（LJKZ0355）.通信作者：孟祥福.E-mail：.第 18 卷第 4 期智能系统学报Vol.18 No.42023 年 7 月CAAI Transactions on Intelligent SystemsJul.2023智能系统学报编辑部版权所有构图（heterogeneous graph,HG），也叫异构信息网络(heterogeneous information network,HIN)7。如，DBLP（digital bibliography&library project）学术

11、网络可以用 HG 表示，它由 4 种类型的节点（作者 A、论文 P、术语 T、地点 V）和 3 种类型的边（作者撰写论文、论文包含术语、论文发表在会议上）组成。基于这些节点和边，可以推导出更复杂的语义。APA 代表着同一个论文的合著者，PAP 代表一个作者发表多篇论文。为了将这些图数据应用到下游任务，如节点分类8、链路预测9、节点聚类10和推荐11等，需要对异构图进行映射和嵌入处理，使得原始网络中的节点和边的结构和语义信息得到有效保持，并且压缩冗余信息。图嵌入作为一种高效的大规模网络表示和管理方法，将网络的拓扑结构映射到低维向量空间中，使得原始网络节点的邻近信息得到很好地保留和利用。早期的嵌入

12、技术着重研究同构图，如 Deep-Walk12，将图上的一组随机游动序列输入 Skip-Gram13模型来近似这些游动中的节点共现概率，并获得节点嵌入表示。与它类似的还有 Node2-vec14。随着深度学习的迅速发展，图神经网络（graph neural networks,GNNs）被提出，它利用专门设计的神经层学习图表示。尽管 GNN 在许多任务中取得了先进的成果，但大多数基于 GNN的模型都假设输入的是同构图，如 Esim15。为了解决异构图嵌入问题，研究者提出了元路径的概念，通过元路径将异构图转化为同构图，从而进行节点表示，如 Metapath2vec16、HAN(heterogen-

13、eous graph attention network)17、MAGNN(metapathaggregated graph neural network for heterogeneousgraph embedding)18等。也有研究不采用元路径，直接在异构图上进行操作，如 HetSANN19、Het-GNN20、GATNE21等。然而，现有的异构图嵌入方法大多是通过简单的线性变换将不同类型节点的不同属性信息投影到同一向量空间，忽视了不同节点的属性信息间的关联。如 DBLP 数据集中有“作者”节点、“会议”节点、“作者”具有“研究方向”、“发表论文”等属性，研究方向为“数据库”的作者发表的

14、文章都是与数据库相关的，并且大多数代表性的论文都是发表在 SIGMOD、VLDB、ICDE 等会议上。“研究方向”决定着论文发表到什么样的会议或者期刊上。由此可见，同一节点的不同属性之间具有语义关联，不同节点的属性信息间也存在语义关联。同时，异构图嵌入方法大多是基于元路径的思想，通过注意力机制聚合单条路径上的邻居节点，从而生成目标节点的嵌入，该类方法过于强调邻居节点的重要性而忽视了目标节点本身的信息。为了解决上述问题，本文提出了一种多重注意力指导下的异构图神经网络嵌入方法（multipleattention for heterogeneous graph embedding method，MA

15、N）。MAN 从 Point、Line、Net 3 个角度进行节点嵌入，生成最终的嵌入向量。首先，把节点的属性信息输送进双向长短期记忆模型(bidirection-al long short-term memory networks,Bi-LSTM)，通过正向和反向建模捕获节点属性间的双向联系。然后，利用图注意力机制聚合邻居节点。为了解决图注意力只能聚合元路径实例上的首尾节点的问题，通过引入一个邻居节点聚合器学习每个邻居节点在元路径实例中的上下文向量表示；为了解决目标节点最终向量中包含较少节点属性信息的问题，设计了一种级联网络，该网络通过将图注意力生成的向量和目标节点属性向量进行线性操作，生成

16、 Line 层次的向量表示。最后，通过多重注意力机制混合多条路径进行 Net 层次聚合。注意力机制按照元路径类型对图中所有路径进行分类和平均转换，聚合平均向量生成最终嵌入向量。然而对同一种元路径下的多条路径未区分重要性，因此，为解决这一问题，模型在将注意力作用到根据不同类型元路径形成的平均向量的同时，引入一个可学习的注意力参数，形成多重注意力机制，减小聚合平均向量为最终嵌入向量带来的偏差。本文工作的主要创新点如下：1）提出了基于 Bi-LSTM 的节点属性间关联关系的建模方法。2）设计了级联网络和多重注意力机制来聚合元路径内部以及元路径之间的邻居节点。3）在 3 个大型异构图上进行了节点分类和

17、链路预测任务，评估所提模型的性能。1 相关工作 1.1 图神经网络图神经网络22-24的目标是学习图中每个节点的低维向量表示，从而将这些节点应用于下游任务。图卷积网络（graph convolutional network,GCN）25是一种在图中结合拓扑结构和顶点属性信息学习节点的嵌入表示的方法，然而 GCN 要求在一个确定的图中学习嵌入表示，无法泛化到在训练过程中没有出现过的节点。为解决这一问第 4 期孟祥福，等：多重注意力指导下的异构图嵌入方法689 题，Hamilton26提出了一种通过学习一个对邻居顶点进行聚合的函数来产生目标节点的嵌入向量的方法。图注意力（graph attenti

18、on networks,GAT）27将注意力机制应用到图表示学习上，将原本 GCN的标准化函数替换为使用注意力权重的邻居节点特征聚合函数，从而学习节点的嵌入向量。不同于传统的多头注意力机制均衡地消耗所有的注意力头，GaAN28使用了一个卷积子网络来控制每个注意力头的重要性。1.2 异构图嵌入异构图嵌入，旨在通过保留网络拓扑架构和节点内容信息，将节点表示到低维向量空间中。现有的方法大多是基于元路径，如 Metapath2vec16利用元路径引导生成随机游动，将其馈送到 Skip-Gram13模型学习到节点的嵌入表示；HERec29借助元路径的邻居将异构图转化为同构图，将节点送入 DeepWalk

19、12模型学习到嵌入表示。利用基于元路径的邻居将异构图转化为同构图，降低了图嵌入的复杂性。对于转化后的同构图，HAN17使用图注意力架构聚合来自邻居节点的信息，并利用注意力机制来组合各种元路径；MAGNN18改进了 HAN 和 HERec 只考虑元路径起始节点和末尾节点的问题，利用 RotatE30编码元路径实例，最终得到包含丰富节点信息的嵌入表示。ie-HGCN31打破了需要预先定义元路径的局限性，设计了一种基于邻接矩阵的异构图卷积网络，能够在粗粒度和细粒度 2 个层面上发现对于当前任务最优的元路径。HetSANN19通过一个类型感知的注意力层替换传统 GNN32-34中的卷积层，在不使用元路

20、径的前提下，直接编码异构图中的结构信息。HetGNN20采用重启随机游走为每个节点采样固定数目的强关联异质邻居，对于同类邻居和不同类邻居分别采用 Bi-LSTM35和注意力机制进行聚合，生成嵌入向量。GATNE21提出了一种基于属性多元异构网络的表示学习方法，通过节点之间存在的多种邻近类型，产生具有多个视图的网络，进行多重网络嵌入学习。2 问题定义本节将介绍本文使用的与异构图相关的一些重要术语的形式化定义。G=(,)A R定义 1异构图。异构图由表示，它由节点集合和边集合组成；：为节点类型映射函数，：为边类型映射函数；A 和|A|+|R|2R 表示预定义对象类型和链接类型的集合，如图 1

21、所示。A1R1A2R2A3R3RlAl+1pi=A1,A2,Al+1R=R1R2RlAl+1定义 2元路径。元路径 pi由来表示，简称。其中，是节点类型 A1的组合关系，表示关系上的组合操作。pi=A1,A2,Al+1定义 3元路径上的 k 跳邻居。对于一条元路径，目标节点 A1的元路径pi上的 k 跳邻居为 A1的 k 阶邻居 Ak+1。G=(,)定义 4异构图嵌入。给定一个异构图，异构图嵌入是通过设计的模型学习节点的d 维向量表示，该向量尽可能包含节点在图 G 中的语义信息和结构信息。PVTauthorpapervenuetermA1A2A3P1P2V1T1P3V2A1P1A2(a

22、)节点类型(b)异构图(c)元路径Author-paper-authorA 图 1 异构图Fig.1 Heterogeneous graph 3 多重注意力指导下的异构图神经网络模型本节描述了一种新的多重注意力指导下的异构图神经网络MAN，用于生成异构图嵌入。图 2 给出了单个节点的嵌入向量生成过程。如图 2 所示，Bi-LSTM 捕捉节点属性之间的关系，并将节点投射到相同的向量空间中，级联网络融合元路径上节点的上下文信息，多重注意力模型生成节点嵌入表示。3.1 Point 层次异质节点属性抽取通过预训练得到节点不同属性的嵌入表示，这些表示向量的数据形状由属性内容决定。节点的异质性决定了属性的

23、异质性，不同类型的节点具有不同的属性，属性的维度也是不相同的，无序无规格的属性数据将对后续的操作造成阻碍。以往的解决方法大多是将不同的属性特征进行拼接，或利用转换矩阵将其映射到同一向量空间。单一的线性转换无法反映出节点属性间存在的联系。例如，学术论文数据集(Database systems andlogic programming,DBLP)中有“作者”节点，“作者”具有“研究领域”、“发表论文类型”等属性，对于研究领域为“推荐系统”的作者 A，他发表论文的关键字通常是“推荐”、“协同过滤”等。作者的研究领域与发表论文类型也是密切相关的。因690智能系统学报第 18 卷此，设计了一种基于 B

24、i-LSTM 的模型来捕获节点深层次的特征交互信息，从而增强模型的表达能力。节点 vi的内容嵌入表示为hvi=ixvlstmpfcx(xi)lstmnfcx(xi)|xv|(1)hvi RdRdfcxx式中：为节点 vi经过 Bi-LSTM 模型得到的内容嵌入；为 d 维欧氏空间；为节点特征转换器，可以是一个恒等式（即 fc 的输入与输出相同），也可以是一个参数为的全连接神经网络，用于调整嵌入维度的大小；xv为节点的内容信息；为向量间的串联操作；lstmp、lstmn 分别为正向反向的 LSTM 网络。LSTM 的计算过程为zi=(Uzfcx(xi)+Wzhi1+bz)fi=(Uffcx(xi

25、)+Wfhi1+bf)oi=(Uofcx(xi)+Wohi1+bo)ci=tanh(Ucfcx(xi)+Wchi1+bc)ci=fici1+zicihi=tanh(ci)oi(2)Point 层模型首先使用不同的 FC 层来转换节点的内容信息，然后将转换好的内容信息输入 Bi-LSTM 进行编码，从而挖掘节点特征的深层交互，最后利用所有隐藏状态上的池化层输出一个基于内容信息的节点 vi的嵌入表示。Bi-LSTMBi-LSTM编码编码编码图注意力FCFCMultiple attentionMLPhviviuikhvilviE(vi,ui1)a1a2PointLineNetE(vi,ui2)E(v

26、i,ui3)piavi,uikePipiattr1FCattr2FCattr3FCattr4FCattr1FCattr2FCattr3FCattr4FC 图 2 MAN 工作原理Fig.2 Working principle of MAN 3.2 Line 层次节点上下文信息融合ui1ui2uikuikPoint 层学习节点属性信息，Line 层学习节点在一条元路径实例上基于上下文的结构和语义信息。给定目标节点 vi，pi=vi，为 vi所在的一条元路径实例，设为目标节点在元路径pi上的 k 跳邻居。Line 层使用邻居节点聚合器将vi的邻居节点编码成一个向量。基于复杂空间的关系旋转的邻居节点

27、聚合器定义为E0=hviEk(vi,uik)=huik+Ek1(vi,uik1)rkE(vi,uik)=Elpi(vi,uik)lpi+1(3)E(vi,uik)Rdpiuik式中：为经过聚合器编码后的元路径实例下的第 k 个邻居节点，k(0,lpi；lpi为路ui0rkuik1uikuik径 pi上的最大节点数；代表节点 vi；为节点与之间的关系；为元素间乘积操作。邻居节点聚合器以“累加”的思想将 k 跳邻居信息聚合到节点上，从而实现了邻居节点上下文信息的融合。图 3 描述了邻居节点聚合器的原理。viO1ui2ui3ui4hvir1hui1ui1hui2r2O2r1r2O1 图 3 邻居节点

28、聚合器Fig.3 Neighbor node aggregator 第 4 期孟祥福，等：多重注意力指导下的异构图嵌入方法691 piuikuik将邻居节点聚合为向量表示后，采用一个基于图注意力的级联网络来编码元路径实例上的目标节点 vi的向量。使用注意力机制抽取一条路径上不同类型的节点特征，得到邻居节点对目标节点的重要程度，直接邻居节点的权重通常要高于间接邻居节点。给定节点对（vi，）和连接它们的元路径实例，对于 vi的重要程度的计算方法为epivi,uik=(Tpihvi|E(vi,uik)(4)Tpi R2d()epivi,uikuik利用注意力向量和激活函数从目标节点与邻居节点的串联向

29、量中提取出邻居节点对于目标节点的重要程度。为元路径实例 pi的参数化的注意力向量；为激活函数；为经过邻居节点聚合器编码后的节点对于目标节点 vi在pi上的权重系数；hvi为目标节点的嵌入向量。经过归一化，将权重映射到 0,1，计算方法为apivi,uik=exp(epivi,uik)j(0,lpiexp(epivi,uij)(5)apivi,uikE(vi,uik)最后将归一化后的注意力系数作用到上，加入目标节点 vi的原始向量表示，形成基于注意力的级联网络，经过一个激活函数得到目标节点 vi的 Line 层嵌入，计算方法为lvi=j(0,lpiapivi,uikE(vi,uij)+hvi(6

30、)Line 层首先通过邻居节点聚合器重新定义邻居节点的向量表示，不同于以往只考虑邻居节点的内容信息，MAN 考虑到邻居节点的内容信息以及其在元路径实例上的语义和位置信息。不同类型节点对学习目标节点表示的贡献是不同的，采用图注意力机制来捕获贡献度。最后，借鉴残差的思想，将包含 vi属性信息的原始向量与图注意力下的邻居节点向量进行线性操作，设计了一个级联网络。由此生成的向量表示既包含邻居节点的语义和结构信息，又包含 vi的语义信息，从而实现了对目标节点向量表示的校正操作。3.3 Net 层次节点拓扑结构编码pAp1p2pMlp1vi,lp2vi,lpMvilpjvi对于类型为 A 的目标节点 vi

31、，以及一组元路径=，Line 层为 vi生成 M 个针对特定元路径实例的向量表示，记为其中，每个都表示了节点 vi在 A 类元路径下隐含的一种语义信息。根据元路径类型对 Line 层得到的嵌入向量进行划分，即要对同属于一种元路径类型的向量表示进行聚合。计算方法为epi=1sAitA(MAlvi+bA)ai(7)sAepiaitAMAbA式中：为类型为 A 的元路径的数量；()为激活函数；为基于元路径类型聚合后的嵌入向量；为作用在根据元路径类型划分后的向量上的参数；为节点类型为 A；、为可学习的参数矩阵。通过设计一个多重注意力机制混合节点 vi的基于元路径类型的向量表示来生成 Net 层次节点v

32、i的向量表示，计算方法为pi=softmax(Aepi)hvi=itypepilpi(8)Apihvivi式中：为参数化的注意力向量；为基于元路径类型的嵌入向量的注意力系数；为节点的最终嵌入表示。viviNet 层将编码范围扩大到整个网络，首先对Line 层得到的每个基于元路径实例的节点表示按照元路径的类型划分并进行向量转换。这里将每种元路径解释为一条特定语义，以 DBLP(digitalbiblio-graphy&library project)数据集中为例，类型为 APA 的元路径的特定语义为“合著者及论文”。同一类型元路径下不同实例对于目标节点的影响也是不同的，因此模型对每一条元路径实

33、例进行线性转换时加入一个可学习的“Mul-tiple”系数，以平衡对于同种元路径实例取平均带来的误差。然后，得到了不同语义下目标节点的表示向量。同样，不同语义对于目标节点的表示向量的贡献度也是不同的。因此，采用注意力机制为不同语义分配注意力权重。4 实验与评估 4.1 实验设计 4.1.1 数据集实验采用 MAGNN18中提供的 3 个异构图形数据集作为实验数据，分别是 DBLP、IMDB（inter-net movie database）和 Last-fm（last favorite music），并与最先进的基线模型进行比较。DBLP 和 IMDB数据集进行节点分类和聚类，Last-fm

34、进行链路预测。对于没有属性的节点采用 one-hot 编码作为虚拟属性。4.1.2 对比方法通过与最新的基线算法进行对比以验证 MAN的有效性。基线模型包括：LINE36：利用节点间的一阶和二阶接近度对图进行嵌入。通过忽略图结构的异构性和删除所有节点内容特征将其应用于异构图。Node2vec14：作为 deepwalk 的升级版应用于异构图。692智能系统学报第 18 卷 Esim15：一种异构图嵌入模型，可以从采样的元路径实例中学习到节点表示。Esim 要求每个元路径具有预定义的权重，因此，实验为所有元路径分配相等的权重。Metapath2vec16：通过将元路径引导得到的实例馈送到 Ski

35、pGram 模型中，得到节点嵌入。该模型依赖于单个用户指定的元路径，因此，实验分别对所有元路径进行测试，并取具有最佳结果的元路径。GCN25：一个半监督图卷积网络，用于齐次图。GAT13：模型结合注意机制，在图形空间域执行卷积运算。实验在基于元路径的同构图上测试 GAT，并展示来自最佳元路径的结果。GATNE21：从基嵌入和边嵌入生成节点表示。本文展示的是表现最好的 GATNE 变体的结果。HAN17：一个异质 GNN。它从不同的基于元路径的同构图中学习元路径特定的节点嵌入，并利用注意机制将它们组合为每个节点的一个向量表示。MAGNN18：在 HAN 的基础上，利用一个编码器将元路径实例中的邻

36、居信息进行融合，从而生成包含丰富语义信息的节点嵌入。4.1.3 参数设置对于 LINE、Node2vec、Esim、Metapath2vec 和HERec，窗口大小设置为 5，漫游长度设置为 100，每个节点漫游 40 次，负采样设置为 5。对于 GNN模型，包括 GCN、GAT、HAN 和 MAGNN，dropout设置为 0.5，使用相同的训练集、验证集和测试集；使用 Adam 优化器，学习率设置为 0.005，重量衰减设置为 0.001;对 GNN 进行 100 个 epoch 的培训，并以 30 min 提前停止。对于节点分类和节点聚类，GNN 以半监督方式进行训练，将其中一小部分节点

37、标记为引导。对于 GAT、HAN 和 MAGNN，注意力头的数量设置为 8。对于 HAN 和 MAGNN，元路径间聚合中的注意向量的维数设置为 128。为了公平比较，上述所有模型的嵌入维度设置为 64。4.2 模型应用 4.2.1 节点分类效果测试AF1IF1为比较不同模型在节点分类任务上的性能，对 IMDB 和 DBLP 数据集进行实验。将不同模型生成的节点嵌入表示输送进线性支持向量机(supportvector machine,SVM)分类器中。为保证实验的可靠性，只将测试集中的数据送入 SVM 中。以每个模型运行 10 次的平均和作为评估标准。经过 SVM 分类后的节点，TP为真实标签为

38、正预测标签为正的真正例，FP为真实标签为正预测标签为假的假正例，FN为真实标签为假预测结果为正的假负例，TN为真实标签为假预测标签为假的真负例。准确率、精确率、召回率和 F1表示为Acc=TP+TNtotalP=TPTP+FPR=TPTP+FNF1=2PRP+R(9)MF1IF1和的计算为MF1=2PRP+RIF1=1nni=1Fi(10)MF1IF1从表 1 可以看出，MAN 模型在不同数据集上的分类效果始终优于其他基线模型。同时，基于元路径的 Esim、GAT、HAN、MAGNN 和 MAN 的和均高于其他模型，这也验证了元路径对于提升异构图嵌入质量的有效性的观点。MAN 在最佳基线 MA

39、GNN 上获得的性能增益为 2%4%。4.2.2 节点聚类效果测试NMIARI为比较不同模型在节点聚类上的表现效果，选用 DBLP 和 IMDB 2 个数据集进行试验，并将不同模型得到的节点表示结果嵌入到 K-means 算法中，K-means 中的聚类数设置为每个数据集的类数，即 DBLP 的聚类数为 4，IMDB 的聚类数为3。归一化互信息（）37和调整后的兰德指数（）38作为评估指标。pi=|Ui|NH(U)=Ri=1pilogpiMI(U,V)=Ri=1Cj=1pi,jlog(pi,jpi pj)NMI(U,V)=2MI(U,V)H(U)+H(V)(11)ARI=RIE(RI)max(

40、RI)E(RI)(12)NMIARI取模型运行 10 次的和平均值为最终结果，并在表 2 中给出最终结果。传统模型中 node2vec 表现较好，这是因为node2vec 作为 deepwalk 的变体，基于随机游走采集邻居节点，使得图中临近的点在嵌入到低维向量空间中时也保持了邻近性。基于图神经网络的模型中，MAGNN 的效果高于其他模型，这是由于 MAGNN 引入了一个邻居节点编码器来聚合元第 4 期孟祥福，等：多重注意力指导下的异构图嵌入方法693 路径实例的上下文信息，目标节点融合了部分邻居节点的信息，因此在聚类任务中目标节点与其邻居节点更容易聚合到同一类中。MAN 采用级联网络突出目标

41、节点的原始向量表示，在生成向量表示时不再过度依赖邻居节点，因此在聚类任务中性能提升程度较小。表 1 节点分类Table 1 Node classification 数据集指标训练/%LINENode2vecEsimMetapath2vecGCNGATHANMAGNNMANDBLPAF12087.1686.7090.6888.4788.0091.0591.6993.1394.114088.8588.0791.6189.9189.0091.2491.9693.2394.616088.9388.6991.8490.5089.4391.4292.1493.5795.198089.5188.9392.2

42、790.8689.9891.7392.5094.1096.03IF12087.6887.2191.2189.0288.5191.6192.3393.6194.554089.2588.5192.0590.3689.2291.7792.5793.6894.946089.3489.0992.2890.9489.5791.9792.7293.9995.558089.9689.3792.6891.3190.3392.2493.2394.4796.32IMDBAF12044.0449.0048.3746.0552.7353.6456.1959.3561.114045.4550.6350.0947.5753

43、.6755.5056.1560.2761.386047.0951.6551.4548.1754.2456.4657.2960.6662.708047.4951.4951.3749.9954.7757.4358.5161.4464.67IF12045.2149.9449.3247.2252.8053.6456.3259.6061.054046.9251.7751.2148.1753.7655.5657.3260.5061.286048.3552.7952.5349.8754.2356.4758.4260.8862.578048.9852.7252.5450.5054.6357.4059.2461

44、.5364.51 表 2 节点聚类Table 2 Node cluster 数据集指标LINENode2vecEsimMetapath2vecGCNGATHANMAGNNMANDBLPNMI71.0277.0168.3374.1873.4570.7377.4980.8181.14AMI76.5281.3772.2278.1177.5076.0482.9585.5486.13IMDBNMI1.135.221.070.897.467.8410.7915.5815.93AMI1.206.021.010.227.698.8711.1116.7416.89 4.2.3 链路预测效果测试AUCAPLast

45、-fm 数据集用于评估链路预测任务中 MAN和其他基线的性能。在 GNNs 中，将连接的用户艺术家对视为正节点对，并将所有未连接的用户艺术家链接视为负节点对。将相同数量的随机抽样负节点对添加到验证集和测试集。采用链路预测常用标准和衡量模型性能。定义为AUC=n+0.5nnAP=mL(13)AUC为在测试集中随机选择一条边的分数值比随机选择一条不存在的边的分数值大的概率。独立比较n次，大于则+1(设有n 次)，等于则+0.5(设有APn 次)，小于则不加。侧重于衡量前几条边预测是否准确。假设 m 个预测准确，排在前 L 的边中有 m 个在测试集中，精确度定义为 m/L，对于给定的 L，精确度越大

46、预测越准确。从表 3 中可以看出，MAN 的性能大大优于其他基准模型。最强的传统模型是 metapath2vec，它从由元路径引导的随机游动生成的节点序列中学习节点表示。MAGNN 比 metapath2vec 获得更好的评价，这表明考虑单个 metapath 是次优的。在GNN 基线中，MAGNN 获得了最好的结果，因为它具有异构性意识并结合了多条元路径。与MAGNN相比，MAN 效果提升 0.7%。因此 MAN 的效果优于其他模型。694智能系统学报第 18 卷表 3 链路预测Table 3 Link predict 数据集指标LineNode2vecEsimMetapath2vecGC

47、NGATHANMAGNNMANLast-fmAUC85.7667.1482.0092.2090.9792.3693.4098.9199.63AP88.0764.1182.1990.1191.6591.5592.4498.9399.65 4.3 消融与超参数实验 4.3.1 消融实验AF1IF1为了验证 MAN 模型中的每个组成部分的有效性，对不同的 MAN 变体进行了实验，并将在不同数据集上进行的节点分类、节点聚类和链路预测，结果在表 4 中给出。为直观反映模型的效果，对节点分类任务中得到的不同训练比例的和取均值进行展示。MANpoint 是在不考虑节点属性间存在的联系的情况下提出的模型，使用

48、一个简单的线性变换将不同节点的不同属性映射到同一向量空间中。MANline 是不考虑级联网络的情况下进行的实验，用于验证目标节点的原始向量表示对于最终向量表示的有效性。MANnet 是只考虑 Point 和 Line 层模型而不考虑 Net 层中“Multiple”系数对于注意力权重的影响进行的实验，用于验证多重注意力模型的效果。表 4 消融实验Table 4 Ablation experiments 变量DBLPIMDBLast-fmAF1IF1NMIARIAF1IF1NMIAMIAUCAPMANpoint93.3993.862 879.0684.2060.6660.5515.0813.16

49、99.1799.20MANline94.5294.8679.6084.4561.1861.0615.1214.5498.9498.98MANnet94.7495.1680.4185.4162.1162.0315.0514.0899.0299.03MAN94.9895.3481.1486.1362.46262.3515.9316.8999.6399.65 可以看出，MANnet 的效果与 MAN 差距较小，也就是说，Bi-LSTM 模型和级联网络的加入，对于异构图嵌入的影响显著。而多重注意力模型对最终节点嵌入起一个校正作用，这恰恰验证了本文的观点。上述模型在 DBLP 数据集上的效果高于 IDM

50、B 数据集，这是因为 IMDB 数据集“脏”。4.3.2 超参数实验超参数在 MAN 中起着重要作用，因为它们决定了如何生成节点嵌入。在 DBLP 数据集上研究了不同参数对于节点分类结果的影响，并将节点聚类的 NMI 结果在图 4 中给出。16326412825680.280.079.880.480.680.881.081.2z(a)嵌入向量维度 z 与 NMI 关系NMI326412825651280.279.680.079.479.880.480.680.881.081.2q(b)注意力向量维度 q 与 NMI 关系NMI16326412825680.280.079.880.480.680

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 多重注意力指导构图嵌入方法

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【自信****多点】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。