基于图神经网络节点分类问题研究综述.pdf
《基于图神经网络节点分类问题研究综述.pdf》由会员分享,可在线阅读,更多相关《基于图神经网络节点分类问题研究综述.pdf(3页珍藏版)》请在咨信网上搜索。
1、第 5 卷 第 8 期 新一代信息技术 Vol.5 No.8 2022 年 4 月 NEW GENERATION OF INFORMATION TECHNOLOGY Apr.2022 基金项目:河北政法职业学院2021年研究课题(项目编号:ZF202107Q11)Foundation item:Hebei Professional College of Political Science and Law 2021 Research Project(No.ZF202107Q11)作者简介:张璞(1994),男,硕士研究生,助教,研究方向:数据挖掘。DOI:10.3969/j.issn.2096-
2、6091.2022.08.029 基于图神经网络节点分类问题研究综述 张 璞,李亚飞,史欢欢(河北政法职业学院,河北 石家庄 050067)摘 要:图神经网络已经广泛应用于各个领域,节点分类问题是图神经网络的重要下游任务之一。目前,节点分类主要通过消息传递的方式来实现,通过探讨消息传递的几种方式来比较不同方法之间的优劣,并提出可扩展性问题仍将是未来节点分类问题的主要研究内容。关键词:图神经网络;节点分类;采样;消息传递 本文著录格式:张璞,李亚飞,史欢欢.基于图神经网络节点分类问题研究综述J.新一代信息技术,2022,5(8):95-97 中图分类号:TP391 文献标识码:A Explore
3、 the Node Classification Problem of Graph Neural Network ZHANG Pu,LI-Ya-fei,SHI Huan-huan(Hebei Professional College of Political Science and Law,Hebei,Shijiazhuang 050067,China)Abstract:Graph neural networks have been widely used in various fields,node classification is one of the important downstr
4、eam tasks of graph neural networks.At present,node classification is mainly realized through message passing.By exploring several methods of message passing,comparing the advantages and disadvantages of different methods,scalability will still be the main research content of future node classificati
5、on problems.Key words:graph neural networks;node classification;sampling;message passing Citation:ZHANG Pu,LI-Ya-fei,SHI Huan-huan.Explore the Node Classification Problem of Graph Neural NetworkJ.New Generation of Information Technology,2022,5(8):95-97 0 引言 近年来,由于图神经网络(Graph Neual Network,GNN)1强大的推理
6、能力,引起了研究者的广泛关注。目前,图神经网络已经应用于生物医疗、自然语言处理、推荐系统、计算机视觉、城市数据挖掘以及网络安全等各个领域。为了更好地利用现代机器学习模型来实现图数据上的推理工作,需要找到一种尽可能来表示图数据信息的方法,即图数据表征(图特征提取)。最初大多通过特征工程进行特征提取,而深度学习学得的表示越来越成为当前人工智能研究的最重要利器之一,将深度学习与图数据表征相结合的研究得到了越来越多的关注,图神经网络就是其主要的研究内容。图神经网络的目的在于将图元素的特征具象化,也就是将抽象的图数据变为计算机能识别的低维稠密向量。按照图上的元素分类,图特征提取通常可以分为节点上的特征提
7、取、边上的特征提取、图上的特征提取,其对应的下游任务为节点分类、边分类、图分类。节点分类是目前图特征提取最重要的一个研究任务,现实世界中的恶意账户检测、虚假新闻检测、好友推荐等都可以认为是节点分类问题。1 节点分类简介 给定一个图 G=V,E,其中 V 为图 G 的节点集合,E 为边集合,且|V|=n。假设已知其中部分节点Vtrain的标签 Ytrain,目标是预测一些未知节点 Vtest的标签 Ytest属于哪种类型、类别。为了对节点进行分类,GNN 通常利用自身结构特征与属性特征来进行消息传递,如 GCN。因此,GNN 的核心是图上的消息传递机制,它通过聚合邻居信息并更新中心节点表示。2
8、消息传递机制 GNN 中消息传递机制可分解为两个步骤:消息96 新一代信息技术 2022 年 传递,消息聚合(状态更新),可以分别用 M 函数和 U 函数来表示。假设存在两个存在边的节点 v,w,其在 t 时刻下的节点表示为ttvwhh,()vN是节点 v的邻居集合,则其消息传递如公式(1)所示。1()m(,)tttvtvwwvMh h(1)对于节点 v,得到邻居节点的信息后与自身的节点表示聚合来更新自己的状态,如公式(2)所示。11(,)tttvvvhU h m(2)消息传递机制虽然取得了一定的成功,但是对于大规模的图训练任务,图卷积网络的计算量非常大,通常存在严重的可扩展性问题。如图 1
9、所示,要计算 L 层的节点表示,需要计算出其邻居在 L-1层的表示。同理,为了计算出其邻居在 L-1 层的表示,需要计算出其邻居在 L-2 层的表示。以此类推,当图的规模非常大的时候,要计算某一个节点的表示,可能需要更新整个图的节点表示,这将需要相当大的内存来存储节点的表示。这种经过很多层后信息到达的节点会呈现指数增长的现象,成为邻域爆炸。为了解决邻域爆炸问题并归纳消息传递机制的演变过程,将消息传递机制分为两类:(1)平均机制,如 GraphSAGE2、FastGCN3,该类机制认为各邻居节点在聚合信息的过程中重要性是一致的。(2)注意力机制,如 GAT4,借鉴自然语言处理中attention
10、 机制5,根据邻居节点的聚合表示为每条边赋予权重。图 1 信息传递过程 Fig.1 the process of message passing 2.1 平均机制 2.1.1 点采样 点采样,又称为逐点采样法,典型的例子为GraphSAGE。GraphSAGE 在每一层的计算过程中,对于该层中的每一个节点,都随机从邻居集合中采样出聚合节点集,节点集内的元素数量为 S,使用聚合节点集来更新节点表示6。即将公式(1)中的()v改为公式(3)所示。(,)SvvSAMPLES(3)2.1.2 层采样 虽然点采样将邻居节点的个数固定到了 S 个,但是当层数的值很大时,仍然可能造成邻域爆炸问题。而且点采样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 神经网络 节点 分类 问题 研究 综述
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。