基于图卷积神经网络和拓扑特征的微核糖核酸-疾病关联预测模型.pdf
《基于图卷积神经网络和拓扑特征的微核糖核酸-疾病关联预测模型.pdf》由会员分享,可在线阅读,更多相关《基于图卷积神经网络和拓扑特征的微核糖核酸-疾病关联预测模型.pdf(9页珍藏版)》请在咨信网上搜索。
1、生 物 医 学 工 程 研 究 ,():国家自然科学基金委员会();河南省高校科技创新人才();河南省科技攻关项目()。通信作者 :基于图卷积神经网络和拓扑特征的微核糖核酸 疾病关联预测模型畅豫霄,董亚东,徐永涛,(新乡医学院 医学工程学院,新乡 ;河南省临床与生物医学大数据融合技术工程实验室,新乡 ;郑州大学第一附属医院 互联网医疗系统与应用国家工程实验室,郑州 ;河南省神经信息分析与药物智能设计国际联合实验室,新乡 )摘要:针对在微核糖核酸(,)疾病关联性研究中信息使用不充分,且过度依赖网络节点的相似度信息,预测准确率较低的问题,本研究提出了基于图卷积神经网络(,)及拓扑特征的 和疾病的关
2、联预测计算模型 。该模型综合 相似度矩阵、疾病语义相似度网络和 疾病关联关系矩阵,首先使用 和随机游走算法,分别获取 和疾病的子图顶点嵌入特征及 与疾病相似性网络的拓扑结构特征;然后将其输入多层感知器(,),预测潜在关联性。结果表明,该模型的 值达到 ,优于其他方法。此外,预测的前 个 中,的乳腺恶性肿瘤、的食管癌和 的肺癌得到了独立数据库的验证。因此,本研究模型可作为预测 疾病潜在关联的可靠模型。关键词:链路预测;高斯相互作用谱核相似性;卷积运算;分类特征;图迭代;无向图特征;十折交叉验证中图分类号:;文献标志码:文章编号:(),(,;,;,;,):,(),()(),;(),:;第 期畅豫霄
3、,等:基于图卷积神经网络和拓扑特征的微核糖核酸 疾病关联预测模型 引言微核糖核酸(,)是一类内源基因编码长度约为 个核苷酸的非编码单链 分子,其主要功能是通过与对应的靶向 进行碱基配对来调节基因表达水平 。等 发现 可在转录后调控基因,影响 到蛋白质的转译。近年来,有研究表明 在生物学过程中发挥着重要作用,如细胞增殖、细胞凋亡、新陈代谢、发育时间、神经元基因表达等 。因此,通过生物信息学预测与疾病相关的 ,可有效促进疾病的预防和诊疗。目前有多个数据库存储了已发现的关于 与疾病关联的信息,如:和 数据库()。但其中已被验证的 和疾病之间的关联数量严重不足,而且使用传统生物学验证方法识别新的 与疾
4、病间的关联成本高,且具有一定盲目性。因此,构建有效的计算模型来补充生物实验过程,以预测 与疾病间的潜在关联至关重要 。目前在生物信息学方面已经开展了 与蛋白质相互作用 、与 相互作用 和 与疾病关联预测 等多类研究。该类研究一定程度上促进了预测方法的发展,同时许多计算方法已被用于预测潜在的 与疾病的关联。这些方法可分为基于复杂网络、传统机器学习和深度学习的计算模型。基于复杂网络的预测方法通过整合多个生物数据,构建异构网络来预测疾病相关的 。此类方法主要基于一般假设,即具有相似功能的 往往与具有相似表型的疾病相关,反之亦然 。基于此,等 提出构建异质网络来预测与疾病相关的 。首先根据 功能相似性
5、、疾病语义相似性和已知的 与疾病间的关联构建网络;然后,使用神经网络来预测 与疾病间的关联强度。为优化此类模型,等 提出了一种矩阵分解和异构图推理的预测模型(),首先使用矩阵分解来降低邻接矩阵中噪声的影响,然后构造异构图。但基于复杂网络的预测计算模型依赖于大量数据,而目前数据库中已知的关联(正样本)数量较少,未知关联(负样本)较多。为平衡正负样本数量,等 使用具有线性邻域相似性标记传播的半监督模型来预测潜在的 疾病关联。该模型在已知关联的基础上建立网络,通过网络传播计算未知关联的标签。基于复杂网络的计算过程相对简单,但其预测结果很大程度上依赖于现有的相关性信息。近年来,传统的机器学习及深度学习
6、方法因其高效性和预测结果的可靠性,在生物信息学中得到了广泛应用。基于机器学习的预测模型一般选择已有的 疾病关联作为正样本,随机选择一些未知关联作为负样本训练相关的分类器,然后对未知关联进行预测。为解决有监督学习模型中负样本数量不足的情况,等 提出基于异构网络中的图正则化框架,该算法是一种用于 疾病关联预测的半监督算法,适用于识别与疾病相关的 。为解决特征问题,等 训练了一个基于三网络的自动编码器,用于提取低维抽象特征,使用卷积神经网络识别与疾病相关的 。虽然机器学习方法有良好性能,但也有局限性。首先,对于有监督学习方法,当前数据库无有效且足量的负样本;其次,机器学习方法性能很大程度上依赖于特征
7、的质量。总之,尽管基于复杂网络的方法计算过程相对简单,但其预测结果严重依赖于已知的关联。虽然基于机器学习和基于深度学习的方法具有很好的性能,但很难获得经过验证的负样本和有效的特征表示。这也是目前 与疾病相关的预测准确性无法进一步提高的原因。目前,神经网络在图像分类 、强化学习 等领域有广泛应用。神经网络各层间的连接结构使其能够处理张量。等 提出了可接受任意结构图的深度图卷积神经网络。该算法设计了一个局部化的图卷积模型,并证明了模型与两个图核之间的联系。此外,为了对输入的图进行排序,设计了 层,以一致的顺序对图顶点进行排序,以便传统的神经网络可以在图上进行训练。在基本图分类数据集上的实验表明,该
8、结构与图核及其他图神经网络方法相比,具有较好的结果。近年来,图卷积网络在学习图表达方面表现出强大能力,并被广泛应用于生物信息学方面研究,如药物 靶点相互作用预测 等。同时,由于其在链路预测任务中表现出色,图卷积网络已被用于预测 与疾病间的关联关系。本研究引入随机游走方法和深度图卷积神经网络构建了基于图卷积神经网络和拓扑特征的 疾病关联预测模型 ,用于获取 疾病关联关系一阶邻居子图的拓扑特征及节点嵌入特生物医学工程研究第 卷征。将以上两种特征传入多层感知(,)模型以预测二者的关联,从而实现 疾病的关联预测。实验结果表明,具有预测未知 疾病关联的潜能。模型本研究模型首先将 疾病关联一阶邻居子图传入
9、图卷积神经网络,获取子图的节点嵌入特征;之后,对子图采取随机游走,得到子图的拓扑特征;最后,将节点嵌入特征与拓扑特征进行拼接,输入 以预测 与疾病的关联。本研究模型 框架图见图 。材料 疾病关联数据 疾病关联关系网络来自 数据库 。该数据库包括 种 和 种疾病,及 种已被证实的 与疾病的关联。定义 疾病关联邻接矩阵 ,若 和疾病间存在关联,则 ,();反之 ,(),且满足 及 。其中,表示 数量,表示疾病数量。详细数据见表 。表 数据集描述 数据类型数量 疾病 疾病关联 功能相似性数据 等 通过计算两个 相关的两组疾病间的语义相似性,评估两个 间的功能相似性。假设某个疾病为 ,疾病集合用 表示
10、,。式()中,()代表疾病 与疾病集合 中疾病相似度的最大值,和的相似性计算见式():(,),()()(,)()(,)()其中,、分别表示 和 中疾病的数目。疾病语义相似性疾病语义信息来自 中的疾病语义描述。图 模型框架图 第 期畅豫霄,等:基于图卷积神经网络和拓扑特征的微核糖核酸 疾病关联预测模型该数据库提供了一个疾病分类系统。本研究依据 等 提出的方法构建有向无环图()计算疾病间的语义相似性。疾病 与疾病 的语义计算公式见式():()()()()其中,参数 表示疾病 与子节点 有向边的语义贡献因子。按照式()定义疾病 的语义值。两种疾病的 图重叠部分越多,则两者相似性越高。依据式()计算疾
11、病 与 的语义相似性 。()()()(,)()()()()()与疾病高斯相互作用谱核相似性基于具有功能相似性的 可能与具有类似表型的疾病有关,以及具有类似表型的疾病可能与具有功能相似性的 有关的假设,本研究引入了高斯相互作用属性核相似性 。首先,将某个 记为,其相互作用情况用二元向量()表示,代表标号为 的 与已验证的 疾病关联关系中的每个疾病之间存在或不存在关联,这也是矩阵 的第 行。此外,的高斯相互作用属性核相似性见式():,()()()()其中,()表示 与 间的高斯相互作用属性核相似性,式()中的调整参数 由式()表示:()()其中,表示原始带宽,被定义为 。疾病 与疾病 间的高斯相互
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 图卷 神经网络 拓扑 特征 核糖核酸 疾病 关联 预测 模型
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。