基于结构化深度聚类网络的miRNA-疾病关联预测.pdf
《基于结构化深度聚类网络的miRNA-疾病关联预测.pdf》由会员分享,可在线阅读,更多相关《基于结构化深度聚类网络的miRNA-疾病关联预测.pdf(9页珍藏版)》请在咨信网上搜索。
1、摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇基于结构化深度聚类网络的皂蚤砸晕粤鄄疾病关联预测胡摇 华员,张正涛圆(员郾 枣庄学院 信息科学与工程学院,山东 枣庄摇 圆苑苑员远园;圆郾 中国矿业大学 计算机科学与技术学院,江苏 徐州摇 圆圆员员员远)摘摇 要提出一种结构化深度聚类网络模型来预测 皂蚤糟则燥砸晕粤(皂蚤砸晕粤)和疾病的关联。模型将 皂蚤砸晕粤 和疾病的集成相似性投入自编码器,将自编码器的输出通过传递算子传递到图卷积层,利用双重监督机制对模型进行训练。缘 折交叉验证结果显示,该模型分别在 匀酝阅阅 增圆郾 园 和 匀酝阅阅 增猿郾
2、 园 数据集上平均 粤哉悦(粤则藻葬 哉灶凿藻则 贼澡藻 悦怎则增藻)值分别为 怨猿郾 圆猿豫和 怨源郾 缘愿豫。关键词皂蚤砸晕粤;疾病;关联预测;图卷积神经网络;自编码器摇 摇中图分类号栽孕猿怨怨文献标识码粤文章编号员园园源 原苑园苑苑(圆园圆猿)园缘 原园园缘猿 原园怨园摇 引言皂蚤糟则燥砸晕粤(缩写为 皂蚤砸晕粤)是一种内源性小 砸晕粤,长度约为圆员 耀圆缘 个核苷酸。皂蚤砸晕粤 对体细胞的调控具有重要意义员。传统生物试验方法对 皂蚤砸晕粤 疾病进行关联预测研究存在诸多瓶颈,如试验周期长、成本高等问题。近年来,越来越多的研究者通过机器学习和深度学习的方法研究 皂蚤砸鄄晕粤 和疾病间的关联
3、,但目前大多数 皂蚤砸晕粤 疾病关联预测方法无法将 皂蚤砸晕粤 和疾病数据自身的特性及其结构很好的结合。本文提出一种新的深度聚类网络模型预测 皂蚤砸晕粤 和疾病的关联,称为结构化深度聚类网络(葬 泽贼则怎糟贼怎则葬造 凿藻藻责 糟造怎泽贼藻则蚤灶早 灶藻贼憎燥则噪 皂燥凿藻造 枣燥则 责则藻凿蚤糟贼蚤灶早 皂蚤砸晕粤鄄凿蚤泽藻葬泽藻 葬泽泽燥糟蚤葬贼蚤燥灶泽,杂阅悦晕酝阅粤),将图卷积神经网络视为深度聚类网络中的子模块,使 皂蚤砸晕粤 和疾病的结构信息通过图卷积神经网络整合到深度聚类中。本模型首先通过传递算子将自编码器所学到的表征传递到相应的 郧悦晕(郧则葬责澡 悦燥灶增燥造怎贼蚤燥灶葬造 晕
4、藻贼憎燥则噪)层,并引入双重监督机制,以整合两种不同的深度神经网络结构(郧悦晕 和自编码器),并指导整个模型的更新。通过上述方法,皂蚤砸晕粤 和疾病数据的多重结构与自编码器所学到的表征自然地结合在一起,并且能充分结合中心节点的低阶和高阶邻居。员摇 方法员郾 员摇 人类 皂蚤砸晕粤鄄疾病关联本试验采用 匀酝阅阅 增圆郾 园圆和 匀酝阅阅 增猿郾 园猿数据集对模型进行验证。匀酝阅阅 增圆郾 园 数据集包括源怨缘 种 皂蚤砸晕粤 和 猿愿猿 种疾病,缘 源猿园 条经试验验证的 皂蚤砸晕粤鄄疾病关联。匀酝阅阅 增猿郾 园 数据集中包含愿缘园 种疾病与 员 园缘苑 种 皂蚤砸晕粤,猿圆 圆圆远 条经试验
5、证实的 皂蚤砸晕粤鄄疾病关联。采用二元矩阵 粤(灶凿 伊灶皂)表示 皂蚤砸晕粤 与疾病的关联,灶凿 表示疾病的数目,灶皂 表示 皂蚤砸晕粤 数目。元素 粤(凿蚤,皂躁)等于 员 时,表示疾病 凿蚤与 皂蚤砸晕粤皂躁有关联;否则,表示两者之间没有关联。猿缘圆园圆猿 年 怨 月枣庄学院学报杂藻责郾 圆园圆猿第 源园 卷摇 第 缘 期允韵哉砸晕粤蕴 韵云 在粤韵在匀哉粤晕郧 哉晕陨灾耘砸杂陨栽再灾燥造郾 源园 晕韵郾 缘收稿日期圆园圆猿 原园远 原园缘作者简介胡华(员怨苑苑),女,山东枣庄人,枣庄学院信息科学与工程学院讲师,硕士,主要从事深度学习、图神经网络方面的研究。员郾 圆摇 皂蚤砸晕粤 功能相
6、似性基于表型相似的疾病与功能相似性的 皂蚤砸晕粤 发生关联基本生物学假设,宰粤晕郧 等源提出了一种计算 皂蚤砸晕粤 功 能 相 似 性 的 模 型。皂蚤砸晕粤 功 能 相 似 性 试 验 数 据 下 载 地 址 为“澡贼贼责泽:辕 辕憎憎憎郾 糟怎蚤造葬遭郾 糟灶辕 枣蚤造藻泽辕 蚤皂葬早藻泽辕 糟怎蚤造葬遭辕 皂蚤泽蚤皂郾 扎蚤责”,以此构建出二维矩阵 酝云杂,其包含 源怨缘 行和 源怨缘 列,存储了 皂蚤砸晕粤 的功能相似性。员郾 猿摇 疾病语义相似性常见的疾病相似性有两种计算方法。载哉粤晕 等缘基于 酝藻杂匀(酝藻凿蚤糟葬造 杂怎遭躁藻糟贼 匀藻葬凿蚤灶早泽)数据库,将每种疾病抽象出的数
7、据结构用有向无环图(阅蚤则藻糟贼藻凿 粤糟赠糟造蚤糟 郧则葬责澡,阅粤郧)表示。通过 酝藻杂匀数据库和有向无环图计算疾病语义相似性。用 阅粤郧(凿)越(凿,栽(凿蚤),耘(凿蚤)来描述疾病 凿蚤,其中 栽(凿蚤)表示疾病 凿蚤的祖先节点及其自身,耘(凿蚤)表示从祖先节点到疾病 凿蚤的边集合。然后,计算疾病 凿皂对疾病 凿蚤所作的贡献阅员凿蚤(凿皂)越员皂葬曾阅员凿蚤(凿皂)凿皂凿皂的孩子节点凿皂越 凿蚤凿皂凿蚤,(员)式中:为贡献衰减因子,在试验中设置为 园郾 缘。疾病 凿蚤的语义值可以描述为:阅杂灾员(凿蚤)越凿皂栽(凿蚤)阅员凿蚤(凿皂),(圆)然后,利用式(员)(圆)将疾病的语义相似性公
8、式改写为:阅杂员(凿蚤,凿躁)越凿皂栽(凿蚤)栽(凿躁)阅员凿蚤(凿皂)垣 阅员凿躁(凿皂)阅杂灾员(凿蚤)垣 阅杂灾员(凿躁)。(猿)如果不同 阅粤郧 同一层中的疾病数量不同,则不应默认指定疾病的相同语义贡献值,这会导致计算的语义贡献值不准确。因此,第二种常见的计算疾病 凿皂对疾病 凿蚤的语义贡献值的计算方法修正为:阅圆凿蚤(凿皂)越 原 造燥早(灶怎皂(阅粤郧(凿皂)灶凿)。(源)疾病 凿蚤的语义贡献值的计算为:阅杂灾圆(凿蚤)越凿皂栽(凿蚤)阅圆凿蚤(凿皂)。(缘)利用式(源)(缘),疾病 凿蚤和疾病 凿躁之间的疾病语义相似性公式为:阅杂圆(凿蚤,凿躁)越凿灶栽(凿蚤)栽(凿躁)(阅员凿
9、蚤(凿灶)垣 阅员凿躁(凿灶)阅杂灾圆(凿蚤)垣 阅杂灾圆(凿躁)。(远)为了获得疾病语义的增强信息,整合式(猿)和(远),疾病 凿蚤和 凿躁间的语义相似性 阅杂杂(凿蚤,凿躁)的计算公式为:阅杂杂(凿蚤,凿躁)越阅杂员(凿蚤,凿躁)垣 阅杂圆(凿蚤垣 凿躁)圆(苑)员郾 源摇 皂蚤砸晕粤 与疾病的高斯相互作用谱核相似性考虑到 酝云杂 邻接矩阵和 阅杂杂 邻接矩阵的稀疏性,使用 悦匀耘晕 等远提出的高斯相互作用谱核相似性矩阵。皂蚤砸晕粤 高斯相互作用谱核相似性矩阵计算公式为:郧酝(皂蚤,皂躁)越 藻曾责(原 皂酝郧陨孕(皂蚤)原 酝郧陨孕(皂躁)圆)式中:郧酝 是 皂蚤砸晕粤 的高斯相互作用谱
10、核相似性矩阵,二元向量 酝郧陨孕(酝蚤)用于表示 皂蚤砸晕粤 的相互作用谱,皂用来控制核函数带宽,计算如下:皂越鸳皂员灶皂灶皂蚤 越员酝郧陨孕(皂蚤)圆,源缘枣庄学院学报圆园圆猿 年第 缘 期式中:灶皂表示 皂蚤砸晕粤 的数量,依照惯例 忆皂设置为员。采用同样的方法计算疾病的高斯相互作用谱核相似性矩阵。郧阅(凿蚤,凿躁)越 藻曾责(原 皂阅郧陨孕(凿蚤)原 阅郧陨孕(凿躁)圆)皂越鸳凿员灶凿灶凿蚤 越员阅郧陨孕(凿蚤)圆式中:郧阅 是疾病的高斯相互作用谱核相似性矩阵,参数 灶凿表示疾病数量。员郾 缘摇 皂蚤砸晕粤 和疾病的集成相似性考虑到 皂蚤砸晕粤 功能相似性矩阵的稀疏性,将 皂蚤砸晕粤 功
11、能相似性矩阵与疾病的高斯相互作用谱核相似性矩阵融合,得到 皂蚤砸晕粤 的集成相似性矩阵 陨酝,计算公式如下:陨酝(皂蚤,皂躁)越酝云杂(皂蚤,皂躁)郧酝(皂蚤,皂躁)皂蚤和 皂躁之间存在功能相似性其他类似地,疾病的集成相似性矩阵 陨阅 的计算公式如下:陨阅(凿蚤,凿躁)越阅杂杂(凿蚤,凿躁)郧阅(凿蚤,凿躁)凿蚤和 凿躁之间存在功能相似性其他图 员摇 杂阅悦晕酝阅粤 模型架构图缘缘胡华,张正涛摇 基于结构化深度聚类网络的 皂蚤砸晕粤鄄疾病关联预测圆摇 算法描述为获得 皂蚤砸晕粤 与疾病之间的潜在关联,基于深度聚类网络思想,提出了一种新的图卷积模型杂阅悦晕酝阅粤,模型可描述为以下 远 个步骤:(
12、员)基于 匀酝阅阅 增圆郾 园 构建 皂蚤砸晕粤鄄疾病异构二分图;(圆)将 皂蚤砸晕粤 节点与疾病特征投影到同一维向量空间;(猿)利用 运 最邻近(运 原 晕藻葬则藻泽贼 晕藻蚤早澡遭燥则,运晕晕)算法分别构建 皂蚤砸晕粤 和疾病节点的新相似性,并且利用 皂蚤砸晕粤 与疾病的原始集成相似性进行特征拼接,从而增强 皂蚤砸晕粤 和疾病的特征表示;(源)利用基于自编码器的深度神经网络,学习 皂蚤砸晕粤 和疾病节点的特征表示;(缘)利用传递算子,将自编码器学到的 皂蚤砸晕粤 和疾病的新特征表示作为参数输入到图卷积网络中,进而获得 皂蚤砸晕粤 和疾病节点数据自身表示和结构表示;(远)通过双监督机制进行监
13、督,对模型进行监督训练。杂阅悦晕酝阅粤 模型架构如图 员 所示。圆郾 员摇 构建 皂蚤砸晕粤 和疾病的异构图模型首先读取疾病语义相似性矩阵 阅杂杂 和 皂蚤砸晕粤 功能相似性矩阵 酝云杂。由于矩阵 阅杂杂 和 酝云杂的稀疏性,模型选择用疾病高斯相互作用谱核相似性矩阵对疾病语义相似性矩阵中的 园 元素进行填充。同理,采用 皂蚤砸晕粤 高斯相互作用谱核相似性矩阵对 皂蚤砸晕粤 功能相似性矩阵的园 元素进行填充。其次,本模型从 匀酝阅阅 增圆郾 园 中获得的员愿怨 缘愿缘 条 皂蚤砸晕粤 和疾病的关联关系中,选取缘 源猿园 条已经证实存在的关联作为正样本。为了保证正负样本平衡,模型选择从剩余的尚未证
14、实存在关联的数据中随机挑选出 缘 源猿园 条 皂蚤砸晕粤 和疾病的未知关联作为负样本数据。选择 愿苑愿 个异质节点构建图,其中疾病节点标签为员,皂蚤砸晕粤 节点标签为园,因为 皂蚤砸晕粤 和疾病的关联是无向图,总共生成 圆员 苑圆园 条边。皂蚤砸晕粤 的特征可以描述为一个 源怨缘 维向量 云皂蚤:云皂蚤越(皂蚤皂员,皂蚤皂圆,皂蚤皂猿,皂蚤皂源怨源,皂蚤皂源怨缘),式中:云皂蚤表示 皂蚤砸晕粤 集成相似性矩阵 陨酝 的第 蚤 行,皂蚤皂躁是 皂蚤和 皂躁之间的集成相似度值。此外,疾病的特征可以用相同的方式描述为 猿愿猿 维向量 云凿蚤,计算过程如下:云凿蚤越(凿蚤凿员,凿蚤凿圆,凿蚤凿猿,凿蚤
15、凿猿愿圆,凿蚤凿猿愿源),式中:云凿蚤表示疾病集成相似性矩阵 陨阅 的第 蚤 行,凿蚤凿躁是 凿蚤和 凿蚤之间的集成相似度值。考虑到图的异质性,皂蚤砸晕粤 节点和疾病节点位于不同的特征空间中。采用 源怨缘 伊远源 维度的权重矩阵 宰皂,将 皂蚤砸晕粤 和疾病节点投影到相同维度的特征空间中。皂蚤砸晕粤 的转化特征可以表示为:匀皂越 宰皂云皂式中:匀皂是 皂蚤砸晕粤 经矩阵 宰皂转化后的特征,云皂是 皂蚤砸晕粤 的原始特征 陨酝。类似地,疾病特征的转换可以表示为:匀凿越 宰凿云凿式中:云凿是疾病的原始特征 陨阅,匀凿是原始特征 云凿经过 猿愿猿 伊远源 矩阵 宰凿变换后的疾病特征。圆郾 圆摇 基于
16、 运 最邻近法的特征增强模型构造一个基于原始数据的 运晕晕 图,对于 皂蚤砸晕粤 和疾病节点,是以离散而非连续形式存在的,采用一种离散型相似度计算方法 阅燥贼鄄责则燥凿怎糟贼 来计算第 蚤 个 皂蚤砸晕粤 节点 皂蚤和第 躁 个 皂蚤砸晕粤 节点的相似度,计算过程如下:杂蚤躁越(匀蚤)栽匀躁,式中:杂蚤躁表示第 蚤 个节点类型 节点(皂蚤砸晕粤 或者疾病节点)和第 躁 个节点之间的相似度,匀蚤表示第 蚤 个节点的原始特征。远缘枣庄学院学报圆园圆猿 年第 缘 期接着将 皂蚤砸晕粤 和疾病的特征分别与 杂蚤躁进行拼接,从而获得特征增强,计算公式如下:匀忆皂越(匀皂!杂皂蚤躁),匀忆凿越(匀凿!杂凿
17、蚤躁),式中:匀忆皂和 匀忆凿分别是拼接后得到的特征增强的 皂蚤砸晕粤 节点和疾病节点特征,!是拼接操作,杂皂蚤躁和 杂皂蚤躁分别是 皂蚤砸晕粤 和疾病节点经过 运晕晕 算法得到的新相似性。圆郾 猿摇 基于自编码器的深度神经网络为了增强 皂蚤砸晕粤 和疾病节点的表征能力,本模型还构建了一种 阅晕晕 模块,由编码器和解码器组成。皂蚤砸晕粤 和疾病的初始节点特征分别输入到 造 层自动编码器中,得到新的节点特征输出,第 蚤层自编码器的计算过程如下:匀蚤藻越(宰蚤藻匀蚤 原员藻垣 遭蚤藻),式中:匀蚤藻是编码器的第 蚤 层的节点特征输出,匀园藻是 皂蚤砸晕粤 或者疾病的初始节点特征经过映射后的特征 匀
18、皂或者 匀凿,是全连接层的激活函数,宰蚤藻是第 蚤 层编码器的权重矩阵,遭蚤藻是第 蚤 层编码器的偏移量。接着计算 皂蚤砸晕粤 和疾病节点特征在经过 造 层编码器后,在将输出矩阵输入到解码器中,第 蚤 层解码器的输出:匀蚤凿越(宰蚤凿匀蚤 原员凿垣 遭蚤凿),式中:匀蚤凿是解码器的第 蚤 层的节点特征输出,匀园凿是 皂蚤砸晕粤 或者疾病的初始节点特征。是全连接层的激活函数,宰蚤凿是第 蚤 层解码器的权重矩阵,遭蚤藻是第 蚤 层的偏移量。为了防止过拟合,在损失函数中加入 造圆范数,此子模块损失函数蕴阅晕晕越员圆晕匀原 匀凿圆云式中:晕 是 皂蚤砸晕粤 或者疾病节点的数量,匀是 皂蚤砸晕粤 或者疾
19、病节点未经过编码器的原始特征矩阵,对于 皂蚤砸晕粤 节点 匀是 匀皂,对于疾病节点 匀是 匀凿,匀造凿是 皂蚤砸晕粤 初始特征 匀皂或者疾病节点初始特征 匀凿经过 造 层解码器解码还原后获得的特征。圆郾 源摇 郧悦晕 模块自编码器能够从 皂蚤砸晕粤 和疾病特征数据中学习到数据本身的特性,但忽略了数据间结构的关系。通过传递算子在 郧悦晕 中传播深度神经网络(阅藻藻责 晕藻怎则葬造 晕藻贼憎燥则噪,阅晕晕)中的新表征,集成自编码器后的 郧悦晕 可以学习到 皂蚤砸晕粤 和疾病数据本身和数据之间的结构关系。对于普通图卷积层的第 蚤 层定义为:在(造)越(珟阅原员圆珟粤珟阅原员圆在(造 原员)宰(造 原
20、员),式中:在(造)是第 造 层 皂蚤砸晕粤 或者疾病节点的特征输出,在(造 原员)是第 造 层 皂蚤砸晕粤 或者疾病节点的特征输入,珟粤 越 粤 垣员,珟阅蚤蚤越 躁珟粤蚤躁。对于 郧悦晕 层第一层特征的输出 在(员),输入是 皂蚤砸晕粤 和疾病的原始特征结合了 运晕晕 算法获得的新的特征 匀忆皂,对于疾病节点输入是 匀忆凿,对于 皂蚤砸晕粤 节点输入是 匀忆皂。在(员)的定义如下所示:在(员)越(珟阅原员圆珟粤珟阅原员圆匀忆宰(员)。考虑到自编码器能够学习到数据本身并且包含不同 皂蚤砸晕粤 和疾病节点中有效的特征信息,而郧悦晕 能够从数据结构中学习到新的特征表示,本模型新设计一种传递算子将
21、自编码器的输出与郧悦晕 的输出进行结合,计算过程如下所示:珘在(造 原员)越(员 原)在(造 原员)垣 匀(造 原员),式中:是平衡系数,在本模型中设置为 园郾 缘;珘在(造 原员)是 郧悦晕 的第 造 原员 层的特征输出。郧悦晕 在融合了自编码器的 造 层的输入和输出关系后的特征表示为:苑缘胡华,张正涛摇 基于结构化深度聚类网络的 皂蚤砸晕粤鄄疾病关联预测在(造)越(珟阅原员圆珟粤珟阅原员圆珘在(造 原员)宰(造 原员)。皂蚤砸晕粤 和疾病节点投入到融合了自编码器的 郧悦晕 后,最终的输出分别为 在(蕴)皂和 在(蕴)凿,再对其进行拼接操作得到特征在(蕴)越(在(蕴)皂!在(蕴)凿)。在经过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 结构 深度 网络 miRNA 疾病 关联 预测
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。