基于蛋白质相互作用网络的肺癌骨转移基因识别方法.pdf
《基于蛋白质相互作用网络的肺癌骨转移基因识别方法.pdf》由会员分享,可在线阅读,更多相关《基于蛋白质相互作用网络的肺癌骨转移基因识别方法.pdf(5页珍藏版)》请在咨信网上搜索。
1、第 51 卷收稿日期:2022年11月3日,修回日期:2022年12月10日作者简介:杨天濠,男,硕士研究生,研究方向:生物信息学。王新赠,男,博士,副教授,研究方向:生物信息学。1引言肿瘤转移是指恶性肿瘤细胞从原发部位,经淋巴道、血管或体腔等途径,到达其他部位继续生长的过程1。恶性肿瘤的转移通常发生在癌症晚期,是导致癌症患者死亡的主要原因之一。其中,肺癌的转移是一个较为复杂、由多基因参与的过程,它严重影响肺癌患者治疗的疗效和预后。骨是肺癌远处转移常见的靶部位之一,临床发现,约40%的晚期肺癌患者会发生骨转移,同时会引发多种并发症23。生物学研究证明,特定的遗传背景对癌症转移有重要的影响,有些
2、基因可能参与骨转移发展的进程。因此,对肺癌骨转移相关候选基因的鉴定和筛选对于肺癌患者的诊断和治疗具有迫切而重总第 403 期2023 年第 5 期计算机与数字工程Computer&Digital EngineeringVol.51 No.5基于蛋白质相互作用网络的肺癌骨转移基因识别方法杨天濠1王新赠2(1.中国石油大学(华东)计算机科学与技术学院青岛266580)(2.山东科技大学数学与系统科学学院青岛266580)摘要肿瘤转移通常发生在癌症晚期,是一个复杂且致命的过程,发现与肿瘤转移相关的基因对肿瘤的治疗和预后有着至关重要的作用。通过计算方法发现肿瘤转移基因,相对于昂贵且耗时的生物学方更加高
3、效。基于蛋白质-蛋白质相互作用网络(PPIN),论文提出了一种结合随机游动重启(RWR)算法的模型来识别肺癌骨转移相关基因。此外,通过置换检验规则、交互得分规则和富集分析三种方法对基因进一步筛选,最终获得了12个与肺癌骨转移有关的关键基因。文献挖掘的结果证明大部分基因直接或间接参与了肺癌骨转移过程,验证了该计算方法的有效性。这一项工作有望为肿瘤转移的临床试验提供靶标基因。关键词肿瘤细胞转移;肺癌骨转移;蛋白质相互作用网络;随机游走重启算法中图分类号R319DOI:10.3969/j.issn.1672-9722.2023.05.024Method for Identifying Genes I
4、nvolved in Lung Cancer BoneMetastasis Based on Protein-Protein Interaction NetworkYANG Tianhao1WANG Xinzeng2(1.College of Computer Science and Technology,China University of Petroleum,Qingdao266580)(2.College of Mathematics and Systems Science,Shandong University of Science and Technology,Qingdao266
5、580)AbstractTumor metastasis usually occurs in the late stage of cancer,which is a complicated and lethal process.The identification of the genes associated with tumor metastasis plays a crucial role in the therapy and prognosis of cancer.Compared with theexpensive and time-consuming biological meth
6、ods,it is more effective to find tumor metastasis-related genes through computationalmethods.Based on the protein-protein interaction network(PPIN),an integrated model using random walk with restart(RWR)algorithm is proposed to identify genes involved in lung cancer bone metastasis.In addition,those
7、 genes are further screened by threemethods,which are permutation test,interaction test and enrichment test.Finally,12 potential key genes for lung cancer bone metastasis are obtained.The results of literature review indicate that most of the inferred genes are directly or indirectly contribute toth
8、e process of lung cancer bone metastasis,thereby suggesting the effectiveness of our method.This work is expected to provide target genes for clinical trials of tumor metastasis.Key Wordstumor metastasis,lung cancer bone metastasis,protein-protein interaction,random walk with restart algorithmClass
9、NumberR31911082023 年第 5 期计算机与数字工程要的意义。目前,肿瘤转移相关基因的鉴定和验证主要依赖于临床医学及生物学实验,需要花费大量的时间和成本,限制了发现的能力。随着生物信息学的发展,一些计算方法被应用于识别疾病相关基因及其驱动因子46。相对于临床医学和生物学实验,计算方法具有高效、低成本的优点。针对恶性肿瘤转移关键基因的发现问题,我们提出了一种基于蛋白质-蛋白质相互作用网络(PPIN)的癌症转移基因识别方法,将其应用于肺癌骨转移关键候选基因的鉴定。首先利用随机游动重启(RWR)算法对基因进行分析和预选,然后通过置换检验规则消除网络结构的影响,并利用交互得分规则和富集分
10、析对基因进一步筛选,最终获得了12个可能与肺癌骨转移有关的关键基因。根据文献挖掘的结果,这些基因中有9个基因已被证实与肺癌骨转移的形成或发展有关,并揭示了这些基因可能参与的潜在分子过程,为利用计算方法研究肿瘤转移机制提供了新的思路。2数据2.1数据集肺癌和骨癌相关基因主要来源于Oncomine数据库和TCGA数据库。Oncomine数据库是一个整合了264个独立的数据集,涉及35种癌症类型的综合型癌症数据库。TCGA数据库是目前为止可以获得的公开数据库里面数据相对全面的一个,在各个领域得到了广泛的应用。通过对两个数据库的检索,我们最终得到了412个肺癌相关基因,其集合用S1表示;以及348个骨
11、癌相关基因,其集合用S2表示。2.2蛋白质相互作用网络通过对STRING数据库(版本11.0)的检索,我们得到了5,879,727个涵盖19,354种蛋白质的人类PPI(蛋白质相互作用)。研究证明这些PPI反映了蛋白质之间的直接(物理)和间接(功能)关联。其中每个PPI包含两个Ensembl ID,分别代表蛋白质pa和pb,以及一个范围在 150 和 999 的得分S()papb,代表它们的相互作用强度。基于这些数据,我们构造了一个无向加权的PPIN,包含19,354个节点和5,879,727条边。3癌症转移基因识别方法在本研究中,我们提出了一种基于PPIN的癌症转移基因识别方法,以鉴定肺癌骨
12、转移特异性关键基因。首先,结合收集的肺癌和骨癌基因数据,在 PPIN 上执行 RWR 算法,对基因进行预选。然后,通过置换检验消除网络结构的影响,得到候选基因集。最后,利用交互得分规则和富集分析对基因筛选,增强结果的准确性,得到肺癌骨转移关键基因集。整个方法的过程如图1所示。肺癌基因转移关键基因骨癌基因RWR算法RWR基因置换检验蛋白质相互作用网络交互得分规则候选基因富集分析图1方法流程图3.1随机游走重启算法RWR算法是一种经典的排序算法,它从一些种子节点开始,模拟其在网络中随机游走和重启,同时更新所有节点的概率得分并对节点进行排名7。它已被用于解决疾病基因的发现和药物重定位等问题56。RW
13、R算法的主要过程如下:输入:PPIN的列归一化的邻接矩阵A,初始概率得分向量P0=Ps1Ps2Psn(n=19354)初始化:将S1与S2中基因整合并删去重复的基因,得到682个节点作为种子节点,它们在P0中的概率得分设为1/682,其他节点的初始得分设为0;令重启概率r=0.8过程:For i=0 do执行迭代Pi+1=()1r APi+rP0(1)直到Pi+1PiL1Ps()g#total permutations(2)如果随机概率得分Psi()g普遍大于真实概率得分Ps()g,说明g更可能是因为网络结构而被选出来的假阳性基因。显然,p-value值很高的RWR基因并不是与肺癌骨转移特异性
14、相关的基因,应当被删除。由于0.05是作为被广泛接受的统计学检验传统显著性水平的阈值,我们选择p-value值小于0.05的RWR基因作为肺癌骨转移的潜在候选基因做进一步分析。3.3交互得分规则根据研究证明,PPI中交互得分高的两个蛋白质更有可能具有相似功能8。我们可以利用这一信息筛选出同时与肺癌和骨癌基因在功能上相似的候选基因。对于每个候选基因g,计算它的最大-最小交互得分MMIS:MMIS()g=minmaxS()gg:gS1maxS()gg:gS2(3)其中,S1与S2分别表示2.1节中的肺癌相关基因集合与骨癌相关基因集合,因此MMIS较高的候选基因至少同时与一个已验证的肺癌相关基因和骨
15、癌相关基因密切相关。在STRING数据库中,900是蛋白质之间的最高置信度值,因此选择MMIS得分不小于900的候选基因做进一步研究。3.4富集分析基因本体论(GO)可以从分子功能、生物学过程和细胞成分三个方面描述给定的基因及其产物;京都基因与基因组百科全书(KEGG)数据库提供了多个基因之间的生物学代谢途径。与已知肺癌和骨癌基因共享相同或相似的 GO terms和 KEGG通路的候选基因更有可能是与转移相关的基因9。首先,根据富集分析的结果计算每个候选基因g与所有 GO terms 和 KEGG 通路的关系值,得到向量ES()g。对 于 两 个 基 因g与g在 GO terms 和KEGG通
16、路上的富集分析相似性得分可以通过余弦定理计算:()gg=ES()g ES()gES()gES()g(4)具有更高()gg值的两个基因通常在分子功能和生物学过程等方面有很强的相关性。对于每个候选基因g,再计算最大-最小富集得分MMES:MMES()g=minmax()gg:gS1max()gg:gS2(5)在本研究中,我们尝试将0.9作为MMES的阈值,即筛选出MMES大于0.9的候选基因作为最终的转移关键基因。在整个方法中,对于由RWR算法和置换检验规则产生肺癌骨转移候选基因,通过交互得分规则和富集分析进行评估,选择MMIS不小于900并且MMES大于0.9的基因作为肺癌骨转移关键基因,这些基
17、因被认为在肺癌骨转移中发挥了重要作用。4结果与分析4.1结果如 3.1 节所述,我们将与肺癌和骨癌相关的682个基因作为种子节点,在PPIN上执行RWR算法,筛选概率得分大于105的基因后,得到了6850个RWR基因。其次,我们采取了置换检验规则来消除网络结构对结果的影响,得到了964个p-value值小于0.05的候选基因做进一步研究。为了更准确地识别肺癌骨转移相关基因,我们通过交互得分规则和富集分析测试对候选基因进行了评估与筛选。通过计算,对于每个侯选基因得到了一个 MMIS 和 MMES,我们选择 MMIS 不小于900并且MMES大于0.9的12个基因作为肺癌骨转移关键基因,如表1所示
18、。文献挖掘的结果证明这些关键基因基因大部分参与了肺癌骨转移的发展过程,与肺癌骨转移特异性显著相关。杨天濠等:基于蛋白质相互作用网络的肺癌骨转移基因识别方法11102023 年第 5 期计算机与数字工程表112个肺癌骨转移关键基因及其概率得分、P-value、MMIS及MMES值Ensembl IDENSP00000258149ENSP00000317272ENSP00000263388ENSP00000379204ENSP00000398632ENSP00000290921ENSP00000278568ENSP00000251849ENSP00000257430ENSP00000348838E
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 蛋白质 相互作用 网络 肺癌 转移 基因 识别 方法
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。