基于生物信息学分析骨肉瘤转移的关键基因及预后.pdf
《基于生物信息学分析骨肉瘤转移的关键基因及预后.pdf》由会员分享,可在线阅读,更多相关《基于生物信息学分析骨肉瘤转移的关键基因及预后.pdf(7页珍藏版)》请在咨信网上搜索。
1、2023 年 4 月第 45 卷第 2 期农垦医学Journal of Nongken MedicineApr.2023Vol.45No.2【摘要】目的:通过生物信息学分析筛选出骨肉瘤转移的关键基因,探讨骨肉瘤转移潜在的机制和关键标志物。方法:从 TARGET 数据库中下载骨肉瘤基因表达谱和临床信息数据,采用 R 软件的“limma”包筛选骨肉瘤转移组和非转移组的差异基因(Difference genes,DEGs),对差异基因运用 R 软件的“clusterProfiler”包进行基因本体论(GeneOntology,GO)、京都基因与基因组百科全书(Kyoto Encyclopedia o
2、f Genes and Genomes,KEGG)分析,了解 DEGs 富集的分子功能及通路,采用 STRING 数据库构建蛋白-蛋白相互作用(Protein-Protein inter-action network,PPI)网络,采用 Cytoscape 软件对 DEGs 进行相关性分析,找出与骨肉瘤转移进展最相关的核心基因(Hub gene);对 Hub 基因进行 Kaplan-Meier(K-M)生存分析,明确和验证 Hub 基因与骨肉瘤患者预后之间的关系,筛选出对预后具有意义的关键基因。结果:分析出 248 个有差异表达的基因,其中上调 18 个、下调 230 个差异基因,GO 分析发
3、现主要涉及肌肉组织、器官、系统的发育和横纹肌组织发育,KEGG 信号通路主要参与肌动蛋白细胞骨架的调节、Ras 信号通路、PI3K-Akt 信号通路和 MAPK 信号通路,通过 PPI 网络分析筛选得到 20 个关键基因,生存分析显示 PLCB4 的高表达与骨肉瘤患者的不良预后显著相关。结论:PLCB4 可能参与骨肉瘤转移,并与预后显著相关,可能成为骨肉瘤患者预后和治疗的潜在靶点。【关键词】骨肉瘤;转移;生物信息学;PLCB4;预后中图分类号:R738.1文献标识码:AAnalysis of Key Genes and Prognosis of Osteosarcoma Metastasis
4、Based onBioinformaticsTAN Rui1,ZHAO Chun-bing2,LI Ke1,CHEN Lei1(1.Orthopedic Center,the First Affiliated Hospital of Shihezi University,Xinjiang Shihezi,832008;2.Department ofPharmacy,the First Affiliated Hospital of Shihezi University,Xinjiang Shihezi,832008)【Abstract】Objective:To screen out the ke
5、y genes of osteosarcoma metastasis by bioinformatics analysis and toexplore the potential mechanism and key markers of osteosarcoma metastasis.Methods:Download osteosarcoma geneexpression profile and clinical information data from TARGET database.We used the limma package of R softwareto screen the
6、difference genes(DEGs)of osteosarcoma metastasis group and non-metastatic group which wasanalysed by the R language clusterProfiler for gene ontology(Gene Ontology,GO),Kyoto gene and genomeencyclopedia(Kyoto Encyclopedia of Genes and Genomes,KEGG).So we can understand the molecular functions andpath
7、ways of DEGs enrichment.A protein-protein interaction(Protein-Protein inter-action network,PPI)network wasconstructed by the STRING database.To identify the core genes(Hubs)most associated with the progression ofosteosarcoma metastasis,the correlation between DEGs enrichment was analyzed by Cytoscap
8、e software.Kaplan-Meier(K-M)survival analysis of Hub gene was carried out to clarify and verify the relationship between Hub gene andthe prognosis of osteosarcoma patients,and to screen key genes that have significance for prognosis.Results:248differentially expressed genes were analyzed,including 1
9、8 up-and 230 differentiated.The genes are mainly involved基于生物信息学分析骨肉瘤转移的关键基因及预后谭锐1赵纯冰2李柯1陈磊1(1.石河子大学第一附属医院骨科中心,新疆石河子,832008;2.石河子大学第一附属医院药剂科,新疆石河子,832008)基金项目:石河子大学校级课题项目(ZZZC201818A)。通讯作者:陈磊,主任医师,教授,硕士研究生导师,从事骨科基础研究和临床工作。119 第 2 期农垦医学第 45 卷骨肉瘤(Osteosarcoma,OS)是一种起源于间充质的恶性肿瘤,是最常见的原发性恶性肿瘤之一,好发于儿童、青少年
10、的长管状骨的干骺端,具有侵袭性高、易复发和远处转移等特点,在发现时约40%的患者存在转移,肺部是最常见的转移部位1。骨肉瘤的治疗主要包括手术、放疗和化疗的综合治疗,骨肉瘤患者 5 年总体生存率为 67%69%,但转移性骨肉瘤患者 5 年的总体生存率约为 20%2,而复发或转移是骨肉瘤生存率低的主要原因。因此,探究骨肉瘤转移的分子机制及可能靶点,对提高骨肉瘤患者预后至关重要。近年来,随着基因芯片技术和高通量测序的快速发展,应用生物信息学的方法分析其可能的分子机制被广泛用于包括骨肉瘤等多种肿瘤的研究3,4。本研究利用 TARGET 数据中的骨肉瘤基因芯片数据和临床信息,通过生物信息学方法分析骨肉瘤
11、转移和非转移之间的差异基因。通过 GO 和 KEGG 通路富集分析差异基因的生物学功能和机制。通过 STRING 数据库构建 PPI 网络挖掘 Hub 基因,通过 K-M 生存分析 Hub 基因对骨肉瘤患者的预后情况,筛选出对预后有显著影响的基因,为早期发现和改善骨肉瘤患者预后及防治远处转移提供可靠的分子标志及有效靶点。1资料与方法1.1 基因芯片获取和数据处理从 TARGET 数据集(https:/ocg.cancer.gov/pro-grams/target)获得 88 例骨肉瘤的 RNA 测序数据(第3 级)的原始计数和相应的临床信息,筛选出临床资料完整的样本纳入本研究,共纳入 87 例
12、患者,其中转移患者 20 例,非转移患者 67 例。1.2 差异表达基因筛选采用 R 软件的“limma”包(版本 3.40.2)对骨肉瘤样本的转移组和非转移组样本组织的 mRNA 差异表达谱进行分析,设置参数 fold change 为 1.5 且0.05 被鉴定为 DEGs。随后通过“gplots”包对差异基因绘制火山图和热图,直观地显示 DEGs 的表达情况。1.3 GO 和 KEGG 通路富集分析为进一步研究差异基因的功能和生物学途径,对其进行 GO 功能和 KEGG 通路富集分析,利用 R语言“clusterProfiler”包进行分析,运用“org.Hs.eg.db”软件包进行注释
13、转换,运用“ggplot2”软件包进行绘制气泡图,0.05 为差异具有统计学意义。1.4 PPI 网络构建和关键基因筛选采 用 String 在 线 软 件(https:/www.string-db.org/)构建 PPI 网络,并由 Cytoscape 软件可视化,采用 Cytoscape 软件的 cytoNCA 插件以 Betweenness(BC)算法筛选出前 20 位关键基因。1.5 关键基因的预后分析以关键基因表达值的中位数分为高、低表达两组,采用 R 语言的“survival”、“survminer”软件包对患者总生存期通过 K-M 生存曲线进行分析,筛选出对预后有影响的基因,并对
14、筛选出的基因进行绘制ROC 曲线,预测骨肉瘤患者的预后(1 年生存率、3年生存率和 5 年生存率),评估其预测能力。2结果2.1 差异表达基因筛选从 TARGET 骨肉瘤数据集中筛选出 248 个有意义的差异基因,其中 18 个上调基因,230 个下调基因,对差异基因绘制火山图(图 1A),同时绘制了前 50 位上调和下调的差异基因热图(图 1B)。in the development of muscle tissue,organs,systems and rhabdomyomuscular tissue by GO analysis.The KEGGsignaling pathway is
15、mainly involved in the regulationof actincytoskeleton,Ras signalingpathway,PI3K-Aktsignaling pathway and MAPK signaling pathway.20 key genes screened by protein interaction network analysis wereoperated Survival analysis,which showed high expression of PLCB4 was significantly associated with poor pr
16、ognosis inpatientswithosteosarcoma.Conclusion:PLCB4maybeinvolvedinosteosarcomametastasisandsignificantlycorrelatedwithprognosis,whichmaybecomeapotentialtargetforprognosisandtreatmentinpatientswithosteosarcoma.【Key words】Osteosarcoma;Metastasis;Bioinformatics;PLCB4;Prognosis 120 2023 年 4 月第 45 卷第 2 期
17、农垦医学Journal of Nongken MedicineApr.2023Vol.45No.22.2 GO 和 KEGG 通路富集分析对筛选得到的 248 个差异基因进行 GO 和KEGG 通路富集分析,GO 结果显示:上调的 DEGs主要涉及肌肉组织、器官、系统的发育和横纹肌组织发育(图 2A);下调的 DEGs 主要涉及细胞外组织结构和细胞外基质组织(图 2C);KEGG 信号通路分析结果显示:上调的 DEGs 主要参与肌动蛋白细胞骨架的调节、Ras 信号通路、PI3K-Akt 信号通路和MAPK 信号通路(图 2B);下调的 DEGs 主要涉及TGF-信号通路、细胞因子-细胞因子受体
18、相互作用和 PI3K-Akt 信号通路(图 2D),0.05 为差异具有统计学意义。图 2GO 和 KEGG 通路富集分析注:图 2A 为上调基因差异基因的 GO 分析;图 2B 为上调基因差异基因的 KEGG 分析;图 2C 为下调差异基因的 GO 分析;图 2D 下调差异基因的 KEGG 分析。圆圈越大,颜色越深,富集程度越高。图 1骨肉瘤转移组与非转移组的差异基因注:图 1A 为转移组和非转移组比较得到差异基因的火山图,以差异表达倍数 FC1.5,0.05 表示,其中红色为上调基因,蓝色为下调基因,黑色为无差异基因;图 1B 为转移组和非转移组比较得到前 50 位差异基因的热图。121
19、第 2 期农垦医学第 45 卷2.3PPI 构建及关键基因的识别String 在线软件分析结果显示,有 380 个边数,平均节点数 3.09,平均局部聚类系数 0.425,PPI 富集1.0e-16,网络差异有统计学意义,将基因互作关系的数据导出,输入数据分析软件 Cytoscape 进行处理分析,得到基因表达通路的连接网络(图 3A)。进一步采用 cytoNCA 插件以 Betweenness(BC)算法从 PPI 网络筛选出排名前 20 位的关键基因,分别为FN1、MYOD1、BMP4、BMP2、NTF3、CTSK、CDKN2A、ITGB3、PDGFRA、PLCB4、COL7A1、ALPL
20、、TNFSF11、ICAM1、BGN、FGFR1、IL11、SLIT3、JDP2、GLI3(图 3B)。图 3PPI 蛋白网络及关键基因注:图 3A 为差异基因的 PPI 蛋白网络图,交互线条越多代表示相互作用关系越强。图 3B 为前 20 位的 Hub 基因,圆圈越大代表示相互作用关系越强。2.4骨肉瘤患者的预后分析进一步研究 PPI 网络筛选出的关键基因对骨肉瘤患者预后的影响,对 PPI 筛选出的前 20 位关键基因进行生存分析,以基因中位表达值分为高、低表达组,结果发现 CTSK、PLCB4 对预后具有显著影响,其中,CTSK 高表达对预后具有保护作用(HR 为0.48,95%CI 为
21、0.25-0.94);而 PLCB4 高表达对预后为危险因素(HR 为 3.23,95%CI 为 1.58-6.76)差异具有统计学意义(图 4A)。其中 PLCB4 高表达对预后具有显著影响(=0.0013)(图 4B),进一步对该基因进行预测能力分析,ROC 曲线显示预测骨肉瘤患者 1 年、3 年和 5 年生存率的准确性分别为 0.61、0.66、0.72,具有一定的准确性(图 4C)。122 2023 年 4 月第 45 卷第 2 期农垦医学Journal of Nongken MedicineApr.2023Vol.45No.2图 4骨肉瘤患者的预后分析注:图 4A 为前 20 位 H
22、ub 基因预后的森林图;图 4B 为 PLCB4 基因的总生存期的 K-M 图;图 4C为 PLCB4 基因的 ROC 曲线。3讨论骨肉瘤是儿童和青少年最常见的原发恶性骨肿瘤,约 40%的患者在诊断时已发生远处转移,对于转移性骨肉瘤 5 年生存率预后仅为 20%5。因此急需寻找与转移相关的标志物,不仅可以早期发现,减少转移的发生,也可以进行靶向治疗和评估预后。近年来,基因芯片测序和二代测序技术的快速发展,生物信息学研究被广泛应用于基因组学、转录组学和蛋白组学研究疾病的发生发展6,7。利用生物信息学大数据的方法不仅能高效筛选出可能的靶点,同时也节约成本,为骨肉瘤的早期诊断和治疗提供了新的研究方案
23、。本研究通过分析 TARGET 数据中的骨肉瘤基因芯片数据和临床信息,分析骨肉瘤转移和非转移之间的差异基因,其中 18 个上调的差异基因,230个下调的差异基因,在 KEGG 富集分析中,上调的DEGs 主要参与肌动蛋白细胞骨架的调节、Ras 信号通路、PI3K-Akt 信号通路和 MAPK 信号通路;下调的 DEGs 主要参与 TGF-信号通路、细胞因子-细胞因子受体相互作用和 PI3K-Akt 信号通路。研究表明,肌动蛋白是细胞骨架的重要组成,其重组是肿瘤细胞产生细胞迁移和细胞转移所需机械力的来源8;此外,细胞骨架还提供物理支持,将细胞外刺激与细胞内信号传导连接起来促进肿瘤发生和进展9。R
24、as 信号通路是生理活动中非常重要的信号调节通路,参与细胞的增殖、迁移、侵袭、代谢等各种活动,大量研究证实,Ras 信号通路的异常激活可使细胞异常增殖,导致肿瘤发生和发展10。PI3K通路是 Ras 下游的重要信号通路,活化的 AKT 通过mTOR、NF-KB 等信号通路,影响细胞凋亡和增殖等 123 第 2 期农垦医学第 45 卷生理功能11。MAPK 也是 Ras 下游的重要信号通路,MAPK 级联激酶有三种变体:ERK1/2 和 ERK5、JNK和 SAPK 以及 p38,受到不同的刺激信号产生不同的作用12,其中 ERK1/2 可以调节细胞分裂,影响细胞周期;JNK 和 p38 可以调
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 生物 信息学 分析 骨肉 转移 关键 基因 预后
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。