基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物.pdf
《基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物.pdf》由会员分享,可在线阅读,更多相关《基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物.pdf(18页珍藏版)》请在咨信网上搜索。
1、J Clin Pathol Res2023,43(6)http:/ 临床与病理杂志基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物赵轩迪,甘秀国,宋尔霖,安瑞华(哈尔滨医科大学附属第一医院泌尿外科,哈尔滨 150001)摘要 目的:膀胱癌(bladder cancer,BLCA)是具有高发病率的泌尿系统肿瘤之一,临床常规诊疗方法可提高患者的生存率,但肿瘤的复发和转移致使患者的预后仍然较差。长链非编码RNA(long non-coding RNA,lncRNA)在调控肿瘤发生、发展及癌症免疫中具有重要作用,可以作为一种新型的标志物预测患者预后及免疫应答。本研究基于生物信息学
2、分析,构建BLCA预后模型,并筛选出BLCA的靶向分子药物。方法:从癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库下载RNA测序数据和临床数据,并将BLCA患者分为训练集和验证集。基于加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)的方法提取免疫相关lncRNAs(immune related lncRNAs,IR-lncRNAs),通过最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归的方法构建预
3、后模型,利用美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)数据库和泛癌数据进行预后基因集的肿瘤相关性分析,并依据Kaplan-Meier分析和受试者操作特征(receiver operating characteristic,ROC)曲线评价该模型的预后准确性。根据风险打分将样本分为高风险组与低风险组,并在此基础上通过风险差异基因筛选出高风险基因。最后,通过CMap数据库筛选抑制高风险基因表达的药物,从而降低BLCA患者的发病风险,提高患者的生存率。结果:基于TCGA数据库中的414例肿瘤样本和19例癌旁样本,预
4、处理得到1 342个免疫相关基因(immune related genes,IRGs)和409个临床数据,并通过WGCNA得到927个生存数据。根据Pearson相关分析和单因素Cox分析,得到74个与预后相关的IR-lncRNAs(|R|0.4,P0.4,P0.05).Twelve IR-lncRNAs and 21 IRGs were performed through LASSO regression analysis.According to the follow-up analysis,the prediction model predicted the survival and p
5、rognosis of patients in high-risk and low-risk group,verified the independent prediction ability and prediction accuracy of the prognostic model,and finally screened 11 potential targeted drugs of BLCA.Conclusion:A prognostic model based on IRGs and IR-lncRNAs for BLCA patients is constructed,and 11
6、 potential targeted molecular drugs are screened,which may provide new ideas for the precise treatment of BLCA patients.KEY WORDS bladder cancer;immune-related genes;long non-coding RNA;prognostic model;targeted drugs膀胱癌(bladder cancer,BLCA)是泌尿系统常见的恶性肿瘤,发病率逐年上升,手术治疗是BLCA临床上的首选方法,但术后容易复发和进展1-4。因此,寻找可
7、靠的标志物,对BLCA的靶向治疗具有重要意义。长链非编码RNA(long non-coding RNA,lncRNA)是 一 类 长 度 超 过 200 个 碱 基 对 的 非 编 码 RNA,lncRNA具有促癌或抑癌的功能,并参与肿瘤细胞的增殖和生长;lncRNA也参与癌症免疫的多个阶段,包括免疫浸润、杀伤和活化。LncRNA具有高度的组1087临床与病理杂志,2023,43(6)http:/织和细胞特异性,故在不同的基因集中其表达模式均呈现出相关性。免疫相关lncRNAs(immune related lncRNAs,IR-lncRNAs)作为一种优良的标志物,可用于癌症精确诊断及治疗5
8、-6。免疫相关基因(immune related genes,IRGs)是机体免疫反应的关键调控因子,参与免疫细胞激活,导致肿瘤免疫细胞浸润,与肿瘤的发生、发展密切相关7-10。然而,目前很少有关于 IRGs 及 IR-lncRNAs 直接调控 BLCA 的研究报道。随着基因测序技术和公共数据库的进步与完善,运用生物信息学的方法深入挖掘测序数据,使得发现新的标志物成为可能。癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库收集了33种常见肿瘤的转录组数据、临床数据、甲基化数据等,是重要的权威数据库之一。本研究基于生物信息学分析,通过对TCGA数据库中BLCA患者的
9、转录组数据和临床数据进行分析,并从中提取 IRGs 和 IR-lncRNAs,旨在构建BLCA的预后模型并筛选BLCA潜在的靶向分子药物,从而对BLCA患者个体化的治疗提供依据,以改善患者的生命质量。1 资料与方法 1.1 资料BLCA 患 者 的 临 床 数 据 和 RNA 测 序(RNA-sequencing,RNA-seq)数据下载于TCGA官网(https:/tcga-data.nci.nih.gov/tcga/,共414例肿瘤样本和19例癌 旁 样 本),IRGs 从 Immport 数 据 库(https:/www.Import.org/Shared/home)中获取,用于进一步筛
10、选数据中差异表达的IRGs。1.2 加权基因共表达网络分析用 R 语言加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)包构建共表达网络,根据选定的软阈值将差异表达的IRGs建立成邻接矩阵,通过Pearson相关检验筛选与预后相关且具有临床意义的模块。1.3 单因素Cox回归分析及LASSO回归分析利用单因素Cox分析筛选预后相关的IRGs,根据Pearson相关检验分析得到IR-lncRNAs,再次进行单因素Cox分析,获得预后相关的IR-lncRNAs。用R语言将预后相关的基因集进一步进行最小绝对收缩和 选 择 算
11、 子(least absolute shrinkage and selection operator,LASSO)回归分析,构建BLCA的临床预后模型:风险评分=n(coef expression)。1.4 模型效能评估将样本随机分成训练集和验证集(73),基于预后模型,得出患者的风险评分,并将患者分为高、低风险组。利用Kaplan-Meier生存曲线评估患者的生存差异,受试者操作特征(receiver operating characteristic,ROC)曲线及Cox回归分析评估模型的准确性。通过美国国家生物技术信息中心(National Center for Biotechnology
12、 Information,NCBI)数据库(https:/www.ncbi.nlm.nih.gov/gene/)评估模型在肿瘤中的作用,并且在泛癌数据中进行单因素Cox分析,进一步评估模型的独立预测效能。1.5 免疫细胞浸润与富集分析根据样本中免疫细胞的含量,将患者分为高、低风险组,并利用Kaplan-Meier生存曲线评估免疫评分与生存率之间的关系。应用CIBERSORT算法评估样本中免疫细胞的浸润情况,Wilcoxon秩和检验比较高、低风险组免疫细胞之间的差异,Kaplan-Meier生存曲线评估免疫细胞浸润与生存率之间的关系。用R语言limma包提取风险差异基因,并对差异表达的IRGs进
13、行基因本体(gene ontology,GO)功能注释和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)路径富集分析。1.6 筛选靶向药物通 过 基 因 表 达 数 据 库 CMap(https:/portals.broadinstitute.org/cmap)筛选抑制高风险基因的靶向分子药物,根据 PubMed 中的相关实验验证药物对BLCA的作用及机制,并在PubChem数据库(https:/pubchem.ncbi.nlm.nih.gov/)中查询靶向药物的二级及三级结构。1.7 统计学处理应用perl语言相关程序包进行
14、数据预处理,应用R语言(4.2.0)及相关程序包进行数据分析和模型构建及验证,均采用双侧统计学检验。P0.05为差异有统计学意义。2 结 果 2.1 预后相关免疫基因及lncRNA筛选通过R语言limma包筛选差异表达的BLCA基因集,包括1 342个IRGs;并利用WGCNA得到预后相关的模块,用于进一步分析(软阈值为 2时得到1088基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物 赵轩迪,等最优的无尺度网络,图1A、1B)。因浅蓝色模块与生存时间和生存状态高度相关(r=0.2,P0.001;r=0.17,P0.001),故从中进行预后相关免疫基因集的筛选(图2)。采
15、用单因素Cox回归分析,以P0.05为标准筛选出178个与预后相关的IRGs(图3A);基于共表达的方法得到14 178个IR-lncRNAs,并同样以P0.05为标准利用单因素Cox分析,筛选出74个与预后相关的IR-lncRNAs(图3B)。Scale independenceSoft threshold(power)Gene dendrogram and module colorsSoft threshold(power)5 10 15 205 10 15 200.90.80.70.60.51.00.90.80.70.6150100500Scale free topology model
16、 f it,signed R2HeightDynamic tree cutMean connectivityMean connectivityAB图1 无尺度网络Figure 1 Scale-free networkA:Soft threshold selection;B:Hierarchical clustering tree.1089临床与病理杂志,2023,43(6)http:/2.2 构建模型并评估效能对预后相关的基因集进行LASSO回归分析(图4A、4B),得到一个由 12 个 lncRNA 和 21 个信使RNA(messenger RNA,mRNA)构成的 BLCA 预后模型(表
17、1)。利用上述模型训练集中风险评分的中位值,将样本分为高风险组、低风险组,差异分析显示参与模型构建的基因和lncRNA在高低风险组中差异有统计学意义(P0.05,图5A)。Kaplan-Meier生存曲线显示随着时间的推移,生存率逐渐下降,且高风险组的生存率显著低于低风险组(P0.001,图5B)。通过对样本进行内部验证分析,该模型的曲线下面积(area under the curve,AUC)为0.826,说明该模型预测患者生存率的准确性较高(图5C)。Cox回归分析提示预后模型中的风险评分可作为可靠的临床独立预后因子(风险评分的P1,图5D)。在NCBI数据库及PubMed中搜索得到预后基
18、因集,其在肿瘤中的表达及作用见表 2、3,其中lncRNA MAFG-DT、NR2F1-AS1、SLC25A25-AS1具有调控肿瘤进展的作用,其中MAFG-DT为胃癌潜在的预后标志物11。并且 CTSE、HLA-G、KIR2DL4、CIITA、IFNGR1、APOBEC3G、GNLY、TRIM27、GBP2、OAS1、CCL17、CARD11、SEMA4D、NTF3 在肿瘤生长中具有重要的调控作用,其中HLA-G 为 转 移 性 乳 腺 癌 预 后 的 预 测 因 子23,SEMA4D与肿瘤免疫浸润相关,是BLCA、肾透明细胞癌、黑色素瘤和胸腺瘤的预后生物标志物45。这说明预后基因集作为预后
19、标志物,具有重要的作用。对预后基因集进行泛癌数据的单因素 Cox分析,结果显示:在 BLCA 等肿瘤组织中,上述 IR-lncRNAs 及 IRGs 与患者的预后显著相关(P0.05,图 6A、6B)。Module-trait relationshipsFutimeFustatAgeGenderGradeStageTMNMEblueMEturquoiseMEbrownMEyellowMEgrey10.500.51图2 加权基因共表达网络分析Figure 2 WGCNACell contains correlation coefficient(top)and P value(bottom)of
20、correlation test(positive correlation in red,negative correlation in blue).WGCNA:Weighted gene co-expression network analysis.1090基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子药物 赵轩迪,等AB图3 预后相关的免疫基因及lncRNAFigure 3 Immunue-related genes and lncRNAs associated with prognosisA:IRGs associated with prognosis;B:IR-ln
21、cRNAs associated with prognosis.LncRNA:Long non-coding RNA;IRGs:Immune related genes;IR-lncRNAs:Immune related lncRNAs.1091临床与病理杂志,2023,43(6)http:/AB108 91 63 46 34 22 7108 98 87 71 57 51 39 34 28 22 11 7 05.0 4.5 4.0 3.5 3.0 2.5 2.05.0 4.5 4.0 3.5 3.0 2.5 2.0Log lambdaLog()CoefficientsPartial likel
22、ihood deviance432101252015图4 LASSO回归Figure 4 LASSO Cox regressionA:Correlation coefficient diagram;B:Partial likelihood deviation diagram.LASSO:Least absolute shrinkage and selection operator.表1 基因及对应系数值Table 1 Genes and corresponding coefficient values基因名称AL353150.1MAFG-DTAP003352.1AC016957.2NR2F1-
23、AS1AJ271736.1AC005674.2AF131215.6OCIAD1-AS1STAG3L5P-PVRIG2P-PILRBSLC25A25-AS1AC104785.1CTSEHLA-GKIR2DL4CIITAHTN1系数值0.1423728370.2064390950.0057720310.012141310.0635129490.1073574360.1034752850.0705860210.0043100720.1027233680.0331794220.0925194650.0183412690.0671412430.1118559090.0520510171.60425501
24、4基因名称IFNGR1APOBEC3GGNLYTRIM27GBP2OAS1UNC93B1CCL17CARD11SEMA4DGPR32CGB5FGF1NTF3PPYHTR3B系数值0.1238538730.0268973560.000730730.1589216030.063712920.0198520310.0024596150.0177311690.0121438750.0774665750.0337845620.0568949440.2022216350.3673290740.1801251850.1763594281092基于免疫相关长链非编码RNA及基因建立膀胱癌预后模型并筛选靶向分子
25、药物 赵轩迪,等AL353150.1Gene expressionSurvival probabilityRisk Risk Low HighP0.001Risk High risk Low risk0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 150 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Time/yearsTime/yearsHigh riskLow risk141 76 29 17 12 7 4 3 2 2 2 1 1 1 0 0142 117 67 42 33 24 15 11 7 5 3 1 1 1 0 0MAFG-DTAP00
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 免疫 相关 长链非 编码 RNA 基因 建立 膀胱癌 预后 模型 筛选 靶向 分子 药物
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。