结肠癌免疫相关基因筛选和预后模型建立.pdf
《结肠癌免疫相关基因筛选和预后模型建立.pdf》由会员分享,可在线阅读,更多相关《结肠癌免疫相关基因筛选和预后模型建立.pdf(10页珍藏版)》请在咨信网上搜索。
1、2023,27(14):6371,77.实用临床医药杂志Journal of Clinical Medicine in Practice63结肠癌免疫相关基因筛选和预后模型建立齐荣暄,刘格良1,,穆俊芳1,2,李晨龙2,3,李渊?,贺培凤,于琦,2(山西医科大学,1.管理学院,3.基础医学院,山西太原,0 30 0 0 1;2.山西省临床决策研究大数据重点实验室,山西太原,0 30 0 0 1)摘要:目的筛选结肠癌(CC)关键预后相关免疫基因(KIGs),构建免疫相关预后模型。方法从癌症基因组图谱(T CCA)数据库中下载CC患者的基因表达数据和临床数据,基于免疫分型筛选差异表达基因(DEGs
2、),将DEGs与ImmPort数据库中免疫基因取交集得到差异表达免疫基因(DEIGs)。通过单因素Cox回归分析、Lasso-Cox回归分析筛选出KIGs,建立免疫相关预后模型,并验证预后模型的预测性能。分析风险评分与临床特征、免疫浸润细胞、肿瘤突变负荷、微卫星不稳定性的相关性。应用单因素和多因素Cox回归分析筛选CC的独立预后因素,进一步构建用于预测CC患者总生存率(OS)的列线图。结果基于免疫分型筛选出1439个DEGs,D EG s 与ImmPont数据库免疫基因取交集得到37 9个DEIGs,通过单因素Cox回归分析、Lasso-Cox回归分析筛选出12 个KIGs,构建免疫相关预后模
3、型。高风险评分(高风险组)患者和低风险评分(低风险组)患者的OS差异有统计学意义(P0.05);预后模型预测1、3、5年OS的受试者工作特征曲线的曲线下面积(AUC)分别为0.735、0.7 2 5、0.6 99,表明预后模型的预测效果较好。不同疾病分期、不同TNM分期患者的风险评分比较,差异有统计学意义(P 0.0 5);K IG s 与众多免疫浸润细胞均存在相关性(P0.05);高风险组与低风险组的肿瘤突变负荷比较,差异有统计学意义(P0.05);高风险组的微卫星不稳定性比低风险组更强。单因素和多因素Cox回归分析发现,风险评分是CC的独立预后因素(P0.001),进一步构建的列线图对CC
4、患者生存状态具有良好的预测能力和准确性。结论本研究构建了基于12 个KIGs的免疫相关预后模型,并建立了可用于预测CC患者OS的列线图,有助于医生做出个体化治疗决策。关键词:结肠癌;癌症基因组图谱;转录组;免疫基因;肿瘤微环境;预后模型中图分类号:R735.3;R7 30.7 文献标志码:A文章编号:16 7 2-2 353(2 0 2 3)14-0 6 3-0 9D01:10.7 6 19/j c mp.2 0 2 3157 6Screening of immune-related genes and establishmentof prognostic model for colon ca
5、ncerQI Rongxuan.2,LIU Geliang.2,MU Junfang2,LI Chenlong.3,LI Yuan2,HEPeifeng,YUQil.(1.School of Management,3.School of Basic Medical Sciences,Shanai Medical University,Taiyuan,Shanxi,030001;2.Shanai Key Laboratory of Big Data for ClinicalDecisionResearch,Taiyuan,Shanxi,030001)Abstract:Objective To s
6、creen key prognosis-related immune genes(KIGs)in colon cancer(CC)and construct immune-related prognostic model.Methods The gene expression data and clini-cal data of CC patients were downloaded from the Cancer Genome Atlas(TCGA),differential ex-pressed genes(DEGs)were screened based on immune typing
7、,and the intersection of DEGs and im-mune genes of ImmPort database was used to obtain differentially expressed immune genes(DEIGs).Univariate Cox analysis and Lasso-Cox analysis were used to screen KIGs to establish immune-relatedprognostic models.Next,the predictive performance of the prognostic m
8、odel was verified.The correla-tions of risk score with clinical features,immune infiltrating cells,tumor mutation burden,and micro-satellite instability were analyzed.Independent prognostic factors of CC were screened by univariateand multivariate Cox analysis,and a nomogram related to overall survi
9、val rate(OS)was constructed topredict the overall survival rate of CC patients.Results A total of 1,439 DEGs were screened out收稿日期:2 0 2 3-0 5-16基金项目:山西省重点研发计划项目(2 0 2 10 2 130 50 10 0 3,2 0 190 3D311011);山西省回国留学人员科研资助项目(HGKY2019057);山西医科大学省级博士基金项目(SD2229);山西省研究生教育创新项目(2 0 2 2 Y426)通信作者:于琦,E-mail:y
10、u q s x m u.e d u.c n修回日期:2 0 2 3-0 6-2 464based on immune typing,and 379 DEIGs were obtained by the intersection of DEGs and immune genesof ImmPort database.A total of 12 KIGs were screened out by univariate Cox analysis and Lasso-Coxanalysis,and an immune-related prognostic model was constructed.T
11、here was a significant differ-ence in OS between high-risk score patients(high-risk group)and low-risk score patients(low-riskgroup)(P0.05).The area under the receiver operating characteristic curve(AUC)for 1-,3-and 5-year were 0.735,0.725 and 0.699,respectively,which showed that the model had a goo
12、dpredictive effect.There were significant differences in risk scores of patients with different diseasestages and different TNM stages(P0.05);KIGs was correlated with numerous immune infiltratingcells(P0.05);micro-satellite instability was greater in the high-risk group than in the low-riskgroup.Uni
13、variate and multivariate Cox regression analysis showed that risk score was an independentprognostic factor for CC(P0.585(FC为差异倍数)、错误发现率(FDR)0.0 5。从ImmPort数据库下载免疫相关基因列表,将列表基因与DEGs取交集,得到差异表达免疫基因(DEIGs)。通过对DEIGs进行单因素Cox回归分析,得到PIGs(P0.05)。1.5富集分析利用基因集富集分析(CSEA)探讨涉及DEGs的关键信号通路,该分析可分别展示京都基因与基因组百科全书(KECG)
14、和Hallmark基因组中显著富集的通路(FDR0.01)。1.6预后模型的构建与验证利用Lasso惩罚的Cox回归分析筛选PIGs,构建CC的免疫相关预后模型,参与预后模型构建的PIGs被称为关键预后相关免疫基因(K IG s),风险评分的计算公式如下:The risk score=ECoef,Expr;式中,Expr;表示基因i的表达水平,Coef.表示模型中基因i的回归系数。基于得到的风险评分计算中位数,根据中位数将所有患者样本分为高风险组、低风险组,并采用R包”survivalsur-vminer进行Kaplan-Meier生存分析。采用R包timeROC生成具有时间依赖性的受试者工作
15、特征(ROC)曲线,并计算1、3、5年总生存率(OS)的曲线下面积(AUC)来验证预后模型的预测能力。风险评分与临床特征、免疫浸润细胞、TMB、M SI的相关性采用Spearman相关分析法进行分析,2组比较采用Wilcoxon秩和检验,多组比较采用Kruskal-Wallis秩和检验。使用R包 maftools工具获取、分析和可视化CC样本基因突变瀑布图。对风险评分和其他临床因素进行单因素和多因素Cox回归分析,确定独立预后因素,基于上述协变量通过R包 rmsnomogramExregplot建立列线图,并采用ROC曲线和校准曲线验证建立的列线图是否适用于临床。P0.05为差异有统计学意义。
16、2结果2.1基于免疫基因组分析鉴定CC的2 种亚型基于2 9个免疫基因集,采用ssGSEA算法和层次聚类算法分析来自TCGA-COAD队列的47 9个肿瘤样本,将样本分为高免疫组和低免疫组实用临床医药杂志Journal of Clinical Medicine in Practice(图1A、图1B)。R包 estimate评估结果显示,与低免疫组相比,高免疫组基质评分、免疫评分和综合评分水平较高,差异有统计学意义(P0.001),见图1C。免疫细胞浸润分析结果显示,高免疫组与低免疫组的初始B细胞、CD8*T细胞、静止的CD4*记忆T细胞、记忆激活CD4T细胞、滤泡辅助性T细胞、单核细胞、M1
17、型巨噬细胞、M2型巨噬细胞、中性粒细胞存在显著差异(图1D)。进一步采用tSNE算法对CC患者进行免疫水平聚类验证,结果证明了聚类算法的可靠性(图1E)。本研究比较高免疫和低免疫这2 种亚型中的HLA基因表达情况,发现2 4种HLA基因在高免疫亚型中的表达水平均高于低免疫亚型,差异有统计学意义(P0.05),见图1F。2.21DEGs、D EI G s 和PIGs的鉴定及功能富集分析对高免疫组和低免疫组进行基因差异表达分析,得到1439个DEGs,其中10 7 4个基因表达上调,36 5个基因表达下调。将ImmPort数据库中免疫基因与DEGs取交集,得到37 9个DEIGs,其中36 5个基
18、因表达上调,14个基因表达下调(图2A图2 D)。采用单因素Cox回归分析筛选出15个PIGs,见图2 E。为了深人了解免疫基因表达影响CC生物学过程的整体模式,本研究通过GSEA确定DEGs涉及的通路。在Hallmark基因集中,DEGs主要富集在免疫反应、信号传导、细胞生长与死亡等相关通路,见图2 F。K ECG 通路中,DEGs主要富集在免疫系统、信号分子与相互作用信号传导等相关通路,见图2 G。2.3构建和验证免疫基因相关预后模型将PIGs作为预选基因进行Lasso-Cox回归分析,筛选出12 个KIGs用于构建预后模型,见图3AB。下载GEO数据库中556 例CC患者的样本数据并筛选
19、相应临床数据(表1),作为验证集验证预后模型的准确性。分别计算TCGA-CO-AD、G EO G SE3958 2 数据集中每例CC患者的风险评分,并根据风险评分中位数将患者分为高风险组和低风险组(图3CD)。与低风险组相比,高风险组患者的生存时间较短,病死率较高,见图3EF。K a p l a n-M e i e r 曲线分析显示,低风险组的OS高于高风险组,差异有统计学意义(P0.05),见图3GH。RO C曲线显示,预后模型预测TCGA-COAD中患者1、3、5年OS的AUC分别为0.7 35、0.7 2 5、0.6 99,预后模型预测验证集65662.01.5实用临床医药杂志Jourm
20、al of Clinical Medicine in Practice第2 7 卷99.3薰40 0 01.00.5F02:00COO-Ta腾3 0 0Th15K2000-2:000T物NE自低免疫申低免疫串高免疫高免疫0.6f40000.420000.2:1-2000-4000L100-10-20F中患者1、3、5年0 S的AUC分别为0.6 150.6 0 7、0.584,表明预后模型有着良好的预测能力和准确性,见图3IJ。2.4风险评分与临床特征、免疫浸润细胞、TMB、MSI的相关性基于TCGA-COAD数据,对风险评分与临床特征、免疫浸润细胞、TMB、M SI的相关性进行检验,患者的临
21、床特征见表2。不同疾病分期、不同TNM分期患者的风险评分比较,差异有统计学意义(P0.05),见图4AD。K IG s 与众多免疫细胞均存在相关性(P0.05),见图4E。风险评分与TMB呈正相关(r=0.16,P=0.0 0 2 1),见图4F;高风险组和低风险组患者的TMB比较,差异B基质评分免疫评分200tSNE1A:样本分为高免疫和低免疫这2 种亚型;B:T CG A-CO A D 中的肿瘤微环境热图和免疫特征;C:高免疫组和低免疫组免疫评分、基质评分、综合评分比较;D:高免疫组和低免疫组的免疫细胞浸润分析;E:t SNE算法验证分型结果;F:高免疫与低免疫亚型的HLA基因表达差异。8
22、综合评分C低免疫12.5斤高免疫10.05.02.52040图1层次聚类分析结果有统计学意义(P0.05),见图4G;低TMB组OS高于高TMB组,差异有统计学意义(P0.05),见图4H;瀑布图显示,肿瘤驱动突变基因腺瘤性息肉样腺癌基因(APC)突变频率最高,见图4I。高风险组较低风险组患者MSI更强,见图4J;进一步比较微卫星稳定状态(MSS)、微卫星低不稳定性(MSI-L)和微卫星高不稳定性(MSI-H)的风险评分差异发现,MSS与MSI-H(P=2 e-0 5)、MSI-L与MSI-H(P=0.049)的风险评分差异均有统计学意义,见图4K。2.5列线图的构建与验证将风险评分、年龄、性
23、别和疾病分期作为协变量进行单因素和多因素Cox回归分析,结果显示,D申低免疫中高免疫EF第14期DEGS实用临床医药杂志Journal of Clinical Medicine in Practice免疫基因6710603791414BPM比(95%e7)50NOS2下调基因TGFB3无差异基因UL.BP240上调基因(da)8oT-3020100补休中联I.2/STAT5信号通路同种异体移植排芹炎症反应IL6/JAK/STAT3信号通路细胞渊通过NF-B的TNFa信号通路干扰素反应上调基因的KRAS信号通路缺氧凝血联干扰素反应血红素代谢上皮纠胸润质转化雄激素反应顶端连接组装血管生成顶1NES
24、A:D EG s 与免疫基因的交集;B:D EG s 热图;C:D EIG s 热图;D:D EG s 火山图;E:基于单因素Cox风险回归分析的PIGs及其风险比;F:D ECs 的Hallmark基因集富集分析;G:D EG s 的KECG基因集富集分析。风险评分是CC患者的独立预后因素(P65岁565岁性别疾病分期T分期M分期N分期G例数占比/%33760.621839.210.230454.725245.340.7325.826247.119935.8期59T期1期11T2期44T期360T4期117Tio期3未知20Mo期474M;期60Mx期2未知20No期299N期133N2期9
25、8N3期6未知2010.60.22.07.964.821.00.53.685.210.80.43.653.823.917.61.13.668实用临床医药杂志Journalof Clinical Medicinein Practice第2 7 卷151515151514131312121211074012.212.011.411.2-7-6-5-4-3Log(入)A121510/642A:在Lasso模型中调整参数进行10 倍交叉验证(2 条虚线之间的区域表示合理值);B:12 个KIGs在Lasso模型中的Coef系数面图;C、D:T CG A-CO A D G EO G SE3958 2 数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 结肠癌 免疫 相关 基因 筛选 预后 模型 建立
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。