![点击分享此内容可以赚币 分享](/master/images/share_but.png)
基于TCGA数据库的胰腺癌临床预后风险模型构建与药物筛选.pdf
《基于TCGA数据库的胰腺癌临床预后风险模型构建与药物筛选.pdf》由会员分享,可在线阅读,更多相关《基于TCGA数据库的胰腺癌临床预后风险模型构建与药物筛选.pdf(7页珍藏版)》请在咨信网上搜索。
1、浙江中西医结合杂志 2023 年第 33 卷第 8 期ZJITCWM(Vol.33 No.8 2023)基于 TCGA 数据库的胰腺癌临床预后风险模型构建与药物筛选陈松鹤1陈烨2虞听2陈亚栋3关键词TCGA 数据库;胰腺癌;预后风险模型;药物筛选窑调查研究窑作者单位:1 浙江省宁波市海曙区鼓楼街道社区卫生服务中心中医科(宁波 315000);2 浙江省余姚市中医医院重症医学科(宁波 315400);3 广东省中医院肿瘤科(广州 510120)通信作者:陈亚栋,E-mail:胰腺癌(pancreatic adenocarcinoma,PAAD)是一种恶性程度高且预后较差的消化道恶性肿瘤。起病隐匿
2、,发现时多发展为中晚期,甚至伴有肝脏或淋巴结转移。PAAD 的病死率较高,高居恶性肿瘤死亡的第 7 位1。在我国,PAAD 的 5 年生存率仅 6%左右2。目前 PAAD 的治疗除了手术以外,还包括化疗、放疗、免疫治疗、靶向治疗和新辅助治疗等,但 PAAD患者的总体生存率仍然未明显改善。因此,从分子层面探究其机制作为高效早期诊断标志物以及精确安全的靶向治疗对改善 PAAD 不良预后尤为关键。本研究通过癌症基因组图谱(TCGA)数据库收录的PAAD 的相关数据进行数据挖掘与分析,构建临床预后风险模型和筛选候选药物。1资料与方法1.1数据的获取与处理运用癌症基因组图谱TCGA 数据库(https:
3、/portal.gdc.cancer.gov/)下 载PAAD 转录组和临床数据进行整理,最终得到 178 例PAAD 肿瘤样本和 4 例正常组织样本转录组数据。临床数据包含 185 例 PAAD 患者的生存时间、生存状态、年龄、性别、分期等临床信息。通过 IMMPORT(https:/www.immport.org/resources)数据库下载免疫相关基因。1.2加权基因共表达网络分析(WGCNA)模块分析运 用 Perl 软件区 分 转 录 组 数 据 中 的 mRNA 和lncRNA,通过 R 软件“limma”包提取免疫相关基因在样品中的表达。利用 PAAD 患者临床数据和免疫相关基
4、因进行 WGCNA,以“生存时间”“生存状态”中P0.4、P0.001”为筛选条件,以共表达得到免疫相关的 lncRNA 及表达量,采用单因素 Cox 回归分析得到预后相关的 lncRNA,绘制森林图。通过最小绝对收缩和选择算子(Least Absolute Shrinkage andSelection Operator,Lasso)回归进一步分析,以 7颐3 为比例随机分为训练组和验证组,建立多因素预后风险模型,计算风险评分。1.4预后风险模型评价通过 R 软件进行软件模型差异分析,观察参与模型构建的免疫基因和lncRNA 在高低风险组中是否有差异,绘制箱线图。通过 Kaplan-Meier
5、 法进行生存分析,比较高低风险组之间的生存是否具有差异,以 P0.05 为差异具有统计学意义。通过 R 软件“pheatmap”包进行风险分析,观察随着患者的风险增大与患者风险得分、生存状态、基因的关系。通过受试者工作特征(ROC)曲线下面积判断模型的准确性。采用多因素 Cox 回归分析评价模型的独立性,P0.05 为差异具有统计学意义。1.5临床相关性分析运用 PAAD 患者风险得分与临床数据,通过软件采用 字2比较高风险组患者和低风险组患者之间临床性状的差异性,以 P0 为基因在高风险中上调,LogFC0 为基因低分险中上调。运用连按图平台CMAP 平台(https:/clue.io/)进
6、行药物筛选,筛选出前 5 抑制高风险基因表达的药物。1.7统计学方法本研究数据来源于 TCGA 数据库,采用 R version 4.2.0 进行数据分析与可视化。采用单因素分析筛选预后相关免疫基因和 IncRNA,以 7颐763浙江中西医结合杂志 2023 年第 33 卷第 8 期ZJITCWM(Vol.33 No.8 2023)3 比例随机分为训练组和验证组,采用 Lasso 回归和多因素 Cox 回归分析构建预后风险模型和模型独立预后分析,采用通过 ROC 曲线下的面积来评价预后风险模型的准确性。计数资料采用 字2检验,P0.05 为差异具有统计学意义。2结果2.1WGCNA 模块分析采
7、用 WGCNA 模块描述不同患者间基因关联模式,鉴定高度协同变化的基因集,将基因进行聚类得到不用的分型,见图 1。以 P0.05 为显著性筛选条件得到生存相关的模块基因为“MEgrey(P=0.040.05)”。2.2预后风险模型构建免疫相关基因表达的样本和临床生存数据样本合并后共得 177 例交集样合共包含免疫相关基因 129 个。单因素 Cox 回归分析得到 28 个预后相关免疫基因和 70 个预后相关的lncRNA,见图 2A、2B。利用预后相关的免疫基因和lncRNA 进一步采用 Lasso 回归和多因素 Cox 回归分析构建 PAAD 预后风险模型,见图 2C、2D。风险评分模型:(
8、AC005332.3 表达量)伊(-0.00181076409386439)+(AC245041.1 表 达 量)伊0.0453272096793022+(AC009407.1 表 达 量)伊(-0.0830525908684835)+(AL133520.1 表 达 量)伊(-0.61364328816871)+(AC142472.1 表 达 量)伊(-0.167383902194242)+(AHNAK 表达量)伊0.0703791814308141+(NRAS 表达量)伊0.0483376355953627。通过风险评分的最佳截断值(中位值),将样本分为高风险组样品 85 组,低风险组样品
9、92 组。2.3预后风险模型评价预后风险模型差异分析显示,参与模型构建的免疫基因和 lncRNA 在高低风险组中具有差异,见图 2E、2F。生存分析显示,随着生存时间的增加,高低风险组的生存率下降,并且训练组和验证组高低风险组之间的生存具有明显差异(P0.05),提示模型可区分高低风险组的患者,见图2G、2H。风险分析结果显示,随着患者风险依次增大,风险得分增加,依据中位值分为高和低风险两组,见图 3A、3B。随着患者风险增加,训练组和验证组的死亡率也逐渐增加,见图 3C、3D。训练组和验证组随着风险增大,免疫基因和 lncRNA 的表达下降均为低风险,如 AC005332.3、AC00940
10、7.1、AL133520.1、AC142472.1。免疫基因和 IncRNA 的表达上升为均高风险,如 AC245041.1、AHNAK、NRAS,如图 3E、3F。ROC 曲线显示,训练组和验证组曲线下面积分别为0.708 和 0.651,表明模型具有一定的准确性与预测能力,如图 3G、3H。2.4独立预后分析通过 R 软件进行单因素和多因素 Cox 回归分析,进一步评价模型的预测价值,单因素结果显示该模型风险评分、年龄和分级是影响 PAAD生存期的危险因素(HR=6.793,P0.001);多因素 Cox回归分析结果显示该模型风险评分可作为 PAAD 独立预后因子(HR=6.251,P0.
11、001),见图 3I、3G。2.5临床相关性分析通过 R 软件采用 字2检验比较高低风险组患者之间临床性状的差异性,其中年龄以 65 岁界限,分为逸65 岁和0.05),T 期在高低风险组之间具有明显差异(P=0.00965 岁男/女(例)Grade 分级例(%)G12G34NAStage 分期例(%)Stage 玉域Stage 芋Stage 芋郁NAT例(%)T12T34NAM例(%)M0M1NAN例(%)N0N1NA表 1临床相关性分析注:grade 为分级;stage、T、N、M 为 AJCC 第八版制定的 TNM 分期高风险组(n=85)47(55.29)38(44.71)45/405
12、6(65.88)29(34.12)0(0.00)79(92.94)1(1.18)4(4.71)1(1.18)8(9.41)77(90.59)0(0.00)40(47.06)3(3.53)42(49.41)21(24.71)62(72.94)2(2.35)低风险组(n=92)46(50.00)46(50.00)52/4069(75.00)21(22.83)2(2.17)88(95.65)0(0.00)2(2.17)2(2.17)23(25.00)67(72.83)2(2.17)39(42.39)1(1.09)52(56.52)28(30.43)61(66.30)3(3.26)P值0.5790.7
13、440.1580.3780.0090.6610.468序号12345表 2筛选结果评分-97.70-97.43-97.02-96.30-96.12名称组蛋白去乙酰化酶 6 抑制剂头孢噻肟 Cefotaxime菲卓替尼 TG-101348替沃扎尼 Tivozanib吡咯酰胺 Pyroxamide药物描述组蛋白去乙酰化酶抑制剂细菌细胞壁合成抑制剂FMS 样酪氨酸激酶 3 抑制剂血管内皮生长因子受体抑制剂组蛋白去乙酰化酶抑制剂767浙江中西医结合杂志 2023 年第 33 卷第 8 期ZJITCWM(Vol.33 No.8 2023)化酶 HDAC 与人类肿瘤的发展和进展有关,被认为是癌症治疗最有希
14、望的靶标。ISOX 作为 HDAC 抑制剂能够抑制了体外肿瘤细胞聚集17。临床批准的 JAK2选择性抑制剂 TG-101348 可以逆转 KRAS 驱动的基因特征,在胰腺导管腺癌细胞中表现出 KRAS 依赖性抗癌活性18。血管内皮生长因子(VEGF)信号通路似乎是参与肿瘤血管生成的主要途径,被认为在调节抗肿瘤免疫反应中起关键 作用。替沃扎 尼Tivozanib 是一种有效且选择性的口服新型的 VEG原FR 抑制剂,用于肾细胞癌和实体肿瘤的治疗。Tivozanib 联合用药也可作为消化道恶性肿瘤治疗的一种探索。Pyroxamide 也是 HDAC 抑制剂的一种,该药物的抗肿瘤作用可能与在转化细胞
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 TCGA 数据库 胰腺癌 临床 预后 风险 模型 构建 药物 筛选
![提示](https://www.zixin.com.cn/images/bang_tan.gif)
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。