刺猬线粒体基因组密码子偏好性分析.pdf
《刺猬线粒体基因组密码子偏好性分析.pdf》由会员分享,可在线阅读,更多相关《刺猬线粒体基因组密码子偏好性分析.pdf(8页珍藏版)》请在咨信网上搜索。
1、2023年第4期饲料博览收稿日期:2023-05-05作者简介:韩君(1988),男,黑龙江哈尔滨人,硕士,工程师,研究方向为生物信息学与多组学数据分析。刺猬线粒体基因组密码子偏好性分析韩君(北京康仁堂药业有限公司,北京101301)摘要:为利用分子技术探究刺猬皮等组织作为中药使用的机制,促进远东刺猬分子进化研究。以远东刺猬线粒体全基因组序列为材料,从中筛选出长度大于300 bp的非重复编码序列(CDS)12条,利用CodonW1.4.2、SPSS 25.0和Excel 2007等软件分析其密码子偏好性。结果显示:密码子第3位的碱基平均GC含量为24.30%;有效密码子数目(ENC)分布范围为
2、31.8350.67,平均值为43.37;相对同义密码子使用度(RSCU)值1.00的密码子共有32个,偏好以碱基A或U(T)结尾。中性绘图分析结果显示,GC1和GC2的平均值(GC12)与GC3之间的相关系数为0.443;ENC-plot分析结果显示,多数基因在标准曲线附近聚集;对应性分析结果表明,第14个向量轴的贡献率分别为35.64%、16.22%、10.26%和9.13%,同义密码子第3位的GC含量(GC3s)、ENC与第1向量轴(Axis1)呈显著正相关;密码子适应指数(CAI)与Axis1呈负相关,最终确定CUA、AUA、GUU、UCU、CCC、ACA、GCU、CAU、AAA、GA
3、A、UGA、CGC、GGC和GGA为最优密码子。通过优化远东刺猬线粒体基因组密码子以及应用分子手段进行深入研究,有助于探究远东刺猬组织入药机制。关键词:远东刺猬;线粒体;密码子;偏好性;中药中图分类号:S862;R282文献标志码:A文章编号:1001-0084(2023)04-0031-07Codon Preference Analysis on MitochondrialGenome ofErinaceusamurensisHAN Jun(Beijing Tcmages Pharmaceutical Co.,Ltd.,Beijing 101301,China)Abstract:Using
4、molecular technique to explore the mechanism of hedgehog hide and other tissues applied astraditional Chinese medicine,and promote molecular evolution of Erinaceus amurensis in the Far East,taking thecomplete mitochondrial genome sequence of Erinaceus amurensis as the material,12 non-repeating codin
5、gsequences(CDS)with a length greater than 300 bp were selected as the research objects in this study,and theircodon preference was analyzed by using CodonW1.4.2,SPSS 25.0,Excel 2007 and other software.The average GCcontent of the third codon was 24.30%;the number of effective codons(ENC)ranged from
6、31.83 to 50.67,with anaverage value of 43.37;and the relative synonymous codon usage(RSCU)value of 32 codons was greater than 1.00,and the preference ends with either A or U(T).According to neutral plot analysis,the correlation coefficientbetween the average value(GC12)of GC1,and GC2and GC3was 0.443
7、.In addition,ENC-plot analysis also revealedthat most genes cluster near the standard curve;besides,the corresponding analysis showed that the contributionrates of the 1-4 vector axes were 35.64%,16.22%,10.26%and 9.13%,respectively;and the GC content of the thirdsynonymous codon(GC3s)and ENC were si
8、gnificantly positively correlated with the first vector axis(Axis1).Inaddition,the codon adaptation index(CAI)was negatively correlated with Axis1.Hence,it could finally beEconomic Animal Research经济动物研究DOI:10.20041/ki.slbl.2023.04.00631饲料博览2023年第4期猬科在我国共有5个属7个种。刺猬一直被用作传统药物,具有较高的药用价值1-3。研究表明,刺猬皮肤的刺主要
9、由角蛋白构成,而皮肤下层的真皮主要由弹性蛋白和脂肪等物质构成4-5。刺猬肉甘平无毒,具有降逆和胃、凉血止血的作用 6。猬脂具有止血杀虫的功效,可用于治疗瘰疬、恶疮等 7。猬胆则有清热解毒和明目的作用。除了传统功效之外,还有人将刺猬用于治疗前列腺肥大,且疗效显著 8。其中,远东刺猬起源于朝鲜半岛,广泛分布在中国、俄罗斯和朝鲜半岛,是一种小型的夜间动物,生活在森林中。最近研究表明,刺猬皮含有丰富的矿物质元素,其中钾、钠和钙的含量最高。刺猬皮药用价值与其矿物质元素含量密切相关 9。不同种类和含量的矿物质元素,对于药效发挥具有重要意义,但目前仍然缺少分子层面上的研究与验证。因此,本研究拟以远东刺猬线粒
10、体mtDNA编码蛋白质基因序列为研究对象进行密码子偏好性分析,以期为预测远东刺猬未知蛋白的基因所在基因组位置、提高特定基因的表达效率打下理论基础,同时为促进其药用价值的分子机制探究提供基础材料。1材料本研究所用的远东刺猬线粒体基因组基因序列,均来源于美国国立生物技术信息中心GenBank数据库。登录NCBI数据库,并下载完整远东刺猬线粒体基因组序列及其编码序列(CDS),序列总长16 941 bp。为了准确分析远东刺猬线粒体基因密码子偏好性,本研究选择远东刺猬线粒体mtDNA编码蛋白质的基因序列中长度大于300 bp的非重复编码序列(CDS)12条进行研究。2方法2.1密码子偏好参数(CBI)
11、计算使用CodonW1.4.2软件和在线程序CUSP(http:/imed.Med.ucm.es/EMBOSS/)对所选择的CDS进行密码子使用偏好参数分析10,包括相对同义密码子使用度(RSCU)、有效密码子数目(ENC)、密码子适应指数(CAI)、最优密码子使用频率(Fop)、氨基酸数(L_aa)、同义氨基酸数(L_sym)、平均亲水性值(Gravy)、密码子偏爱指数(CBI)、GC、GC1、GC2、GC3和GC3s,其中GC、GC1、GC2和GC3的数字表示密码子的位数(第1、2、3位),GC3s为同义密码子第3位的GC含量。2.2中性分析通过中性分析,可以初步确定影响密码子偏好的因素。
12、该分析是通过计算GC1和GC2的平均值(即GC12),将其作为纵坐标,并以GC3作为横坐标,绘制散点图。每个点代表1个不同的基因,通过结合中性绘图的结果来分析密码子在这3个位点上的GC含量之间的关系,从而推断影响密码子使用偏好的因素。若密码子这3个位点上GC含量存在内在关系,则表明相关基因在进化与遗传时受突变作用;若密码子这3个位点上的GC含量之间没有相关性,那么可以推断该基因受到选择的影响,从而判断导致密码子使用偏好的因素11。2.3ENC-plot绘图以GC3s为横坐标,ENC为纵坐标,将各基因根据横纵坐标进行定位绘制散点图,并在图中构建ENC的标准曲线。根据基因相对标准曲线的分布位置,从
13、而判定密码子偏好性的影响因素。基因位于标准曲线附近或上方,表示突变是影响密码子偏好性的主要因素;而基因位于标准曲线下方,则表示自然选择是影响密码子偏好性的主要因素。2.4对应性分析利用CodonW1.4.2软件中的RSCU对应分析功能,可以对远东刺猬线粒体基因组密码子进行分析,推测密码子偏好性规律。2.5最优密码子的确定通过按照ENC参数从大到小对参与分析的基因进行排序,可以将这些基因分成高低偏性两个集合,分别取两端各10%的基因序列,然后筛选同义密码子相对使用度差值(RSUA)大于0.08且同义密码子相对使用度(RSUA)大于1的密码子,将其determined that CUA,AUA,G
14、UU,UCU,CCC,ACA,GCU,CAU,AAA,GAA,UGA,CGC,GGC and GGA wereoptimal codons.Studying the optimization of the mitochondrial genome codon of Erinaceus amurensis using themolecular technique,the mechanism of drug action of its tissue could be explored further.Key words:Erinaceus amurensis;mitochondria;codon;
15、preference;traditional Chinese medicine经济动物研究Economic Animal Research322023年第4期饲料博览确定为最优密码子12。3结果与分析3.1密码子组成分析本研究共筛选出12条以ATG为起始密码子且长度大于300 bp的序列,并利用CodonW1.4.2软件与CUSP程序对筛选出的12条基因进行分析。结果见表1,显示远东刺猬的线粒体基因组密码子第1位 GC(GC1)平均含量为 41.4%、第 2 位(GC2)为34.4%、第3位(GC3)为24.3%。结果表明,远东刺猬线粒体基因密码子的前2位GC含量明显高于第3位,而第1位的GC
16、含量最高,这表明其偏好于以A和U结尾的密码子。ENC的范围为31.8350.67,平均值为43.37。根据Jiang Y.等13的研究,当ENC值大于35时说明密码子偏好性弱、小于35时密码子偏好性强的标准,说明远东刺猬线粒体基因密码子偏好性较弱。密码子相关性分析结果见表 2,显示 GC1、GC2、GC3与GC之间,均未呈显著相关,相关系数为分别为-0.018、0.029、0.039,表明对远东刺猬线粒体基因组而言,GC1、GC2、GC3不可以决定GC的含量。同时,GC1、GC2、GC3三者之间,均呈显著正相关,相关系数均大于0.98,说明三者含量具有正向的互相影响作用。此外,ENC 与 GC
17、1、GC2、GC3、GC均呈非显著负相关,这表明GC含量对密码子的使用偏好性具有一定的负面影响。表1远东刺猬的线粒体基因组不同位置的GC含量基因ND1ND2COX1COX2ATP6COX3ND3ND4LND4ND5ND6CYTB平均值GC含量/%GC143.034.349.547.744.447.041.141.834.135.538.140.841.4GC235.932.838.536.533.737.430.428.634.533.435.834.934.4GC323.721.625.424.825.627.523.221.424.624.419.330.024.3GC34.229.637
18、.836.334.537.331.530.631.031.131.135.233.4ENC/个39.9544.1244.0142.6643.4446.2743.2450.6744.7144.0831.8345.4243.37表2各基因相关参数的相关性分析项目GC1GC2GC3CAICBIFopENCGC3sGCL_symL_aaGravyGC11.0000.987*0.986*-0.097-0.204-0.247-0.2140.021-0.018-0.031-0.0280.030GC21.0000.999*-0.171-0.266-0.311-0.2600.0160.0290.0320.035
19、-0.014GC31.000-0.193-0.250-0.304-0.2300.0000.0390.0230.0260.002CAI1.0000.5080.676*-0.1290.542-0.728*0.0050.0000.300CBI1.0000.963*0.648*-0.042-0.762*0.1660.1650.809*Fop1.0000.5300.174-0.813*0.2330.2310.745*ENC1.000-0.295-0.1440.0750.0780.494GC3s1.000-0.0040.0540.0530.004GC1.000-0.373-0.369-0.601*L_sy
20、m1.0001.000*0.378L_aa1.0000.378Gravy1.000注:*表示在0.01水平上显著相关;*表示在0.05水平上显著相关。RSCU分析结果见表3,发现远东刺猬线粒体RSCU值大于1.00的密码子数目为32个。其中,密码子第3位碱基为A的有14个;第3位为U的有14个;第3位为C的有4个。综上说明,远东刺猬线粒体基因组密码子偏好以A或U(T)结尾,不偏好以C或G结尾。3.2中性绘图及ENC-plot分析远东刺猬线粒体基因中性绘图分析(见图1)Economic Animal Research经济动物研究33饲料博览2023年第4期显示,GC12的取值范围为0.3360.
21、440,GC3的取值范围为0.2160.254,所有基因的分布均位于对角线上方,且没有沿对角线或在对角线附近的分布情况。利用SPSS 25.0对GC12与GC3进行相关性分析,结果表明,两者相关系数为0.443,双尾检测未达到显著水平。表3远东刺猬线粒体各氨基酸相对同义密码子使用度注:带下画线的为高频密码子。氨基酸PheLeuIleValTyrHisGlnAsnLysAspGly密码子UUUUUCUUAUUGCUUCUCCUACUGAUUAUCAUAGUUGUCGUAGUGUAUUACCAUCACCAACAGAAUAACAAAAAGGAUGACGGUGGCGGAGGG数目16666232149
22、7451851128796247501967148660554172311161907382956527420RCSU1.430.572.380.141.000.461.900.111.370.461.181.330.511.790.371.180.821.150.851.920.081.290.711.860.141.130.871.111.031.470.40氨基酸SerProThrAlaCysTERTrpArgGluMet密码子UCUUCCUCAAGUAGCUCGCCUCCCCCACCGACUACCACAACGGCUGCCGCAGCGUGUUGCUAAUGAUAGUGGCGUCGCCGA
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 刺猬 线粒体 基因组 密码子 偏好 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。