分享
分销 收藏 举报 申诉 / 31
播放页_导航下方通栏广告

类型第四章核酸序列分析.ppt

  • 上传人:精****
  • 文档编号:12696472
  • 上传时间:2025-11-26
  • 格式:PPT
  • 页数:31
  • 大小:536KB
  • 下载积分:10 金币
  • 播放页_非在线预览资源立即下载上方广告
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第四 核酸 序列 分析
    资源描述:
    单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章 核酸序列分析,4.1 DNA序列分析和基因结构,DNA,序列分析的目的意义,在,DNA,序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了,DNA,与蛋白质或者,DNA,与,RNA,的相互作用。存放这些信息的,DNA,片段称为功能位点,如启动子(,Promoter,)、,基因终止序列(,Terminator sequence,)、,剪切位点(,Splice site,),等。,DNA,序列分析就是在获得,DNA,原始序列的基础上,快速寻找基因,找出基因的位置及其功能位点,这对于基因的结构和功能研究,揭示生命奥秘具有重要意义。,UTR,非翻译区域(untranslated regions),基因结构,原核生物基因结构,真核生物基因结构,基因不连续性:,基因的编码序列在DNA分子上是被不编码的序列隔开而不连续排列,绝大多数真核生物基因是不连续的,由内含子(intron)和外显子(exon)组成。,发现重复元素,数据库搜索,分析功能位点,综合分析,基本的,DNA,序列分析方案,遮蔽重复序列,序列重复现象在原核、真核生物DNA中都存在,真核生物更普遍。有种属特异性,基因组越大重复序列含量越丰富。分为轻度重复序列、中度重复序列、高度重复序列等类型。,一般来说,在进行任何DNA序列的基因分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。重复序列还常常会搅乱其它分析,特别是在数据库搜索中,由于重复序列的存在,可能得到许多同样的结果,这些结果的得分很高,使解释数据库搜索结果变得复杂、困难。,基因分析,序列翻译与开放阅读框(,ORF,),预测,序列翻译,指利用计算机程序将核酸序列按照三联体密码规则翻译成蛋白质序列,还可以将氨基酸序列倒翻成核酸序列。,阅读框(reading frames),对于任何给定的单链核酸序列,根据密码子的起始位置,可以按照三种方式进行解释,这三种阅读顺序称为阅读框。,双链DNA序列有6个可读框,开放阅读框(open reading frames,ORF),以起始密码子(通常为ATG)开始,以终止密码子(TAA、TGA或TAG)结束(但不包括终止密码子),中间由一系列密码子组成的序列区域,它决定了所编码蛋白质的氨基酸顺序。,DNA序列分析中基因识别的目的之一就是进行开放阅读框(ORF)的寻找和预测。,ORF辨别的基本方法,(1)利用编码区所具有的独特信号,比如起始密码子、终止密码子等进行识别,检查终止密码子的出现频率,基本思想:,如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。,基本算法:,扫描给定的,DNA,序列,在三个不同的阅读框中寻找较长的,ORF,。,遇到终止密码子以后,回头寻找起始密码子。,这种算法过于简单,不适合于处理短的,ORF,或者交叠的,ORF,。,分析各种密码子出现的频率,基本思想,:,每种氨基酸是由相应个数密码子编码的,例如,亮氨酸、丙氨酸、色氨酸分别有,6,个、,4,个和,1,个密码子。将一个随机均匀分布的,DNA,序列翻译成氨基酸序列,理论上说各氨基酸在序列中出现的比例应该符合氨基酸的密码子数目,如上述,3,种氨基酸出现的比例应该为,6:4:1,。但是在真实的氨基酸序列中,上述比例并不正确,这说明,DNA,的编码区域并非随机。,基本算法:,假设在一条,DNA,序列中已经找到所有的,ORF,,,那么可以利用密码子频率进一步区分编码,ORF,和非编码,ORF,,,利用这种方法,可以计算一个,ORF,成为编码区域的可能性。,(2)利用编码区与非编码区的碱基组成不同进行识别,由于蛋白质中20种氨基酸出现的概率不同,每种氨基酸的密码子兼并度不同,同一种氨基酸的兼并密码子使用频率不同等原因,造成单个碱基的组成比例和多个碱基的组成方式在不同的物种中呈现出不同的规律。,因此,可通过统计分析识别编码序列。,(3)利用经验规律进行识别,若在起始密码子上游发现了核糖体结合位点,则可肯定找到一个,ORF,。,利用,Kozak,规则识别翻译起始位点,Kozak,规则是研究第一个,ATG,侧翼序列的碱基分布所满足的统计规律,若将第一个,ATG,中的碱基,A,,,T,,,G,分别标为,1,,,2,,,3,位,则,Kozak,规则可描述如下:,第,4,位的偏好碱基为,G,;,ATG,的,5,端约,15bp,范围的侧翼序列内不含碱基,T,;,在,-3,,,-6,和,-9,位置,,G,是偏好碱基;,除,-3,,,-6,和,-9,位,在整个侧翼序列区,,C,是偏好碱基。,Kozak,规则是基于已知数据的统计结果,不见得必须全部满足,一般来说,满足前两项即可。,应用程序,ORF finder,(,www.ncbi.nlm.nih.gov/gorf/gorf.html,),简单的在线基因查找程序,可对任何序列执行,6,个可读框的翻译,用户可自由选择义多肽的最小长度和所用的遗传编码规则。主要适合寻找基因分布密集并且无内含子的核酸序列。,GetOrf,(,,bioweb.pasteur.fr/seqanal/interfaces/getorf.html,),Plotorf,(,mobyle.pasteur.fr/cgi-bin/portal.py?form,=,plotorf,),GENSCAN,商业软件,基本思路:,找出基因两端的功能区域,:,转录启动区(启动子)、终止区,在启动区下游位置寻找翻译起始密码子,转录剪切分析,探查,DNA,中的功能性位点,启动子,分析,启动子是,DNA,分子可以与,RNA,聚合酶特异结合的部位,也就是使转录开始的部位。识别出启动子对于基因辨识十分重要,启动子一般可分为两类,:,(1),一类是,RNA,聚合酶可以直接识别的启动子。,(2),另一类启动子在和聚合酶结和时需要有蛋白质辅助因子(转录因子)的存在。,启动子分析方法,:,利用模型描述几种转录因子结合部位定向及其侧翼结构特点,然后进行其它,DNA,序列的启动子预测的启发式方法;,根据启动子与转录因子结合的特性,从转录因子结合部位的密度推测出启动子区域,这方法存在较高的假阳性;,根据启动子区自身的特征来进行测定,这种方法的准确性比较高。同时,还可以结合是否存在,CpG,岛,而对启动子预测的准确性做出辅助性的推测。,启动子预测软件有:,PromoterScan,;Promoter 2.0;NNPP;EMBOSS,Cpgplot,;,CpG,Prediction,(From:,端起始的两个核苷酸总是,GT,,,3,端的最后两个核苷酸始终是,AG,,,这就是,RNA,剪接的信号。,基本思路:,(1)寻找基因剪切位点,形成外显子和内含子的边界,剪切给体(donor)位点-“,GT,”,受体(acceptor)位点-“AG”,(2)搜集候选外显子,连接形成候选基因,候选基因位于给定的DNA序列,并满足下列一致性条件:,a 所有外显子加起来的长度是3的整数倍;,b 在各个外显子内部(除最后一个外显子的最后一个密码子),没有终止编码;,c 第一个内含子-外显子边界是翻译起始编码,而最后一个外显子-内含子边界是终止编码。,(3)构建位点图,从起点到终点的任何一条路径代表一个可能的基因结构。,(4)求最优路径,计算外显子、内含子度量,赋予每一条子途径一个权值;计算剪切位点度量,赋予每个节点权值。,利用DNA、RNA和蛋白质数据库中的同源信息进行搜索,寻找相似体,从而综合评价出最可能的外显子组合。,软件,网址,说明,GRAIL,compbio.ornl.gov/Grail-1.3,分析范围主要包括人、小鼠、果蝇、拟南芥、大肠杆菌,GeneSplicer,www.tigr.org/tdb/GeneSplicer/gene_spl.html,分析范围主要包括人、果蝇、拟南芥、疟疾、水稻,NetGene2,www.cbs.dtu.dk/services/NetGene2/,可对基因序列片段进行预测,Tiger Combiner,www.tigr.org/software,综合3种以上预测方法,用于Unix系统,BCM Gene Finder,www.bioscience.org/urllists/genefind.htm,在线分析7000bp序列,大于此长度的可通过E-mail进行分析,IDB,nutmeg.bio.indiana.edu/intro/index.html,内含子序列数据库,ExInt,intro.bic.nus.edu.sg/,外显子和内含子数据库,Intronerator,www.soe.ucsc.edu/kent/intronerator,C.Elegans的内含子和选择性剪接基因的数据库,GenScan,genes.mit.edu/GENSCAN.html,基因搜索及内含子分析相关资源,其它基因分析方法,EST,策略的电子克隆,表达序列标签(,Expressed Sequence Tag,,,EST,),是从一个随机选择的,cDNA,克隆进行,5,端和,3,端单一次测序获得的短的,cDNA,部分序列,代表一个完整基因的一小部分,一般长,200-600,个核苷酸对。,一个全长的,cDNA,分子可以有许多个,EST,,,但特定的,EST,有时可以代表某个特定的,cDNA,分子。首先对获得的,EST,数据进行同源性性分析,两端有重叠的共有序列的,EST,可以组装成一个叠连群,,,直到装配成全长的,cDNA,序列,然后再进行,ORF,和相关功能位点的判定,这样就等于是克隆了一个基因的编码序列。还可以将,EST,作为一种标记序列定位在基因组,从而明确这个,cDNA,的基因组结构,包括外显子、内含子等。,EST,数据库:,,www.ncbi.nlm.nih.gov/dbEST,/,基因分析方法存在的问题:,(,1,)目前的方法仅仅识别蛋白质编码基因,转录信号,(,2,)现有的许多方法仅检测单个基因,部分基因、多重基因,(,3,)基于同源分析的方法是保守的,不可能发现新的基因,(,4,)忽视关于基因结构的生物学知识,基因表达的真实分子机制,常用的基因分析软件,商业软件包,GCG,与,Staden,同属软件包,就是大量单个完成不同功能的软件的集合。使用时,单个软件可以互相调用、协同工作,也可以只使用单一一个软件完成某项操作。,GCG,和,Staden,都可执行数百种任务,如序列比对,数据库搜索和查询,研究生物进化,序列装配,寻找基因及模式识别,,RNA,指纹及限制性内切酶图谱,引物设计,蛋白质,motif,分析,,DNA/RNA,二级结构分析,翻译等等。,GCG,与,Staden,的主要区别就在于,,GCG,有网络功能,用户不必在其本地机上装载,GCG,。而,Staden,到目前为止还不支持网络用户。,免费软件包,(,1,),同源性搜索,BLAST,、,FASTA,(,2,),未知序列分析软件,重复序列分析,CENSOR,、,RepeatMasker,编码区统计特性分析工具,常见的编码区统计特性分析工具将多种统计分析技术组合起来,给出对编码区的综合判别。著名的程序有,GRAIL,和,GenMark,等,,GRAIL,提供了基于,Web,的服务。网址是:,compbio.ornl.gov/Grail-1.3/,剪接位点分析,GENESCAN,、,NetGene,翻译起始,/,终止位点分析,对于真核生物,如果已知转录起始点,并且没有内含子打断,5,非翻译区的话,“,Kozak,规则”可以在大多数情况下定位起始密码子。,对于原核生物,关键是核糖体结合点的定位,可根据,Shine-,Dalgarno,序列的特点进行。,PolyA,和翻译终止信号不象起始信号那么重要,但也可以辅助划分基因的范围。,启动子识别,识别出启动子对于基因辨识十分重要。常用软件有,Promoter Scan II,、,PromoterInspector,、,Dragon Promoter Finder,等。但是预测过程中遗漏和假阳性都比较严重,仍需挖掘新的算法和软件。,tRNA,基因的识别,tRNA,基因识别比编码蛋白质的基因识别简单,常用工具,tRNAscan,-SE(,www.genetics.wustl.edu/eddy/tRNAscan,-SE/),。,常用工具软件,EBI,整理的生物软件目录,biocatalog,(,www.biocatalogue.org/,),,,包含有近千个软件,其中包括常用的引物设计软件,Primer Premier,和酶切位点设计软件,WEBcutter,等,基本上是最全的专业软件目录。,引物设计软件,原理 引物通常是指与模版,DNA,的特定位置互补的寡核苷酸。,(1),择合适的靶序列:设计引物之前,必须分析待测靶序列的性质,选择高度保守、碱基分布均匀的区域进行引物设计。,(2),长度:一般来说,寡核苷酸引物长度为,15,30bp,。,(3)Tm,值:引物的,Tm,值一般控制在,55,60,,尽可能保证上下游引物的,Tm,值一致,一般不超过,2,。若引物中的,G+C,含量相对偏低,则可以使引物长度稍长,而保证一定的退火温度。,(4)G+C,含量:有效引物中(,G+C,),的比例一般为,40,60,。,(5),碱基的随机分布:引物中四种碱基的分布最好是随机的,不存在聚嘌呤和聚嘧啶,尤其在引物的,3,端不应超过,3,个连续的,G,或,C,。,(6),引物自身:引物自身不存在连续,4,个碱基以上的互补序列,如回文结构,发夹结构等,否则会影响到引物与模板之间的复性结合,尤其避免,3,末端的互补。,引物设计的基本过程,(1),获得目标序列,可从实验获取或者核酸数据库查询得到。,(2),同源性比较,A,、,在线的两两比较,如,www.ncbi.nlm.nih.gov/blast/blast.cgi,。,B,、,采用软件进行两两或多序列比较,如,OMIGA,PCGENE,。,(3),引物设计软件进行设计与筛选,如,Primer Premier 5.0,软件,限制性酶切位点分析软件,酶切位点(Restriction Enzyme cutting site):DNA上一段碱基的特定序列,限制性内切酶能够识别出这个序列并在此将DNA酶切成两段。,限制性内切酶图谱:是指DNA链上某些限制性内切酶酶切位点的分布情况。,分析方法:,在线分析,如,,NEBcutter,程序(,
    展开阅读全文
    提示  咨信网温馨提示:
    1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
    2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
    3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
    4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
    5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
    6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

    开通VIP折扣优惠下载文档

    自信AI创作助手
    关于本文
    本文标题:第四章核酸序列分析.ppt
    链接地址:https://www.zixin.com.cn/doc/12696472.html
    页脚通栏广告

    Copyright ©2010-2025   All Rights Reserved  宁波自信网络信息技术有限公司 版权所有   |  客服电话:0574-28810668    微信客服:咨信网客服    投诉电话:18658249818   

    违法和不良信息举报邮箱:help@zixin.com.cn    文档合作和网站合作邮箱:fuwu@zixin.com.cn    意见反馈和侵权处理邮箱:1219186828@qq.com   | 证照中心

    12321jubao.png12321网络举报中心 电话:010-12321  jubao.png中国互联网举报中心 电话:12377   gongan.png浙公网安备33021202000488号  icp.png浙ICP备2021020529号-1 浙B2-20240490   


    关注我们 :微信公众号  抖音  微博  LOFTER               

    自信网络  |  ZixinNetwork