
《第3章 序列比对-shen》由会员分享,可在线阅读,更多相关《第3章 序列比对-shen(62页珍藏版)》请在文档大全上搜索。
1、第三章 序列比对为什么要序列比对?为什么要序列比对?基于同源物鉴定的功能预测基于同源物鉴定的功能预测基本假设:基本假设: 序列的保守性序列的保守性 功能的保守性功能的保守性因为:因为:1. 蛋白质一般在三级结构的层面上执行功能;蛋白质一般在三级结构的层面上执行功能;2. 蛋白质序列的保守性决定于其编码蛋白质序列的保守性决定于其编码DNA的保守性。的保守性。序列比对中的进化假设1. 所有的生物都起源于同一个祖先;所有的生物都起源于同一个祖先;2. 序列不是随机产生,而是在进化上,不断发生着序列不是随机产生,而是在进化上,不断发生着演变;演变;3. 基本假设:基本假设: 序列保守性序列保守性 结构
2、保守性结构保守性注意:反之并不为真。注意:反之并不为真。 结构保守性结构保守性 序列保守性序列保守性 contents3.1 概述概述3.2 两条序列比对方法两条序列比对方法3.3 多条序列比对方法多条序列比对方法3.1 概述概述3.1.1 序列比对的概念序列比对的概念3.1.2 生物序列之间的关系生物序列之间的关系 序列比对(序列比对(Sequence alignment)序列比对是序列相似性分析的常用方法,又称序列比对是序列相似性分析的常用方法,又称序列联配。序列联配。通过将两个或多个核酸序列或蛋白序列进行比通过将两个或多个核酸序列或蛋白序列进行比对,显示其中相似的结构域,这是进一步相似对
3、,显示其中相似的结构域,这是进一步相似性分析的基础。通过比较未知序列与已知序列性分析的基础。通过比较未知序列与已知序列的一致性或相似性,可以预测未知序列功能。的一致性或相似性,可以预测未知序列功能。3.1.1 序列比对的概念两条序列比对(两条序列比对(pairwise alignment)通过比较两条序列之间的相似区域通过比较两条序列之间的相似区域和保守性位点,寻找二者之间可能和保守性位点,寻找二者之间可能的进化关系。的进化关系。多重序列比对(multiple alignment)1.不同物种中,许多基因的功能保守,序列不同物种中,许多基因的功能保守,序列相似性较高,通过多条序列的比较,发现相
4、似性较高,通过多条序列的比较,发现保守与变异的部分保守与变异的部分2. 可构建可构建HMM模型,搜索更多的同源序列模型,搜索更多的同源序列3. 构建进化的树的必须步骤构建进化的树的必须步骤4. 比较基因组学研究比较基因组学研究5. 两类:全局或局部的多序列比对两类:全局或局部的多序列比对 同源性和相似性同源性和相似性如果两个序列有一个共同的进化祖先,那么它们如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度问题。这两是同源的。这里不存在同源性的程度问题。这两条序列之间要么是同源的,要么是不同源的。条序列之间要么是同源的,要么是不同源的。所谓同源序列,简单地说,是指从某一
5、共同祖先所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。经趋异进化而形成的不同序列。同源蛋白质的氨基酸序列具有明显的相似性同源蛋白质的氨基酸序列具有明显的相似性,这种这种相似性称为序列相似性称为序列同源性同源性。 同源性(同源性(homology)相似性相似性 (similarity)相似性相似性是指序列比对过程中用来描述检测序列和目标序列是指序列比对过程中用来描述检测序列和目标序列之间相同之间相同DNA碱基或氨基酸残基顺序所占比例的高低。碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义,并不要求与进化起源是否同一,与亲相似性本身的含义,并不要求与进化起源是否同一,与
6、亲缘关系的远近、甚至于结构与功能有什么联系。缘关系的远近、甚至于结构与功能有什么联系。当相似程度高于当相似程度高于50%时,比较容易推测检测序列和目标序时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于列可能是同源序列;而当相似性程度低于20%时,就难以时,就难以确定或者根本无法确定其是否具有同源性。确定或者根本无法确定其是否具有同源性。 直系同源和旁系同源直系同源和旁系同源直系同源(直系同源(orthology)是指不同物种内的同源序列,是指不同物种内的同源序列,它们来源于物种形成时的共同祖先基因。它们来源于物种形成时的共同祖先基因。 (1) 在进化上起源于一个始祖基因并在
7、进化上起源于一个始祖基因并垂直传递垂直传递(vertical descent)的同源基因;)的同源基因; (2) 分布于分布于两种或两种以上物种两种或两种以上物种的基因组;的基因组; (3) 功能高度保守乃至于近乎相同,甚至于其在近缘功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换;物种可以相互替换; (4) 结构相似;结构相似; (5) 组织特异性与亚细胞分布相似。组织特异性与亚细胞分布相似。旁系同源(旁系同源(paralogy)基因是指同一基因组基因是指同一基因组(或(或同一物种同一物种的基因组)中,由于始祖基因的基因组)中,由于始祖基因的加倍而的加倍而横向横向/水平方向水平方向
8、(horizontal)产生)产生的几个同源基因。的几个同源基因。即:旁系同源是基因复制的结果,两份拷贝即:旁系同源是基因复制的结果,两份拷贝在一个物种的历史上时平行演化的。这样的在一个物种的历史上时平行演化的。这样的基因就被称为旁系同源基因。基因就被称为旁系同源基因。直系同源和旁系同源直系同源和旁系同源 直系与旁系的直系与旁系的共性共性是同源,都源于各自的始祖是同源,都源于各自的始祖基因。基因。 其其区别区别在于:在于: 在进化起源上,直系同源是强调在在进化起源上,直系同源是强调在不同基因组不同基因组中的中的垂直传递垂直传递,旁系同源则是在,旁系同源则是在同一基因组同一基因组中中的的横向加倍
9、横向加倍; 在功能上,直系同源要求功能高度相似,而旁在功能上,直系同源要求功能高度相似,而旁系同源在定义上对功能上没有严格要求,可能系同源在定义上对功能上没有严格要求,可能相似,但也可能并不相似相似,但也可能并不相似(尽管结构上具一定程尽管结构上具一定程度的相似度的相似),甚至于没有功能,甚至于没有功能(如基因家族中的如基因家族中的假基因假基因)。 序列比对的数学模型对序列从头到尾进行比较对序列从头到尾进行比较,试图使尽可能,试图使尽可能多的字符在同一列中匹配。多的字符在同一列中匹配。适用于相似度较高且长度相近的序列适用于相似度较高且长度相近的序列如:如:Needleman-Wunsch算法算
10、法全局比对局部比对寻找序列中相似度最高的区域寻找序列中相似度最高的区域,也就是匹,也就是匹配密度最高的部分。配密度最高的部分。适用于在某些部分相似度较高,而其他部适用于在某些部分相似度较高,而其他部位差异较大的序列。位差异较大的序列。如:如:Smith-Waterman算法算法序列比对的数学模型大体可以分为两类,一类从全长序列出发,序列比对的数学模型大体可以分为两类,一类从全长序列出发,考虑序列的整体相似性,即整体比对;第二类考虑序列部分区考虑序列的整体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。域的相似性,即局部比对。 局部相似性比对局部相似性比对的生物学基础是蛋白质功能
11、位点往局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。灵敏度,其结果更具生物学意义。BLAST和和FastA等常用的数据库搜索程序等常用的数据库搜索程序均采用局均采用局部相似性比对的方法,具有较快的运行速度部相似性比对的方法,具有较快的运行速度,而基,而基于整体相似性比对的
12、数据库搜索程序则需要超级计于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。算机或专用计算机才能实现。 3.2 两条序列比对方法序列两两比对分析是最简单、最基本的对齐分析。序列两两比对分析是最简单、最基本的对齐分析。三种方法三种方法:点阵分析法点阵分析法动态规划法动态规划法:Needleman-Wunsch算法、算法、Smith-Waterman算法算法词或词或K串法串法(BLAST or FASTA中应用中应用)3.2.1采用采用Blast进行序列两两对齐分析进行序列两两对齐分析3.2.2采用本地化软件进行两条序列比对采用本地化软件进行两条序列比对3.2.1 采用采用Bl
13、ast进行序列两两对齐分析进行序列两两对齐分析Blast是一个局部比对搜索工具,用来确定是一个局部比对搜索工具,用来确定一条查询序列和一个数据库的比对,最早一条查询序列和一个数据库的比对,最早的版本不引入间隙,但现在所用的版本已的版本不引入间隙,但现在所用的版本已经允许比对中引入间隙。经允许比对中引入间隙。“Bl2Seq”是是NCBI上上Blast程序的一部分,允程序的一部分,允许两条序列之行局部双序列比对,使用这许两条序列之行局部双序列比对,使用这个程序执行蛋白质(或个程序执行蛋白质(或DNA序列)的双序序列)的双序列比对非常容易。列比对非常容易。网络服务如网络服务如NCBI的的“bl2se
14、q”程序,地址:程序,地址:http:/blast.ncbi.nlm.nih.gov/Blast.cgi点!点!特殊特殊BLAST蛋白质序列比对用蛋白质序列比对用blastp,DNA序列比对用序列比对用blastn例:拟南芥和菠菜的抗坏血酸过氧化物酶基因的两两比对例:拟南芥和菠菜的抗坏血酸过氧化物酶基因的两两比对粘贴粘贴sequence1粘贴粘贴sequence2竖线:一致性竖线:一致性(identities)缺口缺口(gap):不同之处:不同之处双序列比对的显著性:一致性百分比双序列比对的显著性:一致性百分比核酸和蛋白质序列进行对库检索的结果中是否具核酸和蛋白质序列进行对库检索的结果中是否具
15、有生物学意义是一个很重要的问题。蛋白质序列有生物学意义是一个很重要的问题。蛋白质序列对齐分析得到的结论是:对于有对齐分析得到的结论是:对于有70个氨基酸残基个氨基酸残基的比对,的比对,40%的氨基酸一致性(的氨基酸一致性(identities)是一)是一个认为两个蛋白同源的合理阈值,即它们一般具个认为两个蛋白同源的合理阈值,即它们一般具有相类似的生物学性质;在此标准之下,两条蛋有相类似的生物学性质;在此标准之下,两条蛋白质序列可能具有相似的功能,也可能是性质上白质序列可能具有相似的功能,也可能是性质上完全不同的蛋白质。完全不同的蛋白质。对于对于DNA序列需要具有序列需要具有75以上的同源性才可
16、能以上的同源性才可能具有潜在的生物学意义。具有潜在的生物学意义。3.2.2 采用本地化软件进行两条序列比对做多重比对分析的本地软件也可以做两做多重比对分析的本地软件也可以做两两比对分析,如两比对分析,如clustalX软件软件等。等。Clustal是一个单机版的基于渐进比对的是一个单机版的基于渐进比对的多序列比对工具。其基本思想就是基于多序列比对工具。其基本思想就是基于相似序列通常具有进化相关性的这一假相似序列通常具有进化相关性的这一假设。设。当然,当然,DNAStar、DNAMan等软件也可等软件也可以进行比对。以进行比对。生物软件网:生物软件网:http:/bio- 多条序列比对方法3.3
17、.1 序列对数据库的比对检索分析序列对数据库的比对检索分析3.3.2 多重序列的本地化软件对齐多重序列的本地化软件对齐3.3.3 Clustal比对结果的编辑比对结果的编辑多重序列比对:多重序列比对:用于描述一组序列之间的相似性关系,以便了解一个基用于描述一组序列之间的相似性关系,以便了解一个基因家族的基本特征,寻找因家族的基本特征,寻找motif,保守区域等。,保守区域等。用于描述一个同源基因之间的亲缘关系的远近,应用到用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中。分子进化分析中。其他应用,如构建其他应用,如构建profile,打分矩阵等。,打分矩阵等。3.3.1 序列对数
18、据库的比对检索分析序列对数据库的比对检索分析一条序列对整个数据库进行相似性分析,以发现一条序列对整个数据库进行相似性分析,以发现其同源性是生物信息学分析中一个极重要的方面。其同源性是生物信息学分析中一个极重要的方面。本质上,这种分析方法类似于将序列两两对齐重本质上,这种分析方法类似于将序列两两对齐重复成百上千次。复成百上千次。目前在单条序列对库检索中使用最广泛的程序是目前在单条序列对库检索中使用最广泛的程序是FASTA和和BLAST。FASTA不会漏检较强的结果,不会漏检较强的结果,但有时无法检出弱的但是具有显著性的匹配。但有时无法检出弱的但是具有显著性的匹配。BLAST(基本局域联配搜索工具
19、,(基本局域联配搜索工具,Basic Local Alignment Search Tool)只匹配连续序列,缺失)只匹配连续序列,缺失片断将被分段显示。片断将被分段显示。以以BLAST检索为例检索为例BLAST是一个序列数据库搜索程序家族,是一个序列数据库搜索程序家族,BLAST检索的网络资源较多:检索的网络资源较多:http:/www.ncbi.nlm.nih.gov/BLASThttp:/www.ebi.ac.uk/blast2http:/blast.genome.jp/当然,也可以将数据库下载到本地进行本地当然,也可以将数据库下载到本地进行本地Blast。前面讲的两两比对是一种特殊的。
20、前面讲的两两比对是一种特殊的blast。基因组基因组BLAST基本基本blast基本基本BLAST有有5种。种。粘贴序列粘贴序列结果显示结果显示结果显示结果显示结果显示结果显示3.3.2 多重序列的本地化软件对齐序列的本地化软件对齐例如:可采用例如:可采用ClustalX软件软件CLUSTAL是一种渐进的比对方法,先将多是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反映序列个序列两两比对构建距离矩阵,反映序列之间两两关系;然后根据距离矩阵计算产之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始
21、,行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。直到所有序列都被加入为止。Clustal的渐进比对过程的渐进比对过程在比对过程中,先对所有的序列进行两两在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。间进行比对,计算相似性分值。根据相似性分值继续分组比对,直到得到根据相似性分值继续分组比对,直到得到最终比对结果。在比对过程中,相似性程最终比对结果
22、。在比对过程中,相似性程度较高的序列先进行比对而距离较远的序度较高的序列先进行比对而距离较远的序列添加在后面。列添加在后面。Clustal的工作原理Clustal输入多个序列输入多个序列快速的序列两两比对,计算序列间的快速的序列两两比对,计算序列间的距离,获得一个距离矩阵。距离,获得一个距离矩阵。采用邻接法(采用邻接法(NJ)构建一个树(引导树)构建一个树(引导树)根据引导树,渐进比对多个序列。根据引导树,渐进比对多个序列。Clustal的输入输出格式的输入输出格式 输入序列的格式比较灵活,可以是前面介绍输入序列的格式比较灵活,可以是前面介绍过的过的FASTA格式,还可以是格式,还可以是PIR
23、、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等等格式。格式。 输出格式也可以选择,有输出格式也可以选择,有ALN、GCG、PHYLIP和和NEXUS等,用户可以根据自己的等,用户可以根据自己的需要选择合适的输出格式。需要选择合适的输出格式。将要比对的多个序列以将要比对的多个序列以Fasta格式保存格式保存以多个物种的抗坏血酸过氧化物酶的的蛋以多个物种的抗坏血酸过氧化物酶的的蛋白质序列进行比对为例白质序列进行比对为例载入多个序列后,选择输出选项,选择输出格式。载入多个序列后,选择输出选项,选择输出格式。或者在比对完成之后,在或者在比对完成之后,在“文件文件”中选择中选择
24、“序列序列另存为另存为”,同样可以选择合适的输出格式。,同样可以选择合适的输出格式。选择选择“进行完全比对进行完全比对”,输出的文件路径自动与原始,输出的文件路径自动与原始的序列文件的路径一致。的序列文件的路径一致。Clustal比对结果星号:完全一致星号:完全一致峰:表示一致程度高峰:表示一致程度高谷:表示一致程度低谷:表示一致程度低3.3.3 Clustal比对结果的编辑Clustal比对之后的结果,可以采用其他软件进比对之后的结果,可以采用其他软件进行编辑,如行编辑,如BioEdit软件、软件、GeneDoc软件,但必软件,但必须注意所用软件的输入文件的格式。须注意所用软件的输入文件的格
25、式。BioEdit软件不能识别软件不能识别“.aln”格式,但可识别格式,但可识别“.pir”或或“.phy”格式文件。格式文件。也可以采用一些在线的着色软件来编辑也可以采用一些在线的着色软件来编辑Clustal比对结果。如比对结果。如Boxshade软件,网址:软件,网址:http:/www.ch.embnet.org/software/BOX_form.html 本地软件编辑比对结果:以本地软件编辑比对结果:以BioEdit软件为例软件为例各种调整图形各种调整图形的参数可选。的参数可选。相当于相当于“复制复制”键,可黏贴到其他键,可黏贴到其他文件,如文件,如“word、PowerPoint
26、”等等这是粘贴后的结果102030405060708090100.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|barley_AAL08496_MAAKCYPTVSDEYLAAVAKARRKLRGLIAEKNCAPLMLRLAWHSAGTFDVATKTGGPFGTMKCPAELAHGANAGLDIAVRLLEPIKEQFPILSYADFYQLwheat_ACO90196_-.maize_ACG41151_-MV.A.NED.K.D.K.N.Q.E.I.millet_ABP65326_-M.A.QE.E.A.S.S.N.Q.M.V.E.L.cotton_ACT56
27、517_-MT.ED.QN.Q.K.K.Q.A.N.L.cocoa_ABR68691_-MT.E.KK.E.K.I.K.R.Q.N.T.tobacoo_BAA12918_-MG.E.K.D.CK.Y.CS.RFK.QG.N.I.I.G.capsicum_CAA57140_-MG.E.K.D.CK.Y.CS.RFKT.QS.N.I.L.LG.tea_ABD97259_-MG.E.KK.ID.K.I.Y.T.RHKL.QG.N.E.I.strawberry_AAD41405_-MG.E.KK.ID.K.Y.K.Q.N.oil-MG.S.K.E.QK.D.CKK.F.F.I.Y.K.F.T.N.D.
28、G.grape_AAZ79357_-MG.S.E.KK.E.K.I.I.K.R.M.E.N.I.mustard_AAN60795_-MT.S.ED.QK.IE.CK.I.V.C.S.RFD.QG.S.IH.L.D.R.TI.F.H.110120130140150160170180190200.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|.|barley_AAL08496_AGVVAVEVTGGPEVPFHPGRQDKPEPPPEGRLPDATQGSDHLRQVFSTQMGLSDQDIVALSGGHTLGRCHKERSGFEGAWTANPLIFDNSYFTELLSG
29、EKwheat_ACO90196_.P.R.K.D.maize_ACG41151_.D.A.D.S.K.millet_ABP65326_.I.E.Q.K.GK.P.R.V.K.T.D.cotton_ACT56517_.I.I.E.H.N.E.A.N.P.T.K.T.cocoa_ABR68691_.I.I.E.H.K.A.TA.P.T.M.V.tobacoo_BAA12918_.D.E.T.V.K.D.VK.K.P.T.capsicum_CAA57140_.D.E.V.K.D.VK.P.K.G.tea_ABD97259_.I.D.E.V.K.T.D.VKH.T.K.P.T.strawberry_
30、AAD41405_.D.E.GK.E.GKT.A.P.P.V.oil.I.I.E.S.E.K.D.G-H.S.K.grape_AAZ79357_.I.E.K.C.V.N.K.A.P.S.K.mustard_AAN60795_.I.E.Q.K.C.TK.K.A.D.S.K.T.210220230240250.|.|.|.|.|.|.|.|.|.|.|.barley_AAL08496_EGLLQLPTDKVLLTDPAFRPLVDKYAADEDAFFADYAEAHLKLSELGFGEASEGCCwheat_ACO90196_.S.T.V.E.K.E.K.R.YA.-maize_ACG41151_.
31、S.A.S.S.A.-millet_ABP65326_.S.T.S.V.E.K.D.K.R.AD.-cotton_ACT56517_A.S.V.T.AD.-cocoa_ABR68691_.D.K.V.S.V.T.AD.-tobacoo_BAA12918_.S.A.S.E.A.V-capsicum_CAA57140_.S.A.S.E.A.-tea_ABD97259_.SG.A.N.V.E.M.A.-strawberry_AAD41405_.A.S.V.E.L.QR.A.-oil.S.A.V.E.A.-grape_AAZ79357_.S.A.S.E.E.K.AD.-mustard_AAN60795
32、_.VS.A.D.V.E.E.AD.-(2)以)以GeneDoc为例为例选择选择Clustal比对后的结果,其中的比对后的结果,其中的“.aln”文件,将其文件,将其打开。当然,如果打开。当然,如果Clustal比对的之后,有将文件另存为比对的之后,有将文件另存为其它格式,也可以打开,如其它格式,也可以打开,如“.PIR”、“phy”格式文件。格式文件。在在“Edit”中选择中选择“Select Blocks for copy”,即:选择某个区域用于复制。即:选择某个区域用于复制。选择了某个选择了某个block后,再选择后,再选择“copy selected blocks to” “metfl
33、ie”等。相当等。相当于将所选的于将所选的block复制了。然后再黏贴到复制了。然后再黏贴到word文件中。文件中。复制到复制到word中的结果。中的结果。 barley_AAL : wheat_ACO9 : maize_ACG4 : millet_ABP : cotton_ACT : cocoa_ABR6 : tobacoo_BA : capsicum_C : tea_ABD972 : strawberry : oil : grape_AAZ7 : mustard_AA : * 20 * 40 * 60 * 80 MAAKCYPTVSDEYLAAVAKARRKLRGLIAEKNCAPLMLR
34、LAWHSAGTFDVATKTGGPFGTMKCPAELAHGANAGLDIAVRL-VSDEYLAAVAKARRKLRGLIAEKNCAPLMLRLAWHSAGTFDVATKTGGPFGTMKCPAELAHGANAGLDIAVRL-MVKAYPTVNEDYLKAVDKAKRKLRGLIAEKNCAPLMLRLAWHSAGTFDVATKTGGPFGTMKNPAEQAHGANAGLEIAIRL-MAKCYPTVSAEYQEAVEKARRKLRALIAEKSCAPLMLRLAWHSAGTFDVSTKTGGPFGTMKNPAEQAHGANAGLDIAVRM-MTKCYPTVSEDYQNAVQKAKR
35、KLRGLIAEKNCAPLMLRLAWHSAGTFDVKTKTGGPFGTMKQPAELAHAANNGLDIAVRL-MTKCYPTVSEEYKKAVEKAKRKLRGLIAEKNCAPIMLRLAWHSAGTFDVKTRTGGPFGTMKQPAELAHGANNGLDIAVRL-MGKCYPTVSEEYLKAVDKCKRKLRGLIAEKNCAPLMLRLAWHSAGTYDVCSKTGGPFGTMRFKAEQGHGANNGIDIAIRL-MGKCYPTVSEEYLKAVDKCKRKLRGLIAEKNCAPLMLRLAWHSAGTYDVCSKTGGPFGTMRFKTEQSHGANNGIDIAL
36、RL-MGKCYPTVSEEYKKAIDKAKRKLRGLIAEKNCAPIMLRLAWHSAGTYDVTTKTGGPFGTMRHKLEQGHGANNGLEIAVRL-MGKCYPTVSEEYKKAIDKAKRKLRGLIAEKNCAPLMLRLAWHSAGTYDVKTKTGGPFGTMKQPAELAHGANNGLDIAVRL-MGKSYPKVSEEYQKAVDKCKKKFRGFIAEKNCAPLMLRIAWHSAGTYDVKTKTGGPFGTMKFPTELAHGANNGLDIAVRL-MGKSYPTVSEEYKKAVEKARKKLRGLIAEKNCAPIMLRIAWHSAGTFDVKTRTG
37、GPFGTMKMPEELAHGANNGLDIAVRL-MTKSYPTVSEDYQKAIEKCKRKLRGLIAEKNCAPIMVRLAWHSAGTFDCASKTGGPFGTMRFDAEQGHGANSGIHIALRL m k yptVseeY A6 K 44KlRglIAEKnCAP6M6R6AWHSAGT5Dv 34TGGPFGTM4 E HgAN G6dIA6R6 : 81 : 73 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 80 : 80 barley_AAL : wheat_ACO9 : maize_ACG4 : millet_ABP
38、: cotton_ACT : cocoa_ABR6 : tobacoo_BA : capsicum_C : tea_ABD972 : strawberry : oil : grape_AAZ7 : mustard_AA : * 100 * 120 * 140 * 160 LEPIKEQFPILSYADFYQLAGVVAVEVTGGPEVPFHPGRQDKPEPPPEGRLPDATQGSDHLRQVFSTQMGLSDQDIVALSGLEPIKEQFPILSYADFYQLAGVVAVEVTGGPEVPFHPGRQDKPEPPPEGRLPDATQGSDHLRQVFSTQMGLSDQDIVALSGLE
39、PIKEQFPILSYADFYQLAGVVAVEVTGGPDVPFHPGRQDKPEAPPEGRLPDATQGSDHLRQVFSTQMGLSDQDIVALSGLEPVKEEFPILSYADLYQLAGVVAVEVTGGPEIPFHPGREDKPQPPPEGRLPDATKGSDHLRQVFGKQMGLSDQDIVALSGLEPIKEQLPILSYADFYQLAGVVAVEITGGPEIPFHPGREDKPHPPPEGRLPNATEGADHLRQVFSNQMGLSDQDIVALSGLEPIKEQFPILTYADFYQLAGVVAVEITGGPEIPFHPGREDKPHPPPEGRLPDATKGAD
40、HLRQVFTAQMGLSDQDIVALSGLEPIKEQFPILSYGDFYQLAGVVAVEVTGGPDVPFHPGREDKTEPPVEGRLPDATKGSDHLRDVFVKQMGLSDKDIVALSGLEPLGEQFPILSYADFYQLAGVVAVEVTGGPDVPFHPGREDKPEPPVEGRLPDATKGSDHLRDVFVKQMGLSDQDIVALSGLEPIKEQFPIISYADFYQLAGVVAVEITGGPDVPFHPGREDKPEPPVEGRLPDATKGTDHLRDVFVKHMGLTDKDIVALSGLEPIKEQFPILSYADFYQLAGVVAVEVTGGPDVPF
41、HPGREDKPEPPPEGRLPDAGKGSDHLREVFGKTMGLSDQDIVALSGLDPIKEQFPILSYGDFYQLAGVVAVEITGGPEIPFHPGREDKSEPPEEGRLPDATKGSDHLRDVFG-HMGLSDQDIVALSGLEPIKEQFPIISYADFYQLAGVVAVEVTGGPEIPFHPGREDKPEPPPEGRLPDATKGCDHLRQVFVTQMGLNDKDIVALSGLDPIREQFPTISFADFHQLAGVVAVEVTGGPEIPFHPGREDKPQPPPEGRLPDATKGCDHLRQVFTKQMGLSDKDIVALSGLeP6 E2fPi6
42、35aDfyQLAGVVAVE6TGGP 6PFHPGR2DKp pP EGRLP1At G DHLR VF qMGL D DIVALSG : 162 : 154 : 161 : 161 : 161 : 161 : 161 : 161 : 161 : 161 : 160 : 161 : 161 barley_AAL : wheat_ACO9 : maize_ACG4 : millet_ABP : cotton_ACT : cocoa_ABR6 : tobacoo_BA : capsicum_C : tea_ABD972 : strawberry : oil : grape_AAZ7 : mus
43、tard_AA : * 180 * 200 * 220 * 240 GHTLGRCHKERSGFEGAWTANPLIFDNSYFTELLSGEKEGLLQLPTDKVLLTDPAFRPLVDKYAADEDAFFADYAEAHLKLGHTLGRCHKERSGFEGPWTRNPLKFDNSYFTELLSGDKEGLLQLPSDKTLLTDPVFRPLVEKYAADEKAFFEDYKEAHLRLGHTLGRCHKDRSGFEGAWTSNPLIFDNSYFKELLSGEKEGLLQLPSDKALLSDPSFRPLVDKYAADEDAFFADYAEAHLKLGHTLGRCHKERSGFEGPWTRNPL
44、VFDNSYFKELLTGDKEGLLQLPSDKTLLSDPVFRPLVEKYAADEKAFFDDYKEAHLRLGHTLGRCHKERSGFEGPWTTNPLIFDNSYFKELLTGEKAGLLQLPTDKVLLSDPVFRPLVDKYAADEDAFFADYTEAHLKLGHTLGRCHKERSGFEGPWTTNPLIFDNSYFMELLVGEKEDLLKLPTDVVLLSDPVFRPLVDKYAADEDAFFADYTEAHLKLGHTLGRCHKERSGFEGPWTTNPLIFDNSYFTELLSGEKEGLLQLPSDKALLSDPAFRPLVEKYAADEDAFFADYAEAHLK
45、LGHTLGRCHKERSGFEGPWTANPLIFDNSYFKELLGGEKEGLLQLPSDKALLSDPAFRPLVEKYAADEDAFFADYAEAHLKLGHTLGRCHKERSGFEGPWTANPLIFDNSYFTELLTGEKEGLLQLPSGKALLNDPVFRPLVEKYAADEDAFFADYAEAHMKLGHTLGRAHKERSGFEGPWTPNPLIFDNSYFTVLLSGEKEGLLQLPTDKALLSDPVFRPLVEKYAADEDAFFADYALAHQRLGHTLGRCHKERSGFEGAWTSNPLIFDNSYFKELLSGEKEGLLQLPSDKALLTDPVF
46、RPLVEKYAADEDAFFADYAEAHLKLAHTLGRCHKERSGFEGPWTSNPLIFDNSYFKELLSGEKEGLLQLPSDKALLSDPAFRPLVEKYAADEDAFFEDYKEAHLKLAHTLGRCHKDRSGFEGAWTSNPLIFDNSYFKELLTGEKEGLLQLVSDKALLDDPVFRPLVEKYAADEEAFFADYAEAHLKLgHTLGRcHKeRSGFEG WT NPL FDNSYF eLL GeKegLLqLp3dk LL DP FRPLV KYAADEdAFFaDY eAH 4L : 243 : 235 : 242 : 242 : 242 :
47、 242 : 242 : 242 : 242 : 242 : 241 : 242 : 242 barley_AAL : wheat_ACO9 : maize_ACG4 : millet_ABP : cotton_ACT : cocoa_ABR6 : tobacoo_BA : capsicum_C : tea_ABD972 : strawberry : oil : grape_AAZ7 : mustard_AA : * SELGFGEASEGCCSELGYAEA-SELGFAEA-SELGFADA-SELGFADA-SELGFADA-SELGFAEV-SELGFAEA-SELGFAEA-SELG
48、FAEA-SELGFAEA-SELGFADA-SELGFADA-SELG5a a : 256 : 243 : 250 : 250 : 250 : 250 : 250 : 250 : 250 : 250 : 249 : 250 : 250 在线的着色软件编辑在线的着色软件编辑clustal比对结果:比对结果: 以以Boxshade为例为例网址:网址:http:/www.ch.embnet.org/software/BOX_form.html输出格式:默认为输出格式:默认为Photoshop格式;格式;可选可选RFT-New格式便于在格式便于在word中操中操作。作。一致序列:可选择用字母、符号一
49、致序列:可选择用字母、符号来表示或者不显示一致序列。来表示或者不显示一致序列。输入格式选择输入格式选择“aln”将将clustal比对后的比对后的“.aln”文件文件用记事本打开,全选后黏贴用记事本打开,全选后黏贴点击运行点击运行程序程序点击下载,即可。点击下载,即可。知识点知识点概念:同源性、相似性、一致性、直系同概念:同源性、相似性、一致性、直系同源、旁系同源、全局比对、局部比对、双源、旁系同源、全局比对、局部比对、双序列比对的显著性序列比对的显著性熟悉熟悉BLAST的比对及对结果的解读的比对及对结果的解读熟悉熟悉ClustalX的使用及结果的编辑的使用及结果的编辑熟悉熟悉BioEdit等软件等软件