生物信息學(xué)2016-9-序列比對(duì)_第1頁(yè)
生物信息學(xué)2016-9-序列比對(duì)_第2頁(yè)
生物信息學(xué)2016-9-序列比對(duì)_第3頁(yè)
生物信息學(xué)2016-9-序列比對(duì)_第4頁(yè)
生物信息學(xué)2016-9-序列比對(duì)_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Liaoning University Bioinformatics 生物信息學(xué)生物信息學(xué)Life Science SchoolHongsheng Liu Prof.Liaoning University Bioinformatics 第第三三章:章:序列比對(duì)序列比對(duì)Liaoning University Bioinformatics 序列比對(duì)的基本概念序列比對(duì)的基本概念 打分矩陣打分矩陣 序列比對(duì)算法序列比對(duì)算法 序列序列比對(duì)軟件使用方法介紹比對(duì)軟件使用方法介紹Liaoning University Bioinformatics 序列比對(duì)軟件使用方法介紹序列比對(duì)軟件使用方法介紹Liaonin

2、g University Bioinformatics 一致性:一致性指兩個(gè)序列相同的程度。保守性:某一氨基酸殘基或序列的改變(突變)保持了原始氨基酸殘基的物理化學(xué)特征,那么這個(gè)突變就是保守的。相似性:相似性表示序列之間相關(guān)聯(lián)的程度。與一致性比較相似性進(jìn)一步考慮了發(fā)生保守突變的氨基酸的數(shù)目,即考慮了相似氨基酸的數(shù)目。同源性:如果兩個(gè)序列是來(lái)源于一個(gè)共同的祖先,那么他們是同源的。內(nèi)容回顧內(nèi)容回顧Liaoning University Bioinformatics l匹配:匹配:豎線(豎線(| |)l相似:相似:雙點(diǎn)(雙點(diǎn)(: :)l較弱的相似:較弱的相似:?jiǎn)吸c(diǎn)(單點(diǎn)(. .)l空位:空位:短橫線

3、(短橫線(- -)l不相似的替換:不相似的替換:空白空白序列比對(duì)結(jié)果的表示方法Liaoning University Bioinformatics 兩序列進(jìn)行比對(duì),通常使一個(gè)得分矩陣(兩序列進(jìn)行比對(duì),通常使一個(gè)得分矩陣(scoring scoring matixmatix)來(lái)計(jì)算比對(duì)的分值,以得到一個(gè)評(píng)價(jià)優(yōu)劣的)來(lái)計(jì)算比對(duì)的分值,以得到一個(gè)評(píng)價(jià)優(yōu)劣的標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。 核酸的得分矩陣:核酸的得分矩陣:等價(jià)矩陣、等價(jià)矩陣、BLASTBLAST矩陣矩陣 蛋白質(zhì)的得分矩陣:蛋白質(zhì)的得分矩陣:等價(jià)矩陣、等價(jià)矩陣、PAMPAM矩陣、矩陣、BLUSOMBLUSOM矩矩陣陣 存在空位(存在空位(GapGap)是要

4、進(jìn)行空位罰分()是要進(jìn)行空位罰分(Gap penaltyGap penalty)Liaoning University Bioinformatics 序列比對(duì)常用軟件使用方法序列比對(duì)常用軟件使用方法l點(diǎn)陣法:點(diǎn)陣法:http:/myhits.isb-sib.ch/cgi-bin/dotlethttp:/myhits.isb-sib.ch/cgi-bin/dotletl動(dòng)態(tài)規(guī)劃算法動(dòng)態(tài)規(guī)劃算法: : 全局序列比對(duì):全局序列比對(duì):Needleman-WunschNeedleman-Wunsch算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_needle/http:

5、/www.ebi.ac.uk/Tools/psa/emboss_needle/局部局部序列比對(duì)序列比對(duì):Smith-Waterman算法算法http:/www.ebi.ac.uk/Tools/psa/emboss_water/http:/www.ebi.ac.uk/Tools/psa/emboss_water/雙序列比對(duì)常用軟件雙序列比對(duì)常用軟件Liaoning University Bioinformatics l全局比對(duì):全局比對(duì):對(duì)序列從頭到尾進(jìn)行比較。試圖使盡可能對(duì)序列從頭到尾進(jìn)行比較。試圖使盡可能多的字符在同一序列中匹配。全局比對(duì)適用于相似度多的字符在同一序列中匹配。全局比對(duì)適用于相

6、似度較高而長(zhǎng)度相近的序列。較高而長(zhǎng)度相近的序列。例子例子1 1:使用:使用Needleman-WunschNeedleman-Wunsch算法對(duì)人算法對(duì)人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4蛋白進(jìn)行全局比對(duì)蛋白進(jìn)行全局比對(duì) 首先在UNIPROT數(shù)據(jù)庫(kù)( /)中下載人RBP4蛋白(P02753)和小鼠RBP4蛋白(Q00724)的氨基酸序列 然后打開(kāi)Needleman-Wunsch算法程序(Needle)的在線服務(wù)器網(wǎng)址 把人RBP4序列和小鼠RBP4序列分別粘貼到兩個(gè)文本框中 如果需要可以調(diào)整比對(duì)的參數(shù),如:得分矩陣,空位罰分等 然后提

7、交具體步驟:具體步驟:Liaoning University Bioinformatics 粘貼序列粘貼序列粘貼序列粘貼序列修改參數(shù)修改參數(shù)提交提交Liaoning University Bioinformatics 人人RBP4RBP4蛋白和小鼠蛋白和小鼠RBP4RBP4全局序列比對(duì)全局序列比對(duì)結(jié)果結(jié)果一致性一致性相似性相似性空位空位得分得分序列比對(duì)結(jié)果序列比對(duì)結(jié)果Liaoning University Bioinformatics l局部比對(duì):局部比對(duì):尋找序列中相似度最高的區(qū)域,也就是匹尋找序列中相似度最高的區(qū)域,也就是匹配密度最高的部分。局部比對(duì)適用于某些部位相似度配密度最高的部分。局

8、部比對(duì)適用于某些部位相似度較高,而其他部位差異較大的序列。較高,而其他部位差異較大的序列。例子例子2 2:使用:使用Smith-WatermanSmith-Waterman算法對(duì)人算法對(duì)人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白進(jìn)行局部比對(duì)蛋白進(jìn)行局部比對(duì) 首先在UNIPROT數(shù)據(jù)庫(kù)中下載人RBP4蛋白(P02753)和人lipocalin1蛋白(P31025)的氨基酸序列 然后打開(kāi)Smith-Waterman算法程序(Water)的在線服務(wù)器網(wǎng)址 把人RBP4序列和人lipocalin1蛋白序列分別粘貼到兩個(gè)文本框中 如果需要可以調(diào)整比對(duì)的參數(shù),如:得分矩

9、陣,空位罰分等 然后提交具體步驟:具體步驟:Liaoning University Bioinformatics 人人RBP4RBP4蛋白和人蛋白和人lipocalin1lipocalin1蛋白局蛋白局部比對(duì)結(jié)果部比對(duì)結(jié)果比對(duì)不是從第一個(gè)氨基酸比對(duì)不是從第一個(gè)氨基酸開(kāi)始的,也不是到最后一開(kāi)始的,也不是到最后一個(gè)氨基酸結(jié)束,而是找出個(gè)氨基酸結(jié)束,而是找出了相似性最高的一部分了相似性最高的一部分(局部比對(duì))(局部比對(duì))全局比對(duì)結(jié)果全局比對(duì)結(jié)果Liaoning University Bioinformatics 多序列比對(duì),實(shí)際上是一組蛋白質(zhì)之間的一系列的雙序列比對(duì)。與雙序列比對(duì)相比,多序列比對(duì)更能

10、發(fā)現(xiàn)進(jìn)化保守關(guān)系信息。在雙序列比對(duì)中出現(xiàn)的相同的氨基酸殘基,雖然在兩條序列上是保守的,但這種保守可能只是偶然的。而如果某一位點(diǎn)在多序列比對(duì)的都出現(xiàn)了相同的氨基酸殘基,則說(shuō)明該殘基是進(jìn)化保守的可能性更大。多序列比對(duì)多序列比對(duì)Liaoning University Bioinformatics 序列分別為雞、小鼠、序列分別為雞、小鼠、人、豬和牛的人、豬和牛的RBP4蛋白蛋白使用了使用了Clustal Omega軟件軟件通過(guò)多序列比對(duì)可以發(fā)通過(guò)多序列比對(duì)可以發(fā)現(xiàn)現(xiàn)RBP4蛋白中的大部分蛋白中的大部分氨基酸殘基在多個(gè)哺乳氨基酸殘基在多個(gè)哺乳動(dòng)物中都保守。動(dòng)物中都保守。Liaoning Universi

11、ty Bioinformatics 序列分別為人的載脂蛋序列分別為人的載脂蛋白白D,人視黃醇結(jié)合蛋白,人視黃醇結(jié)合蛋白4,孕激素相關(guān)子宮內(nèi)膜,孕激素相關(guān)子宮內(nèi)膜蛋白,補(bǔ)體蛋白,補(bǔ)體8(肽),肽),lipocalin1,人氣味結(jié)合,人氣味結(jié)合蛋白蛋白2A, -1微球蛋白,微球蛋白,嗜中性明膠酶相關(guān)蛋白,嗜中性明膠酶相關(guān)蛋白,前列腺素前列腺素D2合成酶合成酶通過(guò)多序列比對(duì)可以發(fā)通過(guò)多序列比對(duì)可以發(fā)現(xiàn)人這些旁系同源物序現(xiàn)人這些旁系同源物序列高度趨異,互相之間列高度趨異,互相之間的相似度并不高。的相似度并不高。但都存在一個(gè)保守的模但都存在一個(gè)保守的模體:體:GXW,即甘氨酸,即甘氨酸-任任意氨基酸意氨

12、基酸-色氨酸。色氨酸。GXW保守保守模體模體Liaoning University Bioinformatics Clustal OmegaClustal Omegahttp:/www.ebi.ac.uk/Tools/msa/clustalo/http:/www.ebi.ac.uk/Tools/msa/clustalo/MUSCLEMUSCLEhttp:/www.ebi.ac.uk/Tools/msa/muscle/http:/www.ebi.ac.uk/Tools/msa/muscle/CLUSTAL XCLUSTAL X/clustal2/http

13、://clustal2/(下載網(wǎng)站)(下載網(wǎng)站)MEGAMEGA(分子發(fā)育分析綜合軟件,集成了(分子發(fā)育分析綜合軟件,集成了ClustalWClustalW和和MUSCLEMUSCLE)http:/ (下載網(wǎng)站)(下載網(wǎng)站)多序列比對(duì)常用軟件多序列比對(duì)常用軟件Liaoning University Bioinformatics 例子例子3 3:使用:使用Clustal OmegaClustal Omega比對(duì)人比對(duì)人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋蛋白,雞白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋

14、白的氨基酸序列蛋白的氨基酸序列 首先在UNIPROT數(shù)據(jù)庫(kù)中下載人RBP4蛋白(P02753),小鼠RBP4蛋白(Q00724),雞RBP4蛋白(P41263),豬RBP4蛋白(P27485),牛RBP4蛋白(P18902)的氨基酸序列 然后打開(kāi)Clustal Omega的在線服務(wù)器網(wǎng)址 把所有蛋白序列粘貼到文本框中,也可以直接上傳FASTA文件 然后提交具體步驟:具體步驟:Liaoning University Bioinformatics 多序列比對(duì)結(jié)果多序列比對(duì)結(jié)果ALNALN格式,參照格式,參照第三節(jié)課第三節(jié)課PPTPPT中中介紹介紹Liaoning University Bioinf

15、ormatics 例子例子4 4:使用:使用ClstalXClstalX比對(duì)人比對(duì)人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,雞蛋白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序列蛋白的氨基酸序列 打開(kāi)ClustalX后,點(diǎn)擊File Load Sequences,加載包含上述蛋白序列的FASTA文件 然后點(diǎn)擊Alignment Do complete alignment,選擇好比對(duì)結(jié)果文件的文件夾,進(jìn)行序列比對(duì)具體步驟:具體步驟:lClustalX是需要安裝的軟件,需要先下載,安裝之后才能使用。Liaoning Univer

16、sity Bioinformatics Liaoning University Bioinformatics 例子例子5 5:使用:使用MEGAMEGA中的中的ClustalWClustalW比對(duì)人比對(duì)人RBP4RBP4蛋白,小鼠蛋白,小鼠RBP4RBP4蛋白,雞蛋白,雞RBP4RBP4蛋白,豬蛋白,豬RBP4RBP4蛋白,牛蛋白,牛RBP4RBP4蛋白的氨基酸序蛋白的氨基酸序列列 打開(kāi)MEGA后,點(diǎn)擊Align Edit/Built Alignment Create New Alignment Protein,出現(xiàn)序列編輯的界面 可以將蛋白質(zhì)序列粘貼進(jìn)去,也可以通過(guò)菜單欄Data Open

17、Retrieve Sequences from File,加載包含上述蛋白序列的FASTA文件 然后點(diǎn)擊W按鈕或通過(guò)菜單欄Alignment Alignment by Clustal 出現(xiàn)參數(shù)頁(yè)面,可以調(diào)整參數(shù),一般都使用默認(rèn)參數(shù),點(diǎn)擊OK進(jìn)行序列比對(duì)具體步驟:具體步驟:lMEGA也需要安裝之后才能使用。Liaoning University Bioinformatics Liaoning University Bioinformatics Liaoning University Bioinformatics Clustal WLiaoning University Bioinformatics ClustalW的參數(shù)設(shè)置頁(yè)面,一般的參數(shù)設(shè)置頁(yè)面,一般情況下使用默認(rèn)參數(shù)情況下使用默認(rèn)參數(shù)Liaoning University Bioinformatics Liaoning University Bioinformatics 課堂練習(xí)題課堂練習(xí)題練習(xí)課件中的例子1-5使用Clast

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論