




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Chapter 6 Analysis of Sequence Alignment and Molecular Evolution of Proteins Part One利用網(wǎng)絡(luò)數(shù)據(jù)庫資源,將用戶所測定的蛋白利用網(wǎng)絡(luò)數(shù)據(jù)庫資源,將用戶所測定的蛋白質(zhì)序列與已知序列進(jìn)行相似性比對,是推斷質(zhì)序列與已知序列進(jìn)行相似性比對,是推斷該序列的結(jié)構(gòu)、功能以及同源關(guān)系的強(qiáng)有力該序列的結(jié)構(gòu)、功能以及同源關(guān)系的強(qiáng)有力的手段。的手段。序列相似性比對包括序列相似性比對包括全局序列比對全局序列比對(整體比(整體比對)與對)與局部序列比對局部序列比對。由于局部序列相似性比對更能反映蛋白質(zhì)片由于局部序列相似性比對更能反映蛋白
2、質(zhì)片段序列在結(jié)構(gòu)與功能上的同源關(guān)系,故更具段序列在結(jié)構(gòu)與功能上的同源關(guān)系,故更具有實(shí)際意義。有實(shí)際意義。序列相似性序列相似性與與序列同源性序列同源性是兩個不同的概念。是兩個不同的概念。序列相似性(序列相似性(similarity)是一量化參數(shù),反映序列之是一量化參數(shù),反映序列之間相似或相同的程度。也可用間相似或相同的程度。也可用序列一致性(序列一致性(identity)來表示。來表示。序列同源性(序列同源性(homology)則是反映序列之間在進(jìn)化則是反映序列之間在進(jìn)化上親緣關(guān)系的遠(yuǎn)近。上親緣關(guān)系的遠(yuǎn)近。一般說來,序列相似性或一致性越大,則序列之間具一般說來,序列相似性或一致性越大,則序列之間
3、具有同源關(guān)系的可能性越大。有同源關(guān)系的可能性越大。6.1 6.1 局部序列相似性的局部序列相似性的兩兩比對兩兩比對局部序列相似性的兩兩比對就是將用戶提交的局部序列相似性的兩兩比對就是將用戶提交的一段蛋白質(zhì)序列,與數(shù)據(jù)庫中已知的蛋白質(zhì)序一段蛋白質(zhì)序列,與數(shù)據(jù)庫中已知的蛋白質(zhì)序列進(jìn)行局部序列相似性比對,以確定二者在序列進(jìn)行局部序列相似性比對,以確定二者在序列結(jié)構(gòu)與功能上的同源關(guān)系。列結(jié)構(gòu)與功能上的同源關(guān)系。目前,進(jìn)行局部序列相似性比對十分有用的網(wǎng)目前,進(jìn)行局部序列相似性比對十分有用的網(wǎng)絡(luò)工具軟件是絡(luò)工具軟件是NCBI的的BLAST服務(wù)程序和服務(wù)程序和EBI的的FASTA服務(wù)程序。服務(wù)程序。由于二者
4、的實(shí)際檢索過程具有許多相似之處,由于二者的實(shí)際檢索過程具有許多相似之處,故這里僅介紹故這里僅介紹BLAST服務(wù)程序。服務(wù)程序。局部比對基本檢索工具局部比對基本檢索工具(Basic Local Alignment Search Tool,BLAST),是由),是由NCBI開發(fā)的一種局部序列比對檢索系統(tǒng),主開發(fā)的一種局部序列比對檢索系統(tǒng),主要用于將用戶所提交的核苷酸或蛋白質(zhì)序列要用于將用戶所提交的核苷酸或蛋白質(zhì)序列與已知的數(shù)據(jù)庫序列資料進(jìn)行相似性比對。與已知的數(shù)據(jù)庫序列資料進(jìn)行相似性比對。6.1.1 BLAST6.1.1 BLAST檢索服務(wù)程序檢索服務(wù)程序相對于全序列比對而言,相對于全序列比對而言
5、,BLAST采用采用啟發(fā)式啟發(fā)式比對方式比對方式進(jìn)行進(jìn)行局部序列比對局部序列比對,因而能夠檢測出,因而能夠檢測出存在于各個不同區(qū)段的、具有相似性的序列。存在于各個不同區(qū)段的、具有相似性的序列。直接利用直接利用Web瀏覽器獲得瀏覽器獲得BLAST服務(wù)是最便捷服務(wù)是最便捷的途徑之一。的途徑之一。用戶在啟動用戶在啟動IE瀏覽器后,在地址欄中輸入瀏覽器后,在地址欄中輸入“/Blast.cgi”并并回車,即可進(jìn)入回車,即可進(jìn)入BLAST服務(wù)程序的主頁。此時,服務(wù)程序的主頁。此時,用戶可以根據(jù)自己的檢索目的,選擇不同的用戶可以根據(jù)自己的檢索目的,選擇
6、不同的BLAST檢索服務(wù)程序。檢索服務(wù)程序。允許用戶檢索與特定種屬的生物相關(guān)的序列,包括人允許用戶檢索與特定種屬的生物相關(guān)的序列,包括人類基因組、大鼠和小鼠基因組、果蠅基因組、微生物類基因組、大鼠和小鼠基因組、果蠅基因組、微生物基因組、植物基因組等?;蚪M、植物基因組等。主要用于:主要用于:對待檢索序列作圖;對待檢索序列作圖;決定基因組的結(jié)構(gòu);決定基因組的結(jié)構(gòu);鑒定新的基因。鑒定新的基因。 BLAST Assembled Refseq Genomes(基(基因組參考序列因組參考序列BLAST)基本基本BLAST檢索服務(wù)程序包括:檢索服務(wù)程序包括: Nucleotide BLAST(blastn
7、)標(biāo)準(zhǔn)的核苷酸標(biāo)準(zhǔn)的核苷酸-核苷酸比對服務(wù)程序,用核苷酸比對服務(wù)程序,用于單條待檢索序列的鑒定,或查找與之相于單條待檢索序列的鑒定,或查找與之相似的核苷酸序列。似的核苷酸序列。 Basic BLAST(基本(基本BLAST) Protein BLAST(blastp)標(biāo)準(zhǔn)的蛋白質(zhì)標(biāo)準(zhǔn)的蛋白質(zhì)-蛋白質(zhì)蛋白質(zhì)BLAST,用于待檢,用于待檢索序列的鑒定,或查找與之相似的蛋白質(zhì)索序列的鑒定,或查找與之相似的蛋白質(zhì)序列。序列。序列輸入?yún)^(qū)序列輸入?yún)^(qū)數(shù)據(jù)庫選擇數(shù)據(jù)庫選擇檢索程序選擇檢索程序選擇運(yùn)算參數(shù)選擇運(yùn)算參數(shù)選擇翻譯的核苷酸檢索序列翻譯的核苷酸檢索序列- -蛋白質(zhì)數(shù)據(jù)庫,蛋白質(zhì)數(shù)據(jù)庫,即將用戶提交的核苷
8、酸序列全部翻譯為即將用戶提交的核苷酸序列全部翻譯為蛋白質(zhì)序列,并與蛋白質(zhì)序列,并與NCBI的蛋白質(zhì)序列的蛋白質(zhì)序列數(shù)據(jù)庫進(jìn)行比對。數(shù)據(jù)庫進(jìn)行比對。 Translated query vs. protein database (blastx)遺傳密碼選擇遺傳密碼選擇蛋白質(zhì)檢索序列蛋白質(zhì)檢索序列- -核苷酸序列翻譯數(shù)據(jù)核苷酸序列翻譯數(shù)據(jù)庫,即將用戶提交的庫,即將用戶提交的蛋白質(zhì)序列與蛋白質(zhì)序列與NCBI核苷酸數(shù)據(jù)庫按全部讀碼框動態(tài)核苷酸數(shù)據(jù)庫按全部讀碼框動態(tài)翻譯的序列進(jìn)行比對。翻譯的序列進(jìn)行比對。 Protein query vs. translated database (tblastn)翻譯的
9、核苷酸檢索序列翻譯的核苷酸檢索序列- -核苷酸序列翻譯數(shù)核苷酸序列翻譯數(shù)據(jù)庫,即將用戶提交的核苷酸序列按據(jù)庫,即將用戶提交的核苷酸序列按6個個讀碼框翻譯為蛋白質(zhì)序列,再與讀碼框翻譯為蛋白質(zhì)序列,再與NCBI核苷核苷酸數(shù)據(jù)庫的酸數(shù)據(jù)庫的6個讀個讀碼框翻譯序列進(jìn)行比對。碼框翻譯序列進(jìn)行比對。 Translated query vs. translated database(tblastx) Specialized BLAST(特殊的(特殊的BLAST)6.1.2 6.1.2 序列格式序列格式為了將待檢索序列與數(shù)據(jù)庫序列進(jìn)行比對,用為了將待檢索序列與數(shù)據(jù)庫序列進(jìn)行比對,用戶必須按照一定的格式提交欲比
10、對的序列。戶必須按照一定的格式提交欲比對的序列。即貯存蛋白質(zhì)或核苷酸序列的文本文件格式,即貯存蛋白質(zhì)或核苷酸序列的文本文件格式,首行為描述行。首行為描述行。 FASTA Format純序列格式是不帶有純序列格式是不帶有FASTA格式描述行定義格式描述行定義的序列數(shù)據(jù),不允許出現(xiàn)空行,但可嵌入空格的序列數(shù)據(jù),不允許出現(xiàn)空行,但可嵌入空格和和/或數(shù)字?;驍?shù)字。 Net Sequence Format序列標(biāo)識格式即只輸入注冊號或序列標(biāo)識格式即只輸入注冊號或GI,不允許出,不允許出現(xiàn)空格符?,F(xiàn)空格符。 Sequence Identifier Format6.1.3 BLAST6.1.3 BLAST比對
11、數(shù)據(jù)庫的選擇比對數(shù)據(jù)庫的選擇用戶應(yīng)根據(jù)自己的檢索目的,選擇不同的用戶應(yīng)根據(jù)自己的檢索目的,選擇不同的NCBI數(shù)據(jù)庫以用于待檢索序列的比對分析。數(shù)據(jù)庫以用于待檢索序列的比對分析??晒┯脩暨x擇的數(shù)據(jù)庫包括核苷酸序列數(shù)據(jù)庫、可供用戶選擇的數(shù)據(jù)庫包括核苷酸序列數(shù)據(jù)庫、多肽序列數(shù)據(jù)庫及人類基因組序列數(shù)據(jù)庫等。多肽序列數(shù)據(jù)庫及人類基因組序列數(shù)據(jù)庫等。需注意某些數(shù)據(jù)庫對蛋白質(zhì)或核苷酸序列是有需注意某些數(shù)據(jù)庫對蛋白質(zhì)或核苷酸序列是有選擇的,不能與某一特定的選擇的,不能與某一特定的BLAST檢索服務(wù)檢索服務(wù)程序相結(jié)合使用。程序相結(jié)合使用。例如,不能使用例如,不能使用BLASTN程序檢索程序檢索UniProt蛋蛋
12、白質(zhì)序列數(shù)據(jù)庫。白質(zhì)序列數(shù)據(jù)庫。6.1.4 6.1.4 遺傳密碼表遺傳密碼表對于需進(jìn)行翻譯的序列,可供選對于需進(jìn)行翻譯的序列,可供選擇的遺傳密碼表及其相關(guān)聯(lián)的值擇的遺傳密碼表及其相關(guān)聯(lián)的值有:有:1 Standard(標(biāo)準(zhǔn)密碼);(標(biāo)準(zhǔn)密碼);2 Vertebrate Mitochondrial(脊椎動物線(脊椎動物線粒體密碼);粒體密碼);3 Yeast Mitochondrial(酵母線粒體密碼);(酵母線粒體密碼);4 Mold Mitochondrial and Mycoplasma/ Spiroplasma(霉菌線粒體和(霉菌線粒體和支原體支原體/螺旋體密碼)等。螺旋體密碼)等。6.
13、1.5 6.1.5 評分系統(tǒng)評分系統(tǒng)BLASTP、BLASTX、TBLASTN 和和TBLASTX程序所使用的評分系統(tǒng)為評分矩陣,主要有兩大程序所使用的評分系統(tǒng)為評分矩陣,主要有兩大類:類:第一類為第一類為模塊替換矩陣模塊替換矩陣(blocks substitution matrix,BLOSUM),該矩陣),該矩陣是由是由Henikoff夫婦于夫婦于1992年建立的,它以序年建立的,它以序列片段為基礎(chǔ),基于蛋白質(zhì)模塊數(shù)據(jù)庫列片段為基礎(chǔ),基于蛋白質(zhì)模塊數(shù)據(jù)庫BLOCKS,考慮了序列片段中相鄰殘基之間,考慮了序列片段中相鄰殘基之間的關(guān)系。的關(guān)系。BLOSUM Score Matrix在進(jìn)行相似性
14、比對時,如在進(jìn)行相似性比對時,如相相同殘基的分值越高同殘基的分值越高,則表示,則表示其其越保守越保守,越不易發(fā)生突變;,越不易發(fā)生突變;如如不同殘基的分值越高不同殘基的分值越高,則,則表示其在進(jìn)化過程中越容易表示其在進(jìn)化過程中越容易發(fā)生相互突變,發(fā)生相互突變,相似性越高相似性越高;如如不同殘基的分值為負(fù)數(shù)不同殘基的分值為負(fù)數(shù),則表示其在進(jìn)化過程中不易則表示其在進(jìn)化過程中不易發(fā)生相互替換,發(fā)生相互替換,相似性較低相似性較低。第二類為第二類為突變數(shù)據(jù)矩陣突變數(shù)據(jù)矩陣(mutation data matrix,MD),主要來自于單個殘基之間),主要來自于單個殘基之間的相似性,它是基于可接受突變點(diǎn)(的
15、相似性,它是基于可接受突變點(diǎn)(point accepted mutation,PAM)的概念。)的概念。1個個PAM表示在一定進(jìn)化距離中,表示在一定進(jìn)化距離中,1%的殘的殘基發(fā)生突變的頻數(shù)?;l(fā)生突變的頻數(shù)。Relationship of BLOSUM with PAM Matrixes6.1.6 6.1.6 檢索策略檢索策略BLAST比對結(jié)果輸出的基本單位是高分值片比對結(jié)果輸出的基本單位是高分值片段對(段對(High-scoring Segment Pair,HSP)。)。HSP由兩段任意的、長度相等的序列片段構(gòu)成,由兩段任意的、長度相等的序列片段構(gòu)成,這兩段序列的局部比對程度最大,且比對分
16、值這兩段序列的局部比對程度最大,且比對分值達(dá)到或超過界值(或截止分值)。達(dá)到或超過界值(或截止分值)。在在BLAST比對分析中,每對比對分析中,每對HSP由一來自于由一來自于待檢索序列的片段與一來自于數(shù)據(jù)庫序列的片待檢索序列的片段與一來自于數(shù)據(jù)庫序列的片段構(gòu)成。段構(gòu)成。BLAST程序所采用的相似性檢索過程,首先程序所采用的相似性檢索過程,首先是在待檢索序列與數(shù)據(jù)庫序列之間查找相似的是在待檢索序列與數(shù)據(jù)庫序列之間查找相似的片段(片段(HSP),然后對任何找到的匹配片段進(jìn)),然后對任何找到的匹配片段進(jìn)行統(tǒng)計(jì)學(xué)意義的評估(期望值行統(tǒng)計(jì)學(xué)意義的評估(期望值E),最后只報),最后只報告滿足用戶所選擇的統(tǒng)
17、計(jì)學(xué)界值的匹配片段。告滿足用戶所選擇的統(tǒng)計(jì)學(xué)界值的匹配片段。6.1.7 6.1.7 運(yùn)算參數(shù)運(yùn)算參數(shù)在進(jìn)行在進(jìn)行BLAST檢索比對時,用戶可根據(jù)自己檢索比對時,用戶可根據(jù)自己的檢索目的,按一定的格式輸入待檢索序列,的檢索目的,按一定的格式輸入待檢索序列,選擇并設(shè)定必要的參數(shù)。選擇并設(shè)定必要的參數(shù)。需要注意的是,相關(guān)的運(yùn)算參數(shù)可因需要注意的是,相關(guān)的運(yùn)算參數(shù)可因BLAST程序不同,或因程序或網(wǎng)頁的更新而改變。程序不同,或因程序或網(wǎng)頁的更新而改變。Blastp程序的運(yùn)算參數(shù)(可選)程序的運(yùn)算參數(shù)(可選)顯示目標(biāo)序列最大值顯示目標(biāo)序列最大值(可改為(可改為10)期望值閾值期望值閾值啟發(fā)式檢索最小初始
18、值啟發(fā)式檢索最小初始值評分矩陣系統(tǒng)評分矩陣系統(tǒng)缺口值(終止缺口值(終止/延伸)延伸)6.1.8 6.1.8 檢索結(jié)果檢索結(jié)果所有所有BLAST程序以大致相同的格式輸出檢索程序以大致相同的格式輸出檢索結(jié)果,其內(nèi)容依次為:結(jié)果,其內(nèi)容依次為: 檢索程序簡介及一般信息;檢索程序簡介及一般信息; 匹配序列的圖形化總結(jié);匹配序列的圖形化總結(jié); 匹配序列的在線描述;匹配序列的在線描述; 實(shí)際的序列比對結(jié)果;實(shí)際的序列比對結(jié)果; 檢索參數(shù)及其他統(tǒng)計(jì)學(xué)資料。檢索參數(shù)及其他統(tǒng)計(jì)學(xué)資料。Blastp蛋白質(zhì)序列比對操作實(shí)例蛋白質(zhì)序列比對操作實(shí)例1.用瀏覽器打開用瀏覽器打開Blastp檢索界面:檢索界面: /Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=blastp&a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家樂園樓層管理制度
- 家用制氧機(jī)管理制度
- 應(yīng)急儲備點(diǎn)管理制度
- 強(qiáng)化清單制管理制度
- 待處置車輛管理制度
- 微量泵使用管理制度
- 心電圖感染管理制度
- 快遞員物料管理制度
- 急診VTE管理制度
- 患者入出院管理制度
- 土地租賃協(xié)議書樣本
- 《某飛機(jī)場物業(yè)管理服務(wù)方案》
- 移動OA系統(tǒng)建設(shè)方案
- 2024年重慶高考化學(xué)試題卷(含答案解析)
- 人體器官講解課件
- DB3301-T 0256-2024 城市生態(tài)河道建設(shè)管理規(guī)范
- 2023年南京市衛(wèi)健委所屬部分事業(yè)單位招聘考試試題及答案
- 《管理會計(jì)》說課及試講
- 二手農(nóng)機(jī)買賣合同協(xié)議書
- 機(jī)床安全 壓力機(jī) 第 2 部分:機(jī)械壓力機(jī)安全要求
- 住院醫(yī)師規(guī)范化培訓(xùn)臨床小講課的設(shè)計(jì)與實(shí)施培訓(xùn)課件
評論
0/150
提交評論