2022年MEGA構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟教學(xué)文案_第1頁(yè)
2022年MEGA構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟教學(xué)文案_第2頁(yè)
2022年MEGA構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟教學(xué)文案_第3頁(yè)
2022年MEGA構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟教學(xué)文案_第4頁(yè)
2022年MEGA構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟教學(xué)文案_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、MEGA 構(gòu) 建 系 統(tǒng) 進(jìn) 化 樹(shù) 的 步 驟 以 MEGA7 為 例 MEGA 構(gòu)建系統(tǒng)進(jìn)化樹(shù)的步驟(以MEGA7 為例)本文是看中國(guó)慕課山東高校生物信息學(xué)課程總結(jié)出來(lái)的分子進(jìn)化的討論對(duì)象是核酸和蛋白質(zhì)序列;討論某個(gè)基因的進(jìn)化,是用它的 DNA 序列,仍是翻譯后的蛋白質(zhì)序列呢?序列的選取要遵循以下原就:1)如 果 DNA 序列的兩兩間的一樣度 70%,選用 DNA 序列;由于,假如 DNA 序列 都如此相像,它的蛋白質(zhì)會(huì)相像到看不出區(qū)分,這對(duì)構(gòu)建系統(tǒng)發(fā)生樹(shù)是不利的;所以這種情形下應(yīng)當(dāng)選用DNA 序列,而不選蛋白質(zhì)序列;2)假如 DNA序列的兩兩間的一樣度 70%,DNA 序列和蛋白質(zhì)序列都

2、可以選用;1. 將要用于構(gòu)建系統(tǒng)進(jìn)化樹(shù)的全部序列合并到同一個(gè) fasta格式文件,注 意:全部序列的方向都要保持一樣 5-3;想要做系統(tǒng)發(fā)生樹(shù)先要做多序列比對(duì),然后把多序列比對(duì)的結(jié)果提交給建樹(shù)軟件進(jìn)行建樹(shù),所以在用MEGA 建樹(shù)時(shí)可以輸入一個(gè)已經(jīng)比對(duì)好的多序列比對(duì),也可以輸入一條原始序列,讓 MEGA 先來(lái)做多序列比對(duì),再建樹(shù)(一般我 們都是原始序列);所以我們以后者為例;2. 打開(kāi) MEGA 軟件,挑選主窗口的” File” “Open A File” 找到并打開(kāi) fasta文件,這時(shí)會(huì)詢(xún)問(wèn)以何種方式打開(kāi),我們是原始序列,需要先進(jìn)行多序列 比對(duì),所以挑選“ Align ” ;假如是比對(duì)好的多

3、序列比對(duì)可以直接挑選“Analyze” ;3. 在打開(kāi)的 Alignment Explorer 窗口中挑選” Alignment”-“Align by ClustalW ”進(jìn)行多序列比對(duì)( MEGA 供應(yīng)了 ClustalW 和 Muscle 兩種多序列比對(duì)方法,這里挑選熟識(shí)的 ClustalW),彈出窗口詢(xún)問(wèn)“ Nothing selected for alignment,Select all?” 挑選“OK” ;4. 之后,彈出多序列比對(duì)參數(shù)設(shè)置窗口;這個(gè)窗口和 EMBL 在線(xiàn)多序列比 對(duì)一樣,可以設(shè)置替換記分矩陣、不同的空位罰分(罰分填寫(xiě)的是正數(shù),運(yùn)算時(shí)按負(fù)數(shù)運(yùn)算)等參數(shù);MEGA 的全

4、部默認(rèn)參數(shù)都是經(jīng)過(guò)反復(fù)考量設(shè)置的,這保證了 MEGA 傻瓜機(jī)全自動(dòng)檔的品質(zhì),所以當(dāng)你無(wú)從下手,或者沒(méi)有什么特殊 要求的時(shí)候,直接點(diǎn)擊“ OK” ,接受這些默認(rèn)參數(shù),開(kāi)頭多序列比對(duì);明白兩個(gè)參數(shù): 替換記分矩陣,替換記分矩陣是反映殘基之間相互替換率的矩陣,也就是說(shuō),它描述了殘基兩兩相像的量化關(guān)系;DNA 序列有 DNA 序列的替換記分矩陣,蛋白質(zhì)序列有蛋白質(zhì)序列的替換記分矩陣,兩者不行混用;DNA 序列的替換記分矩陣主要有三種:1)等價(jià)矩陣 ;相同核苷酸得分為1,不同核苷酸間的替換得分為 0;由于不含堿基的理化信息和不區(qū)分對(duì)待不同的替換,一般只用于理論運(yùn)算;被嘌呤或嘧啶被嘧啶替換;顛換:2)轉(zhuǎn)換

5、 -顛換矩陣 ;轉(zhuǎn)換: DNA 分子中的嘌呤 DNA 分子中的嘌呤被嘧啶或嘧啶被嘌呤替換;在進(jìn)化過(guò)程中,轉(zhuǎn)換發(fā)生的頻率遠(yuǎn)比顛換高;為了反映這一情形,轉(zhuǎn)換-顛換矩陣中,轉(zhuǎn)換的得分比顛換要高為-1 分,而顛換的得分為 -5 分; 3)BLAST 矩陣 ;經(jīng)過(guò)大量實(shí)際比對(duì)發(fā)覺(jué),假如令被比對(duì)的兩個(gè)核苷酸相同時(shí)得分為 +5 分,不相同為 -4 分,這時(shí)比對(duì)成效最好;這個(gè)矩陣廣泛地被 DNA 序列比較所采納;沒(méi)有為什么,就是好,實(shí)踐體會(huì)所得;由于這個(gè)矩陣最早應(yīng)用于 BLAST 工具,因此得名 BLAST 矩陣;蛋白質(zhì)的替換記分矩陣要比核酸的復(fù)雜一些: 1)等價(jià)矩陣 ;相同得 1 分,不同得 0 分; 2)

6、PAM 矩陣;基礎(chǔ)的 PAM-1 矩陣反應(yīng)的是進(jìn)化產(chǎn)生的每一百個(gè)氨基酸平均發(fā)生一個(gè)突變的量值,是基于相像度85%的序列產(chǎn)由統(tǒng)計(jì)方法計(jì)算得到的;由 PAM-1 自乘 n 次可以外推得到 PAM-n ,表示發(fā)生了更多次突 變;假如序列親緣關(guān)系遠(yuǎn),也就是說(shuō)序列間會(huì)有許多突變,那就選 PAM 后面 跟一個(gè)大數(shù)字的矩陣;假如親緣關(guān)系近,也就是突變比較少,序列間大多數(shù)地方都是一樣的,那就選 PAM 后面跟一個(gè)小數(shù)字的矩陣;3)BLOSUM 矩陣 ;后面也有一個(gè)編號(hào),是通過(guò)對(duì)大量符合特定要求的序列運(yùn)算而來(lái)的;比如BLOSUM62 是指這個(gè)矩陣是由一樣度62%的序列運(yùn)算得到的;假如序列親緣關(guān)系遠(yuǎn),序列相像度低

7、,那就選 BLOSUM 后面跟一個(gè)小數(shù)字的矩陣;假如序列親緣關(guān)系近,序列相像度高,那就選BLOSUM 后面跟一個(gè)大數(shù)字的矩陣;總結(jié),親緣關(guān)系較近的序列之間的比較,用 PAM 數(shù)小的矩陣或 BLOSUM 數(shù)大的矩陣;而親緣關(guān)系較遠(yuǎn)的序列之間的比較,用 PAM 數(shù)大的矩陣或 BLOSUM數(shù)小的矩陣;對(duì)于關(guān)系較遠(yuǎn)的序列之間的比較,由于 PAM250 是通過(guò)矩陣自乘推算而來(lái)的,所以其精確度受到肯定限制;相比之下BLOSUM 矩陣更具優(yōu)勢(shì);對(duì)于關(guān)系較近的序列之間的比較,用 PAM 或 BLOSUM 矩陣做出的比對(duì)結(jié)果,差別不大;假如關(guān)于要比較的序列不知道親緣關(guān)系遠(yuǎn)近,那么就閉著眼睛用 BLOSUM62

8、吧!假如你記不住或者聽(tīng)不懂上面講的種種,那就記住 BLOSUM62 這個(gè)名字,也可以走遍天下全不怕! 空位罰分包括兩種: gap 開(kāi)頭( gap open)和 gap延長(zhǎng)( gap extend);默認(rèn)gap開(kāi)頭罰分高, gap延長(zhǎng)罰分低,這樣得出的結(jié)果gap很集中,有許多長(zhǎng)串出現(xiàn)的 gap,這可以比對(duì)兩條很相像的序列-同源序列;相反,假如 gap開(kāi)頭罰分少, gap延長(zhǎng)罰分高,比對(duì)結(jié)果 gap就比較分散,極少顯現(xiàn)連續(xù)長(zhǎng)串的 gap(可以想象其中的緣由,總是要保證得分高),這可以比對(duì)兩條絕大部分序列都很相像,但其中一條的一個(gè)功能區(qū)在另一條序列中是缺失的兩條序列,可以找出這個(gè)功能區(qū);5. 比對(duì)過(guò)

9、程是先進(jìn)行雙序列比對(duì),在進(jìn)行多序列比對(duì),最終會(huì)顯現(xiàn)一個(gè)多序列比對(duì)結(jié)果;將之作為中間結(jié)果儲(chǔ)存下來(lái);在A(yíng)lignment Explorer 窗口中挑選“Data” “Export Alignment ” “MEGA Format” ;這里肯定挑選 MEGA format 以 便利 MEGA 后續(xù)分析(其他格式適用于其他軟件的分析),MEGA 自動(dòng)給予“.meg” 后綴名,儲(chǔ)存后,彈出窗口,“ 為這組數(shù)據(jù)命名” ,自己看得懂知道就可 以,我這里命名為“ il1r2 alignment” ;6. 生成的“ .meg” 文件可以雙擊直接導(dǎo)入 MEGA ;也可以將其拖入 MEGA 主窗口中;拖入后主窗口增

10、加了一個(gè)“TA ” 按鈕,點(diǎn)擊彈出新窗口“ Sequence Data Explorer” ,其是多序列比對(duì)結(jié)果;再點(diǎn)擊“ Sequence Data Explorer” 上的“TA ” 按鈕,點(diǎn)擊后多序列最上面增加了一行,這一行是依據(jù)多序列比對(duì)結(jié)果分析得 出的共有序列( consensus sequence),也就是一列里顯現(xiàn)次數(shù)最多的字母;多 序列比對(duì)中每一列里的字母假如和共有序列相同就打點(diǎn),不同就標(biāo)出不同的字 母,空位仍是空位;假如仍想進(jìn)一步明白序列的保守程度,可以點(diǎn)擊“C” 按鈕,以黃色標(biāo)記保守序列;或者點(diǎn)擊“ V” 按鈕,以黃色標(biāo)記不保守序列;通過(guò)進(jìn)一步的分析,可以剔除掉一些序列,比

11、如海選的的序列里有一些不合群的序列,就可以 把他們?nèi)サ?不讓他們參加建樹(shù),以免影響建樹(shù)質(zhì)量;此外,仍可以對(duì)這些序列進(jìn)行分組標(biāo)記;點(diǎn)擊分組按鈕,點(diǎn)擊“ 加號(hào)”按鈕,更換組名,然后按住 Ctrl 鍵同時(shí)選中 Ungrouped Taxa 列表中的要放入這個(gè)組的序列,選中后點(diǎn)擊“ 箭頭” 按鈕,即可將序列放入分組;同理,可以創(chuàng)建其他分組;當(dāng)序列數(shù)量較多時(shí),人為分組,可以從樹(shù)上更加清楚的看出 組內(nèi)哪些成員叛逃了去了別的組;此外,輸入序列的名字較長(zhǎng),作為構(gòu)建的系統(tǒng)發(fā)生樹(shù)上葉子的名字,會(huì)破 壞樹(shù)的外觀(guān)也不利于信息的解讀;因此,需要人為修改一下序列的名字;選中序列后點(diǎn)擊,把名字改為能區(qū)分彼此的關(guān)鍵詞,全部改

12、好之后點(diǎn)擊“save” 按鈕,預(yù)備工作全部完成;7. 開(kāi)頭建樹(shù);點(diǎn)擊 MEGA 主窗口上的 Phylogeny下拉菜單,挑選 Neighbor Joining(最近鄰居法);彈出窗口詢(xún)問(wèn)是否使用當(dāng)前 .meg里面的數(shù)據(jù),選Yes;接下來(lái),彈出參數(shù)設(shè)置窗口(Analysis Preferences);參數(shù)設(shè)置對(duì)構(gòu)建的系統(tǒng)發(fā)生樹(shù)的精確程度特別重要;在樹(shù)構(gòu)建好之后,仍常常需要依據(jù)樹(shù)的詳細(xì) 情形,重新設(shè)置參數(shù),并重新建樹(shù),如此反復(fù),紙質(zhì)結(jié)果令人中意為止;同樣 的假如對(duì)參數(shù)設(shè)置摸不著頭腦,就接受默認(rèn)設(shè)置,也能做出基本中意的系統(tǒng)發(fā) 生樹(shù);至少應(yīng)當(dāng)把握其中三個(gè)參數(shù)的設(shè)置: Test of Phylogeny

13、(建樹(shù)的檢驗(yàn)方法),是用來(lái)檢驗(yàn)建樹(shù)的質(zhì)量的;默認(rèn)的 檢驗(yàn)方法是 Bootstrp method (步長(zhǎng)檢驗(yàn));步長(zhǎng)檢驗(yàn)需要設(shè)定檢驗(yàn)次數(shù),通常為 100 的倍數(shù),默認(rèn)設(shè)置為500;步長(zhǎng)檢驗(yàn)是依據(jù)所挑選的建樹(shù)方法,運(yùn)算并繪制指定次數(shù)株系統(tǒng)發(fā)生樹(shù);由于大多數(shù)建樹(shù)的方法的核心算法都是統(tǒng)計(jì)概率 模型,所以每次運(yùn)算出來(lái)的樹(shù)都會(huì)有所差別;而劍豪的系統(tǒng)發(fā)生樹(shù)上每個(gè)節(jié)點(diǎn) 上都會(huì)標(biāo)有一個(gè)數(shù)字,它代表了指定次數(shù)次運(yùn)算所得出的系統(tǒng)發(fā)生樹(shù)中有百分 之多少的樹(shù)都含有這一節(jié)點(diǎn);一般來(lái)講,絕大多數(shù)節(jié)點(diǎn)上的數(shù)值都大于 70%的 樹(shù)才可信;個(gè)別低于 70%的節(jié)點(diǎn)可以暫且容忍,或通過(guò)添加、山間序列來(lái)改善 質(zhì)量; Substitut

14、ion Model;是挑選運(yùn)算遺傳距離時(shí)使用的運(yùn)算模型;理論上應(yīng)當(dāng)嘗 試各種模型,依據(jù)檢驗(yàn)結(jié)果挑選最合適的模型運(yùn)算;但在實(shí)際操作中,可先嘗 試選用較簡(jiǎn)潔的距離模型,比如 p-distance; Gap/Missing Data Treatment,大多數(shù)建樹(shù)方法會(huì)要求刪除多序列比對(duì)中含有 空位較多的列;但是依據(jù)遺傳距離度量方法的不同,刪除原就也不同;假如是 以序列間不同殘基的個(gè)數(shù)來(lái)度量遺傳距離的話(huà),這里需要挑選 Complete deletion(全部刪除);假如是其他方法,比如這里選用的 NJ 方法,可以挑選 Partial deletion(部分刪除);刪除程 度定在 50%,即,保留一半

15、含有空位的列;8. 依據(jù)以上方案參數(shù)設(shè)置后,點(diǎn)擊“Compute” 按鈕,開(kāi)頭構(gòu)建系統(tǒng)發(fā)生樹(shù);經(jīng)過(guò)一番運(yùn)算之后,新窗口 Tree Explorer 里展現(xiàn)的就是創(chuàng)建好的系統(tǒng)發(fā)生樹(shù);這個(gè)窗口里有兩個(gè)標(biāo)簽頁(yè);第一個(gè)是 Original Tree(原始樹(shù)),其次個(gè)是 Bootstrap consensus tree(步長(zhǎng)檢驗(yàn)合并出來(lái)的樹(shù));Bootstrap consensus tree 上,節(jié)點(diǎn)處的數(shù)字表示,經(jīng)步長(zhǎng)檢驗(yàn)有百分之幾的樹(shù)具有這根樹(shù)枝,即,反應(yīng)了該樹(shù)枝的可信度;當(dāng)前構(gòu)建的這株系統(tǒng)發(fā)生樹(shù)中,絕大多數(shù)節(jié)點(diǎn)處的數(shù)值都是 70 的話(huà),這株樹(shù)整體上就是可信的; Original Tree 是步長(zhǎng)檢驗(yàn)構(gòu)建的 500 株樹(shù)中的一株,未經(jīng)過(guò)多棵樹(shù)合并,所以樹(shù)枝的長(zhǎng)短可以精確代表遺傳距離;此外,從這株樹(shù)也可以看出之前的人為分組情形是不是發(fā)生了意想不到的變化;比如,有的可能好像脫離了分組,成為了外類(lèi)群,從而確定了樹(shù)根;樹(shù)構(gòu)建好之后,形狀或許仍不太令人中意;比如或許你想要將樹(shù)的形狀改成圓形或三角型,可以通過(guò)按鈕挑選;或者你想要調(diào)整樹(shù)枝的粗細(xì)或字體的大小

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論