MEGA計(jì)算序列間遺傳距離_第1頁
MEGA計(jì)算序列間遺傳距離_第2頁
MEGA計(jì)算序列間遺傳距離_第3頁
MEGA計(jì)算序列間遺傳距離_第4頁
MEGA計(jì)算序列間遺傳距離_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、序列間遺傳距離的計(jì)算1. 導(dǎo)入比對好的“*.meg”格式數(shù)據(jù)。2. 數(shù)據(jù)劃分(1)序列數(shù)據(jù)的基因和域(genes & domains)的指定和選擇在mega中可對指定范圍的序列位點(diǎn)進(jìn)行分析。雖然經(jīng)過比對和剪切后的序列通常都可全長用于分析,但對于蛋白質(zhì)編碼基因序列來說,序列的第一位并非總是密碼子的第一位,此時(shí)要通過該設(shè)置指定密碼子是從序列的第幾位開始(要先通過spin翻譯確定),否則軟件會(huì)將序列的第一位默認(rèn)為密碼子的第一位。具體的操作是:點(diǎn)擊“datasetup/select genes & domains”(在主窗口和數(shù)據(jù)管理窗口均可進(jìn)行此設(shè)置),在彈出的“genes/domain organ

2、ization”小窗口中進(jìn)行設(shè)置;“from”選項(xiàng)用于設(shè)置分析的起始位點(diǎn),“to”用于設(shè)置分析的終止位點(diǎn)(設(shè)置完成后會(huì)在#site項(xiàng)顯示出選定范圍內(nèi)的位點(diǎn)總數(shù)),“codon start”用于設(shè)置密碼子(開放閱讀框)從序列的第幾位堿基開始讀起(如密碼子從序列的第一位堿基開始讀則設(shè)置為“1st site”,依此類推),“codi”用于選擇是否啟動(dòng)蛋白質(zhì)翻譯功能,該項(xiàng)未選時(shí)(如右圖)mega將無法將蛋白質(zhì)編碼基因序列翻譯成蛋白質(zhì)序列,數(shù)據(jù)管理窗口中的按鈕將呈灰色顯示而失去功能。 (2)分類單元的分組及選擇mega可對數(shù)據(jù)集中指定的分類單元進(jìn)行分析。為了使選擇更加方便,通??蓪?shù)據(jù)的分類單元進(jìn)行分組

3、(groups),分組的具體操作是:點(diǎn)擊“datasetup/select taxa & groups”(在主窗口和數(shù)據(jù)管理窗口均可進(jìn)行此設(shè)置),在彈出來的“setup/select taxa & groups”小窗口中根據(jù)分析需要對分類單元進(jìn)行分組,選擇需要分析的數(shù)據(jù)組,點(diǎn)擊右下角的“close”按鈕關(guān)閉小窗口,即可對選定的組進(jìn)行相關(guān)分析。(3)已分組數(shù)據(jù)的保存為了保存已經(jīng)指定的數(shù)據(jù)分組,在關(guān)閉活動(dòng)數(shù)據(jù)文件(active data file;在主窗口中用“fileclose dataalt+f5”關(guān)閉文件或直接關(guān)閉mega軟件)前必須將數(shù)據(jù)輸出另存,否則分組信息不會(huì)直接保存在原始序列文件中。

4、注意,在保存數(shù)據(jù)時(shí)必須確認(rèn)數(shù)據(jù)中的所有分類單元都被選定(即在“setup/select taxa & groups”小窗口左邊的“taxa/groups”框中選定“all”選項(xiàng)),否則輸出的數(shù)據(jù)文件中將只能保存分析時(shí)選定的數(shù)據(jù)部分。3. 成對序列遺傳距離計(jì)算點(diǎn)擊“distancecompute pairwise f7”菜單命令,彈出分析選擇(analasys preference)窗口(也可稱為參數(shù)設(shè)置窗口),可通過點(diǎn)擊各選項(xiàng)右邊的下拉菜單(pull-down menu)完成設(shè)置。各種參數(shù)的設(shè)置方法如下:“compute”參數(shù)設(shè)置:該設(shè)置有兩個(gè)選項(xiàng),選擇“distances only”時(shí)只計(jì)算

5、遺傳距離;選擇“distances & std. err.”時(shí)在計(jì)算遺傳距離的同時(shí)還計(jì)算標(biāo)準(zhǔn)誤差,此時(shí)會(huì)增加一項(xiàng)設(shè)置誤差計(jì)算參數(shù)的選項(xiàng),可以調(diào)節(jié)。一般選擇“distances only”即可?!癷nclude sites”參數(shù)設(shè)置:該設(shè)置包括“gaps/missing data”和“codon positions”兩項(xiàng)?!癵aps/missing data”用來設(shè)置空位處理原則:若選“complete deletion”則在計(jì)算遺傳距離時(shí)凡有任一序列具空位的位點(diǎn)都不予計(jì)算;若選“parwise deletion”則在計(jì)算兩條序列的遺傳距離時(shí)僅不計(jì)算兩條序列中的任一條具空位的位點(diǎn),對于兩條序列都

6、不具空位的位點(diǎn),即使數(shù)據(jù)集中的其它序列存在空位,也不刪除;一般情況下都選“parwise deletion”?!癱odon positions”用來設(shè)置計(jì)算遺傳距離時(shí)使用的密碼子位點(diǎn),可以根據(jù)需要選擇使用密碼子中的任意一位或幾位或全部位點(diǎn)來計(jì)算遺傳距離;通??煽紤]用不同位點(diǎn)分別計(jì)算并進(jìn)行對比。“substitution model”參數(shù)設(shè)置:該設(shè)置包括“model”和“substitutions to include”兩項(xiàng)?!癿odel”選項(xiàng)用來選擇計(jì)算遺傳距離時(shí)使用的計(jì)算模型:點(diǎn)擊“model”選項(xiàng)右邊的圖標(biāo),在下拉菜單(pull-down menu) “nucleotide距離模型,如p-

7、distance、kimura 2-parameter等” 中選擇合適的計(jì)算遺傳距離的模型(理論上應(yīng)先用modeltest檢驗(yàn)各種模型,然后選擇最適模型進(jìn)行計(jì)算,但在通常情況下選擇較簡單的模型即可,如p-distance、k2p模型等;“number of differences”是一種根據(jù)序列間不同堿基的數(shù)量來計(jì)算遺傳距離的模型,選用此模型時(shí)則“gaps/missing data”選項(xiàng)應(yīng)設(shè)置為“complete deletion”)?!皊ubstitutions to include”用來選擇計(jì)算遺傳距離時(shí)使用的堿基替換信息:“d: transitions+transversions”表示同

8、時(shí)利用轉(zhuǎn)換和顛換值來計(jì)算遺傳距離,“s: transitions only”表示僅用轉(zhuǎn)換值來計(jì)算遺傳距離,“v: transversions only”表示僅用顛換值來計(jì)算遺傳距離,“r=s/v”表示用轉(zhuǎn)換顛換比值來計(jì)算遺傳距離(“l(fā): no. of valid common sites”表示用普通有效位點(diǎn)來計(jì)算遺傳距離?)。所有參數(shù)設(shè)置完成后點(diǎn)擊窗口右下方的即開始計(jì)算,結(jié)果將在新窗口中顯示(該窗口最小化隱藏后可從主窗口上方的“windows”菜單中恢復(fù)),將結(jié)果另存?zhèn)溆眉纯伞? 利用窗口上方的快捷圖標(biāo)(shortcuts)可選擇顯示格式和保存格式,如點(diǎn)擊圖標(biāo)可使遺傳距離值顯示在左下方(low

9、er left),點(diǎn)擊圖標(biāo)可使使遺傳距離值顯示在右上方(upper right),利用圖標(biāo)可減少(decrease)或增加(increase)小數(shù)(decimal)的位數(shù),點(diǎn)擊圖標(biāo)將以文本格式輸出計(jì)算結(jié)果,點(diǎn)擊圖標(biāo)將以excel格式輸出計(jì)算結(jié)果。點(diǎn)擊任何一個(gè)輸出格式選擇圖標(biāo)都會(huì)彈出遺傳距離輸出選擇窗口(distance write-out options),點(diǎn)擊的圖標(biāo)代表的格式為該窗口中的默認(rèn)輸出格式,若想改變輸出格式,可點(diǎn)擊該窗口中output format選項(xiàng)框右邊的按鈕,在下拉菜單中選擇其它輸出格式。4. 序列總體平均遺傳距離:點(diǎn)擊“distancecompute overall mea

10、n”菜單命令,在彈出的分析選擇(analasys preference)窗口(也可稱為參數(shù)設(shè)置窗口)中設(shè)置各種參數(shù),點(diǎn)擊窗口右下方的,保存計(jì)算結(jié)果備用。5. 替換飽和性分析(重要)(1)計(jì)算序列的校正遺傳距離:在進(jìn)行“成對序列遺傳距離計(jì)算”時(shí)將“substitution model”參數(shù)設(shè)置中的“model”選項(xiàng)設(shè)置為kimura 2-parameter(也可根據(jù)需要選用其它模型,但后面的顛轉(zhuǎn)換、顛換遺傳距離計(jì)算也要選用同一模型) ,“substitutions to include”選項(xiàng)設(shè)置為 “d: transitions+transversions”,計(jì)算所得的遺傳距離作為替換飽和性分析

11、的校正距離,以 “*.xls”格式保存?zhèn)溆茫ㄝ敵鰰r(shí)mega會(huì)自動(dòng)將對角矩陣轉(zhuǎn)換成一列數(shù)據(jù))。(2)計(jì)算序列的轉(zhuǎn)換遺傳距離:在進(jìn)行“成對序列遺傳距離計(jì)算”時(shí)將“substitution model”參數(shù)設(shè)置中的“model”選項(xiàng)設(shè)置為kimura 2-parameter(一定要與計(jì)算校正距離時(shí)選用的模型相同) ,“substitutions to include”選項(xiàng)設(shè)置為 “s: transitions only”,計(jì)算所得的遺傳距離即為替換飽和性分析的轉(zhuǎn)換距離,以 “*.xls”格式保存?zhèn)溆谩#?)計(jì)算序列的顛換遺傳距離:在進(jìn)行“成對序列遺傳距離計(jì)算”時(shí)將“substitution mode

12、l”參數(shù)設(shè)置中的“model”選項(xiàng)設(shè)置為kimura 2-parameter(一定要與計(jì)算校正距離時(shí)選用的模型相同) ,“substitutions to include”選項(xiàng)設(shè)置為 “v: transversions only”,計(jì)算所得的遺傳距離即為替換飽和性分析的顛換距離,以“*.xls”格式保存?zhèn)溆?。注意:以上分析可選擇不同的模型進(jìn)行比較,看結(jié)果是否有差異。(4)excel作圖,用直觀坐標(biāo)圖顯示替換飽和性狀態(tài)。 導(dǎo)入數(shù)據(jù):將上述三種遺傳距離導(dǎo)入同一個(gè)excel文件中,按相同的順序排成三列,列與列之間不要留下空白列,每一列數(shù)據(jù)的標(biāo)識(shí)符號(hào)(名稱)放在該列的頂端(第一行),校正距離放在第一列

13、(因?yàn)閑xcel作圖時(shí)一般將第一列默認(rèn)為橫坐標(biāo))。作圖:選定三列數(shù)據(jù),點(diǎn)擊主菜單中的“插入圖表”,在彈出的“圖表向?qū)?圖表類型”窗口中選擇“標(biāo)準(zhǔn)類型”中的“xy散點(diǎn)圖”(在進(jìn)行其它數(shù)據(jù)分析時(shí)可根據(jù)需要選擇其它圖表類型,包括“自定義”類型),點(diǎn)擊“下一步”;在“圖表源數(shù)據(jù)”窗口中點(diǎn)擊“下一步”;在“圖表選項(xiàng)”窗口中設(shè)置需要在圖表中顯示的各種選項(xiàng):在“標(biāo)題”標(biāo)簽中可設(shè)置“圖表標(biāo)題”、“數(shù)值(x)軸(a)”標(biāo)題、“數(shù)值(y)軸(v)”標(biāo)題,在“坐標(biāo)軸”標(biāo)簽中可設(shè)置“顯示/隱藏坐標(biāo)軸上的數(shù)值”,在“網(wǎng)格線”標(biāo)簽中可設(shè)置“顯示/隱藏網(wǎng)格線”,在“圖例”標(biāo)簽中可設(shè)置“顯示/隱藏圖例”以及圖例與圖表的相對位

14、置(包括“底部、右上角、靠上、靠右、靠左”等選項(xiàng)),在“數(shù)據(jù)標(biāo)志”標(biāo)簽中可設(shè)置“數(shù)據(jù)標(biāo)簽”(該項(xiàng)設(shè)置只有在數(shù)據(jù)較少時(shí)為了方便識(shí)別數(shù)據(jù)才選用,一般情況下均不予選擇),點(diǎn)擊“下一步”;在“圖表位置”窗口選擇圖表插入的具體位置,一般選擇默認(rèn)選項(xiàng)“作為其中的對象插入(o)”,點(diǎn)擊完成,即會(huì)在excel表中插入一個(gè)生成的圖表;該圖表可直接復(fù)制插入到word文檔中使用,也可在photoshop軟件中轉(zhuǎn)換成獨(dú)立的“*.jpg”文件保存?zhèn)溆?,需要時(shí)再插入word文檔中。注意:該項(xiàng)分析也可在其它一些軟件中進(jìn)行。如dambe,但可供選用的模型在不同軟件中有所不同;選擇不同密碼子的方法是:點(diǎn)擊命令“sequence

15、swork on codon position 1/2/3/1+2”,用“sequencesrestore sequences”命令可恢復(fù)全序列進(jìn)行分析;堿基替換飽和性分析的方法是:打開序列數(shù)據(jù)點(diǎn)擊命令“graphicstransition and transversion versus divergence”,在彈出來的小窗口中選擇參數(shù)設(shè)置,點(diǎn)擊“go”按鈕,分析結(jié)果將顯示在一個(gè)新的“graph tool”窗口中。圖形文件的輸出:在“graph tool”窗口中點(diǎn)擊“filesave file in metafile format”即可將分析結(jié)果保存為“*.wmf”格式的圖形文件;若選擇“f

16、ilesave file in bitmap format”,則保存為“*.bmp”格式的圖形文件,文件較小,但分辨率較低,不能滿足發(fā)表論文的需要。要編輯坐標(biāo)軸則點(diǎn)擊“graphic”菜單進(jìn)行選擇。若要將分析結(jié)果以遺傳距離的形式保存,則在“graph tool”窗口中點(diǎn)擊“editcopy data to excel”,然后創(chuàng)建一個(gè)“*.xls”文檔,將數(shù)據(jù)粘貼到新建的“*.xls”文檔中即可。使用dambe進(jìn)行堿基替換飽和性分析的優(yōu)點(diǎn)是可以直接輸出圖形文件,對大型數(shù)據(jù)矩陣特別方便,缺點(diǎn)是以excel格式輸出遺傳距離值時(shí)沒有同時(shí)輸出物種對名稱;若要將遺傳距離與物種對對應(yīng)起來,需要使用其它命令或

17、方法。dna序列組成及變異分析* 這些分析通??梢栽趍ega軟件中進(jìn)行,也可以在其它相關(guān)軟件中實(shí)現(xiàn),如dambe等。用mega進(jìn)行數(shù)據(jù)分析時(shí),輸入的數(shù)據(jù)必須是“*.meg”格式文件,否則不能識(shí)別,所以在分析數(shù)據(jù)前要先將其它格式文件轉(zhuǎn)換成“*.meg”格式文件。mega可以將多種格式的序列文件(*.fasta、*.aln、*.nexus、*.phylip、*.phylip2、*.gcg、*.pir、*.nbrf、*.msf、*.ig和*.xml格式)轉(zhuǎn)換成“*.meg”格式,不論其是否已經(jīng)比對好。所以,用mega轉(zhuǎn)換序列數(shù)據(jù)格式之前要先將序列比對好并刪除引物序列。許多人通常喜歡將比對整理好的序列

18、保存為“*.fasta”格式,因?yàn)檫@種格式更加通用,而且其它格式的文件均可由此格式通過一定的軟件或批處理文件轉(zhuǎn)換生成。* mega(molecular evolutionary genetics analysis; /)是一個(gè)不斷更新的軟件,如果啟動(dòng)該軟件時(shí)出現(xiàn)“the current test version of mega may be out of date (release #4104). we recommend that you obtain an updated version from http:/www.megasoftwa

19、 or ”, 可考慮重新下載新版本安裝,也可點(diǎn)擊“ok”后忽略。一、轉(zhuǎn)換文件格式1. 運(yùn)行mega 4.1。2. 導(dǎo)入數(shù)據(jù)。點(diǎn)擊mega 4.1主窗口左上角工具欄中的“text editor and format convertor”圖標(biāo)(或點(diǎn)擊“filetext editor.f3”),在彈出來的“text file editor and format convertor”窗口中點(diǎn)擊“fileopen”或直接點(diǎn)擊窗口左上角工具欄中的“open a file (ctrl+0)”圖標(biāo),選擇并打開需要轉(zhuǎn)換的序列文件。* “text edito

20、r and format convertor”窗口最小化隱藏后可點(diǎn)擊mega主窗口中的“text editor and format convertor”圖標(biāo)和隨之顯示在主窗口左下角的該窗口的最小化圖標(biāo)來恢復(fù),也可點(diǎn)擊主窗口中的“filetext editor f3”菜單命令,然后點(diǎn)擊顯示在主窗口左下角的該窗口的最小化圖標(biāo)來恢復(fù)。在用mega的數(shù)據(jù)處理窗口“view sequence data”進(jìn)行統(tǒng)計(jì)分析時(shí),若選擇了“statisticdisplay results in text editor”設(shè)置,即在“text editor and format convertor”窗口中顯示結(jié)果,窗

21、口最小化隱藏后又需要重新使用時(shí)也是用同樣的方法來激活恢復(fù)。text editor and format convertor圖標(biāo)3. 點(diǎn)擊“text file editor and format convertor”窗口左上角工具欄中的“convert to mega format (contrl+m)”圖標(biāo)或使用菜單命令“utilitiesconvert to mega format contrl+m”,在彈出來的“select file and format”小窗口中點(diǎn)擊“ok”即可完成文件轉(zhuǎn)換。* 一步轉(zhuǎn)換的方法是:在mega 4.1主窗口中點(diǎn)擊“fileconvert to mega f

22、ormat”,在彈出來的“select file and format”小窗口中點(diǎn)擊“data file to convert”選項(xiàng)欄右側(cè)的“open”圖標(biāo),然后在彈出來的“choose a file to convert”窗口中選擇需要轉(zhuǎn)換的序列文件,點(diǎn)擊“打開”按鈕,再點(diǎn)擊“select file and format”小窗口中的“ok”按鈕即完成文件格式轉(zhuǎn)化。4. 檢查文件內(nèi)容,刪除多余的符號(hào)如“#”和“*”等(這些多余信息通常出現(xiàn)在文件末尾,若不檢查刪除,mega可能在導(dǎo)入文件時(shí)無法識(shí)別,從而出錯(cuò)),將文件保存到指定的文件夾,關(guān)閉文件轉(zhuǎn)化窗口。另外,序列名稱或編號(hào)中也不能出現(xiàn)“?、-、

23、*和#”等符號(hào),否則可能導(dǎo)致出現(xiàn)“序列長度不相等”之類的錯(cuò)誤警報(bào)。* 若在轉(zhuǎn)化文件格式時(shí)確實(shí)忘記了檢查刪除多余信息而導(dǎo)致分析數(shù)據(jù)時(shí)打不開“*.meg”格式的文件,可用下述方法重新檢查:在主窗口中點(diǎn)擊“filetext editor f3”打開“text file editor and format convertor”窗口,點(diǎn)擊工具欄中的快捷圖標(biāo)(open a file (ctrl+0)打開序列文件,檢查數(shù)據(jù)并刪除多余的干擾信息,保存并退出該窗口即可重新導(dǎo)入數(shù)據(jù)進(jìn)行后面的分析。* 如果要省去文件格式轉(zhuǎn)換的麻煩,在序列數(shù)目較少時(shí)可直接將“*.fasta”格式文件導(dǎo)入mega進(jìn)行比對,然后以“*.

24、meg”格式保存即可;具體操作見“用mega軟件比對序列”。因這樣做并沒有使整個(gè)操作步驟簡化多少,還要重新比對序列(而大多數(shù)人更習(xí)慣在clastal軟件中比對序列),所以通常沒有必要采用這種方法來轉(zhuǎn)換文件格式。二、dna序列的堿基組成及變異分析1. 導(dǎo)入數(shù)據(jù)在mega主窗口中點(diǎn)擊“fileopen data f5”,打開待分析序列的“.meg”文件;在彈出來的“input data”小窗口中選擇“data type”,如“nucleotide sequence”、“protein sequences”、“pairwise distance”等,點(diǎn)擊“ok”按鈕;在彈出來的(popped up)

25、“confirm”小窗口中出現(xiàn)提問“protein-coding nucleotide sequence data?”,若為蛋白質(zhì)編碼序列則點(diǎn)擊“yes”,若為非蛋白質(zhì)編碼序列則點(diǎn)擊“no”按鈕;在彈出來的“select genetic code”小窗口中選擇“invertebrate mitochondial”,點(diǎn)擊“ok”按鈕,即出現(xiàn)“view sequence data”窗口(數(shù)據(jù)處理窗口);該窗口最小化后可點(diǎn)擊mega主窗口左上角工具欄中的“explore active data(f4)”圖標(biāo)來恢復(fù),也可點(diǎn)擊主窗口上方主菜單中的“datadata explorer f4”來直接恢復(fù)。*

26、 除了上述方法(包括使用快捷鍵f5)外,還可點(diǎn)擊主窗口中的鏈接來打開數(shù)據(jù)文件,其它操作相同。2. 計(jì)算保守位點(diǎn)(conserved sites)、變異位點(diǎn)(variable sites)、簡約信息位點(diǎn)(parsimony-informative sites)。 這些統(tǒng)計(jì)數(shù)值可以通過點(diǎn)擊數(shù)據(jù)處理窗口工具欄中的相應(yīng)圖標(biāo)來顯示在窗口的最下方,也可以通過點(diǎn)擊“highlignt”菜單命令來顯示,將顯示結(jié)果記錄下來備用即可。例如,將鼠標(biāo)選中某一個(gè)堿基,在窗口的左下角就會(huì)顯示該堿基所在序列的長度及該堿基在序列中的位置(1/465表示該序列長為465pb,選中的堿基是該序列的第一位堿基;conserved:

27、 278/465表示分析的序列長465bp,保守位點(diǎn)278個(gè));其它統(tǒng)計(jì)類推。* 工具欄中各快捷圖標(biāo)的含義分別為: 保守位點(diǎn)conserved sitesc,變異位點(diǎn)variable sitesv,簡約信息位點(diǎn)parsimony-informative sitespi,自裔位點(diǎn)singleton sites,0-fold degenerate sites0, 2-fold degenerate sites2,4-fold degenerate sites4。將鼠標(biāo)移到相應(yīng)的快捷圖標(biāo)上時(shí),會(huì)短暫顯示“mark conserved sites”、等字樣,由此可知該圖標(biāo)的具體功能。* degener

28、acy (密碼子的簡并性)0-fold degenerate sites are those at which all changes are nonsynonymous. (非簡并性位點(diǎn))2-fold degenerate sites are those at which one out of three changes is synonymous. (all sites at which two out of three changes are synonymous also are included in this category.) (二重簡并位點(diǎn))4-fold degenerate

29、 sites are those at which all changes are synonymous. (四重簡并位點(diǎn))* singleton sites(自裔位點(diǎn))a singleton site contains at least two types of nucleotides (or amino acids) with, at most, one occurring multiple times. mega identifies a site as a singleton site if at least three sequences contain unambiguous nu

30、cleotides or amino acids.* 工具欄其它快捷圖標(biāo)的含義及對應(yīng)的菜單命令如下:對應(yīng)于“dataexport data”菜單命令,可將序列比對結(jié)果以“*.meg”格式文件輸出保存。點(diǎn)擊該圖標(biāo)后會(huì)彈出“text file editor and format convertor”窗口,點(diǎn)擊“save a file(ctrl+s)”圖標(biāo)即可將文件保存到指定的位置,文件名可自己擬定。與上面的圖標(biāo)功能相同。對應(yīng)于“statisticsdesplay results in excel(xl)”菜單命令。對應(yīng)于“statisticsdesplay results in comma-del

31、imited(csv)”菜單命令。對應(yīng)于“dataset up/select taxa & groups”菜單命令,點(diǎn)擊該圖標(biāo)后會(huì)彈出“select/edit taxa groups”窗口,在該窗口中可對需要分析的分類單元進(jìn)行分組或選擇已劃分的全部或部分組進(jìn)行分析。對應(yīng)于“dataset up/select genes & domains”菜單命令。對應(yīng)于“displayuse identical symbol”菜單命令;該圖標(biāo)凸顯時(shí)導(dǎo)入的序列全部以堿基符號(hào)顯示;* 點(diǎn)擊該圖標(biāo)使其凹顯()時(shí),導(dǎo)入的序列將會(huì)以第一條序列為參照,凡是與第一條序列相同的堿基則以一致性符號(hào)“.”顯示,不相同的堿基以堿

32、基符號(hào)顯示;輸出時(shí)可根據(jù)需要選擇顯示形式。對應(yīng)于“datatranslate/untranslate t”菜單命令,突出顯示,表示序列正在以核苷酸的形式顯示(如下圖),點(diǎn)擊該圖標(biāo)后可將核苷酸序列翻譯成蛋白質(zhì)序列顯示出來,圖標(biāo)變?yōu)榘枷蒿@示。對應(yīng)于“datatranslate/untranslate t”菜單命令,凹陷顯示,表示序列正在以氨基酸的形式顯示,點(diǎn)擊該圖標(biāo)后可將蛋白質(zhì)序列恢復(fù)成核苷酸序列顯示出來,圖標(biāo)變?yōu)橥钩鲲@示形式。對應(yīng)于“displayfind sequence (ctrl+f)”菜單命令,可以查找序列。3. 計(jì)算dna序列堿基組成在“view sequence data”窗口(即數(shù)

33、據(jù)處理窗口)中點(diǎn)擊“satisticsdesplay results in text editor”,將統(tǒng)計(jì)結(jié)果設(shè)置為在“text file editor and format convertor”窗口中顯示(也可以根據(jù)需要將統(tǒng)計(jì)結(jié)果設(shè)置為以“excel”形式或“comma-delimited format”形式顯示);點(diǎn)擊“satisticsnucleotide composition”,軟件將會(huì)在內(nèi)置文本編輯器(built-in text editor)“text file editor and format convertor”窗口中顯示堿基組成分析結(jié)果,保存文件備用(分析結(jié)果包括堿基總

34、數(shù),每種堿基的百分比,各堿基在密碼子第1位、第2位、第3位的使用頻率)。* “text editor and format convertor”窗口最小化隱藏后可點(diǎn)擊mega主窗口中的“text editor and format convertor”圖標(biāo)和隨之顯示在主窗口左下角的該窗口的最小化圖標(biāo)來恢復(fù),也可點(diǎn)擊主窗口中的“filetext editor f3”菜單命令,然后點(diǎn)擊顯示在主窗口左下角的該窗口的最小化圖標(biāo)來恢復(fù)。4. 計(jì)算密碼子使用情況:點(diǎn)擊“satisticscodon usage”,軟件將會(huì)在“text file editor and format convertor”窗口中

35、顯示密碼子使用分析結(jié)果,保存文件備用(分析結(jié)果包括堿基總數(shù),每種堿基的百分比,各堿基在密碼子第1位、第2位、第3位的使用頻率)。* 計(jì)算“密碼子使用”情況時(shí),必須先指定密碼子在序列中的起點(diǎn)(第一位、第二位、第三位或其它位置),具體操作見“序列遺傳距離的計(jì)算”中的“2. 指定序列數(shù)據(jù)的起始及終止位點(diǎn)”。5. 計(jì)算堿基對頻率(nucleotide pair frequencies) 點(diǎn)擊“satisticsnucleotide pair frequencydirectional(16 pairs)或undirectional(10 pairs)”,統(tǒng)計(jì)結(jié)果將顯示在“text editor and

36、format convertor”窗口中,保存?zhèn)溆眉纯伞? 用此菜單命令計(jì)算獲得的轉(zhuǎn)換/顛換比值(r)將作為后面利用paup軟件進(jìn)行系統(tǒng)發(fā)育分析時(shí)確定是否對數(shù)據(jù)進(jìn)行加權(quán)的參考依據(jù)。* directional (16 pairs)是指定向的替換;undirectional(10 pairs)是指不定向的替換。6. 堿基替換模式檢驗(yàn)用此數(shù)據(jù)處理窗口中的“statisticalnucleotide pair frequency”菜單命令計(jì)算的“轉(zhuǎn)換/顛換值”是轉(zhuǎn)換/顛換位點(diǎn)的數(shù)量比值,而用主窗口中的“pattern”菜單命令可以計(jì)算有關(guān)堿基替換模型的一些其它統(tǒng)計(jì)數(shù)值(statistical quan

37、tities)(1)序列間替換模式的同質(zhì)性檢驗(yàn)(test of the homogeneity of substitution patterns between sequences.)點(diǎn)擊“patterntest substitution pattern homogeneity”菜單命令,在彈出來的分析選擇(analysis preferences)窗口中設(shè)置相關(guān)選項(xiàng):“gap/missing”選項(xiàng)一般選“pairwise deletion”,“codon positions”可根據(jù)需要選擇密碼子第一位、第二位、第三位或任意兩位的組合或全選;設(shè)置完成后點(diǎn)擊窗口右下角的“compute”按鈕,計(jì)算結(jié)果將會(huì)在一個(gè)新窗口中顯示保存結(jié)果備用。該菜單命令計(jì)算所得的數(shù)值(statistical quantities)表示:根據(jù)序列間堿基組成偏倚差異程度推斷時(shí)拒絕零假說(null hypothesis,即序列以相同的替換模式進(jìn)化)的概率。用monte carlo test (1000 replicates)估算p-值,p-值顯示在表格的左下方(below the diagonal);p-值小于0.05使被認(rèn)為顯著(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論