Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第1頁(yè)
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第2頁(yè)
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第3頁(yè)
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第4頁(yè)
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1Mothor分析atpD過程記錄2012-11-22Mothur軟件分析OTU或?qū)⑿蛄袣w為不同的種類,見相似性部分(前半部分,第2到15張ppt),或按是否完全一樣來(lái)分(最后的4張ppt)。21.用Mothur確定OTU 也就是將序列相似性97%的定為一個(gè)OTU。如果按Plos One上提出的三個(gè)基因的相似性為準(zhǔn)(如下),那么就能定出OTU了。Zhang YM, Tian CF, Sui XH, Chen WF, Chen WX (2012) Robust Markers Reflecting Phylogeny and Taxonomy of Rhizobia. PLoS ONE 7(9)

2、: e44936.3如何在dos環(huán)境下運(yùn)行mothur? (1) 文件準(zhǔn)備:將目標(biāo)序列保存為fasta格式; (2) 將mothur.exe與x.fasta放在同一文件目錄下:4 (3) 打開mothur,注意在英文輸入法下打開mothur,否則會(huì)造成程序不響應(yīng)。5(4) 調(diào)用dist.seqs指令,產(chǎn)生距離矩陣;輸入完后按entercalc以不同方式處理gap:onegap指把所有把對(duì)偶排列中出現(xiàn)的所有連續(xù)缺失的堿基當(dāng)做一個(gè)gap;nogap按實(shí)際缺失的堿基數(shù)對(duì)待;默認(rèn)為onegap; countends: 用以處理末端gap的罰分,=F,指對(duì)末端gap不罰分;=T指對(duì)末端gap進(jìn)行罰分;c

3、utoff:OTU的分界閾值Output: lt (指low triangle)或square, 指輸出距離矩陣為下三角還是矩形6 運(yùn)行之后產(chǎn)生一個(gè)輸出文件: 注意文件格式:xxx.phylip.dist,該文件位于同一個(gè)目錄下,見下頁(yè)。7生成的文件:atpD_Aligned-fasta.phylip.dist8 說明:與Mega5中形成的距離值類似。用記事本打開生成的文件:atpD_Aligned-fasta.phylip.dist,如下,為距離值9 (5)讀入距離矩陣,用cluster進(jìn)行OTU聚類(PS: mothur的早期版本此處要用read.dist先讀入距離矩陣,最新版本將其與cl

4、uster指令整合在一起) Method有三種選擇:10回車,屏幕顯示如下結(jié)果:11(7) 輸出OTU的分類結(jié)果,用bin.seqs指令xxx.phylip.fn.0.01.fasta文件對(duì)應(yīng)于序列相似為99%的OTU (cutoff=0.01);xxx.phylip.fn.0.03.fasta文件對(duì)應(yīng)于序列相似為97%的OTU (cutoff=0.03)這個(gè)上面的輸出中沒有,是舉個(gè)例子,來(lái)自于原始的文件12用記事本打開atpD_Aligned-fasta.phylip.fn.unique文件,即可看出將每個(gè)序列歸到不同的種類里去,即OTU。從中可看出,12個(gè)序列共有7個(gè)OTU。這與Mega5

5、中聚樹結(jié)果是一致的。13給出獨(dú)特的序列:7個(gè)OTU,99%相似性以上的:5個(gè)OUT,輸出的文件見相應(yīng)的名字。14打開文件如下,將序列歸類,與前面的一致,但是沒有了序列,只有序列號(hào)名字。如果為unique,則表示某一個(gè)序列與其它的全一樣,或全不一樣。并將其中一個(gè)序列定為代表序列,如atpD_15644。 或如下,有0.01,則將99%以上相似性的序列歸到一起。并將其中一個(gè)序列定為代表序列,如atpD_15644。15這張片子在我處理的數(shù)據(jù)中沒有,因?yàn)闆]有低于97%的序列,因此沒有出現(xiàn)這種情況。16一篇博士論文中提到的Unique.seq也應(yīng)與前面的原理一樣。可以試著做一下。 測(cè)試成功!見下面的片子!17使用unique.seqs分析獨(dú)特的序列類型在Mothur中輸入:Unique.seqs(fasta=XXX.fasta),回車。即能計(jì)算出來(lái)。如我分析的atpD序列,共12個(gè)序列,產(chǎn)生7個(gè)獨(dú)特的序列。并產(chǎn)生兩個(gè)文件。兩個(gè)文件的內(nèi)容見下頁(yè)。輸入的命令產(chǎn)生的結(jié)果,12條序列,7個(gè)獨(dú)特 的序列產(chǎn)生的兩個(gè)文件,打開后見下頁(yè)。18新生成的文件 文件格

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論