高通量測序解析總結計劃_第1頁
高通量測序解析總結計劃_第2頁
高通量測序解析總結計劃_第3頁
高通量測序解析總結計劃_第4頁
高通量測序解析總結計劃_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

高通量測序及解析總結計劃高通量測序及解析總結計劃高通量測序及解析總結計劃高通量測序及解析高通量測序與功能解析微生物群落測序是指對微生物集體進行高通量測序,經(jīng)過解析測序序列的構成解析特定環(huán)境中微生物集體的構成狀況或基因的構成以及功能。借助不一樣樣樣環(huán)境下微生物群落的構成差異解析我們能夠解析微生物與環(huán)境要素或宿主之間的關系,找尋標記性菌群或特定功能的基因。對微生物群落進行測序包含兩類,一類是經(jīng)過16srDNA,18srDNA,ITS地區(qū)進行擴增測序解析微生物的集體構成和多樣性;還有一類是宏基因組測序,是不經(jīng)過分別培育微生物,而對所有微生物DNA進行測序,進而解析微生物群落構成,基因構成,發(fā)掘有應用價值的基因資源。16srDNA擴增進行測序解析主要用于微生物群落多樣性和構成的解析,當前的生物信息學解析也能夠鑒于16srDNA的測序?qū)ξ⑸锶郝涞幕驑嫵珊痛x門路進行展望解析,大大拓展了我們對于環(huán)境微生物的微生態(tài)認知。當前我們依據(jù)16s的測序數(shù)據(jù)能夠?qū)⑽⑸锶郝浞诸惖椒N(

species

)(一般只好對部分菌進行種的判斷),甚至對亞種級別進行解析,幾個見解:16SrDNA(或16SrRNA):16SrRNA基因是編碼原核生物核糖體小亞基的基因,長度約為1542bp,其分子大小適中,突變率小,是細菌系統(tǒng)分類學研究中最常用和最合用的標記。16SrRNA基因序列包含9個可變區(qū)和10個守舊區(qū),守舊區(qū)序列反應了物種間的親緣關系,而可變區(qū)序列則能表現(xiàn)物種間的差異。16SrRNA基因測序以細菌16SrRNA基因測序為主,核心是研究樣品中的物種分類、物種豐度以及系統(tǒng)進化。OTU:operationaltaxonomicunits(OTUs)在微生物的免培育解析中常常用到,經(jīng)過提取樣品的總基因組DNA,利用16SrRNA或ITS的通用引物進行PCR擴增,經(jīng)過測序此后就能夠解析樣品中的微生物多樣性,那怎么區(qū)分這些不一樣樣樣的序列呢,這個時候就需要引入operationaltaxonomicunits,一般狀況下,假如序列之間,比方不一樣樣樣的16SrRNA序列的相像性高于97%就能夠把它定義為一個OTU,每個OTU對應于一個不一樣樣樣的16SrRNA序列,也就是每個OTU對應于一個不一樣樣樣的細菌(微生物)種。經(jīng)過OTU解析,就能夠知道樣品中的微生物多樣性和不一樣樣樣微生物的豐度。測序區(qū)段:因為16srDNA較長(1.5kb),我們只好對此中常常變化的地區(qū)也就是可變區(qū)進行測序。16srDNA包含有9個可變區(qū),分別是v1-v9。一般我們對v3-v4雙可變地區(qū)進行擴增和測序,也有對v1-v3區(qū)進行擴增測序。工具/原料?16srDNA測序第一需要提取環(huán)境樣品的DNA,這些DNA能夠來自土壤、糞便、空氣或水體等任何根源。提取DNA后需要經(jīng)過質(zhì)檢和純化,一般16srDNA測序擴增對DNA的總量要求其實不高,總量大于100ng,濃度大于10ng/ul一般都能夠知足要求。假如是來自和寄主共生的環(huán)境如昆蟲的腸道微生物,提取時可能包含了寄主自己的大批DNA,對DNA的總量要求會提升。微生物菌群多樣性測序受DNA提取和擴增影響很大,不一樣樣樣的擴增區(qū)段和擴增引物甚至PCR循環(huán)數(shù)的差異都會對結果有所影響。因此建議同一項目不一樣樣樣樣品的都采用相同的條件和測序方法,這樣互相之間才存在可比性。達成PCR此后的產(chǎn)物一般能夠直接上測序儀測序,在上機測序前我們需要對所有樣本進行定量和均一化,平常要進行熒光定量PCR。達成定量的樣品混淆后就能夠上機測序。16srDNA測序當前能夠采納多種不一樣樣樣的測序儀進行測序,包含羅氏的454,Illumina的MiSeq,Life的PGM或Pacbio的RSII三代測序儀。不一樣樣樣的儀器各有優(yōu)弊端,當前最主流的是Illumina企業(yè)的MiSeq,因為其在通量、長度和價錢三者之間最為均衡。MiSeq測序儀能夠產(chǎn)生2x300bp的測序讀長,一次能夠產(chǎn)生15Gb的測序數(shù)據(jù)遠遠大于其余測序儀的測序通量。方法/步驟116srDNA解析基本流程:2原始數(shù)據(jù)辦理:原始測序數(shù)據(jù)需要去除接頭序列,并將雙端測序序列進行拼接成單條序列。依據(jù)測序barcode序列區(qū)分不一樣樣樣的樣本序列。過濾低質(zhì)量序列和沒法比對到16srDNA數(shù)據(jù)庫的序列。3OTU分類和統(tǒng)計:OTU(operationaltaxonomicunits)是在系統(tǒng)發(fā)生學研究或集體遺傳學研究中,為了便于進行解析,人為給某一個分類單元(品系,種,屬,分組等)設置的同一標記。平常依據(jù)97%的相像性閾值將序列區(qū)分為不一樣樣樣的OTU,每一個OTU平常被視為一個微生物物種。相像性小于97%就能夠以為屬于不同的種,相像性小于93%-95%,能夠以為屬于不一樣樣樣的屬。樣品中的微生物多樣性和不一樣樣樣微生物的豐度都是鑒于對OTU的解析。使用QIIME()工具包進行統(tǒng)計說明。使用QIIME()的ucluster方法依據(jù)97%的序列相像度將所有序列進行同源比對并聚類成operational

taxonomicunits

(OTUs)。此后與數(shù)據(jù)庫

GreenGenes(version

)進行比對,比對方法

uclust

。此后對每個

OTUs進行

reads

數(shù)目統(tǒng)計。下邊的

2個表,此中一個表是對每個樣本的測序數(shù)目和

OTU數(shù)目進行統(tǒng)計,并且在表栺中列出了測序覆蓋的圓滿度(顯示前

10個樣本)。另一個表是對每個樣本在分類字水平上的數(shù)目進行統(tǒng)計,并且在表栺中列出了在每個分類字水平上的物種數(shù)目(顯示前10個樣本)。能夠看到絕大部分的OTU都分類到了屬(Genus),也有好多分類到了種Species)。但是仍舊有好多沒法圓滿分類到種一級,這是因為環(huán)境微生物自己存在特別豐富的多樣性,還有大批的菌仍舊沒有被測序和發(fā)現(xiàn)。測序數(shù)目統(tǒng)計表主假如對每個樣本的測序數(shù)目和OTU數(shù)目進行統(tǒng)計,并且在表格中列出了測序覆蓋的圓滿度(顯示前10個樣本,假如樣本超出10個,請查察結果中文件)此中SampleName表示樣本名稱;SampleSize表示樣本序列總數(shù);OTUsNumber表示說明上的OTU數(shù)目;OTUsSeq表示說明上OTU的樣本序列總數(shù)。Coverage是指各種品文庫的覆蓋率,其數(shù)值越高,則樣本中序列沒有被測出的概率越低。該指數(shù)實質(zhì)反應了本次測序結果能否代表樣本的真切狀況。計算公式為:C=1-n1/N此中n1=只含有一條序列的OTU的數(shù)目;N=抽樣中出現(xiàn)的總的序列數(shù)目。分類水平統(tǒng)計表主假如對每個樣本在分類學水平上的數(shù)目進行統(tǒng)計,并且在表格中列出了在每個分類學水平上的物種數(shù)目(只顯示前

10個樣本,如果樣本超出

10個,請查察結果中

文件)此中SampleName表示樣本名稱;Phylum表示分類到門的OTU數(shù)目;Class表示分類到綱的OTU數(shù)目;Order表示分類到目的OTU數(shù)目;Family表示分類到科的OTU數(shù)目;Genus表示分類到屬的OTU數(shù)目;Species表示分類到種OTU數(shù)目。4.4我們還可以夠夠夠?qū)@些種屬的構成進行柱狀圖顯示:橫坐標中每一個條形圖代表一個樣本,縱坐標代表該分類層級的序列數(shù)目或比率。同一種顏色代表相同的分類級別。圖中的每根柱子中的顏色表示該樣本在不一樣樣樣級別(門、綱、目等)的序列數(shù)目,序列數(shù)目只計算級別最低的分類,比方在屬被騙算過了,則在科中則不重復計算。Q:為何要選擇V3-V4區(qū)的測序長度?為何有些文件是V6區(qū),有什么差異?16SrRNA總長約1540bp,包含9個可變區(qū)。因為高通量測序的測序長度的限制,不可以夠能將16SrRNA的9個可變區(qū)所有測序,因此在PCR擴增時常常只好選擇1-3個可變區(qū)作為擴增片段。Kozich等評估了Miseq測序儀解析的不一樣樣樣16SrRNA可變區(qū)的正確性發(fā)現(xiàn),測定V4區(qū)見效最正確。依據(jù)我們的測序長度,v3-v4區(qū)是最正確選擇。5.5我們還需要對樣本之間或分組之間的OTU進行比較獲取韋恩圖:注意,韋恩圖當前一般最多只好顯示5個樣本或分組,過多的樣本沒法沒法進行韋恩圖繪制6樣品構成豐度:稀釋曲線微生物多樣性解析中需要考證測序數(shù)據(jù)量能否足以反應樣品中的物種多樣性,稀釋曲線(豐富度曲線)能夠用來查驗這一指標。稀釋曲線是用來議論測序量能否足以覆蓋所有類群,并間接反應樣品中物種的豐富程度。稀釋曲線是利用已測得16SrDNA序列中已知的各種OTU的比較較例,來計算抽取n個(n小于測得reads序列總數(shù))reads時出現(xiàn)OTU數(shù)目的希望值,此后依據(jù)一組n值(一般為一組小于總序列數(shù)的等差數(shù)列)與其相對應的OTU數(shù)目的希望值做出曲線來。當曲線趨于緩和或許達到平臺期時也就能夠以為測序深度已經(jīng)基本覆蓋到樣品中所有的物種;反之,則表示樣品中物種多樣性較高,還存在好多未被測序檢測到的物種。以以下列圖中的稀釋曲線橫坐標代表隨機抽取的序列數(shù)目;縱坐標代表察看到的OTU數(shù)目。樣本曲線的延長終點的橫坐標地點為該樣本的測序數(shù)目,假如曲線趨于平展表示測序已趨于飽和,增添測序數(shù)據(jù)沒法再找到更多的OTU;反之表示不飽和,增添數(shù)據(jù)量能夠發(fā)現(xiàn)更多OTU。7.7Shannon-Winner曲線Shannon-Wiener曲線,是利用shannon指數(shù)來進行繪制的,反應樣品中微生物多樣性的指數(shù),利用各種品的測序量在不一樣樣樣測序深度時的微生物多樣性指數(shù)建立曲線,以此反應各種本在不一樣樣樣測序數(shù)目時的微生物多樣性。當曲線趨勢平展時,說明測序數(shù)據(jù)量足夠大,能夠反應樣品中絕大部分的微生物物種信息。與上圖相同,橫坐標代表隨機抽取的序列數(shù)目;縱坐標代表的是反應物種多樣性的Shannon指數(shù)。樣本曲線的延長終點的橫坐標地點為該樣本的測序數(shù)目,假如曲線趨于平展表示測序已趨于飽和,增添測序數(shù)據(jù)沒法再找到更多的OTU;反之表示不飽和,增添數(shù)據(jù)量能夠發(fā)現(xiàn)更多OTU。此中曲線的最高點也就是該樣本的物種多樣性越高。Q:Shannon指數(shù)怎么算的?

Shannon指數(shù),指數(shù)越高表示樣品的A:Shannon指數(shù)公式:此中,Sobs=實質(zhì)丈量出的OTU數(shù)目;ni=含有i條序列的OTU數(shù)目;N=所有的序列數(shù)。8Rank-Abundance曲線用于同時解說樣品多樣性的兩個方面,即樣品所含物種的豐富程度和均勻程度。物種的豐富程度由曲線在橫軸上的長度來反應,曲線越寬,表示物種的構成越豐富;物種構成的平均程度由曲線的形狀來反應,曲線越平展,表示物種構成的平均程度越高。一般超出20個樣本圖就會變得特別復雜并且不雅觀,因此一般20個樣本以下會做該圖,圖片保存為結果目錄中rank.pdf。橫坐標代表物種排序的數(shù)目;縱坐標代表察看到的相對豐度。樣本曲線的延長終點的橫坐標地點為該樣本的物種數(shù)目,假如曲線越圓滑降落表示樣本的物種多樣性越高,而曲線迅速突然降落表示樣本中的優(yōu)勢菌群所占比率很高,多樣性較低。9Alpha多樣性(樣本內(nèi)多樣性)Alpha多樣性是指一個特定地區(qū)或許生態(tài)系統(tǒng)內(nèi)的多樣性,常用的胸懷指標有

Chao1

豐富度預計量(Chao1richnessestimator)、香農(nóng)-威納多樣性指數(shù)(Shannon-wienerdiversity

index)、辛普森多樣性指數(shù)(Simpsondiversityindex

)等。計算菌群豐度:Chao、ace;計算菌群多樣性:Shannon、Simpson。Simpson指數(shù)值越大,說明群落多樣性越高;Shannon指數(shù)越大,說明群落多樣性越高。表中顯示前10個樣本,假如樣本大于10個,詳見結果目錄中的alpha_div.txt。Q:能不可以夠夠解說下每個指數(shù)(如chao1、shannon)?Chao1:是用chao1算法預計群落中含OTU數(shù)目的指數(shù),chao1在生態(tài)學中常用來預計物種總數(shù),由Chao(1984)最早提出。Chao1值越大代表物種總數(shù)越多。Schao1=Sobs+n1(n1-1)/2(n2+1)此中Schao1為預計的OTU數(shù),Sobs為察看到的OTU數(shù),n1為只有一條序列的OTU數(shù)目,n2為只有兩條序列的OTU數(shù)目。Shannon:用來預計樣品中微生物的多樣性指數(shù)之一。它與Simpson多樣性指數(shù)均為常用的反應alpha多樣性的指數(shù)。Shannon值越大,說明群落多樣性越高。Ace:用來預計群落中含有OTU數(shù)目的指數(shù),由Chao提出,是生態(tài)學中預計物種總數(shù)的常用指數(shù)之一,與Chao1的算法不一樣樣樣。Simpson:用來預計樣品中微生物的多樣性指數(shù)之一,由EdwardHughSimpson(1949)提出,在生態(tài)學中常用來定量的描繪一個地區(qū)的生物多樣性。Simpson指數(shù)值越大,說明群落多樣性越高。辛普森多樣性指數(shù)=隨機取樣的兩個個體屬于不一樣樣樣種的概率=1-隨機取樣的兩個個體屬于同種的概率10.10Beta多樣性解析(樣品間差異解析)Beta多樣性胸懷時空尺度上物種構成的變化,是生物多樣性的重要構成部分,與好多生態(tài)學和進化生物學識題親密有關,因此在近來10年間成為生物多樣性研究的熱門問題之一。PCoA解析PCoA(principalco-ordinatesanalysis)是一種研究數(shù)據(jù)相像性或差異性的可視化方法,經(jīng)過一系列的特點值和特點向量進行排序后,選擇主要排在前幾位的特點值,PCoA能夠找到距離矩陣中最主要的坐標,結果是數(shù)據(jù)矩陣的一個旋轉(zhuǎn),它沒有改變樣品點之間的互相地點關系,但是改變了坐標系統(tǒng)。經(jīng)過PCoA能夠察看個體或集體間的差異。每一個點代表一個樣本,相同顏色的點來自同一個分組,兩點之間距離越近表示二者的群落構成差異越小。PCoA有多張圖,分別代表的PCoA1-2,2-3,3-1。11.11NMDS解析(非胸懷多維尺度解析)NMDS(NonmetricMultidimensionalScaling)常用于比對樣本組之間的差異,能夠鑒于進化關系或數(shù)目距離矩陣。橫軸和縱軸:表示鑒于進化或許數(shù)目距離矩陣的數(shù)值在二維表中成圖。PCA解析的主要差異在于考量了進化上的信息。每一個點代表一個樣本,相同顏色的點來自同一個分組,兩點之間距離越近表示二者的群落構成差異越小。12.12PCA解析主成分解析PCA(Principalcomponentanalysis)是一種研究數(shù)據(jù)相像性或差異性的可視化方法,經(jīng)過一系列的特點值和特點向量進行排序后,選擇主要的前幾位特點值,采納降維的思想,PCA能夠找到距離矩陣中最主要的坐標,結果是數(shù)據(jù)矩陣的一個旋轉(zhuǎn),它沒有改變樣品點之間的互相地點關系,但是改變了坐標系統(tǒng)。詳盡對于主成分解析的解說介紹大家看一篇文章,。經(jīng)過PCA能夠察看個體或集體間的差異。每一個點代表一個樣本,相同顏色的點來自同一個分組,兩點之間距離越近表示二者的群落構成差異越小。以上三個圖可能碰到的問題:1:PCA,PcoA,NMDS解析分別是鑒于什么數(shù)據(jù)畫的?回答:PCA,PcoA,NMDS解析均是鑒于OTU分類taxon數(shù)據(jù)所畫,用的是R語言Vegan包中的有關函數(shù)畫成,此中PcoA與NMDS還要鑒于樣本之間的距離矩陣才能畫成。2:PCA解析假如圖中大部分點集中在一同,少量點在很遠的外面,是什么原由造成的?回答:是因為樣本OTU分類時候,少量樣本某些菌含量特別高所造成,致使這些樣本偏離正常范圍,建議獨自取出這些樣本察看,看是不是實驗錯誤。3:PCA解析時,不是有PC1,PC2,PC3三個坐標嗎?是給出三張圖嗎?仍是三維立體圖?回答:PCA作圖時,會得出PC1,PC2,PC3三個坐標,能夠依據(jù)PC12,PC13,PC23分別作圖,一般給出的是PC12的圖,當PC12圖質(zhì)量不好,看不出顯然的樣安分類見效時,能夠看PC13或PC23的圖分類能否清楚,也能夠用R語言rgl包做出PC123三維圖。QIIME自己結果中有供給PCA的三維圖結果,能夠經(jīng)過網(wǎng)頁翻開。13.13LDA差異貢獻解析PCA和LDA的差異在于,PCA,它所作的但是將整組數(shù)據(jù)整體照耀到最方便表示這組數(shù)據(jù)的坐標軸上,照耀時沒有益用任何數(shù)據(jù)內(nèi)部的分類信息,是無監(jiān)察的,而LDA是由監(jiān)察的,增添了種屬之間的信息關系后,聯(lián)合顯然性差異標準測試(克魯斯卡爾-沃利斯查驗和兩兩Wilcoxon測試)和線性鑒別分析的方法進行特點選擇。除了能夠檢測重要特點,他還可以夠夠夠依據(jù)效應值進行功能特點排序,這些功能特點能夠解說頂部的大部分生物學差異。詳盡說明能夠參照這篇文章

。不一樣樣樣顏色代表不一樣樣樣樣本或組之間的顯然差異物種。使用

LefSe

軟件解析獲取,此中顯然差其余

logarithmicLDAscore

設為

2。問題:LDA解析有什么用?回答:組間差異顯然物種又能夠稱作生物標記物(biomarkers),該分析主假如想找到組間在豐度上有顯然差其余物種。物種進化樹的樣本群落散布圖是將不一樣樣樣樣本的群落構成及散布以物種分類樹的形式在一個環(huán)圖中展。數(shù)據(jù)經(jīng)過解析后,將物種分類樹和分類豐度信息經(jīng)過軟件GraPhlAn(/GraPhlAn)進行繪制。其目的是將物種之間的進化關系以及不一樣樣樣樣本的物種散布豐度和最高散布樣本的信息在一個視覺集中的環(huán)圖中一次展現(xiàn),其供給的信息量較其余圖最為豐富。中間為物種進化分類樹,不一樣樣樣顏色的分支代表不一樣樣樣的綱(詳盡的代表顏色見右上角的圖例),此后外圈的灰色標示字母的環(huán)表示的是本次研究中比例最高的15個科(字母代表的科拜見左上角的圖例)。此后的外圈供給的是熱力爭,假如樣本數(shù)<=10個則繪制樣本,假如樣本數(shù)超出10個則依據(jù)分組繪制,每一環(huán)為一個樣本,依據(jù)其豐度繪制的熱力爭。最外圈為柱狀圖,繪制的是該屬所占比率最高的樣本的豐度和樣本顏色(樣本顏色見環(huán)最下方的樣本名字的顏色)。此中熱力爭和柱狀圖取值均為原比率值x10000后進行l(wèi)og2變換后的值參照文件:1.Vazquez-BaezaY,PirrungM,GonzalezA,KnightR.2013.Emperor:Atoolforvisualizinghigh-throughputmicrobialcommunitydata.Gigascience2(1):16.Legendre,P.andLegendre,L.1998.NumericalEcology.SecondEnglishEdition.DevelopmentsinEnvironmentalModelling20.Elsevier,Amsterdam.SegataN,IzardJ,WaldronL,etal.Metagenomicbiomarkerdiscoveryandexplanation[J].GenomeBiol,2011,12(6):R60.LangilleMGI,ZaneveldJ,CaporasoJG,McDonaldD,KnightsD,ReyesJAetal.(2013).Predictivefunctionalprofilingofmicrobialcommunitiesusing16SrRNAmarkergenesequences.NatBiotechnol31:814–821.物種有關性解析依據(jù)各個物種在各個樣品中的豐度以及變化狀況,計算物種之間的有關性,包含正有關和負有關。有關性解析使用CCREPE算法,第一對原始16s測序數(shù)據(jù)的種屬數(shù)目進行標準化,此后進行Spearman和Pearson秩有關解析并進行統(tǒng)計查驗,計算出各個物種之間的有關性,此后在所有物種中依據(jù)simscore絕對值的大小,挑選出有關性最高的前100組數(shù)據(jù),鑒于Cytoscap繪制共表達解析網(wǎng)絡圖,網(wǎng)絡圖采納兩種不一樣樣樣的形式表現(xiàn)出來。物種有關性網(wǎng)絡圖A:圖中每一個點代表一個物種,存在有關性的物種用連線連結,此中,紅色的連線代表負有關,綠色的先代表正有關,連線顏色的深淺代表有關性的高低。物種有關性網(wǎng)絡圖B:圖中每一個點代表一個物種,點的大小表示與其他物種的關系關系的多少,此中與之有有關性的物種數(shù)越多,點的半徑和字體越大,連線的粗細代表兩物種之間有關性的大小,連線越粗,有關性越高。參照文件:SchwagerE,WeingartG,BielskiC,etal.CCREPE:CompositionalityCorrectedbyPermutationandRenormalization[J].2014.聚類解析依據(jù)OUT數(shù)據(jù)進行標準化辦理(1wlog10)此后,采納數(shù)目最多的前60個物種,鑒于Rheatmap進行作圖,熱圖中的每一個色塊代表一個樣品的一個屬的豐度,樣品橫向擺列,屬縱向擺列,兩個熱圖,差異是能否對樣品進行聚類,從聚類中能夠認識樣品之間的相像性以及屬水平上的群落構成相像性。假如聚類結果中出現(xiàn)大面積的白或黑是因為大批的菌含量特別低,致使都沒有數(shù)值,能夠在繪制以行進行標準化操作,對每一類菌單獨自身進行Z標準化。群落功能差異解析經(jīng)過對已有測序微生物基因組的基因功能的構成進行解析后,我們能夠經(jīng)過16s測序獲取的物種構成推斷樣本中的功能基因的構成,進而解析不一樣樣樣樣本和分組之間在功能上的差異(PICRUStNatureBiotechnology,1-10.82013)。經(jīng)過對宏基因組測序數(shù)據(jù)功能解析和對應16s展望功能解析結果的比較發(fā)現(xiàn),此方法的正確性在84%-95%,對腸道微生物菌群和土壤菌群的功能解析湊近95%,能特別好的反應樣品中的功能基因構成。為了能夠經(jīng)過16s測序數(shù)據(jù)來正確的展望出功能構成,第一需要對原始16s測序數(shù)據(jù)的種屬數(shù)目進行標準化,因為不一樣樣樣的種屬菌包含的16s拷貝數(shù)不相同。此后將16s的種屬構成信息經(jīng)過建立好的已測序基因組的種屬功能基因構成表照耀獲取展望的功能結果。(依據(jù)屬這個水平,對不一樣樣樣樣本間的物種豐度進行顯然性差異兩兩查驗,我們這里的查驗方法使用STAMP中的two-sample中T-TEST方法,Pvalue值過濾為0.05,作Extenterrorbar圖。)此處供給COG,KO基因展望以及KEGG代謝門路展望。用戶也可自履行用我們供給的文件和軟件(STAMP)對不一樣樣樣層級以及不一樣樣樣分組之間進行統(tǒng)計解析和制圖,以及選擇不一樣樣樣的統(tǒng)計方法和顯然性水平。參照文件:DonovanH.Parks1,GeneW.Tyson,STAMP:statisticalanalysisoftaxonomicandfunctionalprofiles,COG構成差異解析圖圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了COG構成在組間存在顯然差其余功能分類以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。KEGG代謝門路差異解析圖經(jīng)過KEGG代謝門路的展望差異解析,我們能夠認識到不一樣樣樣分組的樣品之間在微生物群落的功能基因在代謝門路上的差異,以及變化的高低。為我們認識群落樣本的環(huán)境適應變化的代謝過程供給一種簡單快捷的方法。圖解讀:圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了在第三層級的構成在組間存在顯然差其余KEGG代謝門路第三層分類以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。本例圖所顯示的是第三層級的KEGG代謝門路的差異解析,也能夠針對第二或第一層的分級進行解析?;虻牟町惤馕鰣D除了能對大的基因功能分類和代謝門路進行展望外,我們還可以夠夠供給優(yōu)秀的功能基因的數(shù)目和構成的展望,以及進行樣本間以及組間的差異解析,并給出擁有統(tǒng)計意義和置信區(qū)間的解析結果。這一解析將我們對于樣本群落的差異進一步深入到了每一類基因的層面。圖解讀:圖中不一樣樣樣顏色代表不一樣樣樣的分組,列出了在組間/樣本間存在顯然差其余每一個功能基因(酶)以及在各組的比率,其余右邊還給出了差其余比率和置信區(qū)間以及P-value。在獲取標準報告后假如希望獨自改正分組或?qū)δ承┙M之間進行顯然性差異解析,能夠使用STAMP軟件在自己的電腦進步行數(shù)據(jù)解析。STAMP供給了豐富的統(tǒng)計查驗方法和圖形化結果的輸出。在使用STAMP以前需要第一準備需要的spf格式文件和樣品分組信息表。在我們的報告中已經(jīng)將KEGG和KO以及COG的結果文件后經(jīng)過變換生成了適于STAMP軟件翻開的spf格式文件,還有對應的分組信息表文件。以下是使用STAMP時的一些有關問題,詳盡的STAMP使用教程能夠參照我們供給的STAMP使用教程。1、stamp作圖用的原始數(shù)據(jù)的根源?STAMP能夠直接使用來自QIIME的biom文件和PICUST的KEGG和ko文件,文件的格式為tab-saperatedvalue(tab鍵分開的數(shù)據(jù))2、分組問題:導入數(shù)據(jù)此后,viewàgrouplegend,在窗口右邊會出現(xiàn)分組欄,依據(jù)需要進行分組。3、Unclassiffied選項中,remainUnclassiffiedreads、removeUnclassiffiedreads、和useonlyforcalculatingfrequencyprofiles方法的差異?remainUnclassiffiedreads和useonlyforcalculatingfrequencyprofiles方法會保存所有的數(shù)據(jù),而removeUnclassiffiedreads但是保存有確立分組信息的數(shù)據(jù)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論