




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、精選優(yōu)質文檔-傾情為你奉上 16srDNA信息分析1.標準信息分析(初級)1.1 基本數(shù)據(jù)處理(使用內(nèi)部撰寫的程序對原始的測序數(shù)據(jù)進行基本處理) 通過Illumina平臺(Miseq)進行Paired-end測序,下機數(shù)據(jù)經(jīng)過去除低質量reads(Q20, 90%標準過濾),并trim掉reads2 尾部100bp 低質量序列;每個樣品數(shù)據(jù)產(chǎn)出詳細統(tǒng)計結果見下表:表1-1 reads數(shù)據(jù)統(tǒng)計:# Samples# HQ reads (total)# HQ reads (mean±SD)CA17110,6516,509±2,175HC19163,6908,615±3
2、,081LK13127,4169,801±2,858Total49401,7578,199±2,992注:原來的樣本中CA15由于原始Reads數(shù)太少(只有23條)而被刪除,因此目前的樣本總數(shù)為49個 1.2 去除 barcode 序列,引物序列及 tags過濾通過COPE軟件(Connecting Overlapped Pair-End,V1.2.3.3),利用重疊關系將雙末端測序得到的成對reads組裝成一條序列。利用內(nèi)部編寫程序去除兩端barcode 序列,引物序列。 Paired End Reads通過reads之間的overlap (19個堿基)關系拼接成Tags
3、;然后去掉barcode序列,引物序列。為了得到高質量的Tags,將拼接的Tags按照長度過濾,去嵌合體等的處理。(這里等的意思就是按照拼接條件過濾:1, 堿基的ASCII value值低于33的過濾掉。2.overlap取19個堿基,這19個堿基相互匹配率低于98%的過濾掉。3.去掉引物序列的時候,允許一個錯配,錯配多于一個的過濾掉。) 表1-2 tags的詳細信息Sample IDRaw Tag NumFinal Tag numHC11756017,319HC296729,604HC31805317,826HC41218112,107HC51155811,477HC81148811,404
4、HC91635416,095HC102158421,270HC1179897926HC121156111,449HC132490924,660HC142297922,736HC152074720,549HC161485714,728HC172117121,002HC181070010,605HC191135911,247CA81620316,040CA101092510,560CA1182547,690CA1294799,053CA1479477,584CA1682218,093CA171066610,479CA181078710,651CA51634416,154CA960475,861CA
5、131029010,1652 高級信息分析2.1 OUT及其豐度分析2.1.1 OUT統(tǒng)計 拼接的Tags經(jīng)過優(yōu)化后,在0.97相似度下利用qiime(v1.8.0)軟件將其聚類為用于物種分類的OTU(Operational Taxonomic Units),統(tǒng)計各個樣品每個OTU中的豐度信息,OTU的豐度初步說明了樣品的物種豐富程度。49個樣品共產(chǎn)生3029個OTU,其中Singletons OTU(即豐度為1的OTU)個數(shù)為0,Non singletons OTU個數(shù)為3029。表4.樣品OUT統(tǒng)計SampleNameOTUsTagsHC154117,319HC22699,604HC353
6、017,826HC421512,107HC520611,477HC821411,404HC945516,095HC1060021,270HC1226211,449HC1329424,660CA1045310,560CA117107,690CA126509,053CA145197,584CA162408,093CA1733010,479CA1828910,651CA533616,154CA93475,861HC111427,926CA1326910,165表5 OTU 統(tǒng)計IndexOTU numNo. of OTUs3029Assigned to families1,708 Assigned
7、to genera1,172 Assigned to species314No. of OTUs per sample368±147Min no. of OTUs per sample127Max no. of OTUs per sample7192.1.2 OTU分布的韋恩圖如下:在0.97的相似度下,得到了每個樣品的OTU個數(shù),利用R(v3.1.1)畫圖軟件繪出Venn圖可以展示多樣品共有和各自特有OTU數(shù)目,直觀展示樣品間OTU的重疊情況。結合OTU所代表的物種,可以找出不同環(huán)境中的核心微生物。圖2-1 OTU venn 分析。不同顏色圖形代表不同樣品或者不同組別,不同顏色圖形
8、之間交疊部分數(shù)字為兩個樣品或兩個組別之間共有的OTU個數(shù)。同理,多個顏色圖形之間交疊部分數(shù)字為多個樣品或組別之間共有OTU個數(shù)。Venn圖容許2-5個樣品或組別。2.1.3 OUT水平的PCA圖如下:R(v3.1.1)畫圖軟件PCA 分析(Principal Component Analysis),即主成分分析,是一種分析和簡化數(shù)據(jù)集的技術。主成分分析經(jīng)常用于減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集中的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。通過分析不同樣品OTU(97%相似性)組成可以反映樣品的差異和距離,PCA運用方差分解,將
9、多組數(shù)據(jù)的差異反映在二維坐標圖上,坐標軸取能夠最大反映方差值兩個特征值。如果兩個樣品距離越近,則表示這兩個樣品的組成越相似。不同處理或不同環(huán)境間的樣品可能表現(xiàn)出分散和聚集的分布情況,從而可以判斷相同條件的樣品組成是否具有相似性。圖2-2 基于OTU豐度的PCA分析。橫坐標表示第一主成分,括號中的百分比則表示第一主成分對樣品差異的貢獻值;縱坐標表示第二主成分,括號中的百分比表示第二主成分對樣品差異的貢獻值。圖中點分別表示各個樣品。不同顏色代表樣品屬于不同的分組。2 .2 Core microbiome分析圖表都是通過qiime(v1.8.0)軟件得到的共有OTU數(shù)與樣本數(shù)的關系:圖2-3 覆蓋所
10、有樣本的微生物組。橫坐標表示樣品占的比率,縱坐標表示包含OUT的數(shù)目。 這些樣本的core microbiome(即覆蓋所有樣本的微生物組)共包含17個OTUs,其物種分類信息如下表2-1。表2-1 覆蓋所有樣本的OTUsOTUTaxonomy levelTaxonomy nameGenusStreptococcusGenusCapnocytophagaSpeciesdisparGenusCampylobacterGenusFusobacteriumGenusStreptococcusGenusStreptococcusGenusPeptostreptococcusGenusGranulica
11、tellaGenusCampylobacterGenusNeisseriaGenusFusobacterium2008GenusNeisseria21908GenusNeisseriaGenusCampylobacterFamilyGemellaceae1212GenusGranulicatella2.3 生物多樣性分析2.3.1 單個樣品復雜性分析通過計算Shannon index, Chao1 index, Phylogenetic diversity (PD, whole tree) 和observed number of species共四個指數(shù)來進行生物多樣性分析。通過qiime(v
12、1.8.0)軟件計算樣品的Alpha多樣性值并用R(v3.1.1)軟件做出相應的稀釋曲線,盒型圖。稀釋曲線是利用已測得16S rDNA序列中已知的各種OTU的相對比例,來計算抽取n個(n小于測得Reads序列總數(shù))Tags時各Alpha指數(shù)的期望值,然后根據(jù)一組n值(一般為一組小于總序列數(shù)的等差數(shù)列)與其相對應的Alpha指數(shù)的期望值繪制曲線。如樣品有提供分組信息,且每組樣品個數(shù)不小于3,將對組間的Alpha多樣性指數(shù)進行差異分析。差異分析的檢驗方法為秩和檢驗,如果組數(shù)為2,采用兩樣品比較的Wilcoxon Rank-Sum Test(R中的wilcox.test);如果組數(shù)大于2,采用多樣品
13、比較的Kruskal-Wallis Test(R中的kruskal.test)。最后利用Alpha多樣性指數(shù)繪制盒形圖。差異分析與作圖均通過R軟件(v3.1.1)進行。 基于 OTU 的結果,我們計算了樣品的 Alpha 多樣性(表2-2)。Alpha 多樣性是對單個樣品中物種多樣性的分析。chao1多樣性估算指數(shù)是根據(jù)所測得的 tags 數(shù)和 OTU 的數(shù)量以及相對比例來預測樣品中微生物的種類(OTU 的數(shù)量),是基于已知結果所得相對值。Shannon 指數(shù)是一個綜合 OTU 豐度和 OTU 均勻度兩方面因素的一個多樣性指數(shù),Shannon 及observed number of speci
14、es、 Phylogenetic diversity (PD, whole tree) 指數(shù)越大,則表示該樣品中的物種越豐富。表2-2 樣品的 Alpha 多樣性#Alphamean(CA)mean(HC)mean(LK)Pvalue(KW)p-vaule(CA-HC)p-vaule(CA-LK)p-vaule(HC-LK)chao1488.357.422.0.0.0.0.observed_species243.161.199.0.0.0.0.PD_whole_tree16.13.15.0.0.0.0.shannon3.2.3.0.0.0.0.Rarefaction分析(樣本不分組):圖2-4
15、 單個樣品內(nèi)的Alpha 多樣性Rarefaction分析(樣本分組):圖2-5 每組樣品內(nèi)的Alpha 多樣性。圖中紅色,黃色,藍色線分別表示CA, HC, LK組的rarefaction分析結果圖2-6為組Alpha多樣性盒形圖,更直觀顯示組間Alpha多樣性差異。盒形圖可以顯示5個統(tǒng)計量(最小值,第一個四分位數(shù),中位數(shù),第三個中位數(shù)和最大值,及由下到上的5條線),異常值以“º”標出。 Alpha多樣性的比較,以Shannon index為例可以看出多樣性CA>LK>HC,其中CA/HC有明顯差異(P=0.008, Students t test),而CA/LK, H
16、C/LK差異不顯著2.3.2 樣品間復雜度比較分析Beta多樣性(Beta diversity)分析是用來比較一對樣品在物種多樣性方面存在的差異大小。本分析中通過QIIME(v1.8.0)軟件,采用迭代算法,分別在加權物種分類豐度信息和不加權物種分類豐度信息的情況下,隨機抽取各樣品中75% Reads單獨進行差異計算,迭代100次之后綜合統(tǒng)計得到最終的統(tǒng)計分析結果表及PCoA展示圖。Beta多樣性熱圖使用R(v3.1.1)軟件中的NMF包的aheatmap進行作圖。 UniFrac是通過利用系統(tǒng)進化的信息來比較樣品間的物種群落差異。其計算結果可以作為一種衡量beta diversity的指數(shù),
17、它考慮了物種間的進化距離,該指數(shù)越大表示樣品間的差異越大。報告中給出的UniFrac結果分為加權UniFrac(weighted UniFrac)與非加權UniFirac(unweighted UniFrac)2種,其中weighted UniFrac考慮了序列的豐度,unweighted UniFrac不考慮序列豐度。 從下面盒形圖看,CA組內(nèi)的物種豐度最大。Weighted Unifrac 圖2-7 Beta多樣性的盒形圖Unweighted UnifracUnifrac距離的主坐標分析(PCoA)如下:Weighted UnifracUnweighted Unifrac圖2-8 Beta
18、多樣性的主坐標分析(PCoA)圖。 如果兩個樣品距離越近,則表示這兩個樣品的組成越相似。不同處理或不同環(huán)境間的樣品可能表現(xiàn)出分散和聚集的分布情況,從而可以判斷相同條件的樣品組成是否具有相似性。圖2-9 UniFrac距離分布heatmap。通過對UniFrac結果的聚類,具有相似beta多樣性的樣品聚類在一起,反應了樣品間的相似性。2.3.3 物種組成分析本分析中分組后各水平的分類比較柱形圖是用QIIME(v1.8.0)軟件得到的,單個樣品的群落分布柱形圖和盒型圖是根據(jù)QIIME(v1.8.0)軟件計算的結果用R(v3.1.1)軟件畫的。 樣品的群落分布圖,直觀的反應各樣品的群落組成。從門水平
19、的群落分布圖中可以看出,在這批樣品中,占主要地位的門有 Firmicutes,Proteobacteria。2.3.3.1 門(phylum)水平比較 圖2-10 分組后門水平的分類比較。從左至右分別為CA,HC,LK的物種組成。 圖2-11樣品的門水平群落分布圖2.3.3.2 綱(class)水平比較圖2-12 分組后綱水平的分類比較。從左至右分別為CA,HC,LK的物種組成。 圖2-13樣品的綱水平群落分布圖2.3.3.3 屬(genus)水平比較 圖2-14樣品的屬水平群落分布圖含量最高的25個屬的物種組成如下: 可以看出,這些樣本中含量最高的屬為Streptococcus, Neiss
20、eria, Neisseriaceae (family), Campylobacter, Bacillus, Gemellaceae, TM7-32.3.4 多組樣本的比較分析下面的表格都是通過QIIME(v1.8.0)軟件計算出的,熱圖是用R(v3.1.1)軟件畫的。2.3.4.1.1 OTU水平的比較分析下表是在不同組樣本間有顯著差異的OTUs(P<0.05, Kruskal-Wallis test),共35個OTUP valueCA_meanHC_meanLK_meanLineage0.0.0.0.s_Streptococcus_infantis0.1.334E-059.02E-0
21、53.309E-05s_Streptococcus_infantisCU.OTU36090.0.4.302E-057.37E-05s_Streptococcus_infantisCU.OTU39510.0.0.0.s_Streptococcus_infantis0.4.506E-052.515E-050.s_Selenomonas_noxia0.0.2.728E-053.53E-05s_Prevotella_tannerae0.0.0.0.s_Haemophiluspara_influenzae0.4.681E-057.871E-050.s_Capnocytophaga_ochraceaCU.
22、OTU15120.0.5.314E-054.729E-05s_Campylobacter_rectusCU.OTU42480.3.144E-053.67E-050.s_Actinobacillus_porcinusCU.OTU46690.0.00.o_LactobacillalesCU.OTU28840.0.0.0.o_Gemellales0.0.0.0.g_Streptococcus0.1.213E-057.16E-050.g_Streptococcus0.0.2.432E-054.272E-05g_Streptococcus0.0.0.0.g_Prevotella0.0.2.607E-05
23、5.232E-05g_Leptotrichia0.08.912E-050.g_Cardiobacterium0.0.0.0.g_Capnocytophaga0.0.7.529E-050.g_Capnocytophaga0.0.00.g_BacillusOTU190.0.0.0.g_Abiotrophia0.0.0.0.f_StreptococcaceaeCU.OTU44370.6.529E-055.103E-060.f_StreptococcaceaeOTU20.4.005E-059.346E-060.f_PasteurellaceaeCU.OTU38810.0.6.821E-050.f_Ne
24、isseriaceaeCU.OTU20270.0.8.193E-050.f_Neisseriaceae0.0.0.0.01988f_GemellaceaeCU.OTU1600.0.8.61E-063.201E-05f_Clostridiaceae0.0.0.0.f_Clostridiaceae6.38E-056.461E-058.711E-050.f_Carnobacteriaceae0.0.0.0.f_Carnobacteriaceae0.0.0.0.f_CarnobacteriaceaeOTU100.0.00.c_BacilliCU.OTU310.0.2.232E-053.781E-05 p_Firmicutes2.3.4.2 屬水平的比較分析首先,PCA分析能夠看出3組樣本之間有一定程度的差異:其次,通過Kruskal-Wallis test分析可以找出在不同組間有明顯差異(P<0.05)的屬如下(共19個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 眾籌購買合同范本
- 免招標合同范本
- 買房贈與車庫合同范本
- 冷凍物品購銷合同范本
- 2025屆中國電建集團重慶工程有限公司秋季招聘筆試參考題庫附帶答案詳解
- 交流合同范本
- 義診合作合同范本
- 獸醫(yī)雇傭合同范本
- 創(chuàng)建服務合同范本
- 三方企業(yè)合資經(jīng)營合同范本
- 自動化電氣控制方案
- 臍疝護理查房課件
- XX學校學校集體備課實施方案細則、方案、計劃、制度、總結(全套資料)
- 開展去向不明人員專項工作方案
- 無人機項目商業(yè)計劃書
- 南方談話學習匯報
- 高處作業(yè)吊籃施工安全監(jiān)理實施細則
- 中國結核病預防性治療指南
- 大班科學《燈的故事》PPT優(yōu)質課件
- 危重癥呼吸支持治療
- 雅馬哈電子琴KB290說明書
評論
0/150
提交評論