微生物專題1課件_第1頁
微生物專題1課件_第2頁
微生物專題1課件_第3頁
微生物專題1課件_第4頁
微生物專題1課件_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、微生物專題上海翰宇生物項(xiàng)目類型測序平臺(tái)翰宇經(jīng)驗(yàn)單體微生物基因組1.1 De novo1.2 重測序分子生態(tài)宏基因組 單體微生物基因組 分子生態(tài) 宏基因組項(xiàng)目類型單體微生物基因組De novo:從頭測序,不需要任何基因序列信息即可對(duì)某個(gè)物種進(jìn)行測序,利用生物信息學(xué)分析方法對(duì)序列進(jìn)行拼接組裝,獲得該物種的基因組序列圖譜。重測序:對(duì)已知基因組序列的物種進(jìn)行不同個(gè)體的基因組測序,在此基礎(chǔ)上對(duì)個(gè)體或群體進(jìn)行差異分析,通過序列比對(duì),檢測單核苷酸多態(tài)性位點(diǎn)(SNP),插入缺失位點(diǎn)(InDel,Insertion/Deletion)、結(jié)構(gòu)變異位點(diǎn)(SV,Structure Variation)等。區(qū)別:有無參

2、考基因組,是否拼裝。 單體微生物基因組De novo技術(shù)路線De novo 單體微生物基因組 分析示例-COGCOG分類橫坐標(biāo)的不同字母代表不同顏色的功能分類縱坐標(biāo)代表每個(gè)功能分類中預(yù)測基因的數(shù)目De novo 單體微生物基因組 分析示例-KEGGKEGGpathway分類橫坐標(biāo)代表參與的代謝通路名稱縱坐標(biāo)代表每類代謝通路中的預(yù)測基因數(shù)目De novoDe novo 單體微生物基因組 分析示例-基因組島基因組島預(yù)測(完成圖)紅色代表不同軟件預(yù)測的整合結(jié)果黃色和藍(lán)色分別代表2中不同的軟件預(yù)測的結(jié)果De novoDe novo 單體微生物基因組 分析示例-蛋白亞細(xì)胞定位蛋白亞細(xì)胞定位(PSORTb

3、)De novoDe novo 單體微生物基因組 分析示例-次生代謝基因簇次生代謝基因簇分析De novoDe novo 單體微生物基因組 分析示例-進(jìn)化樹進(jìn)化樹構(gòu)建De novoDe novo 單體微生物基因組 分析示例-共線性共線性分析紅色代表兩序列在此區(qū)域正向匹配藍(lán)色代表兩序列在此區(qū)域反向互補(bǔ)匹配De novoDe novo 單體微生物基因組基因組重測序分析1、數(shù)據(jù)產(chǎn)出與質(zhì)控2、序列mapping3、SNP分析4、InDel分析 重測序 重測序 單體微生物基因組分析示例-mappingSampleA1A1-3kclean data (pair)63324372134207Mapping

4、data (pair)5695047(89.93%)1744087(81.72%)Genome Size9025608Gene Size7788573Genome coverage8393531(93.00%)8113884(89.90%)Gene coverage7302866(93.76%)7059674(90.64%)mapping統(tǒng)計(jì) 重測序 重測序 單體微生物基因組分析示例-SNPSampleA1A1-3kSNP number 49414Transition Number 29910Transversion Number 1954Heterozygotes number 851Hom

5、ozygotes number 40913SNPs統(tǒng)計(jì)SampleA1A1-3kAffected genes2419Synonymous SNPs1486noSynonymous SNPs2496Genes with amino acids change1355SNPs在基因中的分布 重測序 重測序 單體微生物基因組分析示例-SNP各類堿基變異的頻率分布 重測序 重測序 單體微生物基因組分析示例-InDelSampleA1A1-3kIndel number21341Affected genes6418Frame shift11018amino acids change52intergeneti

6、c9820Start lost11InDels統(tǒng)計(jì) 重測序 重測序 單體微生物基因組分子生態(tài)分子生態(tài):即環(huán)境微生物多樣性。以微生物群落作為研究整體,通過對(duì)核糖體RNA高變區(qū)域(比如16S/18S/ITS等序列)或功能基因(如古菌的氨氧化基因等)進(jìn)行PCR擴(kuò)增和高通量測序,分析相應(yīng)環(huán)境下微生物群落的多樣性和分布規(guī)律。 分子生態(tài)分子生態(tài)分析1、數(shù)據(jù)產(chǎn)出、統(tǒng)計(jì)2、OTU生成及物種注釋3、物種分類4、評(píng)估5、分析6、顯著性差異分析7、數(shù)據(jù)提交提交 分子生態(tài)分析示例-評(píng)估SampleCutoffsOTUsACEChaoShannonSimpsonCoverageA0.01498720503.711249

7、1.047.4580590.0041210.758663A0.02390410739.147560.1847.1990080.0043250.839546A0.0332438038.8925874.636.9376480.0050570.875874A0.0426965775.4384447.1076.7068980.0057690.905868A0.0523174620.143712.1156.5045030.006290.923923評(píng)估 分子生態(tài)分析示例- Shannon 曲線cutoff0.03的Shannon 曲線趨向平坦時(shí)說明測序數(shù)據(jù)量足夠大可以反映樣品中絕大多數(shù)的微生物物種信息。

8、 分子生態(tài)分析示例-Rank曲線cutoff0.03的Rank曲線物種的豐富程度由曲線在橫軸上的長度來反映,曲線越寬表示物種的組成越豐富 物種組成的均勻度由曲線的形狀來反映,曲線越平坦表示物種組成的均勻度越高 分子生態(tài)分析示例-物種分類cutoff0.03的物種分類結(jié)果第1列是代表序列對(duì)應(yīng)的代表OTU的編號(hào);Taxonomy: 代表OTU的分類情況 A 等:為各個(gè)樣品名稱,下方對(duì)應(yīng)的數(shù)字表示該樣品在對(duì)應(yīng)OTU中包含的序列數(shù) 分子生態(tài)分析示例-多樣品相似度cutoff0.03的多樣性相似度柱狀圖橫坐標(biāo)代表樣本名稱縱坐標(biāo)表示不同物種所占的比例 分子生態(tài)分析示例系統(tǒng)進(jìn)化樹cutoff0.03的系統(tǒng)進(jìn)

9、化樹根據(jù)OTU來區(qū)分樣品內(nèi)及多個(gè)樣本間不同物種通過分析OTU組分豐度來計(jì)算不用物種在樣品內(nèi)的豐度根據(jù)分化時(shí)間來判斷物種間的相似度及進(jìn)化關(guān)系。 分子生態(tài)分析示例韋恩圖cutoff=0.03的韋恩圖代表不同樣品之間共有和特有的OTU情況 分子生態(tài)分析示例-群落結(jié)構(gòu)相似度cutoff0.03的群落結(jié)構(gòu)相似度樹狀圖從整個(gè)分類系統(tǒng)上了解樣品中所有微生物的進(jìn)化關(guān)系和豐度差異距離越近說明群落結(jié)構(gòu)越相似 分子生態(tài)分析示例heatmapcutoff0.03的HeatMap圖橫坐標(biāo)是樣本名縱坐標(biāo)是不同的分類單元含有的OTU數(shù)目 分子生態(tài)分析示例PCAcutoff0.03的PCA分析主成分分析,樣品間相似度越高,反

10、映在圖中的距離越近 分子生態(tài)分析示例CCACutoff=0.03的 CCA分析典范對(duì)應(yīng)分析,需提供理化因子 分子生態(tài)分析示例RDAcutoff0.03的RDA分析冗余分析,需提供理化因子 分子生態(tài)分析示例PCoAcutoff=0.03的PCoA分析 主坐標(biāo)分析 分子生態(tài)分析示例-METASTATS顯著性差異分析結(jié)果從左到右分別為顯著差異的OTU,組1平均值,組1方差,組1標(biāo)準(zhǔn)誤,組2平均值,組2方差,組2標(biāo)準(zhǔn)誤,P值,q值 分子生態(tài)宏基因組宏基因組:特定小生境(如土壤,海洋,腸道等)中全部微小生物遺傳物質(zhì)的總和,目前主要指環(huán)境樣品中細(xì)菌和真菌的基因組總和。不依賴傳統(tǒng)的微生物分離培養(yǎng)過程,以高質(zhì)

11、量的環(huán)境樣品總DNA為研究材料,高通量識(shí)別復(fù)雜環(huán)境樣品中微生物的結(jié)構(gòu)組成及功能。 宏基因組宏基因組技術(shù)路線 宏基因組宏基因組測序分析1、數(shù)據(jù)產(chǎn)出、統(tǒng)計(jì)2、數(shù)據(jù)拼裝3、基因預(yù)測和功能注釋4、tRNA、rRNA分類5、COG分析6、代謝通路構(gòu)建7、菌群結(jié)構(gòu)分析 宏基因組分析示例數(shù)據(jù)拼裝、基因預(yù)測、功能注釋、COG分類、代謝通路構(gòu)建和單體微生物基因組分析類似。菌群結(jié)構(gòu)分析和分子生態(tài)類似,構(gòu)建系統(tǒng)進(jìn)化樹、確定優(yōu)勢物種分類。優(yōu)勢物種分布圖橫坐標(biāo)物種分類,縱坐標(biāo)為物種對(duì)應(yīng)的reads數(shù)目 宏基因組測序平臺(tái)簡介454 GS-FLXllumina Miseq/Hiseq2500PacBio RS 測序平臺(tái)45

12、4 GS-FLXOne Bead = One DNA molecule =One Read Shotgun 打斷基因組DNA 1個(gè)run約80w條 reads,400Mb 測序平臺(tái)454 區(qū)分不同樣本物理分區(qū)Multiplex Identifiers (MID-barcode)區(qū)分 測序平臺(tái)Illumina PE庫 測序平臺(tái)Illumina MP庫Size select on a gelExchange ends with Biotin-dNTPsSelf ligationBioBioBioBioP5 SBS3SBS8 P7PCRFragmentEnd repair and ligate ad

13、apterEnrich with magnetic beadMake clusters and sequenceGenomic DNAFragment and make ends bluntExo treat linear DNASize select on a gelStrpStrpStrp 測序平臺(tái)Illumina邊合成邊測序HiSeq 2500 2*100 bp 1張flowcell 8條lane 1條lane 30Gb 約240Gb 2*150 bp 1張flowcell2條lane 1條lane 45Gb 約90Gb 1*50 bp 1張flowcell 1條lane 1條lane

14、12Gb 約12Gb Miseq 2*300 bp 1張flowcell 2條lane 1條lane 6Gb 約12Gb 測序平臺(tái)PacBio RS 單分子實(shí)時(shí)測序8個(gè)SMRTcell,每個(gè)SMRTcell有150,000個(gè)ZMW(納米級(jí)的零模波導(dǎo)孔zero-mode waveguides)每個(gè)ZMW都能夠包含一個(gè)DNA聚合酶及一條DNA樣品鏈,SMRT Cell能夠平行檢測大約75,000個(gè)單分子測序反應(yīng) 測序平臺(tái)PacBio RS 技術(shù)特點(diǎn):超長讀長:平均測序讀長能達(dá)到5,000bp,最長讀長能達(dá)到30,000bp 準(zhǔn)確率高:對(duì)基因組組裝和基因組變異檢測,可以最多達(dá)到99.999% 的準(zhǔn)確

15、率 敏感性強(qiáng):可以檢測頻率在0.1% 的minor variants 無PCR 擴(kuò)增偏好性:樣本無需PCR 擴(kuò)增,有效避免覆蓋度不均一和PCR bias 最小的GC 偏好性(GC bias):在極端高GC 和極端低GC區(qū)域,可以輕松測定,從而保證序列的均勻覆蓋度。 測序平臺(tái)測序平臺(tái)比較 測序平臺(tái)平臺(tái)測序讀長分區(qū)單元單區(qū)數(shù)據(jù)量1個(gè)run數(shù)據(jù)量周期常用文庫優(yōu)點(diǎn)HiSeq 2500 2*100 bp 1張flowcell 8條lane 1條lane 30Gb 約240Gb 12天PE300bp MP 3Kb 產(chǎn)出數(shù)據(jù)量大2*150 bp 1張flowcell 2條lane 1條lane 45Gb 約

16、90Gb 2天PE300bp MP 3Kb 產(chǎn)出數(shù)據(jù)量大1*50 bp 1張flowcell 1條lane 1條lane 12Gb 約12Gb 2天300bp Miseq 2*300 bp 1張flowcell 2條lane 1條lane6Gb 約12Gb 2-3天PE500bp 讀長較長產(chǎn)出數(shù)據(jù)量較大454 GS FLX400-500 bp 1-8個(gè)分區(qū)約80w條 reads,400Mb2-3天300-1Kb 讀長長拼接效果好PacBio RS II 4-5 Kb 8個(gè)SMRTcell1個(gè)cell200-250M約2Gb2-3天10Kb左右讀長超長拼接更準(zhǔn)確完整建庫不經(jīng)PCR 低GC偏好 項(xiàng)

17、目適用測序平臺(tái)項(xiàng)目類型測序平臺(tái)優(yōu)勢適用基因組de novoPacBio RS + Illumina Hiseq2500PacBio RS 長度長,無需PCR,無GC偏好,拼裝完整,Hiseq提高覆蓋深度細(xì)菌完成圖真菌精細(xì)圖Illumina Miseq讀長可達(dá)600bp,媲美454讀長,利于拼裝,性價(jià)比較454高小基因組完成圖微生物框架圖Illumina Hiseq2500 PE+MP高深度、高覆蓋度,性價(jià)比高小基因組完成圖微生物框架圖454 GS-FLX 讀長可到400-800bp,利于拼裝微生物框架圖基因組重測序Illumina Hiseq2500 PE(+MP)高深度、高覆蓋度,性價(jià)比高微

18、生物基因組重測序分子生態(tài)宏基因組Illumina Miseq讀長可達(dá)600bp,媲美454讀長,利于拼裝和物種分類性價(jià)比較454高16srDNA,ITS等擴(kuò)增片段在300-500bp的特異性引物/通用454 GS-FLX 讀長可到400-800bp,利于物種分類超過500bp的特異性引物/通用 測序平臺(tái)翰宇經(jīng)驗(yàn)PacBio RS II+ Illumina 已成功應(yīng)用PacBio RS II超長片段測序拼裝獲得細(xì)菌基因組全序列,借助Illumina短片段高覆蓋率測序?qū)φ麄€(gè)基因組進(jìn)行準(zhǔn)確性評(píng)估和校正,得到精確度高達(dá)99.999%的細(xì)菌基因組完成圖和真菌基因組精細(xì)圖,例如、芽孢桿菌、鏈霉菌、葡萄球菌、假單胞菌、玫瑰桿菌、富鹽菌、乳球菌、瓶霉等。454 GS FLX系統(tǒng): 已完成162種細(xì)菌/古細(xì)菌(0.8-10Mb)的全基因組測序Illumina系統(tǒng): 已完成338種細(xì)菌(包括30余株結(jié)核分枝桿菌)的精細(xì)圖測序工作真菌: 已完成子囊菌和擔(dān)子菌等不同亞門的90多個(gè)真菌(25-70Mb)的全基因組測序 基因組翰宇經(jīng)驗(yàn)環(huán)境微生物分子生態(tài):海洋浮游微生物:2008年

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論