高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用_第1頁(yè)
高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用_第2頁(yè)
高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用_第3頁(yè)
高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用_第4頁(yè)
高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用196中國(guó)醫(yī)藥生物技術(shù)2019年6月第8卷第3期Chin Med Biotechnol, June 2019, Vol. 8, No. 3 DOI:10.3969/cmba.j.issn.1673-713X.2019.03.008,綜述.高通量測(cè)序技術(shù)在宏基因組學(xué)中的應(yīng)用劉莉揚(yáng),崔鴻飛,田埂隨著生命科學(xué)及研究技術(shù)的不斷發(fā)展,人們對(duì)生命現(xiàn)象的了解更加深入。微生物因?yàn)?其在工業(yè)、農(nóng)業(yè)、醫(yī)療衛(wèi)生、環(huán)境保護(hù)等各方面的重要地位,被越來(lái)越多的研究者關(guān)注。 自然狀態(tài)下,微生物幾乎無(wú)處不在,無(wú)論是在自然環(huán)境如土壤、海洋甚至一些極端環(huán)境 (如酸礦水)中,還是在人類和動(dòng)物的皮膚、

2、口腔、腸道中,微生物都與它們所在的環(huán)境 相伴相生。除生存環(huán)境極為廣泛以外,微生物的數(shù)量還極為龐大,以人類為例,人類的基 因總數(shù)只占人類身上微生物基因總數(shù)的1%左右1。這些微生物是環(huán)境能量、物質(zhì)代謝的重要中間環(huán)節(jié)和組成部分,它們有些可以代謝 生成周?chē)渌锼匦璧牡孜铮行﹦t會(huì)代謝生成毒性物質(zhì),導(dǎo)致環(huán)境污染,或者宿 主的疾病。因此,對(duì)微生物的研究顯得極為重要。微生物的傳統(tǒng)研究方法主要是依賴將微生物進(jìn)行培養(yǎng)和分離(culture-dependent)。 然而,到目前為止,絕大多數(shù)微生物(99%以上)不能依靠這樣的方式獲得,這極大地限 制了人們對(duì)微生物的研究。隨著測(cè)序技術(shù)和數(shù)據(jù)處理分析能力的飛速

3、發(fā)展,以及人們對(duì)微 生物之間相互依存的共生互利和平衡關(guān)系的深入認(rèn)識(shí),一種可以對(duì)環(huán)境中所有微生物進(jìn)行 研究而不依賴培養(yǎng)的新方向一一宏基因組學(xué)應(yīng)運(yùn)而生。1宏基因組簡(jiǎn)介宏基因組(Metagenome),或稱為“元基因組,于1998年由Handelsman等2 在一篇研究土壤微生物的文章中首次提出,當(dāng)時(shí)的定義是“微生物群落中的所有基因組的 集合”。在此之后,宏基因組的概念漸漸為人們所接受,并涌現(xiàn)了許多針對(duì)海洋、土壤、 人類腸道等微生物的典型研究工作3-6,目前的宏基因組研究主要指對(duì)細(xì)菌的研究。宏基因組學(xué)研究與傳統(tǒng)微生物研究方式的最大區(qū)別在于把微生物看成一個(gè)整體,擺脫 了對(duì)單個(gè)微生物培養(yǎng)和分離的步驟,直

4、接對(duì)環(huán)境中所有的微生物進(jìn)行研究,進(jìn)而可以全面 地對(duì)所有微生物進(jìn)行分析。隨著宏基因組學(xué)研究技術(shù)的發(fā)展和研究者興趣的不斷增加,對(duì) 其研究手段和研究對(duì)象的重點(diǎn)也不斷發(fā)生著變化,大致可以分為三個(gè)階段:針對(duì)16S rRNA為主要研究對(duì)象的核糖體RNA研究;以環(huán)境中所有遺傳物質(zhì)為研究對(duì)象;以環(huán) 境中所有轉(zhuǎn)錄本為主要研究對(duì)象的宏轉(zhuǎn)錄組研究。狹義的宏基因組學(xué)研究指第二個(gè)階段, 本文提到的“宏基因組學(xué)”傾向于廣義的概念,即三個(gè)階段的總和。原核生物的核糖體RNA,尤其是16S rRNA,由于其高度保守的序列特性,被當(dāng)做可 以鑒別物種的微生物系統(tǒng)發(fā)育的“分子鐘”7。第一代測(cè)序讀長(zhǎng)長(zhǎng)、準(zhǔn)確率較高,但通量較低,比較適合

5、對(duì)16S rRNA進(jìn)行測(cè)序及分析。隨著高通量的第二代測(cè)序(next generation sequencing, NGS)方法的誕生,由于讀長(zhǎng)較短,所以從一次測(cè)序16S rRNA 基因全長(zhǎng),到只針對(duì)16S rRNA中的某一個(gè)或某幾個(gè)高變區(qū)進(jìn)行分析和研究8-11。宏基因組包含著環(huán)境微生物的全部遺傳信息,相比于16S rRNA來(lái)說(shuō),宏基因組除了 群落中各種微生物的分類信息以外,更包含了所有微生物的基因信息。因此,這種數(shù)據(jù)更 有助于我們對(duì)群落潛在的功能進(jìn)行深入分析。并且通過(guò)對(duì)基因組大小進(jìn)行均一化 (normalization),我們可以對(duì)群落中的微生物進(jìn)行相對(duì)定量研究12。功能基因研究 則可以通過(guò)測(cè)

6、序序列找到特定環(huán)境下富集的功能基因13。宏基因組是近年研究的熱點(diǎn), 數(shù)據(jù)量較為龐大,尤其需要高通量的測(cè)序技術(shù)和高效的數(shù)據(jù)處理能力作為依托。宏轉(zhuǎn)錄組數(shù)據(jù)則包含了環(huán)境微生物的全部轉(zhuǎn)錄本信息。與宏基因組中研究“可能的” 群落功能、代謝通路差異相比,宏轉(zhuǎn)錄組可以實(shí)時(shí)、實(shí)地的對(duì)微生物群落的基因表達(dá)情況 進(jìn)行反映14。在新一代測(cè)序技術(shù)出現(xiàn)以前,利用傳統(tǒng)測(cè)序技術(shù)發(fā)展出了使用EST序列 來(lái)發(fā)現(xiàn)新基因的方法,比較方便地得到了大量的基因序列的信息15。新一代測(cè)序技術(shù)的 出現(xiàn),給宏轉(zhuǎn)錄組的研究帶來(lái)了新的機(jī)遇,但是由于原核生物的mRNA較易分解、rRNA 含量極高,高質(zhì)量的樣本制備比較困難,因此現(xiàn)在的研究仍屬于起步階

7、段16。2 測(cè)序技術(shù)的發(fā)展與高通量測(cè)序技術(shù)的特點(diǎn)世界第一臺(tái)自動(dòng)化測(cè)序儀誕生于1987年,由美國(guó)ABI公司制造,其原理基于 Sanger測(cè)序法17。Sanger測(cè)序因其較長(zhǎng)的讀長(zhǎng)( 1000 bp)和較高的測(cè)序質(zhì)量 (99.999%),從20世紀(jì)90年代開(kāi)始,就被廣泛應(yīng)用在生物信息學(xué)研究當(dāng)中,并在人 類基因組計(jì)劃(human genome program, HGP) 18中發(fā)揮了巨大的作用。但Sanger測(cè) 序法由于測(cè)序通量太低,速度較慢,漸漸不能滿足日益增多的數(shù)據(jù)需求19。第二代高 通量測(cè)序則避免了 Sanger測(cè)序中所需的繁瑣的克隆過(guò)程,大大減少了工作量,提高了 效率。隨著測(cè)序技術(shù)的不斷發(fā)展

8、,單分子測(cè)序的技術(shù),如HeliScope20、Picbio21 等測(cè)序技術(shù)逐漸開(kāi)始發(fā)展。但由于技 基金項(xiàng)目:國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃) (2019CB316504)作者單位:100084北京,清華大學(xué)自動(dòng)化系清華信息科學(xué)與技術(shù)國(guó)家 實(shí)驗(yàn)室生物信息學(xué)研究部(劉莉揚(yáng)、崔鴻飛),生物醫(yī)學(xué)測(cè)試中心(劉莉揚(yáng)、田埂)通訊作者:劉莉揚(yáng),Email: HYPERLINK mailto: 收稿日期:2019-03-18中國(guó)醫(yī)藥生物技術(shù)2019年6月第8卷第3期Chin Med Biotechnol, June 2019, Vol. 8, No. 3 197術(shù)并未十分成熟,測(cè)序正確率尚有待提高,而且成

9、本較高,單分子測(cè)序技術(shù)尚未被廣 泛使用。高通量測(cè)序技術(shù)是現(xiàn)今應(yīng)用最廣泛的測(cè)序技術(shù),其特點(diǎn)是成本低、通量高、速度快, 可以快速產(chǎn)生大量的數(shù)據(jù)。高通量測(cè)序技術(shù)的讀長(zhǎng)普遍較短,目前三個(gè)應(yīng)用較多的主流 平臺(tái)中,Roche 454 GS FLX Tianium 能測(cè) 450 800 bp, Illumina HiSeq 2000 能測(cè) 150 bp (單向),其新推出的MiSeq平臺(tái)最長(zhǎng)可測(cè)至250 bp (單向),SOLiD 5500 xl 能測(cè)75 bp (單向)。它們的測(cè)序深度可以在一定程度上彌補(bǔ)讀長(zhǎng)較短所帶來(lái)的問(wèn)題,深 入并且快速的測(cè)序過(guò)程也使它們得以成為現(xiàn)今應(yīng)用最廣泛的測(cè)序技術(shù)(表1)。進(jìn)行測(cè)

10、序分析。盡管不分析全長(zhǎng)序列,由于高通量測(cè)序的覆蓋深度非常高,對(duì)物種多 樣性的分析仍十分有利。由于16S rRNA的分析目前已比較成熟,所以已有很多相關(guān)的研究,包括人體環(huán)境 (如皮膚、口腔、腸道、女性陰道等),自然環(huán)境(土壤、海洋等)的各類環(huán)境微生物群 落進(jìn)行分析。2019年,美國(guó)科羅拉多大學(xué)的Fierer等25采集了 51個(gè)健康年輕人的 手部皮膚表面的微生物樣本并利用Roche 454 GS FLX測(cè)序儀對(duì)其16S rRNA進(jìn)行了測(cè)序, 研究了性別、用手習(xí)慣(即是否左撇子)、洗手習(xí)慣等對(duì)手表面細(xì)菌群落多樣性的影響。 2019年,Lazarevic等8采集了 3個(gè)健康成年人的口腔微生物,對(duì)其V5

11、區(qū)域進(jìn)行擴(kuò) 增并用Illumina進(jìn)行測(cè)序,把V5區(qū)域當(dāng)作分類標(biāo)志,對(duì)人類口腔微生物群落的多樣性 進(jìn)行了分析。同年,Turnbaugh等9采集了 31對(duì)同卵雙生和23對(duì)異卵雙生的雙胞胎 以及其母親的糞便樣本,進(jìn)行腸道微生物研究,分析環(huán)境、肥胖情況等對(duì)人體腸道微生物 的影響。該研究除用Sanger測(cè)序法測(cè)了全長(zhǎng)的16S rRNA序列以外,還用454 GS FLX 測(cè)序儀對(duì)16S rRNA的V2和V6區(qū)進(jìn)行了深度測(cè)序,并以此為分類標(biāo)志進(jìn)行物種多樣性 的分析。除人體微生物的研究以外,環(huán)境微生物也是一個(gè)大的研究方向。如2019年, Roesch等10利用454 GS FLX測(cè)序技術(shù),對(duì)來(lái)自西半球的4個(gè)

12、土壤樣本中微生物16S rRNA的V9高變區(qū)進(jìn)行了測(cè)序,并對(duì)其生物多樣性進(jìn)行了分析。值得一提的是,16S rRNA的應(yīng)用也可與我國(guó)傳統(tǒng)中醫(yī)緊密聯(lián)系起來(lái)。2019年,清 華大學(xué)的Jiang等11邀請(qǐng)了 19位患有慢性萎縮胃炎的志愿者,并通過(guò)傳統(tǒng)的舌苔情 況,參照其癥狀進(jìn)行判斷,將志愿者分為寒癥、熱證,并與另外8位健康志愿者同時(shí)進(jìn) 行舌苔樣本的采集,用Illumina GAIIx測(cè)序平臺(tái)對(duì)其微生物的V6高變區(qū)進(jìn)行測(cè)序,分 析舌苔微生物群落與寒熱癥之間的關(guān)系,并認(rèn)為舌苔微生物群落可以作為人體健康狀態(tài)的 一個(gè)標(biāo)志。高通量測(cè)序技術(shù)在基于16S rRNA的微生物群落分析中的要點(diǎn)在于產(chǎn)生測(cè)序覆蓋深度 極深的

13、16S rRNA的測(cè)序數(shù)據(jù),并通過(guò)比對(duì)或聚類的分析方法,對(duì)數(shù)據(jù)來(lái)源的微生物物種 進(jìn)行分析,并估計(jì)微生物群落的物種構(gòu)成。相信隨著高通量測(cè)序技術(shù)的發(fā)展,可測(cè)序列長(zhǎng) 度會(huì)越來(lái)越長(zhǎng),更多研3高通量測(cè)序技術(shù)在宏基因組學(xué)研究中的應(yīng)用3.1基于16S rRNA的微生物群落分析原核生物的16S rRNA基因,由于其具有鑒別物種信息的作用,被廣泛地應(yīng)用在了微 生物群落物種多樣性的分析上16S rRNA的數(shù)據(jù)庫(kù)資源較為豐富,如RDP22、 Greengene23、SILVA24等都是一些比較成熟、不斷完善并被廣泛使用的數(shù)據(jù)庫(kù),并有 一些自帶的分類工具(比如RDP數(shù)據(jù)庫(kù)的RDP classifer等)便于分析使用。

14、在鑒定物種方面,兩條16S rRNA基因的比對(duì)差異小于3%,則可以認(rèn)為是同一個(gè)物 種(species);差異小于5%,則可認(rèn)為是同一個(gè)屬(genus);差異小于10%,則可認(rèn) 為是同一個(gè)科(family)。通常研究者將環(huán)境微生物群落中的16S rRNA區(qū)域通過(guò)PCR 進(jìn)行擴(kuò)增和測(cè)序,并將測(cè)得的序列比對(duì)到已有的16S rRNA數(shù)據(jù)庫(kù)中,通過(guò)數(shù)據(jù)庫(kù)中的海 量數(shù)據(jù),對(duì)每條16S rRNA的分類位置進(jìn)行標(biāo)定,從而得到微生物群落的物種構(gòu)成、各個(gè) 物種的豐度等信息。此外,鑒于已知的16S rRNA數(shù)據(jù)庫(kù)中信息有限,用比對(duì)已有數(shù)據(jù)庫(kù) 的方法無(wú)法對(duì)未知的16S rRNA進(jìn)行估計(jì),因此還可以將16S rRNA序

15、列聚類成分類操作 邏輯單元(operational taxonomic unit, OTU),利用OTU的數(shù)目、各個(gè)OTU的序列 數(shù)來(lái)分析估計(jì)物種多樣性和豐度。此外,第一代測(cè)序由于測(cè)序長(zhǎng)度較長(zhǎng),所以多采用全長(zhǎng) 的16S rRNA測(cè)序進(jìn)行分析。而第二代的高通量測(cè)序,由于其讀長(zhǎng)較短,無(wú)法覆蓋全長(zhǎng), 因此許多研究都對(duì)16S rRNA的一個(gè)或幾個(gè)高變區(qū)表1三大測(cè)序平臺(tái)基本情況比較測(cè)序平臺(tái)文庫(kù)、樣測(cè)序用化本制備Roche 454 GS FLX TianiumemPCR學(xué)試劑讀長(zhǎng)(bp)測(cè)序反應(yīng)測(cè)序反應(yīng)時(shí)間(d)焦磷酸測(cè)500 800序0.35產(chǎn)量(G) 0.8測(cè)序儀價(jià)格($)500 000時(shí)間長(zhǎng)、讀長(zhǎng)長(zhǎng)

16、,測(cè)序試劑貴、錯(cuò) 細(xì)菌基因組測(cè)序,基因組有利于提高重復(fù)序列的比對(duì)比例Illumina HiSeq 橋式 PCR 邊合成邊 2000 SOLiD 5500 xlemPCR測(cè)序邊連接邊測(cè)序707 1450 1001004 10誤率高、單堿基重復(fù)檢出率低測(cè)序系統(tǒng)本數(shù)量存在瓶頸595 000雙堿基糾正策略提測(cè)序時(shí)間過(guò)長(zhǎng)高了準(zhǔn)確度全基因組測(cè)序;宏基因組測(cè)序組裝(優(yōu)點(diǎn)缺點(diǎn)應(yīng)用100 600540 000目前使用最廣泛的同時(shí)可測(cè)序的樣 全基因組測(cè)序;宏基因組198中國(guó)醫(yī)藥生物技術(shù)2019年6月第8卷第3期Chin Med Biotechnol, June 2019, Vol. 8, No. 3究在分析16S

17、 rRNA時(shí)會(huì)選擇進(jìn)行全長(zhǎng)分析,從而在微生物群落研究中得到精確的結(jié) 果。3.2基于宏基因組的功能基因分析對(duì)16S rRNA的測(cè)序可以快捷地對(duì)環(huán)境微生物的群落構(gòu)成進(jìn)行深入的分析,除了物種 多樣性以外,希望得到更多的信息,比如基因信息等。在原核生物中,已知的物種只占極 少的一部分,對(duì)已知物種的功能、代謝等的研究相比于未知微生物依然是微不足道的。只 了解環(huán)境微生物的物種信息,遠(yuǎn)不能滿足對(duì)于環(huán)境微生物群落與環(huán)境之間關(guān)系的探究,而 且原核生物的變異速度很快,即使是同一個(gè)種級(jí)別內(nèi)部的兩個(gè)菌株在功能上都可能有非常 大的區(qū)別7。因此研究環(huán)境微生物的全基因組就顯得非常必要。在第一代測(cè)序的條件下,由于測(cè)序速度和成

18、本的限制,對(duì)環(huán)境內(nèi)所有微生物的全基因 組進(jìn)行深度測(cè)序并不方便,而高通量測(cè)序則使之變成了可能。從環(huán)境微生物所有遺傳信息 中,可以分析和預(yù)測(cè)出該環(huán)境微生物群落可能的功能,其與環(huán)境可能的相互作用關(guān)系。針對(duì)這種宏基因組的數(shù)據(jù)的分析,一般分為基于比對(duì)(alignment-based)的方法和 不基于比對(duì)(alignment-free)的方法?;诒葘?duì)的方法把測(cè)序得到的所有讀段比對(duì)到已 知的微生物核苷酸數(shù)據(jù)庫(kù)上,如NCBI的NT數(shù)據(jù)庫(kù)(利用Blastp等工具),或者是蛋 白質(zhì)NR數(shù)據(jù)庫(kù)(利用Blastx等工具),得到環(huán)境微生物在物種或功能基因上的豐度信 息,進(jìn)而結(jié)合一些功能基因、代謝通路、信號(hào)通路等數(shù)據(jù)庫(kù)

19、,對(duì)研究者感興趣的部分進(jìn)行 分析。事實(shí)上,在基于比對(duì)的方法中,高通量測(cè)序所得的序列較短,而這種短序列直接進(jìn) 行比對(duì)的效果往往不理想26,并且大量的原始數(shù)據(jù)進(jìn)行比對(duì)會(huì)耗費(fèi)很多時(shí)間,因此需要在比對(duì)前進(jìn)行序列拼接,將其拼接成較長(zhǎng)的序列,提高 分析效率和分析效果。此外,還可以用一些工具對(duì)序列進(jìn)行基因預(yù)測(cè)(如 Metagene27、 GeneMark28、FragGeneScan29等)?;诒葘?duì)處理高通量測(cè)序的宏基因組數(shù)據(jù)的應(yīng)用非常多,2019年,華大基因在 Nature發(fā)表文章,對(duì)人體腸道微生物基因組研究計(jì)劃(MetaHIT)進(jìn)行了總結(jié)30。該研 究為研究人體腸道微生物群落與人類健康之間的關(guān)系,采集

20、了 124個(gè)歐洲人的糞便樣本, 其中包括25個(gè)炎癥性腸?。╥nflammatory bowel disease, IBD)患者和99個(gè)健康志 愿者的樣本,并用Illumina測(cè)序平臺(tái)進(jìn)行了測(cè)序,產(chǎn)生了 567.7 G的測(cè)序數(shù)據(jù),并對(duì) 序列進(jìn)行了拼接、注釋、功能基因的分類、多態(tài)性分析等研究。2019年,華大基因在 Nature發(fā)表了一篇研究人體腸道微生物與II型糖尿病之間關(guān)系的文章31。該研究收 集了 345個(gè)中國(guó)人的腸道微生物樣本,用Illumina測(cè)序平臺(tái)對(duì)其進(jìn)行了深度測(cè)序,并 在全基因組關(guān)聯(lián)研究(genome wide association studies, GWAS)的基礎(chǔ)上,開(kāi)發(fā)了一

21、 種叫做全宏基因組相關(guān)聯(lián)研究(metagenome wide association studies, MGWAS)的方法, 對(duì)II型糖尿病與腸道微生物失調(diào)之間的關(guān)系進(jìn)行了深入的研究。基于比對(duì)的方法準(zhǔn)確性較高,由于已知的數(shù)據(jù)庫(kù)有限,且比對(duì)花費(fèi)的時(shí)間成本非常高。所以,在基于比對(duì)的方法之外,也產(chǎn)生了很多不基于 比對(duì)的方法和應(yīng)用。不基于比對(duì)的方法大多根據(jù)序列特征,以連續(xù)k個(gè)堿基組成的短的 寡核苷酸序列(k字詞、k-mer、k-tuple)作為特征,統(tǒng)計(jì)這些特征在序列中出現(xiàn)的頻數(shù), 并構(gòu)建所有4k個(gè)k字詞的頻數(shù)(頻率)向量。已有研究表明這種k字詞在微生物基因 組中的出現(xiàn)頻率可以分辨微生物的不同物種32

22、?;趉字詞的方法大多數(shù)被應(yīng)用在快 速對(duì)測(cè)序序列進(jìn)行物種分類的方面(binning),這種方法的基本思想是將序列的k字詞 出現(xiàn)頻數(shù)(頻率)向量與數(shù)據(jù)庫(kù)中的微生物各個(gè)物種的k字詞向量作比較,將相近的劃 歸為一組,如AbundanceBin33、MetaCluster34等都是基于這種方法進(jìn)行序列的物種 劃分的工具。此外k字詞的方法也可以應(yīng)用于分析樣本之間的差異。如Willner等35 于2019年發(fā)表文章,對(duì)86個(gè)宏基因組樣本,分別用長(zhǎng)度k = 2、3、4的k字詞進(jìn)行 了統(tǒng)計(jì),為每個(gè)宏基因組樣本構(gòu)建一個(gè)k字詞的頻數(shù)(頻率)向量,并對(duì)86個(gè)樣本的 向量進(jìn)行主成分分析、層次聚類等分析和觀察。不基于比

23、對(duì)的方法避開(kāi)了復(fù)雜的計(jì)算量, 在對(duì)于宏基因組的這種以未知物種為主的分析,k字詞分析的優(yōu)勢(shì)非常明顯,將成為宏基 因組的一個(gè)重要的研究方向。高通量測(cè)序在宏基因組分析中的應(yīng)用,由于分析方法的多樣性,要點(diǎn)也不一而同。但 總的來(lái)說(shuō),基于比對(duì)的方法一般需要進(jìn)行序列拼接、基因預(yù)測(cè)、基因比對(duì)進(jìn)而對(duì)群落的基 因功能進(jìn)行分析,而不基于比對(duì)的方法一般直接對(duì)序列特征進(jìn)行統(tǒng)計(jì)。3.3基于宏轉(zhuǎn)錄組的群落轉(zhuǎn)錄調(diào)控規(guī)律分析宏基因組可以詳細(xì)地展示環(huán)境微生物群落中的所有遺傳信息。為了精確地了解環(huán)境中 正在發(fā)生的代謝過(guò)程,宏轉(zhuǎn)錄組的概念越來(lái)越多地被研究者們重視起來(lái)。相較于單純的微 生物基因組信息,宏轉(zhuǎn)錄組記錄了特定時(shí)間、特定地點(diǎn)的

24、微生物群落的表達(dá)譜。在活的微 生物中,在某個(gè)特定時(shí)間,也并非全部基因都參與表達(dá),而是隨著環(huán)境、生長(zhǎng)周期的變化, 一部分基因有選擇地被激活,進(jìn)行表達(dá)。宏轉(zhuǎn)錄組學(xué)可以實(shí)時(shí)地記錄這些活躍的基因及它 們的表達(dá)量。在宏基因組中,一些已經(jīng)死亡卻尚未被分解的微生物的遺傳信息依然可以被 檢測(cè)到,這些微生物本身已經(jīng)不主動(dòng)參與到環(huán)境的代謝當(dāng)中,但是由于它們被檢測(cè)到,從 而對(duì)研究的結(jié)果產(chǎn)生一定影響。宏轉(zhuǎn)錄組學(xué)的主要方法是對(duì)環(huán)境微生物樣本中的mRNA進(jìn)行提取和擴(kuò)增,反轉(zhuǎn)錄成為 cDNA并進(jìn)行測(cè)序。宏轉(zhuǎn)錄組的實(shí)驗(yàn)難度較大,一方面是由于原核生物的轉(zhuǎn)錄和翻譯同時(shí) 進(jìn)行,mRNA幾乎沒(méi)有修飾,容易被降解,半衰期極短(約為分鐘

25、量級(jí)),因此制備高質(zhì) 量的樣品庫(kù)是實(shí)驗(yàn)成功的關(guān)鍵。另一方面,由于原核生物的rRNA占全部RNA的比例非 常大(約70% 90%) 16, 36-37,因此在制備樣品時(shí)通常需要去掉rRNA,以降低測(cè)序 成本,有效地去除樣本中的rRNA也成為了一個(gè)重要課題。宏轉(zhuǎn)錄組學(xué)從2019年開(kāi)始,已經(jīng)有很多的相關(guān)研究,中國(guó)醫(yī)藥生物技術(shù)2019年6月第8卷第3期Chin Med Biotechnol, June 2019,Vol. 8, No. 3 199幾乎所有的研究都是由高通量測(cè)序提供的數(shù)據(jù)。如2019年,Poroyko等38用 454GSFLX測(cè)序平臺(tái)對(duì)兩組小豬(一組為母乳喂養(yǎng),另一組為配方奶喂養(yǎng))的腸道

26、微生物進(jìn) 行了轉(zhuǎn)錄組測(cè)序;2019年,Xiong等39對(duì)非肥胖者糖尿病(non-obese diabetic,NOD) 的老鼠進(jìn)行研究,設(shè)計(jì)了 8種微生物植入無(wú)菌老鼠的腸道,培養(yǎng)后以不同試劑盒制備樣 品,并用Illumina平臺(tái)進(jìn)行轉(zhuǎn)錄組測(cè)序。隨著實(shí)驗(yàn)技術(shù)的發(fā)展,已經(jīng)有越來(lái)越多的宏轉(zhuǎn) 錄組數(shù)據(jù)相繼發(fā)表出來(lái)。高通量測(cè)序在宏轉(zhuǎn)錄組中的應(yīng)用,要點(diǎn)與在宏基因組分析中的應(yīng)用類似。但由于技術(shù) 尚在摸索之中,現(xiàn)階段的難點(diǎn)依然在于測(cè)序前樣品的制備和保存。3.4單細(xì)胞分離及宏 基因組研究由于宏基因組研究在組裝微生物基因組和研究相似基因序列功能上的局限,當(dāng)研究深 入到一定的水平以后,研究者又對(duì)群體中每一個(gè)細(xì)菌的作

27、用和不同細(xì)菌的相互關(guān)聯(lián)產(chǎn)生興 趣。以單細(xì)胞分離、擴(kuò)增為主要方法的單細(xì)胞測(cè)序方法應(yīng)運(yùn)而生40-42。單細(xì)胞宏基因組,是指將環(huán)境里所有微生物進(jìn)行單個(gè)細(xì)胞的分離,而后通過(guò)全基因組 擴(kuò)增,或者提取RNA反轉(zhuǎn)錄后進(jìn)行擴(kuò)增,來(lái)研究群體里單個(gè)細(xì)胞的基因組和轉(zhuǎn)錄組,進(jìn) 而得到整個(gè)群體更加完整的信息。單細(xì)胞的研究,在很多方面具有較大的優(yōu)勢(shì),但在技術(shù) 上還是遇到了一些問(wèn)題。微生物群落巨大,分離單細(xì)胞本身就是一個(gè)非常有挑戰(zhàn)性的工作, 目前主要應(yīng)用的方法,是利用流式細(xì)胞儀,將細(xì)胞通過(guò)各種染色方法進(jìn)行染色,通過(guò)各種 染色特性來(lái)進(jìn)行區(qū)分,而細(xì)胞的染色特征可能因?yàn)椴煌臓顟B(tài)而存在差異,因此存在分離 不純的問(wèn)題42;在擴(kuò)增技

28、術(shù)上目前還沒(méi)有實(shí)現(xiàn)突破,有擴(kuò)增帶來(lái)的偏向性(bias),組 裝基因組形成了一定的困難41;隨著單分子測(cè)序技術(shù)的不斷發(fā)展,未來(lái)單分子和單細(xì)胞 的結(jié)合,必將會(huì)為宏基因組研究帶來(lái)新的突破。4結(jié)語(yǔ)高通量測(cè)序技術(shù)通量高、速度快,適合宏基因組的深度測(cè)序研究。已經(jīng)有相當(dāng)多的宏 基因組研究工作建立在高通量測(cè)序技術(shù)上,揭示微生物與環(huán)境之間的關(guān)系。同時(shí),高通量 測(cè)序讀長(zhǎng)短、數(shù)據(jù)量大的特點(diǎn),對(duì)于宏基因組數(shù)據(jù)的處理也是一個(gè)挑戰(zhàn),催生出許多宏基 因組特有的算法和工具。隨著高通量測(cè)序技術(shù)的發(fā)展,為宏基因組學(xué)研究帶來(lái)更多的機(jī)會(huì)。 未來(lái)的高通量測(cè)序技術(shù),除了進(jìn)一步發(fā)展其通量高的優(yōu)勢(shì)以外,讀長(zhǎng)也會(huì)逐漸增加,同時(shí) 測(cè)序錯(cuò)誤率也會(huì)

29、更低,現(xiàn)階段研究中遇到的問(wèn)題將逐步得到解決和改善。此外,目標(biāo)為單 分子測(cè)序的第三代測(cè)序技術(shù)的發(fā)展,也會(huì)帶來(lái)全新的數(shù)據(jù)特點(diǎn),宏基因組學(xué)研究將有更多 的機(jī)會(huì)和發(fā)展空間。參考文獻(xiàn)1Ley RE, Peterson DA, Gordon JI. Ecological and evolutionary forcesshaping microbial diversity in the human intestine. Cell, 2019, 124(4): 837-848.2Handelsman J, Rondon MR, Brady SF, et al. Molecular biologicalacce

30、ss to the chemistry of unknown soil microbes: a new frontier for natural products. Chem Biol, 1998, 5(10):R245-R249.Dusko Ehrlich S, MetaHIT consortium. Metagenomics of theintestinal microbiota: potential applications. Gastroenterol Clin Biol, 2019, 34 Suppl 1:S23-S28.Turnbaugh PJ, Ley RE, Hamady M,

31、 et al. The human microbiomeproject. Nature, 2019, 449(7164):804-810.Gilbert JA, Meyer F, Jansson J, et al. The Earth Microbiome Project:Meeting report of the 1 EMP meeting on sample selection and acquisition at Argonne National Laboratory October 6 2019. Stand Genomic Sci, 2019, 3(3):249-253.Willia

32、mson SJ, Rusch DB, Yooseph S, et al. The Sorcerer II GlobalOcean Sampling Expedition: metagenomic characterization of viruses within aquatic microbial samples. PLoS One, 2019, 3(1):e1456. 7 Woese CR. Bacterial evolution. Microbiol Rev, 1987, 51(2):221-271. 8 Lazarevic V, Whiteson K, Huse S, et al. M

33、etagenomic study of theoral microbiota by Illumina high-throughput sequencing. J Microbiol Methods, 2019, 79(3):266-271.Turnbaugh PJ, Hamady M, Yatsunenko T, et al. A core gutmicrobiome in obese and lean twins. Nature, 2019, 457(7228):480- 484.Roesch LF, Fulthorpe RR, Riva A, et al. Pyrosequencing e

34、numeratesand contrasts soil microbial diversity. ISME J, 2019, 1(4):283-290. 11 Jiang B, Liang X, Chen Y, et al. Integrating next-generationsequencing and traditional tongue diagnosis to determine tongue coating microbiome. Sci Rep, 2019, 2:936.Frank JA, Sorensen SJ. Quantitative metagenomic analyse

35、s based onaverage genome size normalization. Appl Environ Microbiol, 2019, 77(7):2513-2521.Allen HK, Moe LA, Rodbumrer J, et al. Functional metagenomicsreveals diverse beta-lactamases in a remote Alaskan soil. ISME J, 2019, 3(2):243-251.Gilbert JA, Field D, Huang Y, et al. Detection of large numbers

36、 ofnovel sequences in the metatranscriptomes of complex marine microbial communities. PLoS One, 2019, 3(8):e3042.Tartar A, Wheeler MM, Zhou X, et al. Parallel metatranscriptomeanalyses of host and symbiont gene expression in the gut of the termite Reticulitermes flavipes. Biotechnol Biofuels, 2019,

37、2:25. 16 Chappell L. Finding a needle in a haystack. Microbialmetatranscriptomes. Nat Rev Microbiol, 2019, 10(7):446.17 Ner SS, Goodin DB, Pielak GJ, et al. A rapid droplet method forSanger dideoxy sequencing. Biotechniques, 1988, 6(5):408, 410, 412. 18 Human genome program. Science, 1989, 246(4932)

38、:873-874. 19 Shendure J, Ji H. Next-generation DNA sequencing. Nat Biotechnol,2019, 26(10):1135-1145.20 Harris TD, Buzby PR, Babcock H, et al. Single-molecule DNAsequencing of a viral genome. Science, 2019, 320(5872):106-109. 21 Eid J, Fehr A, Gray J, et al. Real-time DNA sequencing from singlepolym

39、erase molecules. Science, 2019, 323(5910):133-138.Cole JR, Wang Q, Cardenas E, et al. The Ribosomal Database Project:improved alignments and new tools for rRNA analysis. Nucleic Acids Res, 2019, 37(Database issue):D141-D145.DeSantis TZ, Hugenholtz P, Larsen N, et al. Greengenes, achimera-checked 16S

40、 rRNA gene database and workbench compatible with ARB. Appl Environ Microbiol, 2019, 72(7):5069-5072.Quast C, Pruesse E, Yilmaz P, et al. The SILVA ribosomal RNA gene200中國(guó)醫(yī)藥生物技術(shù)2019年6月第8卷第3期Chin Med Biotechnol, June 2019, Vol. 8, No. 3database project: improved data processing and web-based tools. N

41、ucleic Acids Res, 2019, 41(Database issue):D590-D596.Fierer N, Hamady M, Lauber CL, et al. The influence of sex,handedness, and washing on the diversity of hand surface bacteria. Proc Natl Acad Sci U S A, 2019, 105(46):17994-17999.Prakash T, Taylor TD. Functional assignment of metagenomic data:chall

42、enges and applications. Brief Bioinform, 2019, 13(6):711-727. 27 Noguchi H, Park J, Takagi T. MetaGene: prokaryotic gene findingfrom environmental genome shotgun sequences. Nucleic Acids Res, 2019, 34(19):5623-5630.28 Zhu W, Lomsadze A, Borodovsky M. Ab initio gene identification inmetagenomic seque

43、nces. Nucleic Acids Res, 2019, 38(12):e132. 29 Rho M, Tang H, Ye Y. FragGeneScan: predicting genes in short anderror-prone reads. Nucleic Acids Res, 2019, 38(20):e191.Qin J, Li R, Raes J, et al. A human gut microbial gene catalogueestablished by metagenomic sequencing. Nature, 2019, 464(7285):59- 65

44、.Qin J, Li Y, Cai Z, et al. A metagenome-wide association study of gutmicrobiota in type 2 diabetes. Nature, 2019, 490(7418):55-60. 32 Pride DT, Meinersmann RJ, Wassenaar TM, et al. Evolutionaryimplications of microbial genome tetranucleotide frequency biases. Genome Res, 2019, 13(2):145-158.Wu YW,

45、Ye Y. A novel abundance-based algorithm for binningmetagenomic sequences using l-tuples. J Comput Biol, 2019, 18(3): 523-534.Wang Y, Leung HC, Yiu SM, et al. MetaCluster 5.0: a two-roundbinning approach for metagenomic data for low-abundance species in a noisy sample. Bioinformatics, 2019, 28(18):i356-i362.Willner D, Thurber RV, Rohwer F. Metagenomic signatures of 86microbial and viral metagenomes. Environ Microbiol, 2019, 11(7): 1752-1766.Giannoukos G, Ciulla DM, Huang K, et al. Efficient and robustRNA-seq process f

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論