微生物基因組學(xué)課件_第1頁
微生物基因組學(xué)課件_第2頁
微生物基因組學(xué)課件_第3頁
微生物基因組學(xué)課件_第4頁
微生物基因組學(xué)課件_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、微生物基因組學(xué)微生物基因組研究概況微生物基因組的特點微生物基因組研究的意義微生物基因組學(xué)微生物基因組研究概況微生物基因組重要紀(jì)事年限 事件1994年美國DOE啟動MGP1995年Science發(fā)表了第一株細(xì)菌-流感嗜血桿 菌全基因組1995年發(fā)表了集胞藻菌株P(guān)CC6803的測序和注釋1996年Science發(fā)表了第一個完成的古細(xì)菌-詹 氏甲烷球菌全基因組序列1996年酵母基因組序列發(fā)表1997年大腸桿菌K-12基因組序列發(fā)表 截至2011年4月24日,NCBI上記錄了1534個細(xì)菌基因組, 包括了103個古細(xì)菌和1431個真細(xì)菌, 其中中國科學(xué)家完成了44個 PubMed檢索到的有關(guān)基因組學(xué)和

2、轉(zhuǎn)錄組學(xué)的文獻數(shù)The literature number retrieved in PubMed database using “Genomics” and “Transcriptomics” as keywords年份Year基因組學(xué)文章Articles about Genomics基因組學(xué)綜述Reviews about Genomics轉(zhuǎn)錄組學(xué)文章Articles about Transcriptomics轉(zhuǎn)錄組學(xué)綜述Reviews about Transcriptomics200015433832020012072559422002268982618720033570984231320

3、0448101238562320056109141788522006690515591054920077295161313355200881191603162592009855115792347520108986148729670研究現(xiàn)況及內(nèi)容細(xì)菌 研究內(nèi)容 代表菌株病原菌 毒力因子、致病島、耐藥基因、耐藥機制以及與寄主的關(guān)系等 肺炎鏈球菌、致病性大腸桿菌、沙門氏菌等極端環(huán)境生長的細(xì)菌 極端環(huán)境下的生存機制,如嗜熱菌的熱穩(wěn)定性 詹氏甲烷球菌、熱自養(yǎng)甲烷桿菌、甲烷嗜熱菌、騰沖嗜熱菌等工業(yè)和環(huán)境有影響的細(xì)菌 CO2固定、固氮、硫氧化 和氫代謝等 單細(xì)胞藍細(xì)菌、絲狀藍細(xì)菌、原綠藻等原核生物基因組的大

4、小原核生物基因組的編碼序列(CDS/ORF)原核生物染色體結(jié)構(gòu)GC 含量重復(fù)序列DNA鏈組成的非對稱性微生物基因組的特點微生物基因組的特點類別特征染色體結(jié)構(gòu)多為一條環(huán)狀閉合雙鏈DNA基因組大小從0.16-13Mb編碼序列占基因組總長度的90%,平均為1Kb左右GC含量16.6%-74.9%DNA鏈組成的非對稱分布GCskew、ATskew、基因方向性偏好、密碼子使用偏好Circular representation of the genome of T. tengcongensis MB4原核生物基因組的編碼序列 占原核生物基因組總序列的90 基因的平均大小為1kb ORF原核生物基因組的編碼

5、序列 不同生物編碼序列的比較Organism Genome (kb) ORFs ORF size Coding Sequence(%)Buchnera sp 640 583 988 90Aquifex aeolicus 1,551 1,512 956 93Saccharomyces cerevisiae 12,069 6,294 1,092 57 Schizosaccharomyces pombe 14,000 4,820 2,033 70 Caenorhabditis elegans 97,000 19,099 1,311 27 Arabidopsis thaliana 115,428 25

6、,498 460 29Homo sapiens 3,000,000 30,000 1,340 2 原核生物基因組的編碼序列 核生物(高溫菌)基因組的內(nèi)含子Sulfolobus solfataricus P2: 18個tRNA基因含有單個內(nèi)含子 一個胱氨酸t(yī)RNA基因含有2個內(nèi)含子A.pernix tRNA基因中 發(fā)現(xiàn) 14個內(nèi)含子 Staphylothermus marinus和運動脫硫球菌 23S rRNA基因中也發(fā)現(xiàn)內(nèi)含子 染色體結(jié)構(gòu)大多數(shù)原核生物:一條環(huán)狀閉合雙鏈DNABrucella suis 1330:兩條環(huán)狀閉合雙鏈DNA 2,107,792 bp (Chr I) 1,207,38

7、1bp (Chr II) Vibrio cholerae: 兩條環(huán)狀閉合雙鏈DNA 2,961,146 bp (Chr I) 1,072,314 bp(Chr II) Borrelia burgdorferi B31: 910,725 bp ( linear Chromosome) 21 linear and circular plasmidsTreponema pallidum:一條環(huán)狀閉合雙鏈DNA 1,138,006 bp GC 含量原核生物基因組GC含量為:16.6-74.9 %嗜溫菌基因組GC含量與 rRNA、tRNA的GC含量成正比嗜熱菌rRNA、tRNA的GC含量與 基因組GC含

8、量不成正比,但與OGT(最適生長溫度)成正比tRNA GC含量總是大于rRNA的GC含量嗜溫菌基因組G + C content (%)Organism Genome rRNA tRNA Xfas 52.7 53.1 59.8 Tpal 52.8 53.1 57.2 Mlep 57.8 55.7 61.6 Atum 59.4 54.6 58.4 Smel 62.7 54.5 61.5 Mlot 62.7 56.3 60.5 Mtub 65.6 58.0 62.0 Paer 66.6 53.1 60.1 Drad 67.0 56.5 58.8 Ccre 67.2 55.0 61.2 Hbsp 67

9、.9 58.1 62.4 linear regression 0.88 0.80嗜熱菌最適生長溫度(OGT)與GC含量的關(guān)系OrganismOGT() Genome rRNA tRNA Pabyssi 103 0.45 0.670.70 Pyro 98 0.42 0.63 0.71Aero 95 0.56 0.680.73Mjan 85 0.31 0.61 0.66 Aquae 85 0.43 0.650.68 Aful 83 0.49 0.63 0.68 Ssol 80 0.36 0.62 0.67 Tmar 80 0.46 0.63 0.65Tten 75 0.38 0.590.60 Mt

10、he 65 0.50 0.57 0.62 Tvol 60 0.40 0.53 0.61 Tacid 59 0.46 0.530.61 linear regression 0.01 0.92 0.90基因組非編碼序列的注釋非編碼區(qū)的注釋 各類重復(fù)序列 基因表達的調(diào)控序列 信號序列等 DNA鏈組成的非對稱性 GC分布不對稱 (GC skew) AT分布不對稱(AT skew)前導(dǎo)鏈含有較多的G(A) 而后隨鏈含有較多的C(T) 計算公式為(nG-nC)/(nG+nC) (nA-nT)/(nA+nT) 累計skew (cumulative skew)用于復(fù)制起點和終點的定位GC skew of T.

11、 tengcongensis genomeDNA鏈組成的非對稱性(真細(xì)菌) 基因方向性偏好 基因方向性偏好 (gene orientation bias) 先導(dǎo)鏈上編碼的基因總是多于后隨鏈 Jean R.Lobry Microbiology Today Vol 26DNA鏈組成的非對稱性 碼子使用偏好(codon usage bias) 先導(dǎo)鏈和后隨鏈密碼子的不同 在先導(dǎo)鏈,以G或T開頭或結(jié)尾的密碼子顯著地多于后隨鏈,常見的有GTG、GCG和GAG 在后隨鏈以C或A開頭或結(jié)尾的密碼子多于先導(dǎo)鏈,如CTC、GCC、CCC、ATC和ACC DNA鏈組成的非對稱性 基因密度和密碼子使用的差別 高度表

12、達基因: 核蛋白體蛋白基因,與翻譯和轉(zhuǎn)錄有關(guān)的因子基因,分子伴侶基因和與主要的能量代謝相關(guān)的基因 大多編碼于前導(dǎo)鏈通常都有密碼子偏好(核蛋白體蛋白基因密碼子的第三位多為G )快速生長的細(xì)菌(大腸桿菌、霍亂弧菌、枯草芽孢桿菌和流感嗜血桿菌) 主要的糖酵解和三羧酸循環(huán)基因為高度表達基因產(chǎn)甲烷菌,與甲烷代謝有關(guān)的基因為高度表達基因 高度表達基因: 那些在密碼子使用上與一般基因相差很大,與核蛋白體蛋白基因,翻譯和轉(zhuǎn)錄相關(guān)基因,伴侶-降解蛋白基因等在密碼子使用上高度相似的基因為高度表達基因。 微生物測序及分析流程圖數(shù)據(jù)分析軟件序列拼接組裝: Newbler, AMOScmp, Velvet, Phred

13、/Phrap/Consed, Oligo 6復(fù)制起始位點: ori-finder + GC skew基因注釋: Glimmer, GenemarkS, Prodigal, BLAST基因起始位點:ZCURVE翻譯起始位點:GS-FindertRNA: tRNAscan-SErRNA: RNAmmerSmall RNA: Rfam重復(fù)序列: Tandem repeat Finder, IS finderCRISPR序列:CRISPR finder數(shù)據(jù)分析軟件Prophages: Prophage finderVirulence-associated factors: VFDB databaseS

14、ignal peptides: SignalP跨膜結(jié)構(gòu):TMHMMOperon: OperonDBGenome island: IslandViewer, MobilomeFINDER致病島:PAIDB膜轉(zhuǎn)運蛋白: TCDB抗菌素抗性基因: ARDB可變遺傳因子: ACLAME必需基因:DEG database數(shù)據(jù)分析軟件Overlap基因、假基因: Mciobial Genome Submission Check功能注釋 : COG, KEGG進化樹: Clustal W, CVTree比較基因組分析: Mauve, MUMmer, ACT, MicrobesOnline, mGenomeS

15、ubtracton, xBASEFinishing階段Finishing階段Finishing階段 多重PCR結(jié)果,引自Tettelin H.等文章 Finishing階段短片段文庫構(gòu)建填補二級結(jié)構(gòu)區(qū)示意圖,摘自Amanda A等文章 Finishing階段 基于轉(zhuǎn)座子技術(shù)來完成重復(fù)序列區(qū)的測序,摘自Scott E等文章 微生物基因組測序策略-高通量測序技術(shù)454 長reads 測序Solexa Pair-end測序組合長reads和短reads測序Sanger法finish微生物基因組測序策略副血鏈球菌FW213基因組基本特征 Genome size(bp)2171616G+C conten

16、t(%)41.62Average CDS length(bp) 932Protein coding2059Protein with known or predicted fuction 1496(72.7%)Conserved hypothetical proteins 461(22.4%)Hypothetical proteins 102(4.9%)tRNAs61rRNA operons4副血鏈球菌FW213基因組基本特征副血鏈球菌比對結(jié)果蛋白質(zhì)數(shù)據(jù)庫比對最相似基因數(shù)分布基因組名稱最相似的基因數(shù)血鏈球菌(Streptococcus sanguinis SK36)557肺炎鏈球菌(Strept

17、ococcus pneumoniae) 552戈登鏈球菌(Streptococcus gordonii str. Challis substr. CH1)233嗜熱鏈球菌(Streptococcus thermophilus)149豬鏈球菌(Streptococcus suis) 68變型鏈球菌(Streptococcus mutans UA159)42無乳鏈球菌(Streptococcus agalactiae)31化膿鏈球菌(Streptococcus pyogenes)21COG分類COG分類圖,JKL編碼信息加工和儲存的蛋白質(zhì)的基因;DVTMNUO代表細(xì)胞加工和信息處理基因;CGEFH

18、IPQ是與代謝相關(guān)的基因;RS為功能未知的基因代謝途徑代謝途徑728691bp 735072bp 精氨酸操縱子示意圖,精氨酸脫亞氨酶(arginine deiminase,arcA), 鳥氨酸氨基甲酰轉(zhuǎn)移酶(ornithine carbamyltransferase,arcB), 氨甲基酶(carbamate kinase,arcC), 逆向運輸?shù)鞍?(arginine-ornithine antiporter,arcD), 二肽酶(dipeptidase,arcT)和調(diào)控蛋白(regulator,arcR) 比較基因組分析副血鏈球菌基因組和血鏈球菌基因組比對的全部MUM點陣圖。橫坐標(biāo),副血鏈

19、球菌,2171616bp; 縱坐標(biāo), 血鏈球菌。對角線代表可以對齊區(qū)域,斜率-1的對角線代表大規(guī)模的染色體倒位比較基因組分析副血鏈球菌基因組和其他六株細(xì)菌全基因組比對結(jié)果圖。a,和肺炎鏈球菌CGSP14比對的結(jié)果;b,戈登氏鏈球菌;c,變異鏈球菌;d,化膿性鏈球菌;第e,豬鏈球菌;f,嗜熱鏈球菌 比較基因組分析進化分析毒力基因基因組小島(fwislet1)基因組島(fwisland)抗藥性二元信號轉(zhuǎn)導(dǎo)系統(tǒng)宏基因組學(xué)和宏轉(zhuǎn)錄組數(shù)據(jù)分析流程三 微生物基因組研究的意義基因組研究在醫(yī)學(xué)的應(yīng)用 基因組研究的生物技術(shù)應(yīng)用 微生物的進化 A 基因組研究在醫(yī)學(xué)的應(yīng)用 致病相關(guān)基因的鑒定 設(shè)計特異的實驗診斷方法

20、疫苗的研究 新型抗生素的開發(fā) 1. 致病相關(guān)基因的鑒定 通過基因組比較鑒定病原相關(guān)基因流感桿菌: 7種內(nèi)毒素(脂多糖)基因25種新基因 細(xì)胞表面定居的粘附分子重復(fù)序列1. 致病相關(guān)基因的鑒定 致病相關(guān)基因的預(yù)測致病物質(zhì)多為病原體細(xì)胞壁成分、 表面蛋白和一些分泌性蛋白質(zhì) PHD預(yù)測基因組的跨膜蛋白 SIGNALP預(yù)測分泌性蛋白質(zhì) 1. 致病相關(guān)基因的鑒定 致病相關(guān)基因的預(yù)測(續(xù))功能相同的蛋白質(zhì)往往相鄰并受共同的調(diào)控序列調(diào)控 operon同一菌種的致病菌株與非致病菌株的基因組進行比較 E. coli K12 MG 1655 4.1 + 0.53 M (528genes) E. coli O157

21、:H7 EDL 933 4.1 + 1.34 M (1387genes)2. 設(shè)計特異的實驗診斷方法尋找高度特異的核酸序列 實驗技術(shù) PCR 雜交技術(shù)(Microarray,DNA chip) 應(yīng)用 鑒定病原種類進行臨床診斷 病原分型的流行病學(xué)研究 預(yù)測疾病進展及臨床療效3. 疫苗的研究通過全基因組序列的同源性比較,尋找致病菌的屬特異、群特異、種特異、型特異、甚至亞型特異的抗原 Pizza等和Tettelin等對血清型B腦膜炎奈瑟菌近350種抗原的研究Wizemann等對肺炎鏈球菌的基因組的抗原性蛋白研究 4. 新型抗生素的開發(fā) 藥靶的特征:藥靶應(yīng)是病原生物必需的,在進化上是保守的可作為藥靶的

22、微生物基因或蛋白質(zhì): 毒力基因、必需基因、菌種專一基因、獨特酶類、膜轉(zhuǎn)運蛋白等 毒力基因作為靶位毒力基因的發(fā)現(xiàn):非致病菌(E.coli K12)與致病菌( E.coli O157, 沙門氏菌,耶爾森氏菌)基因組的比較致病島(Pathogenicity islands)編碼的功能已知蛋白作為藥靶必需基因作為藥靶尋找必需基因的方法: 比較基因組:在不同進化階段保守的基因 往往是必需基因 缺失致死或轉(zhuǎn)座子插入 轉(zhuǎn)座子插入PCR尋找流感嗜血桿菌, 肺炎鏈球菌必需基因 致病菌特殊且必需的蛋白作為靶位 菌種專一基因作為藥靶尋找菌種專一基因的方法: 比較基因組方法病原生物基因組中存在但 近緣種屬中缺少的基因

23、可能是致病關(guān)鍵基因幽門螺桿菌(與大腸桿菌和流感桿菌比較)找到594個特有基因,73個編碼種專一蛋白,如丙酮酸:鐵氧還蛋白氧化還原酶,可作為靶位獨特酶類作為藥靶所有細(xì)菌獨特酶類均可作為靶位: 如: 參與細(xì)胞壁合成的酶類 葉酸合成酶類 核酸合成酶類膜轉(zhuǎn)運蛋白作為靶位衣原體和立克次體的ATP/ADP轉(zhuǎn)位酶是致病菌必需,而只有植物葉綠體、線粒體具有類似酶細(xì)菌多藥運輸?shù)鞍祝ū茫┬滦涂股氐拈_發(fā)藥靶的種類共有藥靶菌種或某菌種的致病菌株的特異性藥靶 某一部位常見致病菌的共同藥靶 新型抗生素的開發(fā)Timothy等的研究:肺炎鏈球菌,流感嗜血桿菌,腦膜炎奈瑟菌 共有基因32個 其中2個甲硫氨酸亞砜還原酶基因 疑

24、是毒力決定子 B 基因組研究的生物技術(shù)應(yīng)用 生物降解作用酶工業(yè)食品生物技術(shù)抗生物質(zhì)生物降解作用Deinococcus radiodurans:抵御放射性物質(zhì)Thermotoga maritima:降解單體或復(fù)合植物 聚合物, 如木聚糖和纖維素Dehalococcoides ethenogenes:降解四氯乙烯Pseudomonas putida:降解多種毒性有機廢料, 包括多種芳香族化合物酶工業(yè)Thermotoga maritima:耐熱Aquifex aeolicus:耐熱Methanogenium frigidum:耐寒Halobacterium:耐鹽,降解塑料Pseudomonas pu

25、tida:降解塑料食品生物技術(shù)Lactococcus latis: 生產(chǎn)發(fā)酵食品,微生物營養(yǎng)添加劑抗生物質(zhì)Streptomyces coelicolor: 生產(chǎn)抗生素,用于人類,獸醫(yī)和農(nóng)業(yè)Photorhabdus luminescens: Bacillus thuringiensis Xenorhabdus nematophilus 產(chǎn)生殺昆蟲毒素蛋白 轉(zhuǎn)基因抗昆蟲植物C 微生物的進化 基于16S rDNA的系統(tǒng)進化樹: Woese等的生物 三域 真細(xì)菌域、古生菌域和真核生物域 單個基因的進化并不等同于物種的進化 基因的水平轉(zhuǎn)移 基因的水平轉(zhuǎn)移 的意義研究微生物的進化史研究菌種新功能的來源研究

26、微生物的生命過程預(yù)測基因功能基因水平轉(zhuǎn)移的方式轉(zhuǎn)化接合轉(zhuǎn)導(dǎo)鑒定基因水平轉(zhuǎn)移的方法 鑒定基因組區(qū)段的組成 比較不同基因的系統(tǒng)發(fā)生 最大相似性分析 基因在生物的分布譜 易被水平轉(zhuǎn)移的基因難被轉(zhuǎn)移的基因:informational genes 進化核心基因易被轉(zhuǎn)移的基因:operational genes 氨酰tRNA合成酶基因 剪切因子 重組酶 DNA聚合酶原核生物轉(zhuǎn)錄組學(xué)研究The transcriptomes of prokaryotic have been largely overlooked. It is primary advance in prokaryotic transcriptomics through new sequen-cing technologies in combination with mRNA enrichment and tilling array.原核轉(zhuǎn)錄組-mRNA en

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論