




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生物信息學第七章基因組分析1生物信息學第七章基因組分析1人類基因組計劃2人類基因組計劃2基因組、轉錄組和蛋白質組基因組轉錄組蛋白質組化學生物學3基因組、轉錄組和蛋白質組基因組轉錄組蛋白質組化學生物學3本章內容提要1.基因組的結構與內容2.基因組注釋3.比較基因組學4.基因/蛋白質的功能預測4本章內容提要1.基因組的結構與內容41.基因組的結構與內容(1)基因的結構(2)mRNA:可變剪切(3)蛋白質:翻譯后修飾(4)相互作用網(wǎng)絡:基因、蛋白質、小分子之間的相互作用(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…b.Non-codingRNA:MicroRNAc.轉座子d.重復片段e.偽基因(Pseudogene)51.基因組的結構與內容(1)基因的結構5(1)基因的結構6(1)基因的結構6基因組大小&基因數(shù)7基因組大小&基因數(shù)7基因數(shù)量->生物復雜性?1.基因數(shù)量的變化,無法解釋生物學功能、調控機理以及物種多樣性和復雜性的巨大變化2.當前解釋:蛋白質組的多樣性和復雜性->物種的多樣性和復雜性;~10,000,000種蛋白質分子3.兩種觀點:a.
轉錄后層面,mRNA剪切,產(chǎn)生拼接異構體b.
蛋白質層面,蛋白質序列上一個或多個位點上發(fā)生的翻譯后修飾8基因數(shù)量->生物復雜性?1.基因數(shù)量的變化,無法解釋生GenotypetoPhenotype9GenotypetoPhenotype9isoform1isoform2isoform3mRNASplicing轉錄后層面:mRNASplicing10isoform1isoform2isoform3mRNPhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白質層面:翻譯后修飾11PhosphorylationSumoylationPalm(4)相互作用網(wǎng)絡蛋白質-蛋白質相互作用網(wǎng)絡12(4)相互作用網(wǎng)絡蛋白質-蛋白質相互作用網(wǎng)絡12細胞信號通路G1/S檢驗點:有調控方向13細胞信號通路G1/S檢驗點:13(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…b.Non-codingRNA:MicroRNAc.轉座子d.重復片段e.偽基因(Pseudogene)14(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…Functionalelements:Promotor15Functionalelements:Promotor1TranscriptionFactorBindingSiteCRM:cis-regulatorymodules16TranscriptionFactorBindingSGal4pandKruppelGal4pKruppel17Gal4pandKruppelGal4pKruppel1其他功能元件Exonsplicingenhancer(ESE)andsilencer(ESS)Intronsplicingenhancer(ISE)andsilencer(ISS)18其他功能元件Exonsplicingenhancer(Non-codingRNA1.不翻譯成蛋白質,具有重要的調控功能2.分類:a.transferRNA(tRNA)b.ribosomalRNA(rRNA)c.snoRNAs,d.microRNAs,e.siRNAsf.piRNAs:與piwi相互作用的RNAg.longncRNAs:Xist…19Non-codingRNA1.不翻譯成蛋白質,具有重要的tRNA&rRNA20tRNA&rRNA20snoRNAssnoRNAs:SmallnucleolarRNAs;介導其他RNA分子的化學修飾,例如甲基化21snoRNAssnoRNAs:SmallnucleolamicroRNA/miRNA1.長度21-23bp2.調控基因的表達3.pre-miRNA:~70bp22microRNA/miRNA1.長度21-23bp22Transposon轉座子:在基因組中能夠移動位置的DNA序列23Transposon轉座子:在基因組中能夠移動位置的DNA序2.基因組注釋(1)基因組序列的拼裝(2)基因預測(3)可變剪切的預測(4)非編碼的功能元件的預測242.基因組注釋(1)基因組序列的拼裝24(1)基因組測序:鳥槍法25(1)基因組測序:鳥槍法25基因組的拼裝26基因組的拼裝26重復序列帶來干擾27重復序列帶來干擾27(2)基因預測直接的,序列高度匹配同一或近緣物種中,與EST,cDNA,蛋白質等序列完美或近似完美的匹配間接的,基于統(tǒng)計學的序列比對(Homology)從頭預測(abinitio)以上兩種方法的結合28(2)基因預測直接的,序列高度匹配28真核生物的基因結構5’3’3’5’
~1-100Mbp5’3’3’5’…………
~1-1000kbpexons(cds
&
utr)/introns(~102-103bp)(~102-105bp)Polyadenylationsitepromoter(~103bp)enhancers(~101-102bp)otherregulatorysequences(~101-102bp)29真核生物的基因結構5’3’3’5’~1-100Mbp基因的其他特征1.ORF(OpenReadingFrame):從AUG開始,至stopcodon終止2.CodonUsage:CAI…30基因的其他特征1.ORF(OpenReadingFrHMMmodelforGenePrediction(Genie)Kulp,D.,PhDThesis,UCSC200331HMMmodelforGenePrediction(3)可變剪切的預測將EST,cDNA序列比對到基因組上32(3)可變剪切的預測將EST,cDNA序列比對到基因組上部分有向圖算法33部分有向圖算法333.比較基因組學(1)有功能的通常保守(2)例:SUMO底物的預測:a.SUMO化位點存在ψ-K-X-E模體b.核定位信號(NLS)c.人和小鼠中,SUMO化位點應當保守d.功能分析:GeneOntology(3)分析結果:a.2,683個人-小鼠保守的SUMO化底物b.SUMO化的功能:參與轉錄調控、信號轉導等343.比較基因組學(1)有功能的通常保守34GeneOntology:基因本體論1.描述基因/蛋白質的功能2.三類術語(Term):a.Cellularcomponent:在哪里?b.Biologicalprocess:干什么?c.Molecularfunction:我是誰?35GeneOntology:基因本體論1.描述基因/蛋白質GeneOntology:基因本體論36GeneOntology:基因本體論363737功能顯著性分析:超幾何分布38功能顯著性分析:超幾何分布383939轉錄因子Inhumanproteome:
DNAbinding(GO:0003677):2,255Transcriptionfactoractivity(GO:0003700):1,102regulationoftranscription,DNA-dependent(GO:0006355):2,174InSUMOSubstrates:DNAbinding(GO:0003677):530Transcriptionfactoractivity(GO:0003700):304regulationoftranscription,DNA-dependent(GO:0006355):510因此,可以估計1/4~1/3的轉錄因子受到SUMO化的調控40轉錄因子Inhumanproteome:404.基因/蛋白質的功能預測(1)一級序列的比較:相似的序列具有相似的功能(2)保守的功能結構域:保守的功能(3)三級結構的比較:相似的結構具有相似的功能(4)蛋白質相互作用的預測414.基因/蛋白質的功能預測(1)一級序列的比較:相似的序(1)一級序列的比較1.同源物的鑒定:不同物種中的直系、旁系同源物的預測2.主要工具:BLAST42(1)一級序列的比較1.同源物的鑒定:不同物種中的直系、(2)保守的功能結構域1.保守的功能結構域:保守的功能2.常用工具:工具網(wǎng)址Interprohttp://www.ebi.ac.uk/interpro/Pfamhttp://pfam.sanger.ac.uk/SMARThttp://smart.embl.de/PROSITE/prosite/ProDomhttp://prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgi43(2)保守的功能結構域1.保守的功能結構域:保守的功能工例:Nek244例:Nek244(3)三級結構的比較1.Ubiquitin:泛素,主要負責蛋白質的降解2.SUMO:小的類泛素蛋白質,基因轉錄&信號通路3.催化反應通路的分子機制相似4.序列相似性:不顯著!45(3)三級結構的比較1.Ubiquitin:泛素,主要Ubiquitinvs.SUMO46Ubiquitinvs.SUMO46序列相似性:~20%47序列相似性:~20%47結構相似性SUMOUbiquitin48結構相似性SUMOUbiquitin48(4)蛋白質相互作用的預測1.基因組信息(Genomicinformation)A.GenefusionandfissionB.Conservationofgeneorder/bidirectionalpairsC.Phylogeneticprofile2.關聯(lián)的序列特征(Correlatedsequencesignatures)3.mRNAco-expression4.Literaturemining49(4)蛋白質相互作用的預測1.基因組信息(GenomiGenefusion/fission:RosettaStoneABABQueryproteinLinkedproteinRosettaproteinMarcotteEMetal.,Science1999,285:751-753;EnrightAJetal.,Nature,1999,402:86-90GenomeAGenomeB50Genefusion/fission:RosettaSConservationofgeneorder/bidirectionalpairsGeneorderpairsBidirectionaltranscribedgenepairsDandekarTetal.,TIBS,1998,23:324-328;OverbeekRetal.,PNAS,1999,96:2896-2901;KorbelJOetal.,NBT,2004,22:911-91751Conservationofgeneorder/biPhylogeneticprofilesPellegriniMetal.,PNAS,1999,96:4285-4288;HuynenMAetal.,PNAS,1998,95:5849-585652PhylogeneticprofilesPellegrinCorrelatedsequencesignaturesA.B.ThismodeliscomputationallyfasterandmoreconvenientPIDmodelPIDCmodel53CorrelatedsequencesignaturesPID模型:最大似然性法54PID模型:最大似然性法54P(Imn=1):訓練55P(Imn=1):訓練55Conservedco-expressionNotPPI,butfunctionallinkageStuartJMetal.,Science,2003,302:249-255;vonMeringCetal.,NAR,2005,33:D433-D43756Conservedco-expressionNotPPISTRING:方法的整合57STRING:方法的整合57生物信息學第七章基因組分析58生物信息學第七章基因組分析1人類基因組計劃59人類基因組計劃2基因組、轉錄組和蛋白質組基因組轉錄組蛋白質組化學生物學60基因組、轉錄組和蛋白質組基因組轉錄組蛋白質組化學生物學3本章內容提要1.基因組的結構與內容2.基因組注釋3.比較基因組學4.基因/蛋白質的功能預測61本章內容提要1.基因組的結構與內容41.基因組的結構與內容(1)基因的結構(2)mRNA:可變剪切(3)蛋白質:翻譯后修飾(4)相互作用網(wǎng)絡:基因、蛋白質、小分子之間的相互作用(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…b.Non-codingRNA:MicroRNAc.轉座子d.重復片段e.偽基因(Pseudogene)621.基因組的結構與內容(1)基因的結構5(1)基因的結構63(1)基因的結構6基因組大小&基因數(shù)64基因組大小&基因數(shù)7基因數(shù)量->生物復雜性?1.基因數(shù)量的變化,無法解釋生物學功能、調控機理以及物種多樣性和復雜性的巨大變化2.當前解釋:蛋白質組的多樣性和復雜性->物種的多樣性和復雜性;~10,000,000種蛋白質分子3.兩種觀點:a.
轉錄后層面,mRNA剪切,產(chǎn)生拼接異構體b.
蛋白質層面,蛋白質序列上一個或多個位點上發(fā)生的翻譯后修飾65基因數(shù)量->生物復雜性?1.基因數(shù)量的變化,無法解釋生GenotypetoPhenotype66GenotypetoPhenotype9isoform1isoform2isoform3mRNASplicing轉錄后層面:mRNASplicing67isoform1isoform2isoform3mRNPhosphorylationSumoylationPalmitoylationAcetylationUbiquitination蛋白質層面:翻譯后修飾68PhosphorylationSumoylationPalm(4)相互作用網(wǎng)絡蛋白質-蛋白質相互作用網(wǎng)絡69(4)相互作用網(wǎng)絡蛋白質-蛋白質相互作用網(wǎng)絡12細胞信號通路G1/S檢驗點:有調控方向70細胞信號通路G1/S檢驗點:13(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…b.Non-codingRNA:MicroRNAc.轉座子d.重復片段e.偽基因(Pseudogene)71(5)非編碼區(qū)a.功能元件:轉錄因子結合位點;啟動子…Functionalelements:Promotor72Functionalelements:Promotor1TranscriptionFactorBindingSiteCRM:cis-regulatorymodules73TranscriptionFactorBindingSGal4pandKruppelGal4pKruppel74Gal4pandKruppelGal4pKruppel1其他功能元件Exonsplicingenhancer(ESE)andsilencer(ESS)Intronsplicingenhancer(ISE)andsilencer(ISS)75其他功能元件Exonsplicingenhancer(Non-codingRNA1.不翻譯成蛋白質,具有重要的調控功能2.分類:a.transferRNA(tRNA)b.ribosomalRNA(rRNA)c.snoRNAs,d.microRNAs,e.siRNAsf.piRNAs:與piwi相互作用的RNAg.longncRNAs:Xist…76Non-codingRNA1.不翻譯成蛋白質,具有重要的tRNA&rRNA77tRNA&rRNA20snoRNAssnoRNAs:SmallnucleolarRNAs;介導其他RNA分子的化學修飾,例如甲基化78snoRNAssnoRNAs:SmallnucleolamicroRNA/miRNA1.長度21-23bp2.調控基因的表達3.pre-miRNA:~70bp79microRNA/miRNA1.長度21-23bp22Transposon轉座子:在基因組中能夠移動位置的DNA序列80Transposon轉座子:在基因組中能夠移動位置的DNA序2.基因組注釋(1)基因組序列的拼裝(2)基因預測(3)可變剪切的預測(4)非編碼的功能元件的預測812.基因組注釋(1)基因組序列的拼裝24(1)基因組測序:鳥槍法82(1)基因組測序:鳥槍法25基因組的拼裝83基因組的拼裝26重復序列帶來干擾84重復序列帶來干擾27(2)基因預測直接的,序列高度匹配同一或近緣物種中,與EST,cDNA,蛋白質等序列完美或近似完美的匹配間接的,基于統(tǒng)計學的序列比對(Homology)從頭預測(abinitio)以上兩種方法的結合85(2)基因預測直接的,序列高度匹配28真核生物的基因結構5’3’3’5’
~1-100Mbp5’3’3’5’…………
~1-1000kbpexons(cds
&
utr)/introns(~102-103bp)(~102-105bp)Polyadenylationsitepromoter(~103bp)enhancers(~101-102bp)otherregulatorysequences(~101-102bp)86真核生物的基因結構5’3’3’5’~1-100Mbp基因的其他特征1.ORF(OpenReadingFrame):從AUG開始,至stopcodon終止2.CodonUsage:CAI…87基因的其他特征1.ORF(OpenReadingFrHMMmodelforGenePrediction(Genie)Kulp,D.,PhDThesis,UCSC200388HMMmodelforGenePrediction(3)可變剪切的預測將EST,cDNA序列比對到基因組上89(3)可變剪切的預測將EST,cDNA序列比對到基因組上部分有向圖算法90部分有向圖算法333.比較基因組學(1)有功能的通常保守(2)例:SUMO底物的預測:a.SUMO化位點存在ψ-K-X-E模體b.核定位信號(NLS)c.人和小鼠中,SUMO化位點應當保守d.功能分析:GeneOntology(3)分析結果:a.2,683個人-小鼠保守的SUMO化底物b.SUMO化的功能:參與轉錄調控、信號轉導等913.比較基因組學(1)有功能的通常保守34GeneOntology:基因本體論1.描述基因/蛋白質的功能2.三類術語(Term):a.Cellularcomponent:在哪里?b.Biologicalprocess:干什么?c.Molecularfunction:我是誰?92GeneOntology:基因本體論1.描述基因/蛋白質GeneOntology:基因本體論93GeneOntology:基因本體論369437功能顯著性分析:超幾何分布95功能顯著性分析:超幾何分布389639轉錄因子Inhumanproteome:
DNAbinding(GO:0003677):2,255Transcriptionfactoractivity(GO:0003700):1,102regulationoftranscription,DNA-dependent(GO:0006355):2,174InSUMOSubstrates:DNAbinding(GO:0003677):530Transcriptionfactoractivity(GO:0003700):304regulationoftranscription,DNA-dependent(GO:0006355):510因此,可以估計1/4~1/3的轉錄因子受到SUMO化的調控97轉錄因子Inhumanproteome:404.基因/蛋白質的功能預測(1)一級序列的比較:相似的序列具有相似的功能(2)保守的功能結構域:保守的功能(3)三級結構的比較:相似的結構具有相似的功能(4)蛋白質相互作用的預測984.基因/蛋白質的功能預測(1)一級序列的比較:相似的序(1)一級序列的比較1.同源物的鑒定:不同物種中的直系、旁系同源物的預測2.主要工具:BLAST99(1)一級序列的比較1.同源物的鑒定:不同物種中的直系、(2)保守的功能結構域1.保守的功能結構域:保守的功能2.常用工具:工具網(wǎng)址Interprohttp://www.ebi.ac.uk/interpro/Pfamhttp://pfam.sanger.ac.uk/SMARThttp://smart.embl.de/PROSITE/prosite/ProDomhttp://prodom.prabi.fr/prodom/current/html/home.phpCDD/Structure/cdd/wrpsb.cgi100(2)保守的功能結構域1.保守的功能結構域:保守的功能工例:Nek2101例:Nek244(3)三級結構的比較1.Ubiquitin:泛素,主要負責蛋白質的降解2.SUMO:小的類泛素蛋白質,基因轉錄&信號通路3.催化反應通路的分子機制相似4.序列相似性:不顯著!102(3)三級結構的比較1.Ubiquitin:泛素,主要Ubiquitinvs.SUMO103Ubiquitinvs.SUMO46序列相似性:~20%104序列相似性:~20%47結構相似性SUMOUbiquitin105結構相似性SUMOUbiquitin48(4)蛋白質相互作用的預測1.基因組信息(Genomicinformation)A.GenefusionandfissionB.Conservationofgeneorder/bidirectionalpairsC.Phylogeneticprofile2.關聯(lián)的序列特征(Correla
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑裝飾植筋工程勞務分包合同
- 公共廁所裝飾裝修施工合同
- 業(yè)務合同登記表格
- 環(huán)境監(jiān)測技術操作規(guī)范及標準解讀
- 整體櫥柜合同
- 建筑勞務派遣工合同
- 2025年社保代繳合作協(xié)議書
- 2025年安徽財貿職業(yè)學院單招職業(yè)傾向性測試題庫1套
- 建筑防雷設施工程施工合同
- 2025年安徽省銅陵市單招職業(yè)適應性考試題庫含答案
- 2025年湖南理工職業(yè)技術學院單招職業(yè)技能測試題庫一套
- 2025年專利權侵權和解協(xié)議書范本
- 2024中考百日誓師大會動員講話稿
- 2025年中國廣州軌道交通行業(yè)市場全景評估及投資前景展望報告
- 教職工開學安全第一課培訓
- 2025年貴州貴安發(fā)展集團有限公司招聘筆試參考題庫含答案解析
- 2024-2025學年北京西城區(qū)八年級初二(上)期末英語試卷(含答案)
- 《家庭護士》課件
- 2024年社區(qū)工作者考試時事政治模擬題及答案
- 物業(yè)服務行業(yè)禮儀培訓
- 2025《國家安全教育》教學大綱
評論
0/150
提交評論