基因組學(xué)與比較基因組學(xué)演示文稿課件

上傳人：x*** IP屬地：貴州上傳時間：2022-12-12 格式：PPT 頁數(shù)：134 大小：2.64MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩129頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo基礎(chǔ)分子生物學(xué)期末安排考試時間：

2009年

1月

12日下午

2:00-4:00考試地點：三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基礎(chǔ)分子生物學(xué)期末安排考試時間：2009年1月12基因組計劃基因組（genome）是生物體內(nèi)遺傳信息的集合，是某個特定物種細(xì)胞內(nèi)全部DNA分子的總和。基因組學(xué)（genomics）是指研究并解析生物體整個基因組的所有遺傳信息的學(xué)科?；蚪M計劃（GenomeProject）是指對人類以及其它生物體全基因組的測序工作(sequencing)。人類基因組計劃（HumanGenomeProject，HGP）：90年代提出并已基本完成，同40年代原子彈爆炸，60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉?；蚪M計劃基因組（genome）是生物體內(nèi)遺傳信息的集合，是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因組DNA大片段文庫的構(gòu)建

YAC（yeastartificialchromosome,酵母人工染色體）：含有三種必需成分：著絲粒、端粒和復(fù)制起點。是迄今容量最大的克隆載體，插入片段平均長度為200-1000Kbp，最大的可以達(dá)到2Mbp。BAC（Bacterialartificialchromosome），用細(xì)菌的F質(zhì)粒及其調(diào)控基因構(gòu)建了細(xì)菌染色體克隆載體，其克隆能力在125~150Kbp左右。以BAC為基礎(chǔ)的克隆載體形成嵌合體的頻率較低，轉(zhuǎn)化效率高，而且以環(huán)狀結(jié)構(gòu)存在于細(xì)菌體內(nèi)，易于分辨和分離純化，已被科學(xué)界廣泛接受。Publiceffort-strategy:

基因組DNBAC的構(gòu)建pBAC108L來自細(xì)菌的一個小型F質(zhì)粒，其中oriS和repE控制了質(zhì)粒的復(fù)制起始，parB和parA控制了拷貝數(shù)。100-150KbpinsertionBAC的構(gòu)建100-150Kbpinsertion遺傳圖譜(GeneticMap)

物理圖譜(PhysicalMap)遺傳圖又稱為連鎖圖（LinkageMap），是指基因或DNA標(biāo)志在染色體上的相對位置（或距離），通常以基因或DNA片段在染色體交換過程中的分離頻率（cM）來表示。cM值越大，兩者之間遺傳距離越遠(yuǎn)。物理圖譜是指以已知序列的DNA片段（序列標(biāo)簽位點，sequence-taggedsite，STS）在染色體上的實際位置，位點之間的距離（圖距）以堿基對（bp，kb，Mb）作為測量單位的基因組圖。遺傳圖譜(GeneticMap)

物理圖譜(PhDNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)記是RFLP（RestrictionFragmentLengthPolymorphism）。DNA序列上的微小變化，甚至1個核苷酸的變化，也能引起限制性內(nèi)切酶切點的丟失或產(chǎn)生，導(dǎo)致酶切片段長度的變化。第二代DNA遺傳標(biāo)記SSLP（SimpleSeqeuceLengthPolymorphism)利用了存在于人類基因組中的大量重復(fù)序列，包括重復(fù)單位長度在15-65個核苷酸左右的小衛(wèi)星DNA（minisatelliteDNA），重復(fù)單位長度在2-6個核苷酸之間的微衛(wèi)星DNA（microsatelliteDNA）。第三代DNA遺傳標(biāo)記SNP

（singlenucleotidepolymorphism），也是最廣泛的遺傳標(biāo)記，是分散于基因組中的單個堿基的差異。這種差異包括單個堿基的缺失和插入，但更常見的是單個核苷酸的替換，即單核苷酸的多態(tài)性。到目前為止已經(jīng)在人類基因組發(fā)現(xiàn)了超過1000萬個SNP位點，平均每300bp中就有一個SNP！DNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)RFLPmarkerSSLPmarkersWTmutRFLPmarkerSSLPmarkersWTmutSNPmarkerSNPmarker酵母第三號染色體遺傳圖（右）和物理圖（左）的比較

由于實驗方法不同，不少markers之間的遺傳距離并不等于它們在物理圖上的距離。酵母第三號染色體遺傳圖（右）和物理圖（左）的比較由于實驗方鳥槍法序列測定技術(shù)全基因組鳥槍法測序（shotgunsequencing)技術(shù)：隨機挑選帶有基因組DNA的質(zhì)粒進(jìn)行末端序列測定，然后用計算機程序進(jìn)行序列拼接。鳥槍法測序的主要缺點是，隨著所測基因組總量增大，所需測序的片段大量增加；其次，高等真核生物（如人類）基因組中有大量重復(fù)序列，導(dǎo)致判斷失誤鳥槍法序列測定技術(shù)全基因組鳥槍法測序（shotgunseqDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencingDNAtargetsampleSHEAR&SIZEe大規(guī)模DNA序列拼接

DNA序列拼接問題與組合數(shù)學(xué)中的最短超串問題相似。最短超串問題即給定一個字符串的集合，找出一最短的字符串稱為超串，并將集合中的任何一元素作為其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)大規(guī)模DNA序列拼接DNA序列拼接問題與組合數(shù)學(xué)中的最短超AssemblyoftheIndividualSequencesIndividualsequencingreadsarecomparedtoeachotherandwheretheyoverlapcanbeassembledtocreatecontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列

鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列改進(jìn)后的鳥槍法(adoptedbybothICandCelera)改進(jìn)后的鳥槍法(adoptedbybothICand高通量DNA序列分析技術(shù)

人類基因組計劃的成功很大程度上得益于有效減少DNA測序成本的技術(shù)更新。通過改良測序方法，不斷提升其自動化程度，DNA測序的成本降低了100倍，從20世紀(jì)70-80年代$10/bp降低到本世紀(jì)初$0.1/bp！如果一個熟練的DNA序列分析人員采取早期80年代方法每天測定1000bp計算，人類基因組（約3×109bp）的全序列分析，至少也得需要100名這樣的工人花上100年的時間才能完成。而2000年代的高通量測序儀可達(dá)到月測序1-6Mbp！目前？？？$2/1Mbp3Gbp/machine/day高通量DNA序列分析技術(shù)人類基因組計劃的成功很大程度上得益DNAsequencingtechnologies

?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)

–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)DNAsequencingtechnologiesIllumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runIllumina/SolexaAppliedBiosSangersequencing13maybe800bplong42Sangersequencing13maybe800bRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runRoche/454:GenomeSequencerPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7Pyrosequencing---454Sequencin基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件AsectionofPyrosequencingreadsAsectionofPyrosequencingreIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runIllumina/Solexa:GeneticAnaReversibleterminator-basedsequencing(Solexa)Reversibleterminator-basedseFragmentDNAandligateadaptorsFragmentDNAandligateadapto基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?ComparisonWGS454SolexaCloningRealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide

Ligation&Detection(SOLiD)AppliedBiosystemsOligonucleotSOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SOLiD:SequencingligationcyclesSOLiD:SequencingligationcycSOLiD:DataCollectionandImageAnalysisSOLiD:DataCollectionandImaSOLiD:DecodingthesequenceMardis2008SOLiD:Mardis2008Comparisonof“NextGeneration”SequencingTechnologiesComparisonof“NextGenerationApplicationsGeneticAnalyzerApplicationsGeneticAnalyzerSingleMolecule

SequencingTechnologies:onthehorizon

?ArrayoftetheredDNApolymerasemolecules?Boundtotemplatestrand+primer?Heliscope –Cyclicalbaseaddition(similartoSolexa)?VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing

Technologies:RateLimitingFactors

?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof

the“sequencetsunami”---essemblySingleMoleculeSequencingTecWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)Whatdowesequence?denovogeExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008ExamplesofApplicationsof“NThe“$10,000humangenomesequencing”prize?Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.?Prize:$10million?Deadline:12:01AMPST,October4,2013.?Donors:XFoundation,J.CraigVenterFoundationThe“$10,000humangenomesequHumanHapMapProjectHapMap的構(gòu)建分為三個步驟：（a）在多個個體的DNA樣品中鑒定單核苷酸多態(tài)性（SNPs）；（b）將群體中頻率大于1%的那些共同遺傳的相鄰SNPs組合成單體型；（c）在單體型中找出用于識別這些單體型的標(biāo)簽SNPs。通過對圖中的三個標(biāo)簽SNPs進(jìn)行基因分型，可以確定每個個體擁有哪一個單體型。HumanHapMapProjectHapMap的構(gòu)建分SCIENCE315:1781(30MARCH2007)Metagenomesor

complexsamplesSCIENCE315:1781(30MARCH20轉(zhuǎn)錄圖（transcriptprofiling）

基因轉(zhuǎn)錄圖（cDNA圖），或者基因的cDNA片段圖，即表達(dá)序列標(biāo)簽圖（EST，expressedsequencetag），是基因組圖的重要組成部分。大規(guī)模生產(chǎn)EST的主要程序如下：分離特定組織在某一發(fā)展階段或某種生理條件下的總mRNA，合成雙鏈cDNA，克隆到plasmid中并進(jìn)行兩端測序。轉(zhuǎn)錄圖（transcriptprofiling）基因轉(zhuǎn)錄PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因組項目（/）

根據(jù)2007年1月的數(shù)據(jù)，全球已啟動2296個基因組項目，其中607個項目已經(jīng)完成，已經(jīng)公開發(fā)表481個基因組序列，包括403個細(xì)菌基因組，33個古細(xì)菌基因組和45個真核生物基因組。其它基因組計劃到2006年底已完成的基因組項目根據(jù)2007年1月的數(shù)據(jù)，全到2006年12月全世界主要基因組計劃的進(jìn)展情況

到2006年12月全世界主要基因組計劃的進(jìn)展情況Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocomparethegenecontentofoneorganismtoanotherorganism.Tostudygene/genomeevolution.Tostudyorganismalevolution.Asafoundationforfutureexperimentation.Whydowesequencegenomes?To不同模式生物基因組的比較物種基因組大小估計基因數(shù)尿殖道支原體

Mycoplasmagenitalium580Kb467肺炎支原體

Mycoplasmapneumoniae816Kb677流感嗜血桿菌

Haemophilusinfluenzae1.8Mb1709枯草芽孢桿菌

Bacillussubtilis4.2Mb4100大腸桿菌

Escherichiacoli4.6Mb4288釀酒酵母

Saccharomycescerevisiae13Mb6275線蟲

Caenorhabditiselegans100Mb18891擬南芥

Arabidopsisthaliana125Mb25498果蠅

Drosophilamelanogaster165Mb14113人類

Homosapiens3Gb約2.5萬不同模式生物基因組的比較物種基因組大小估計基因數(shù)尿比較基因組學(xué)（Comparativegenomics）比較基因組學(xué)的威力在于它能根據(jù)對一種生物相關(guān)基因的認(rèn)識來理解、詮釋甚至克隆分離另一種生物的基因。遠(yuǎn)緣基因組間的比較為認(rèn)識生物學(xué)機制的普遍性，尋找研究復(fù)雜生理和病理過程所需的實驗?zāi)Ｐ吞峁┝死碚撘罁?jù)，而近緣基因組間的比較則為認(rèn)識基因結(jié)構(gòu)與功能等細(xì)節(jié)提供了參數(shù)。物種名基因數(shù)目轉(zhuǎn)錄因子數(shù)量比例擬南芥約2938815335.9酵母約58852093.5線蟲約188916693.5果蠅約133796354.5比較基因組學(xué)（Comparativegenomics）比較FunctionalCategoriesinEukaryoticProteomesFunctionalCategoriesinEukarApplicationstoMedicineAkeyapplicationofhumangenomeresearchistofinddiseasegenesbypositionalcloningThismethodinvolvesmappingthechromosomalregioncontainingthegenebylinkageanalysisinaffectedfamiliesThehumangenomicsequenceinpublicdatabasesallowsrapididentificationinsilicoofcandidategenes,followedbymutationscreeningofrelevantcandidates,aidedbyinformationongenestructureForamendeliandisorder,agenesearchcannowoftenbecarriedoutinamatterofmonthswithonlyamodestlysizedteamApplicationstoMedicineAkey基因組學(xué)與比較基因組學(xué)演示文稿課件NextStepsonHGPFinishthehumansequenceLarge-scaleidentificationofregulatoryregionsSequencingofadditionallargegenomesCompletingthecatalogueofhumanvariationFromsequencetofunctionNextStepsonHGPFinishthehuFutureTechnologyDevelopmentFunctionalgenomics-aimstounderstandhowgenesareregulatedandwhattheydo,largelythroughmassivelyparallelstudiesofgeneexpressioninavarietyoftissuesProteomics–promisestomaketheidentityofeachproteinknownandelucidateprotein-proteininteractionsBioinformatics–enhancetheabilityofresearcherstomanipulate,collectandanalyzedatamorequicklyandinnewwaysFutureTechnologyDevelopmentF基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件祝同學(xué)們新年快樂！考試順利！祝同學(xué)們新年快樂！考試順利！個人觀點供參考，歡迎討論！個人觀點供參考，歡迎討論！第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo基礎(chǔ)分子生物學(xué)期末安排考試時間：

2009年

1月

12日下午

2:00-4:00考試地點：三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基礎(chǔ)分子生物學(xué)期末安排考試時間：2009年1月12基因組計劃基因組（genome）是生物體內(nèi)遺傳信息的集合，是某個特定物種細(xì)胞內(nèi)全部DNA分子的總和?；蚪M學(xué)（genomics）是指研究并解析生物體整個基因組的所有遺傳信息的學(xué)科?；蚪M計劃（GenomeProject）是指對人類以及其它生物體全基因組的測序工作(sequencing)。人類基因組計劃（HumanGenomeProject，HGP）：90年代提出并已基本完成，同40年代原子彈爆炸，60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉?；蚪M計劃基因組（genome）是生物體內(nèi)遺傳信息的集合，是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因組DNA大片段文庫的構(gòu)建

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列

?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)

SequencingTechnologies:onthehorizon

Technologies:RateLimitingFactors

?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof

complexsamplesSCIENCE315:1781(30MARCH20轉(zhuǎn)錄圖（transcriptprofiling）

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因組項目（/）

到2006年12月全世界主要基因組計劃的進(jìn)展情況Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocom

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基因組學(xué)與比較基因組學(xué)演示文稿課件

文檔簡介

溫馨提示

最新文檔

評論

基因組學(xué)與比較基因組學(xué)演示文稿課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔