基因組學(xué)與比較基因組學(xué)演示文稿課件_第1頁
基因組學(xué)與比較基因組學(xué)演示文稿課件_第2頁
基因組學(xué)與比較基因組學(xué)演示文稿課件_第3頁
基因組學(xué)與比較基因組學(xué)演示文稿課件_第4頁
基因組學(xué)與比較基因組學(xué)演示文稿課件_第5頁
已閱讀5頁,還剩129頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo基礎(chǔ)分子生物學(xué)期末安排考試時(shí)間:

2009年

1月

12日下午

2:00-4:00考試地點(diǎn):三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基礎(chǔ)分子生物學(xué)期末安排考試時(shí)間:2009年1月12基因組計(jì)劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是某個(gè)特定物種細(xì)胞內(nèi)全部DNA分子的總和?;蚪M學(xué)(genomics)是指研究并解析生物體整個(gè)基因組的所有遺傳信息的學(xué)科?;蚪M計(jì)劃(GenomeProject)是指對人類以及其它生物體全基因組的測序工作(sequencing)。人類基因組計(jì)劃(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子彈爆炸,60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉?;蚪M計(jì)劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因組DNA大片段文庫的構(gòu)建

YAC(yeastartificialchromosome,酵母人工染色體):含有三種必需成分:著絲粒、端粒和復(fù)制起點(diǎn)。是迄今容量最大的克隆載體,插入片段平均長度為200-1000Kbp,最大的可以達(dá)到2Mbp。BAC(Bacterialartificialchromosome),用細(xì)菌的F質(zhì)粒及其調(diào)控基因構(gòu)建了細(xì)菌染色體克隆載體,其克隆能力在125~150Kbp左右。以BAC為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,而且以環(huán)狀結(jié)構(gòu)存在于細(xì)菌體內(nèi),易于分辨和分離純化,已被科學(xué)界廣泛接受。Publiceffort-strategy:

基因組DNBAC的構(gòu)建pBAC108L來自細(xì)菌的一個(gè)小型F質(zhì)粒,其中oriS和repE控制了質(zhì)粒的復(fù)制起始,parB和parA控制了拷貝數(shù)。100-150KbpinsertionBAC的構(gòu)建100-150Kbpinsertion遺傳圖譜(GeneticMap)

vs

物理圖譜(PhysicalMap)遺傳圖又稱為連鎖圖(LinkageMap),是指基因或DNA標(biāo)志在染色體上的相對位置(或距離),通常以基因或DNA片段在染色體交換過程中的分離頻率(cM)來表示。cM值越大,兩者之間遺傳距離越遠(yuǎn)。物理圖譜是指以已知序列的DNA片段(序列標(biāo)簽位點(diǎn),sequence-taggedsite,STS)在染色體上的實(shí)際位置,位點(diǎn)之間的距離(圖距)以堿基對(bp,kb,Mb)作為測量單位的基因組圖。遺傳圖譜(GeneticMap)

vs

物理圖譜(PhDNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)記是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小變化,甚至1個(gè)核苷酸的變化,也能引起限制性內(nèi)切酶切點(diǎn)的丟失或產(chǎn)生,導(dǎo)致酶切片段長度的變化。第二代DNA遺傳標(biāo)記SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人類基因組中的大量重復(fù)序列,包括重復(fù)單位長度在15-65個(gè)核苷酸左右的小衛(wèi)星DNA(minisatelliteDNA),重復(fù)單位長度在2-6個(gè)核苷酸之間的微衛(wèi)星DNA(microsatelliteDNA)。第三代DNA遺傳標(biāo)記SNP

(singlenucleotidepolymorphism),也是最廣泛的遺傳標(biāo)記,是分散于基因組中的單個(gè)堿基的差異。這種差異包括單個(gè)堿基的缺失和插入,但更常見的是單個(gè)核苷酸的替換,即單核苷酸的多態(tài)性。到目前為止已經(jīng)在人類基因組發(fā)現(xiàn)了超過1000萬個(gè)SNP位點(diǎn),平均每300bp中就有一個(gè)SNP!DNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)RFLPmarkerSSLPmarkersWTmutRFLPmarkerSSLPmarkersWTmutSNPmarkerSNPmarker酵母第三號染色體遺傳圖(右)和物理圖(左)的比較

由于實(shí)驗(yàn)方法不同,不少markers之間的遺傳距離并不等于它們在物理圖上的距離。酵母第三號染色體遺傳圖(右)和物理圖(左)的比較由于實(shí)驗(yàn)方鳥槍法序列測定技術(shù)全基因組鳥槍法測序(shotgunsequencing)技術(shù):隨機(jī)挑選帶有基因組DNA的質(zhì)粒進(jìn)行末端序列測定,然后用計(jì)算機(jī)程序進(jìn)行序列拼接。鳥槍法測序的主要缺點(diǎn)是,隨著所測基因組總量增大,所需測序的片段大量增加;其次,高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤鳥槍法序列測定技術(shù)全基因組鳥槍法測序(shotgunseqDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencingDNAtargetsampleSHEAR&SIZEe大規(guī)模DNA序列拼接

DNA序列拼接問題與組合數(shù)學(xué)中的最短超串問題相似。最短超串問題即給定一個(gè)字符串的集合,找出一最短的字符串稱為超串,并將集合中的任何一元素作為其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)大規(guī)模DNA序列拼接DNA序列拼接問題與組合數(shù)學(xué)中的最短超AssemblyoftheIndividualSequencesIndividualsequencingreadsarecomparedtoeachotherandwheretheyoverlapcanbeassembledtocreatecontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列

鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列改進(jìn)后的鳥槍法(adoptedbybothICandCelera)改進(jìn)后的鳥槍法(adoptedbybothICand高通量DNA序列分析技術(shù)

人類基因組計(jì)劃的成功很大程度上得益于有效減少DNA測序成本的技術(shù)更新。通過改良測序方法,不斷提升其自動(dòng)化程度,DNA測序的成本降低了100倍,從20世紀(jì)70-80年代$10/bp降低到本世紀(jì)初$0.1/bp!如果一個(gè)熟練的DNA序列分析人員采取早期80年代方法每天測定1000bp計(jì)算,人類基因組(約3×109bp)的全序列分析,至少也得需要100名這樣的工人花上100年的時(shí)間才能完成。而2000年代的高通量測序儀可達(dá)到月測序1-6Mbp!目前???$2/1Mbp3Gbp/machine/day高通量DNA序列分析技術(shù)人類基因組計(jì)劃的成功很大程度上得益DNAsequencingtechnologies

?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)

–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)DNAsequencingtechnologiesIllumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runIllumina/SolexaAppliedBiosSangersequencing13maybe800bplong42Sangersequencing13maybe800bRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runRoche/454:GenomeSequencerPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7Pyrosequencing---454Sequencin基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件AsectionofPyrosequencingreadsAsectionofPyrosequencingreIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runIllumina/Solexa:GeneticAnaReversibleterminator-basedsequencing(Solexa)Reversibleterminator-basedseFragmentDNAandligateadaptorsFragmentDNAandligateadapto基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?ComparisonWGS454SolexaCloningRealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide

Ligation&Detection(SOLiD)AppliedBiosystemsOligonucleotSOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SOLiD:SequencingligationcyclesSOLiD:SequencingligationcycSOLiD:DataCollectionandImageAnalysisSOLiD:DataCollectionandImaSOLiD:DecodingthesequenceMardis2008SOLiD:Mardis2008Comparisonof“NextGeneration”SequencingTechnologiesComparisonof“NextGenerationApplicationsGeneticAnalyzerApplicationsGeneticAnalyzerSingleMolecule

SequencingTechnologies:onthehorizon

?ArrayoftetheredDNApolymerasemolecules?Boundtotemplatestrand+primer?Heliscope –Cyclicalbaseaddition(similartoSolexa)?VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing

Technologies:RateLimitingFactors

?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof

the“sequencetsunami”---essemblySingleMoleculeSequencingTecWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)Whatdowesequence?denovogeExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008ExamplesofApplicationsof“NThe“$10,000humangenomesequencing”prize?Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.?Prize:$10million?Deadline:12:01AMPST,October4,2013.?Donors:XFoundation,J.CraigVenterFoundationThe“$10,000humangenomesequHumanHapMapProjectHapMap的構(gòu)建分為三個(gè)步驟:(a)在多個(gè)個(gè)體的DNA樣品中鑒定單核苷酸多態(tài)性(SNPs);(b)將群體中頻率大于1%的那些共同遺傳的相鄰SNPs組合成單體型;(c)在單體型中找出用于識別這些單體型的標(biāo)簽SNPs。通過對圖中的三個(gè)標(biāo)簽SNPs進(jìn)行基因分型,可以確定每個(gè)個(gè)體擁有哪一個(gè)單體型。HumanHapMapProjectHapMap的構(gòu)建分SCIENCE315:1781(30MARCH2007)Metagenomesor

complexsamplesSCIENCE315:1781(30MARCH20轉(zhuǎn)錄圖(transcriptprofiling)

基因轉(zhuǎn)錄圖(cDNA圖),或者基因的cDNA片段圖,即表達(dá)序列標(biāo)簽圖(EST,expressedsequencetag),是基因組圖的重要組成部分。大規(guī)模生產(chǎn)EST的主要程序如下:分離特定組織在某一發(fā)展階段或某種生理?xiàng)l件下的總mRNA,合成雙鏈cDNA,克隆到plasmid中并進(jìn)行兩端測序。轉(zhuǎn)錄圖(transcriptprofiling)基因轉(zhuǎn)錄PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因組項(xiàng)目(/)

根據(jù)2007年1月的數(shù)據(jù),全球已啟動(dòng)2296個(gè)基因組項(xiàng)目,其中607個(gè)項(xiàng)目已經(jīng)完成,已經(jīng)公開發(fā)表481個(gè)基因組序列,包括403個(gè)細(xì)菌基因組,33個(gè)古細(xì)菌基因組和45個(gè)真核生物基因組。其它基因組計(jì)劃到2006年底已完成的基因組項(xiàng)目根據(jù)2007年1月的數(shù)據(jù),全到2006年12月全世界主要基因組計(jì)劃的進(jìn)展情況

到2006年12月全世界主要基因組計(jì)劃的進(jìn)展情況Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocomparethegenecontentofoneorganismtoanotherorganism.Tostudygene/genomeevolution.Tostudyorganismalevolution.Asafoundationforfutureexperimentation.Whydowesequencegenomes?To不同模式生物基因組的比較物種基因組大小估計(jì)基因數(shù)尿殖道支原體

Mycoplasmagenitalium580Kb467肺炎支原體

Mycoplasmapneumoniae816Kb677流感嗜血桿菌

Haemophilusinfluenzae1.8Mb1709枯草芽孢桿菌

Bacillussubtilis4.2Mb4100大腸桿菌

Escherichiacoli4.6Mb4288釀酒酵母

Saccharomycescerevisiae13Mb6275線蟲

Caenorhabditiselegans100Mb18891擬南芥

Arabidopsisthaliana125Mb25498果蠅

Drosophilamelanogaster165Mb14113人類

Homosapiens3Gb約2.5萬不同模式生物基因組的比較物種基因組大小估計(jì)基因數(shù)尿比較基因組學(xué)(Comparativegenomics)比較基因組學(xué)的威力在于它能根據(jù)對一種生物相關(guān)基因的認(rèn)識來理解、詮釋甚至克隆分離另一種生物的基因。遠(yuǎn)緣基因組間的比較為認(rèn)識生物學(xué)機(jī)制的普遍性,尋找研究復(fù)雜生理和病理過程所需的實(shí)驗(yàn)?zāi)P吞峁┝死碚撘罁?jù),而近緣基因組間的比較則為認(rèn)識基因結(jié)構(gòu)與功能等細(xì)節(jié)提供了參數(shù)。物種名基因數(shù)目轉(zhuǎn)錄因子數(shù)量比例擬南芥約2938815335.9酵母約58852093.5線蟲約188916693.5果蠅約133796354.5比較基因組學(xué)(Comparativegenomics)比較FunctionalCategoriesinEukaryoticProteomesFunctionalCategoriesinEukarApplicationstoMedicineAkeyapplicationofhumangenomeresearchistofinddiseasegenesbypositionalcloningThismethodinvolvesmappingthechromosomalregioncontainingthegenebylinkageanalysisinaffectedfamiliesThehumangenomicsequenceinpublicdatabasesallowsrapididentificationinsilicoofcandidategenes,followedbymutationscreeningofrelevantcandidates,aidedbyinformationongenestructureForamendeliandisorder,agenesearchcannowoftenbecarriedoutinamatterofmonthswithonlyamodestlysizedteamApplicationstoMedicineAkey基因組學(xué)與比較基因組學(xué)演示文稿課件NextStepsonHGPFinishthehumansequenceLarge-scaleidentificationofregulatoryregionsSequencingofadditionallargegenomesCompletingthecatalogueofhumanvariationFromsequencetofunctionNextStepsonHGPFinishthehuFutureTechnologyDevelopmentFunctionalgenomics-aimstounderstandhowgenesareregulatedandwhattheydo,largelythroughmassivelyparallelstudiesofgeneexpressioninavarietyoftissuesProteomics–promisestomaketheidentityofeachproteinknownandelucidateprotein-proteininteractionsBioinformatics–enhancetheabilityofresearcherstomanipulate,collectandanalyzedatamorequicklyandinnewwaysFutureTechnologyDevelopmentF基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件祝同學(xué)們新年快樂!考試順利!祝同學(xué)們新年快樂!考試順利!個(gè)人觀點(diǎn)供參考,歡迎討論!個(gè)人觀點(diǎn)供參考,歡迎討論!第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因組學(xué)與比較基因組學(xué)ByHongweiGuo基礎(chǔ)分子生物學(xué)期末安排考試時(shí)間:

2009年

1月

12日下午

2:00-4:00考試地點(diǎn):三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基礎(chǔ)分子生物學(xué)期末安排考試時(shí)間:2009年1月12基因組計(jì)劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是某個(gè)特定物種細(xì)胞內(nèi)全部DNA分子的總和?;蚪M學(xué)(genomics)是指研究并解析生物體整個(gè)基因組的所有遺傳信息的學(xué)科?;蚪M計(jì)劃(GenomeProject)是指對人類以及其它生物體全基因組的測序工作(sequencing)。人類基因組計(jì)劃(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子彈爆炸,60年代人類登月一起被認(rèn)為是二十世紀(jì)科技發(fā)展史上的三大創(chuàng)舉。基因組計(jì)劃基因組(genome)是生物體內(nèi)遺傳信息的集合,是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因組DNA大片段文庫的構(gòu)建

YAC(yeastartificialchromosome,酵母人工染色體):含有三種必需成分:著絲粒、端粒和復(fù)制起點(diǎn)。是迄今容量最大的克隆載體,插入片段平均長度為200-1000Kbp,最大的可以達(dá)到2Mbp。BAC(Bacterialartificialchromosome),用細(xì)菌的F質(zhì)粒及其調(diào)控基因構(gòu)建了細(xì)菌染色體克隆載體,其克隆能力在125~150Kbp左右。以BAC為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,而且以環(huán)狀結(jié)構(gòu)存在于細(xì)菌體內(nèi),易于分辨和分離純化,已被科學(xué)界廣泛接受。Publiceffort-strategy:

基因組DNBAC的構(gòu)建pBAC108L來自細(xì)菌的一個(gè)小型F質(zhì)粒,其中oriS和repE控制了質(zhì)粒的復(fù)制起始,parB和parA控制了拷貝數(shù)。100-150KbpinsertionBAC的構(gòu)建100-150Kbpinsertion遺傳圖譜(GeneticMap)

vs

物理圖譜(PhysicalMap)遺傳圖又稱為連鎖圖(LinkageMap),是指基因或DNA標(biāo)志在染色體上的相對位置(或距離),通常以基因或DNA片段在染色體交換過程中的分離頻率(cM)來表示。cM值越大,兩者之間遺傳距離越遠(yuǎn)。物理圖譜是指以已知序列的DNA片段(序列標(biāo)簽位點(diǎn),sequence-taggedsite,STS)在染色體上的實(shí)際位置,位點(diǎn)之間的距離(圖距)以堿基對(bp,kb,Mb)作為測量單位的基因組圖。遺傳圖譜(GeneticMap)

vs

物理圖譜(PhDNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)記是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小變化,甚至1個(gè)核苷酸的變化,也能引起限制性內(nèi)切酶切點(diǎn)的丟失或產(chǎn)生,導(dǎo)致酶切片段長度的變化。第二代DNA遺傳標(biāo)記SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人類基因組中的大量重復(fù)序列,包括重復(fù)單位長度在15-65個(gè)核苷酸左右的小衛(wèi)星DNA(minisatelliteDNA),重復(fù)單位長度在2-6個(gè)核苷酸之間的微衛(wèi)星DNA(microsatelliteDNA)。第三代DNA遺傳標(biāo)記SNP

(singlenucleotidepolymorphism),也是最廣泛的遺傳標(biāo)記,是分散于基因組中的單個(gè)堿基的差異。這種差異包括單個(gè)堿基的缺失和插入,但更常見的是單個(gè)核苷酸的替換,即單核苷酸的多態(tài)性。到目前為止已經(jīng)在人類基因組發(fā)現(xiàn)了超過1000萬個(gè)SNP位點(diǎn),平均每300bp中就有一個(gè)SNP!DNA遺傳標(biāo)記(DNAmarker)第一代DNA遺傳標(biāo)RFLPmarkerSSLPmarkersWTmutRFLPmarkerSSLPmarkersWTmutSNPmarkerSNPmarker酵母第三號染色體遺傳圖(右)和物理圖(左)的比較

由于實(shí)驗(yàn)方法不同,不少markers之間的遺傳距離并不等于它們在物理圖上的距離。酵母第三號染色體遺傳圖(右)和物理圖(左)的比較由于實(shí)驗(yàn)方鳥槍法序列測定技術(shù)全基因組鳥槍法測序(shotgunsequencing)技術(shù):隨機(jī)挑選帶有基因組DNA的質(zhì)粒進(jìn)行末端序列測定,然后用計(jì)算機(jī)程序進(jìn)行序列拼接。鳥槍法測序的主要缺點(diǎn)是,隨著所測基因組總量增大,所需測序的片段大量增加;其次,高等真核生物(如人類)基因組中有大量重復(fù)序列,導(dǎo)致判斷失誤鳥槍法序列測定技術(shù)全基因組鳥槍法測序(shotgunseqDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencingDNAtargetsampleSHEAR&SIZEe大規(guī)模DNA序列拼接

DNA序列拼接問題與組合數(shù)學(xué)中的最短超串問題相似。最短超串問題即給定一個(gè)字符串的集合,找出一最短的字符串稱為超串,并將集合中的任何一元素作為其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)大規(guī)模DNA序列拼接DNA序列拼接問題與組合數(shù)學(xué)中的最短超AssemblyoftheIndividualSequencesIndividualsequencingreadsarecomparedtoeachotherandwheretheyoverlapcanbeassembledtocreatecontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列

鳥槍法測序技術(shù)不能鑒別高等真核生物基因組中的重復(fù)序列改進(jìn)后的鳥槍法(adoptedbybothICandCelera)改進(jìn)后的鳥槍法(adoptedbybothICand高通量DNA序列分析技術(shù)

人類基因組計(jì)劃的成功很大程度上得益于有效減少DNA測序成本的技術(shù)更新。通過改良測序方法,不斷提升其自動(dòng)化程度,DNA測序的成本降低了100倍,從20世紀(jì)70-80年代$10/bp降低到本世紀(jì)初$0.1/bp!如果一個(gè)熟練的DNA序列分析人員采取早期80年代方法每天測定1000bp計(jì)算,人類基因組(約3×109bp)的全序列分析,至少也得需要100名這樣的工人花上100年的時(shí)間才能完成。而2000年代的高通量測序儀可達(dá)到月測序1-6Mbp!目前???$2/1Mbp3Gbp/machine/day高通量DNA序列分析技術(shù)人類基因組計(jì)劃的成功很大程度上得益DNAsequencingtechnologies

?“Classical” –Sangerdideoxysequencing?“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation?Singlemolecule(tetheredDNApolymerase)

–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)DNAsequencingtechnologiesIllumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runIllumina/SolexaAppliedBiosSangersequencing13maybe800bplong42Sangersequencing13maybe800bRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runRoche/454:GenomeSequencerPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7Pyrosequencing---454Sequencin基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件AsectionofPyrosequencingreadsAsectionofPyrosequencingreIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runIllumina/Solexa:GeneticAnaReversibleterminator-basedsequencing(Solexa)Reversibleterminator-basedseFragmentDNAandligateadaptorsFragmentDNAandligateadapto基因組學(xué)與比較基因組學(xué)演示文稿課件基因組學(xué)與比較基因組學(xué)演示文稿課件ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?ComparisonWGS454SolexaCloningRealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide

Ligation&Detection(SOLiD)AppliedBiosystemsOligonucleotSOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SOLiD:SequencingligationcyclesSOLiD:SequencingligationcycSOLiD:DataCollectionandImageAnalysisSOLiD:DataCollectionandImaSOLiD:DecodingthesequenceMardis2008SOLiD:Mardis2008Comparisonof“NextGeneration”SequencingTechnologiesComparisonof“NextGenerationApplicationsGeneticAnalyzerApplicationsGeneticAnalyzerSingleMolecule

SequencingTechnologies:onthehorizon

?ArrayoftetheredDNApolymerasemolecules?Boundtotemplatestrand+primer?Heliscope –Cyclicalbaseaddition(similartoSolexa)?VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing

Technologies:RateLimitingFactors

?Frontend:Makingthesequencinglibrary?Backend:Bioinformaticstomakesenseof

the“sequencetsunami”---essemblySingleMoleculeSequencingTecWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)Whatdowesequence?denovogeExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008ExamplesofApplicationsof“NThe“$10,000humangenomesequencing”prize?Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.?Prize:$10million?Deadline:12:01AMPST,October4,2013.?Donors:XFoundation,J.CraigVenterFoundationThe“$10,000humangenomesequHumanHapMapProjectHapMap的構(gòu)建分為三個(gè)步驟:(a)在多個(gè)個(gè)體的DNA樣品中鑒定單核苷酸多態(tài)性(SNPs);(b)將群體中頻率大于1%的那些共同遺傳的相鄰SNPs組合成單體型;(c)在單體型中找出用于識別這些單體型的標(biāo)簽SNPs。通過對圖中的三個(gè)標(biāo)簽SNPs進(jìn)行基因分型,可以確定每個(gè)個(gè)體擁有哪一個(gè)單體型。HumanHapMapProjectHapMap的構(gòu)建分SCIENCE315:1781(30MARCH2007)Metagenomesor

complexsamplesSCIENCE315:1781(30MARCH20轉(zhuǎn)錄圖(transcriptprofiling)

基因轉(zhuǎn)錄圖(cDNA圖),或者基因的cDNA片段圖,即表達(dá)序列標(biāo)簽圖(EST,expressedsequencetag),是基因組圖的重要組成部分。大規(guī)模生產(chǎn)EST的主要程序如下:分離特定組織在某一發(fā)展階段或某種生理?xiàng)l件下的總mRNA,合成雙鏈cDNA,克隆到plasmid中并進(jìn)行兩端測序。轉(zhuǎn)錄圖(transcriptprofiling)基因轉(zhuǎn)錄PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因組項(xiàng)目(/)

根據(jù)2007年1月的數(shù)據(jù),全球已啟動(dòng)2296個(gè)基因組項(xiàng)目,其中607個(gè)項(xiàng)目已經(jīng)完成,已經(jīng)公開發(fā)表481個(gè)基因組序列,包括403個(gè)細(xì)菌基因組,33個(gè)古細(xì)菌基因組和45個(gè)真核生物基因組。其它基因組計(jì)劃到2006年底已完成的基因組項(xiàng)目根據(jù)2007年1月的數(shù)據(jù),全到2006年12月全世界主要基因組計(jì)劃的進(jìn)展情況

到2006年12月全世界主要基因組計(jì)劃的進(jìn)展情況Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocom

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論