基因組測序的技術(shù)發(fā)展現(xiàn)狀_第1頁
基因組測序的技術(shù)發(fā)展現(xiàn)狀_第2頁
基因組測序的技術(shù)發(fā)展現(xiàn)狀_第3頁
基因組測序的技術(shù)發(fā)展現(xiàn)狀_第4頁
基因組測序的技術(shù)發(fā)展現(xiàn)狀_第5頁
已閱讀5頁,還剩249頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基因組學(xué)共二百五十四頁

元素(yuánsù)周期表的發(fā)現(xiàn)奠定了二十世紀(jì)物理、化學(xué)研究和發(fā)展的基礎(chǔ)元素(yuánsù)周期表“基因組序列圖”將奠定二十一世紀(jì)生命科學(xué)研究和生物產(chǎn)業(yè)發(fā)展的基礎(chǔ)!

“基因組”----生命科學(xué)的“元素周期表”人體解剖圖奠定了現(xiàn)代醫(yī)學(xué)發(fā)展的基礎(chǔ)共二百五十四頁生命(shēngmìng)的奧秘蘊(yùn)藏于“四字天書”之中…GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCATCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCTCCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTCGCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT…共二百五十四頁基因組學(xué)

§1基因組學(xué)概述(ɡàishù)

§2基因組圖譜的構(gòu)建§3基因組測序§4功能基因組學(xué)共二百五十四頁基因組學(xué)概念(gàiniàn)及范疇

基因組(genome)是德國遺傳學(xué)家H.Winkler在1920年將gene(基因)和chromosome(染色體)兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學(xué)的發(fā)展,其含義擴(kuò)展為在個體水平代表(dàibiǎo)一個個體所有遺傳性狀的總和,在細(xì)胞水平代表(dàibiǎo)一個細(xì)胞所有不同染色體(單倍體)的總和,在分子水平代表(dàibiǎo)一個物種所有DNA分子的總和。

共二百五十四頁基因組學(xué)概述(ɡàishù)基因組(genome),又稱染色體組一個物種單倍體的染色體數(shù)目(shùmù),物種全部遺傳信息的總和物種遺傳信息的“總詞典”控制發(fā)育的“總程序”生物進(jìn)化歷史的“總檔案”共二百五十四頁基因組(genome)

基因組(genome)是德國遺傳學(xué)家H.Winkler在1920年將gene(基因)和chromosome(染色體)兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學(xué)的發(fā)展,其含義擴(kuò)展為在個體水平(shuǐpíng)代表一個個體所有遺傳性狀的總和,在細(xì)胞水平(shuǐpíng)代表一個細(xì)胞所有不同染色體(單倍體)的總和,在分子水平(shuǐpíng)代表一個物種所有DNA分子的總和。

共二百五十四頁基因組學(xué)(genomics)就是發(fā)展和應(yīng)用DNA制圖、測序新技術(shù)以及計算機(jī)程序,分析生命體(包括人類)全部基因組結(jié)構(gòu)及功能(gōngnéng)的科學(xué)。1986年提出,至今20年,已經(jīng)發(fā)展成為遺傳學(xué)中最重要的分支學(xué)科。對物種的所有基因進(jìn)行定位、作圖、測序和功能分析共二百五十四頁基因組學(xué)的基礎(chǔ)理論研究(yánjiū)基因組學(xué)是要揭示下述四種整合體系的相互關(guān)系:基因組作為信息載體

(堿基對、重復(fù)序列的整體守恒與局部不平衡的關(guān)系)基因組作為遺傳物質(zhì)的整合體

(基因作為功能和結(jié)構(gòu)單位與遺傳學(xué)機(jī)制的關(guān)系)基因組作為生物化學(xué)分子的整合體

(基因產(chǎn)物作為功能分子與分子、細(xì)胞機(jī)制的關(guān)系)物種進(jìn)化的整合體

(物種在地理(dìlǐ)與大氣環(huán)境中的自然選擇)共二百五十四頁

基因組學(xué)是一個(yīɡè)大學(xué)科“界門綱目科屬種”,地球上現(xiàn)存物種近億,所有生生滅滅的生物,無一例外,都有個基因組?;蚪M作為信息載體,它所儲存的信息是最基本的生物學(xué)信息之一;既是生命本質(zhì)研究的出發(fā)點(diǎn)之一,又是生物信息的歸宿。基因組學(xué)研究包括對基因產(chǎn)物(轉(zhuǎn)錄子組和蛋白質(zhì)組)的系統(tǒng)生物學(xué)研究?;蚨鄳B(tài)性的規(guī)?;芯烤褪腔蚪M多態(tài)性的研究?;蚪M學(xué)的研究必然要上升到細(xì)胞機(jī)制、分子機(jī)制和系統(tǒng)生物學(xué)的水平(shuǐpíng)?;蚪M的起源與進(jìn)化和物種的起源與進(jìn)化一樣是一個新的科學(xué)領(lǐng)域。基因組信息正在以天文數(shù)字計算,規(guī)?;胤e累,它的深入研究必將形成一個嶄新的學(xué)科。共二百五十四頁

基因組學(xué)是一門(yīmén)大科學(xué)基因組的信息是用來發(fā)現(xiàn)和解釋具有普遍意義的生命現(xiàn)象和它們的變化、內(nèi)在規(guī)律、和相互關(guān)系(guānxì)?;蚪M的信息含量高?;蚪M學(xué)的研究又在于基因組間的比較。基因組學(xué)的復(fù)雜性必然導(dǎo)致多學(xué)科的引進(jìn)和介入(各生物學(xué)科、醫(yī)學(xué)、藥學(xué)、計算機(jī)科學(xué)、化學(xué)、數(shù)學(xué)、物理學(xué)、電子工程學(xué)、考古學(xué)等)?;蚪M學(xué)研究的手段和技術(shù)已經(jīng)走在生命科學(xué)研究的最前沿。基因組信息來自于高效率和規(guī)?;a(chǎn)生的實驗數(shù)據(jù)。人類基因組計劃證明了基因組研究的迫切性和可行性。共二百五十四頁基因組與生命(shēngmìng)之謎基因組的產(chǎn)生(chǎnshēng)與進(jìn)化?;蚪MDNA組分的變化、GC百分比、嘌呤:嘧啶守恒。遺傳密碼的發(fā)生、發(fā)展和進(jìn)化。內(nèi)含子(尤其是大于100,000核苷酸的大內(nèi)含子)剪出后的運(yùn)輸和降解。最小內(nèi)含子的生物學(xué)意義。動物基因組與植物基因組在基因分布上的共性和個性。物種衍變過程中基因組水平的變化?;蚪M大小變化與遺傳、分子、細(xì)胞機(jī)制的關(guān)系?!癑UNKDNA”的發(fā)生、分類、進(jìn)化與功能。共二百五十四頁基因組學(xué)研究(yánjiū)的最終目標(biāo)

獲得生物體全部基因組序列鑒定所有基因的功能明確(míngquè)基因之間的相互作用關(guān)系闡明基因組的進(jìn)化規(guī)律

共二百五十四頁經(jīng)典(jīngdiǎn)遺傳學(xué)

在20世紀(jì)初,遺傳學(xué)剛剛誕生的時候,遺傳學(xué)家的工作主要是鑒別感興趣的基因,確定這些基因在染色體上的位置。第一個環(huán)節(jié):尋找自發(fā)突變體,或者利用(lìyòng)物理、化學(xué)因素誘發(fā)突變。第二個環(huán)節(jié):通過連鎖分析確定新基因與已知基因的相互關(guān)系,繪制遺傳連鎖圖。共二百五十四頁幾個(jǐɡè)代表物種的基因組大小共二百五十四頁基因組學(xué)的分類(fēnlèi)3基因組學(xué)(根據(jù)(gēnjù)所研究的生物體種類分類)結(jié)構(gòu)基因組學(xué)功能基因組學(xué)1基因組學(xué)(根據(jù)系統(tǒng)特征分類)2基因組學(xué)(根據(jù)與其它學(xué)科的關(guān)系分類)基因組繪制和測序基因和基因組組織基因組調(diào)節(jié)網(wǎng)絡(luò)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)特征轉(zhuǎn)錄組學(xué)蛋白組學(xué)代謝組學(xué)基礎(chǔ)基因組學(xué)應(yīng)用基因組學(xué)生化基因組學(xué)遺傳基因組學(xué)進(jìn)化基因組學(xué)生理基因組學(xué)計算基因組學(xué)生態(tài)基因組學(xué)工業(yè)基因組學(xué)農(nóng)業(yè)基因組學(xué)環(huán)境基因組學(xué)醫(yī)學(xué)基因組學(xué)植物基因組學(xué)動物基因組學(xué)人類基因組學(xué)微生物基因組學(xué)共二百五十四頁基因組學(xué)的研究(yánjiū)內(nèi)容

結(jié)構(gòu)(jiégòu)基因組學(xué)功能基因組學(xué)蛋白質(zhì)組學(xué)共二百五十四頁結(jié)構(gòu)(jiégòu)基因組學(xué)(structuralgenomics)

基因定位(dìngwèi)基因組作圖測定核苷酸序列共二百五十四頁功能(gōngnéng)基因組學(xué)(functionalgenomics)

又稱后基因組學(xué)(postgenomics)

基因的識別、鑒定、克隆基因結(jié)構(gòu)、功能及其相互關(guān)系基因表達(dá)調(diào)控(diàokònɡ)的研究共二百五十四頁蛋白質(zhì)組學(xué)(proteomics)鑒定(jiàndìng)蛋白質(zhì)的產(chǎn)生過程、結(jié)構(gòu)、功能和相互作用方式共二百五十四頁遺傳學(xué)與基因組學(xué)的里程碑

圖中所示的螺旋展示了遺傳學(xué)和基因組學(xué)重要進(jìn)展的里程碑,從孟德爾遺傳法則的發(fā)現(xiàn)和其在20世紀(jì)初被重新發(fā)現(xiàn)[1]開始。DNA被確立是遺傳的物質(zhì)基礎(chǔ)[2]、DNA結(jié)構(gòu)的確定[3]、遺傳代碼的闡明[4]、DNA重組技術(shù)的發(fā)展[5,6]、以及自動化程度日益提高(tígāo)的DNA測序技術(shù)的建立[7-10],為1990年啟動人類基因組計劃(HGP)奠定了基礎(chǔ)共二百五十四頁研究功能(gōngnéng)基因組學(xué)的挑戰(zhàn)闡釋基因功能鑒別和表征生命的分子機(jī)構(gòu)描繪基因調(diào)節(jié)網(wǎng)絡(luò)(wǎngluò)系統(tǒng)水平上而非單個細(xì)胞水平上對生物系統(tǒng)的認(rèn)識計算機(jī)上的挑戰(zhàn)多學(xué)科協(xié)作共二百五十四頁基因組的進(jìn)化(jìnhuà)(1)基因組大小的進(jìn)化包括基因組的含量、基因組的結(jié)構(gòu)(jiégòu)以及基因的數(shù)量等幾個方面。(2)基因組的分子進(jìn)化DNA序列的進(jìn)化:基因的不同區(qū)域進(jìn)化速率不同。內(nèi)含子中堿基對趨異進(jìn)化速率大于外顯子;編碼序列中同義突變的進(jìn)化速率大于非同義突變,非同義突變的進(jìn)化速率最低。假基因的進(jìn)化速率最高。共二百五十四頁

多基因家族的進(jìn)化(jìnhuà):通過基因擴(kuò)增和不均等交換形成多拷貝基因,在通過突變積累、基因重排和自然選擇等因素形成多基因家族或新的基因。如珠蛋白基因家族的進(jìn)化(jìnhuà)。外顯子混編:來自(láizì)不同基因的多個外顯子相互連接,或基因內(nèi)部的外顯子重復(fù)?;蛩睫D(zhuǎn)移:遺傳物質(zhì)從一個物種通過各種方式轉(zhuǎn)移到另一個物種的基因組中。如轉(zhuǎn)化、轉(zhuǎn)導(dǎo)、接合、轉(zhuǎn)染等。共二百五十四頁范圍和一般(yībān)方法結(jié)構(gòu)(jiégòu)基因組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)代謝物組學(xué)共二百五十四頁基因組學(xué)的發(fā)展(fāzhǎn)歷程年里程碑和事件參考文獻(xiàn)1985-1988美國科學(xué)院和研究委員會討論、辯論制定人類基因組計劃(HGP)Albers,19981990人類基因組計劃在美國正式開始Burris,19981995第一個自由存活生物,Haemophiusinfluenzae鳥槍法測序完成Fleischmann,19951996芽殖酵母測序完成——第一個真核生物基因組Goffeau,199619981998第一個多細(xì)胞生物秀麗線蟲測序完畢微陣列和基因組學(xué)一起列入最高十項科學(xué)突破C.Elegans,1998新聞編委會,19982000全基因組鳥槍法完成果蠅的全基因組測序Adams,20002000美國前總統(tǒng)克林頓宣布即將完成的HGP是人類描繪最奇妙的圖譜Marshall,20002000第一個模式植物擬南芥全基因組測序完成GenomeIntiative2001人類基因組序列草圖的兩個版本分別在nature和science上發(fā)表Venter,20012002兩個水稻亞種基因組序列草圖完成Yu,2002共二百五十四頁§2

基因組圖譜(túpǔ)的構(gòu)建基因組計劃的主要任務(wù)是獲得全基因組序列但是,現(xiàn)在的測序方法每次只能測800~1000bp大量的測序片段要拼接要知道序列在Chr上的位置才能正確拼接基因組計劃的第一個環(huán)節(jié)(huánjié):構(gòu)建基因組圖譜共二百五十四頁基因組圖譜(túpǔ)遺傳(yíchuán)圖譜(geneticmap)物理圖譜(physicalmap)共二百五十四頁遺傳(yíchuán)圖譜(geneticmap)

采用遺傳(yíchuán)分析的方法將基因或其它DNA序列標(biāo)定在染色體上構(gòu)建連鎖圖。共二百五十四頁遺傳(yíchuán)標(biāo)記有可以識別的標(biāo)記,才能確定目標(biāo)的方位及彼此之間的相對位置。構(gòu)建遺傳圖譜就是尋找基因組不同位置上的特征標(biāo)記。包括(bāokuò):形態(tài)標(biāo)記細(xì)胞學(xué)標(biāo)記生化標(biāo)記

DNA分子標(biāo)記共二百五十四頁多態(tài)性(polymophism)所有的標(biāo)記都必須具有多態(tài)性!花色:白色、紅色株高:高、矮血型:A、B、O型淀粉:糯、非糯所有多態(tài)性都是基因突變(jīyīntūbiàn)的結(jié)果!共二百五十四頁形態(tài)(xíngtài)標(biāo)記形態(tài)性狀:株高、顏色、白化癥等又稱表型標(biāo)記數(shù)量(shùliàng)少很多突變是致死的受環(huán)境、生育期等因素的影響共二百五十四頁

最早建立的果蠅連鎖圖,就是利用控制果蠅眼睛的形狀、顏色,軀體(qūtǐ)的顏色、翅膀的形狀等形態(tài)性狀作為標(biāo)記,分析它們連鎖關(guān)系及遺傳距離,繪制而成的。控制性狀的其實是基因,所以形態(tài)標(biāo)記實質(zhì)上就是基因標(biāo)記。共二百五十四頁果蠅(ɡuǒyínɡ)連鎖圖共二百五十四頁細(xì)胞學(xué)標(biāo)記(biāojì)明確顯示遺傳(yíchuán)多態(tài)性的染色體結(jié)構(gòu)特征和數(shù)量特征染色體的核型染色體的帶型染色體的結(jié)構(gòu)變異染色體的數(shù)目變異優(yōu)點(diǎn):不受環(huán)境影響缺點(diǎn):數(shù)量少、費(fèi)力、費(fèi)時、對生物體的生長發(fā)育不利共二百五十四頁生化(shēnɡhuà)標(biāo)記

又稱蛋白質(zhì)標(biāo)記(biāojì)就是利用蛋白質(zhì)的多態(tài)性作為遺傳標(biāo)記。

如:同工酶、貯藏蛋白優(yōu)點(diǎn):數(shù)量較多,受環(huán)境影響小缺點(diǎn):受發(fā)育時間的影響、有組織特異性、只反映基因編碼區(qū)的信息共二百五十四頁DNA分子(fēnzǐ)標(biāo)記簡稱分子標(biāo)記以DNA序列的多態(tài)性作為遺傳標(biāo)記優(yōu)點(diǎn):不受時間和環(huán)境的限制遍布整個基因組,數(shù)量無限不影響性狀表達(dá)自然存在的變異(biànyì)豐富,多態(tài)性好共顯性,能鑒別純合體和雜合體共二百五十四頁限制性片段(piànduàn)長度多態(tài)性

(restrictionfragmentlengthpolymorphism,RFLP)

DNA序列能或不能被某一酶酶切,相當(dāng)于一對等位基因的差異。

如有兩個DNA分子(一對染色體),一個具有某一種酶的酶切位點(diǎn),而另一個沒有這個位點(diǎn),酶切后形成的DNA片段長度(chángdù)就有差異,即多態(tài)性??蓪FLP作為標(biāo)記,定位在基因組中某一位置上。人類基因組中有105個RFLP位點(diǎn),每一位點(diǎn)只有兩個等位基因。共二百五十四頁RFLP分析(fēnxī)共二百五十四頁RFLP標(biāo)記(biāojì)位共顯性標(biāo)記(biāojì)共二百五十四頁微衛(wèi)星(microsatellite)標(biāo)記(biāojì)微衛(wèi)星又稱為簡單(jiǎndān)重復(fù)序列(simplesequencerepeat,SSR)。這種重復(fù)序列的重復(fù)單位很短,常常只有2個、3個或4個核苷酸如一條染色體TCTGAGAGAGACGC

另一染色體TCTGAGAGAGAGAGAGAGACGC,就構(gòu)成了多態(tài)性。共二百五十四頁遺傳(yíchuán)圖譜的構(gòu)建方法

理論(lǐlùn)基礎(chǔ):連鎖與交換基本方法:兩點(diǎn)測驗法和三點(diǎn)測驗法共二百五十四頁植物遺傳(yíchuán)圖譜的構(gòu)建

選擇研究材料(親本)構(gòu)建分離群體遺傳標(biāo)記(biāojì)檢測標(biāo)記間的連鎖分析共二百五十四頁選擇(xuǎnzé)親本

要求親緣關(guān)系遠(yuǎn),遺傳差異大但又不能相差太大以導(dǎo)致引起子代不育。對備選材料進(jìn)行多態(tài)(差異)性檢測,綜合(zōnghé)測定結(jié)果,選擇有一定量多態(tài)性的一對或幾對材料作為遺傳作圖親本。共二百五十四頁構(gòu)建(ɡòujiàn)作圖群體

共二百五十四頁遺傳標(biāo)記(biāojì)的染色體定位

利用遺傳學(xué)方法或其它方法將少數(shù)標(biāo)記錨定在染色體上,作為確定(quèdìng)連鎖群的參照系。常用的方法:單體分析三體分析代換系分析附加系分析共二百五十四頁標(biāo)記(biāojì)間的連鎖分析利用在兩個親本間有多態(tài)性的標(biāo)記分析分離(fēnlí)群體中所有個體的基因型根據(jù)連鎖交換的情況,確定標(biāo)記之間的連鎖關(guān)系和遺傳距離有計算機(jī)軟件可以應(yīng)用共二百五十四頁水稻(shuǐdào)遺傳圖1994年,水稻第一張高密度遺傳圖譜

927個位點(diǎn),1383個標(biāo)記

1998年,1157個位點(diǎn),2275個標(biāo)記

2000年,3267個標(biāo)記高密度的遺傳圖譜為基因組測序和遺傳研究(yánjiū)奠定了堅實的基礎(chǔ)。共二百五十四頁人類遺傳圖譜(túpǔ)的構(gòu)建

不可能根據(jù)需要選擇親本,設(shè)計雜交組合,構(gòu)建分離群體!只能檢測現(xiàn)存家庭(jiātíng)連續(xù)幾代成員的基因型家系分析法資料有限、必須借助于統(tǒng)計學(xué)方法共二百五十四頁現(xiàn)有(xiànyǒu)的人類遺傳圖譜1~22號染色體

8個家系134個成員

X染色體,12個家系170個成員

5364個SSR標(biāo)記

2335個位點(diǎn)標(biāo)記間的平均(píngjūn)距離599kb共二百五十四頁物理圖譜(túpǔ)的構(gòu)建

用分子生物學(xué)方法直接檢測DNA標(biāo)記在染色體上的實際位置(wèizhi)繪制成的圖譜稱為物理圖譜。有遺傳圖譜為什么還要構(gòu)建物理圖譜?

共二百五十四頁遺傳圖譜(túpǔ)的缺陷

分別率有限人類只能研究少數(shù)減數(shù)分裂(jiǎnshùfēnliè)事件,不能獲得大量子代個體測序要求每個標(biāo)記的間隔小于100kb

實際是599kb共二百五十四頁遺傳(yíchuán)圖譜的缺陷精確性不夠(bùgòu)經(jīng)典遺傳學(xué)認(rèn)為,交換是隨機(jī)發(fā)生的基因組中有些區(qū)域是重組熱點(diǎn)倒位、重復(fù)等染色體結(jié)構(gòu)變異會限制交換重組共二百五十四頁酵母遺傳圖與物理(wùlǐ)圖比較A遺傳(yíchuán)圖B物理圖共二百五十四頁物理(wùlǐ)作圖的方法1、限制(xiànzhì)酶作圖2、依靠克隆的基因組作圖3、熒光原位雜交4、序列標(biāo)簽位點(diǎn)作圖共二百五十四頁限制(xiànzhì)酶作圖(restrictionmapping)共二百五十四頁限制(xiànzhì)酶作圖(restrictionmapping)共二百五十四頁熒光(yíngguāng)原位雜交

(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交

(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交

(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁熒光(yíngguāng)原位雜交

(fluorescentinsituhybridization,F(xiàn)ISH)共二百五十四頁人類(rénlèi)基因組物理圖1987年,RFLP圖譜(túpǔ),403個標(biāo)記,10Mb1994年,5800個標(biāo)記,0.7Mb1996年,17000多個標(biāo)記,100kb

完全適應(yīng)全基因組測序的要求共二百五十四頁遺傳圖與物理(wùlǐ)圖的整合有些標(biāo)記既是遺傳標(biāo)記,又是物理標(biāo)記

RFLP標(biāo)記SSR標(biāo)記某些基因序列借助這些(zhèxiē)標(biāo)記可以將遺傳圖和物理圖整合起來共二百五十四頁§3基因組測序共二百五十四頁大規(guī)?;蚪M測序的幾個(jǐɡè)支撐技術(shù)

Sanger雙脫氧末端(mòduān)終止法

PCR技術(shù)

DNA自動測序儀的發(fā)展生物信息學(xué)分析軟硬件設(shè)施共二百五十四頁“雙脫氧末端終止(zhōngzhǐ)”的含義共二百五十四頁

PCR(聚合酶鏈?zhǔn)椒磻?yīng)(liànshìfǎnyìng))原理反應(yīng)所需物質(zhì):DNA模板、引物、DNA聚合(jùhé)酶、dNTP、緩沖液每個循環(huán)包括:變性(90℃)、退火(54

℃)、延伸(72℃)共二百五十四頁大規(guī)?;蚪M測序的

兩種策略逐步(zhúbù)克隆法(ClonebyClone)全基因組霰彈法(WholeGenomeShot-gun)共二百五十四頁………ATGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……………ATGCCGTAGGCCTAGCTCGGA……基因組DNABAC文庫(wénkù)根據(jù)物理圖譜正確(zhèngquè)定位的BAC或contig用于霰彈法測序的候選克隆用于霰彈法測序的亞克隆測序并組裝完整的基因組序列逐步克隆法(ClonebyClone)

全基因組霰彈法(WholeGenomeShot-gun)基因組DNA

霰彈法克隆測序并進(jìn)行全基因組序列組裝完整的基因組序列共二百五十四頁

兩種大規(guī)?;蚪M測序策略(cèlüè)的比較

項目

策略全基因組霰彈法逐步克隆法

遺傳背景不需要需要(需構(gòu)建精確的物理圖譜)速度快慢費(fèi)用低高計算機(jī)性能高(以全基因組為單位進(jìn)行拼接)低(以BAC為單位進(jìn)行拼接)適用范圍工作框架圖精細(xì)圖代表測序物種果蠅、水稻人、線蟲共二百五十四頁BACbyBACWholeGenomeShotgun…thesequencingofthehumangenomeislikelytobetheonlylargesequencingprojectcarriedtocompletionbythemethodsdescribedinthisissue.MaynardV.Olson,Themaps:Clonebyclonebyclone,Nature409,816-818(2001)共二百五十四頁“WorkingDraft”(90%;4X)FinishedGenome(99.99%;8X)Gap1Gap2Chromosome工作(gōngzuò)草稿(框架圖)與完成圖共二百五十四頁BACbyBAC

共二百五十四頁ThesequenceofthehumangenomeC.Venteretal.Science16Feb.291:1304–1351,2001共二百五十四頁人類基因組計劃研究(yánjiū)的主要成果和進(jìn)展表現(xiàn)在這“四張圖”上

遺傳圖譜

又稱為連鎖(liánsuǒ)圖譜(linkagemap),指基因或DNA標(biāo)志在染色體上的相對位置與遺傳距離物理圖譜

以定位的DNA標(biāo)記序列如STS作為路標(biāo),以DNA實際長度即bp、kb、Mb為圖距的基因組圖譜。轉(zhuǎn)錄圖譜

利用EST(expressedsequencetags

表達(dá)序列標(biāo)簽)作為標(biāo)記所構(gòu)建的分子遺傳圖譜序列圖譜

通過基因組測序得到的,以A、T、G、C為標(biāo)記單位的基因組DNA序列

共二百五十四頁逐步(zhúbù)克隆法(ClonebyClone)物理圖譜(túpǔ)的構(gòu)建大片段克隆的篩選霰彈法測序與“工作框架圖”的構(gòu)建序列的全組裝與“完成圖”構(gòu)建共二百五十四頁物理圖譜(túpǔ)的制作

共二百五十四頁物理圖譜的制作——序列(xùliè)標(biāo)簽位點(diǎn)(STS)作圖

物理圖譜是以特異的DNA序列為標(biāo)志(biāozhì)所展示的染色體圖。標(biāo)志(biāozhì)之間的距離或圖距以物理距離如堿基對(basepair;bp,Kb,Mb)表示。最精細(xì)的物理圖是核苷酸順序圖,最粗略的物理圖是染色體組型圖。

STS圖譜是最基本和最為有用的染色體物理圖譜之一,STS(SequenceTaggedSite)本身是隨機(jī)地從人類基因組上選擇出來的長度在200~300bp左右的特異性短序列(每個STS在基因組中是唯一的,STS圖譜就是以STS為路標(biāo)(平均每100Kb一個),將DNA克隆片段有序地定位到基因組上。STS的來源隨機(jī)基因組序列表達(dá)基因序列,如EST遺傳標(biāo)記序列,如微衛(wèi)星標(biāo)記有關(guān)STS的信息可在基因組數(shù)據(jù)庫GDB中找到http://gdbwww.gdb.org共二百五十四頁物理圖譜構(gòu)建的步驟確定各STS序列及其在基因組中的位置大插入片段基因組文庫的構(gòu)建(BAC文庫)

以特定STS為標(biāo)記(biāojì)篩選并定位克隆含有STS的克隆在基因組中排序基因組數(shù)據(jù)庫(GDB)中至少含有24568個STS路標(biāo)(lùbiāo)信息

共二百五十四頁關(guān)于文庫作為(zuòwéi)載體的基本要求

能在宿主細(xì)胞中進(jìn)行獨(dú)立的復(fù)制具有多克隆位點(diǎn),可插入外源

DNA片段有合適(héshì)的篩選標(biāo)記,如抗藥性大小合適,易于分離純化拷貝數(shù)多

文庫的概念

含有某種生物體全部基因的隨機(jī)片段的重組DNA克隆群體載體:能攜帶外源DNA進(jìn)入宿主細(xì)胞的工具,常用的載體有質(zhì)粒載體、噬菌體載體、細(xì)菌人工染色體等宿主:能容納外源DNA片段的生物體,常用的有大腸桿菌、酵母等共二百五十四頁BAC文庫(wénkù)的構(gòu)建NotI、SacI脈沖場凝膠電泳得200Kb左右(zuǒyòu)的大片段DNA

純化后與載體連接

電轉(zhuǎn)化,將連接產(chǎn)物導(dǎo)入大腸桿菌感受態(tài)細(xì)胞插有外源DNA片段的BAC載體在含有氯霉素的固體培養(yǎng)基中培養(yǎng)每一個菌落為帶有相同外源DNA片段的單克隆共二百五十四頁BAC克隆(kèlónɡ)的篩選“STS-PCR反應(yīng)(fǎnyìng)池”方案篩選種子克隆特定的STS標(biāo)記

相互間具有重疊片段的BAC克隆根據(jù)STS信息組裝成contig,并定位于基因組上Contig每一個菌落為帶有相同外源DNA片段的單克隆共二百五十四頁共二百五十四頁Regionalmapping共二百五十四頁Regionalmapping共二百五十四頁Minimaltilingpathselectedforsequencing.Regionalmapping共二百五十四頁BeijingMap共二百五十四頁共二百五十四頁共48個每組8個每8個96孔板組成(zǔchénɡ)1個superpool,384個96孔板組成48個superpools

48superpools共二百五十四頁

Columnpools

Rowpools

123456789101112第八(dìbā)板第二(dìèr)板Platepools第一板

platepools,rowpools,columnpools的構(gòu)成

共二百五十四頁“STS-PCR反應(yīng)(fǎnyìng)池”方案(PoolingProtocol)

1234567891011

12超級(chāojí)池(8個96孔板,共768個克隆)板池(96個克?。┬谐兀?2個克?。┝谐兀?個克?。┐蟠鬁p少篩選的工作量,降低成本,所得篩選結(jié)果準(zhǔn)確可靠

28

VS

768共二百五十四頁sheetofsuperpools,platepools,rowpools,columnpools

共二百五十四頁

BACScreening前48個樣品(yàngpǐn)為引物OGG1.51對superpool(sp)的篩選結(jié)果后48個樣品為引物OGG1.52對superpool(sp)的篩選結(jié)果

共二百五十四頁引物OGG1.52對應(yīng)sp#27,34,45的plate,row,columnpools的篩選(shāixuǎn)結(jié)果共二百五十四頁BACclone確定

(+為陽性(yángxìng)克隆)

共二百五十四頁引物OGG1.52的Colony-PCR

共二百五十四頁延伸克隆的篩選

STS的密度尚未達(dá)到繪制高精度物理圖譜的要求,且在基因組中的分布不均勻,造成(zàochénɡ)很多區(qū)域沒有陽性克隆覆蓋,形成空洞。因此需用指紋圖譜(FPC法)或末端序列(WalkingbyEndSequence)步移等手段對種子克隆進(jìn)行延伸,形成連續(xù)克隆群。利用延伸方法篩選得到的克隆稱為延伸克隆。

Contig1Contig2重疊(chóngdié)序列重疊序列延伸引物篩選到的延伸克隆共二百五十四頁>20kb~300bpMolecularweightmarkerevery5thlaneBACclones在96深孔板中培養(yǎng)(péiyǎng)-HindIII完全酶切-1%瓊脂糖凝膠電泳

指紋圖譜法

(WalkingbyFingerprintingdatabase)

挑取靠近空洞的種子克隆,酶切構(gòu)建其指紋圖譜,在FPC數(shù)據(jù)庫中進(jìn)行比對,搜索含有此克隆的重疊克隆群信息(xìnxī),從中確定覆蓋空洞區(qū)域的克隆,達(dá)到延伸目的。共二百五十四頁HindIII完全(wánquán)酶切HindIII完全(wánquán)酶切FPC數(shù)據(jù)庫中比對CloneACloneBCloneCCAB共二百五十四頁contig搭建(dājiàn)中克隆的錯位

共二百五十四頁末端序列步行法(WalkingbyEndSequence)

挑取靠近空洞的種子克隆進(jìn)行末端測序,然后在基因組數(shù)據(jù)庫中進(jìn)行比對,確定專一性的序列片段作為新的STS路標(biāo)。最后設(shè)計新路標(biāo)的PCR引物,按照STS—PCR“反應(yīng)池”方案篩選(shāixuǎn)新的克隆,達(dá)到延伸的目的??寺?50A18序列輸入endsequencedatabase的查詢(cháxún)結(jié)果共二百五十四頁四、CloneIdentification

1、STS-PCR

2、BACendsequencing

3、Fingerprinting

4、FISH

共二百五十四頁CK2CK1CK2CK113f06267l16481o07250a15204c23340j13對15個克隆進(jìn)行HindIII酶切后電泳(diànyǒnɡ)結(jié)果

共二百五十四頁共二百五十四頁“工作(gōngzuò)框架圖”繪制根據(jù)序列與STSdatabase進(jìn)行blastn比較結(jié)果,將克隆定位末端序的比較,判定(pàndìng)延伸在contig外的一端序列。并可及時進(jìn)行walking,篩選新的克隆

共二百五十四頁霰彈(xiàndàn)法測序組裝與Finishing共二百五十四頁工作(gōngzuò)流程圖

共二百五十四頁ShotgunSequencingI:RANDOMPHASEBacClone:100-200kbShearedDNA:1.0-2.0kbSequencingTemplates:RandomReads共二百五十四頁ShotgunSequencingII:ASSEMBLYConsensusSequenceGap

LowBaseQualitySingleStrandedRegionMis-Assembly(Inverted)共二百五十四頁ConsensusSequenceGap

LowBaseQualitySingleStrandedRegionMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusSequenceGap

SingleStrandedRegionMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusSequenceGap

Mis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ConsensusMis-Assembly(Inverted)ShotgunSequencingIII:FINISHING共二百五十四頁ShotgunSequencingIII:FINISHINGHighAccuracySequence:<1error/10,000bases共二百五十四頁Consed軟件顯示(xiǎnshì)序列組裝結(jié)果界面

1、Filling“intraclonegaps”共二百五十四頁BAC-----453F3’sfinishing>>Sp6<<T7?First4primers1234Allthecontigswalkedhundreds’bpstowardthegaps.453F3’s2600reads12contigsOverlappingBAC-454F24’s200reads+>>Sp6<<T71324abcSecond3primers

1200bp’sAT-rich,(CATATATA)nrepeat.Finally,filledbyusingETsequencingKit.

1240bp’sGC-rich,GC-contentis69.03%;theBAC’sis39.98%.WeuseddGTPKitfillingit.>>Sp6<<T7Completedsequence共二百五十四頁

SequencedcloneBACselectedbyend-sequence113L10324K11173F11101A4167P17586C2116K5572B22544N5R-155E142006P232306M15R-149E1560K?Gapfillingbyendsequences2、Filling“interclonegaps”共二百五十四頁

TheactualandpredictedfingerprintofR-260J13digestedwithHindIII

Lane1:marker,Lane2:R-260J13digestedwithHindIII,3:thepredicted

共二百五十四頁克隆211B19組裝(zǔzhuānɡ)后的序列的錯誤率為零

共二百五十四頁WholeGenomeShotgun

共二百五十四頁Thisbacteriumhasacirculargenomestructurewith2,689,445basepairs,thesecondlargestoneofthermophilesdecodedcompletelytodate.CircularrepresentationofthegenomeofT.tengcongensis

共二百五十四頁Whatisunderheavenisforall.

SunYat-sen,thefatherofmodernChina

天下為公(tiānxiàwéigōng)

/riceDDBJ/EMBL/GenBank:AAAA01000000共二百五十四頁國際一流(yīliú)測序生產(chǎn)線7萬克隆,3000萬堿基/天高產(chǎn)出、低成本:$/bp

¥/bp美分/bp分/bp基因組學(xué):數(shù)據(jù)導(dǎo)向(dǎoxiànɡ)的大科學(xué)有數(shù)據(jù)才是硬道理世上無難事只要肯登攀共二百五十四頁Contigs:127,550

(N50=6,688bp)Scaffolds:102,444(N50=11,764bp)Quality:546bpatQ20共二百五十四頁DeNovoSequencingtheGenomeinBIGHuSongnianBeijingInstituteofGenomics,ChineseAcademyofSciencesNextGenerationSequencing(NGS)Technology共二百五十四頁Secondgenerationsequencers4541Solexa3SOLiD5DenovosequencingRNA-seq,Re-sequencingChIP-seq,Meth-seqMetagenomicsDenovosequencingRNA-seqRe-sequencingChIP-seqRNA-seq“known”GenomeNovelgenome(s)Bothtypes共二百五十四頁1x4545xSOLiD4.02x5500xl3xSOLEXA2xHiseq20003x3730xl1xsequenom1000CPUcores800TBStorage數(shù)據(jù)中心完善的試驗與測序體系和流程強(qiáng)有力的計算、存儲及數(shù)據(jù)庫支持體系成熟的生物信息數(shù)據(jù)處理和分析流程2025/1/5共二百五十四頁基因(jīyīn)測序技術(shù)與基因(jīyīn)組測序第一代測序技術(shù)化學(xué)降解法雙脫氧鏈終止法熒光自動測序技術(shù)(雙脫氧鏈終止法)雜交(zájiāo)測序技術(shù)第二代DNA測序技術(shù)454測序技術(shù)Solexa測序技術(shù)SOLiD測序技術(shù)第三代DNA測序技術(shù)單分子測序共二百五十四頁基因組測序策略(cèlüè)有了高密度的基因組圖譜,就可以開始全基因組測序了測序的技術(shù)飛速發(fā)展,現(xiàn)在可以全自動化測序的策略(cèlüè)有兩個:鳥槍法克隆重疊群法共二百五十四頁鳥槍法(shotgunsequencing)共二百五十四頁鳥槍法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):不需要高密度的圖譜速度快、簡單、成本低缺點(diǎn):拼接組裝困難,尤其在重復(fù)(chóngfù)序列多的區(qū)域主要用于重復(fù)序列少、相對簡單的原核生物基因組共二百五十四頁克隆(kèlónɡ)重疊群法(clonecontig)

將基因組DNA切割長度為0.1Mb-1Mb的大片段,克隆到Y(jié)AC或BAC載體(zàitǐ)上然后再進(jìn)行亞克隆,分別測定單個亞克隆的序列再裝配、連接成連續(xù)的DNA分子。這是一種自上而下(uptodown)的測序策略

clone-by-clonemethod共二百五十四頁基因組測序

快速有效的DNA測序方法于20世紀(jì)70年代中期建立。兩種不同的序方法幾乎同時發(fā)表:

鏈終止法(chainterminationmethod)(Sangeretal,1977):單鏈DNA分子的序列由互補(bǔ)(hùbǔ)的多核苷酸的酶促合成來決定,互補(bǔ)(hùbǔ)鏈在特定的核苷酸位置終止。

化學(xué)降解法(chemicaldegradationmethod)(MaxamandGilbert,1977):雙鏈DNA分子用化學(xué)物質(zhì)處理后,在特定核苷酸位置被切開,從而確定DNA分子的序列。今年6月30日,基因組所新一代測序技術(shù)——SOLiDTM系統(tǒng)基因分析儀投入使用。共二百五十四頁鏈終止法測序(thechainterminationmethod)

基本原理:

通過合成與單鏈DNA互補(bǔ)的多核苷酸鏈,由于合成的互補(bǔ)鏈可在不同位置隨機(jī)終止反應(yīng),產(chǎn)生只差一個(yīɡè)核苷酸的DNA分子,從而來讀取待測DNA分子的順序。共二百五十四頁技術(shù)(jìshù)路線與要求制備(zhìbèi)單鏈模板

↓將單鏈模板與一小段引物退火

↓加入DNA多聚酶

4種脫氧核苷酸分別加入少量4種雙脫氧核苷酸↓將4種反應(yīng)產(chǎn)物分別在4條泳道電泳

↓根據(jù)4個堿基在4條泳道的終止位置讀出基因序列

A克隆于質(zhì)粒中DNA→用堿或熱變性BM13克隆單鏈DNAC噬粒克隆DNADPCR產(chǎn)生單鏈DNAA高酶活性B無5’→3′外切酶活性C無3′→5′外切酶活性ddATP/ddCTP/ddGTP/ddTTP的3’碳原子連接的是氫原子,不是羥基共二百五十四頁共二百五十四頁共二百五十四頁化學(xué)降解法測序基本原理:

在選定的核苷酸堿基中引入化學(xué)集團(tuán),再用化合物處理,使DNA分子(fēnzǐ)在被修飾的位置降解.共二百五十四頁技術(shù)(jìshù)路線:

將雙鏈DNA樣品變?yōu)閱捂湣總€單鏈的同一方向末端都用放射性同位素標(biāo)記,以便顯示DNA條帶↓分別用不同方法處理,獲得只差一個(yīɡè)核苷酸的降解DNA群體↓電泳,讀取DNA的核苷酸順序共二百五十四頁化學(xué)法測序?qū)嵗?shílì)哌啶共二百五十四頁第二代測序技術(shù)(jìshù)454測序技術(shù)(jìshù)Solexa測序技術(shù)SOLiDTM測序技術(shù)共二百五十四頁454測序技術(shù)(jìshù)

1文庫準(zhǔn)備將基因組DNA打碎成300-800bp長的片段(若是snRNA或PCR產(chǎn)物可以直接進(jìn)入下一步),在單鏈DNA的3′2端和5′2端分別連上不同的接頭。2連接帶有接頭的單鏈DNA被固定在DNA捕獲磁珠上。每一個磁珠攜帶一個單鏈DNA片段。隨后擴(kuò)增試劑將磁珠乳化(rǔhuà),形成油包水的混合物,這樣就形成了許多只包含一個磁珠和一個獨(dú)特片段的微反應(yīng)器。3擴(kuò)增每個獨(dú)特的片段在自己的微反應(yīng)器里進(jìn)行獨(dú)立的擴(kuò)增(乳液PCR,emulsionPCR),從而排除了其它序列的競爭。整個DNA片段文庫的擴(kuò)增平行進(jìn)行。對于每一個片段而言,擴(kuò)增產(chǎn)生幾百萬個相同的拷貝。乳液PCR終止后,擴(kuò)增的片段仍然結(jié)合在磁珠上。4測序攜帶DNA的捕獲磁珠被放入PTP板中進(jìn)行測序。PTP孔的直徑(29μm)只能容納一個磁珠(20μm)。放置在4個單獨(dú)的試劑瓶里的4種堿基,依照T、A、C、G的順序依次循環(huán)進(jìn)入PTP板,每次只進(jìn)入一個堿基。如果發(fā)生堿基配對,就會釋放一個焦磷酸。這個焦磷酸在ATP硫酸化酶和熒光素酶的作用下,釋放出光信號,并實時地被儀器配置的高靈敏度CCD捕獲到。有一個堿基和測序模板進(jìn)行配對,就會捕獲到一分子的光信號;由此一一對應(yīng),就可以準(zhǔn)確、快速地確定待測模板的堿基序列[27]。共二百五十四頁Solexa測序技術(shù)(jìshù)

1GenomeAnalyzer技術(shù)的基本原理是將基因組DNA打碎成約100-200個堿基的小片段,在片段的兩個末端加上接頭(adapter)。2將DNA片段變成單鏈后通過接頭與芯片表面的引物堿基互補(bǔ)而使一端被固定在芯片上。另外一端隨機(jī)和附近的另外一個引物互補(bǔ),也被固定住,形成橋狀結(jié)構(gòu)。3通過30輪擴(kuò)增反應(yīng),每個單分子被擴(kuò)增大約1000倍,成為單克隆的DNA簇,隨后將DNA簇線性化。在下一步合成反應(yīng)中,加入改造過的DNA聚合酶和帶有4種熒光標(biāo)記的dNTP。在DNA合成時,每一個核苷酸加到引物末端時都會釋放出焦磷酸鹽,激發(fā)生物發(fā)光蛋白發(fā)出熒光。4用激光掃描反應(yīng)板表面,在讀取每條模板序列第一輪反應(yīng)所聚合上去的核苷酸種類后,將這些熒光基團(tuán)化學(xué)切割,恢復(fù)3′端黏性,隨后添加(tiānjiā)第二個核苷酸。如此重復(fù),直到每條模板序列都完全被聚合為雙鏈。這樣,統(tǒng)計每輪收集到的熒光信號結(jié)果,就可以得知每個模板DNA片段的序列[28]。共二百五十四頁Solexa測序?qū)嶒?shíyàn)流程圖

共二百五十四頁--SOLiDTM系統(tǒng)(xìtǒng)基因分析儀

該技術(shù)以用四色熒光標(biāo)記寡核苷酸進(jìn)行連續(xù)的連接反應(yīng)為基礎(chǔ),能夠?qū)慰截悢U(kuò)增DNA片段進(jìn)行大規(guī)模高通量并行測序。這項技術(shù)使用末端(mòduān)配對分析和雙堿基編碼,在對復(fù)雜基因組進(jìn)行測序研究時其準(zhǔn)確度將大大高于其它新一代測序技術(shù)。共二百五十四頁SOLiDTM測序技術(shù)(jìshù)1文庫準(zhǔn)備SOLiD系統(tǒng)能支持兩種測序模板:片段文庫(fragmentlibrary)或配對末端文庫(mate2pairedlibrary)。片段文庫就是將基因組DNA打斷,兩頭加上接頭,制成文庫。該文庫適用于轉(zhuǎn)錄組測序、RNA定量、miRNA研究、重測序、3′,5′2RACE、甲基化分析及ChIP測序等。配對末端文庫是將基因組DNA打斷后,與中間接頭連接,環(huán)化,然后用EcoP15酶切,使中間接頭兩端各有27bp的堿基,最后加上兩端的接頭,形成文庫。2擴(kuò)增SOLiD用的是與454技術(shù)類似的乳液PCR對要測序的片段進(jìn)行擴(kuò)增。在微反應(yīng)器中加入測序模板、PCR反應(yīng)元件、微珠和引物,進(jìn)行乳液PCR(emulsionPCR)。PCR反應(yīng)結(jié)束后,磁珠表面就固定有拷貝數(shù)目巨大的同一DNA模板的擴(kuò)增產(chǎn)物。3微珠與玻片連接乳液PCR完成之后,變性模板,富集帶有延伸模板的微珠,微珠上的模板經(jīng)過3′修飾,可以與玻片共價結(jié)合。SOLiD系統(tǒng)最大的優(yōu)點(diǎn)就是每張玻片能容納更高密度的微珠,在同一系統(tǒng)中輕松實現(xiàn)更高的通量。含有DNA模板的磁珠共價結(jié)合在SOLiD玻片表面,SOLiD測序反應(yīng)就在SOLiD玻片表面進(jìn)行。每個磁珠經(jīng)SOLiD測序后得到一條序列。4連接測序SOLiD連接反應(yīng)的底物是8堿基單鏈熒光探針混合物。探針的5′端用4種顏色的熒光標(biāo)記,探針3′端第1、2位堿基是ATCG4種堿基中的任何兩種堿基組成的堿基對,共16種堿基對,因此每種顏色對應(yīng)著4種堿基對。3-5位是隨機(jī)的3個堿基。6-8位是可以和任何堿基配對的特殊堿基。單向SOLiD測序包括5輪測序反應(yīng),每輪測序反應(yīng)含有多次連接反應(yīng),得到原始顏色序列。SOLiD序列分析軟件根據(jù)“雙堿基編碼矩陣”把堿基序列轉(zhuǎn)換成顏色編碼序列,然后與SOLiD原始顏色序列進(jìn)行比較。由于雙堿基編碼規(guī)則中一種顏色對應(yīng)4種堿基對,前面堿基對的第二個堿基是后面堿基對的第一個堿基,所以一個錯誤顏色編碼就會引起連鎖(liánsuǒ)的解碼錯誤,改變錯誤顏色編碼之后的所有堿基。SOLiD序列分析軟件可以對測序錯誤進(jìn)行自動校正,最后“解碼”成原始序列。因為SOLiD系統(tǒng)采用了雙堿基編碼技術(shù),在測序過程中對每個堿基判讀兩遍,從而減少原始數(shù)據(jù)錯誤,提供內(nèi)在的校對功能,得到的原始堿基數(shù)據(jù)的準(zhǔn)確度大于99.94%,而在15X覆蓋率時的準(zhǔn)確度可以達(dá)到99.999%,是目前新一代基因分析技術(shù)中準(zhǔn)確度最高的[29,30]。超高通量是共二百五十四頁

基因組所引進(jìn)SOLiDTM系統(tǒng),將大大推進(jìn)基因組測序和分析的能力。該系統(tǒng)每輪運(yùn)行可以產(chǎn)生超過30億堿基(相當(dāng)于一個人類基因組全序列)的可定位數(shù)據(jù)。可對多種菌株進(jìn)行極高覆蓋度的測序分析;能夠?qū)Πㄌ厥饧膊』蛘咚幬锉硇偷仍趦?nèi)的完整基因進(jìn)行精確的序列分析;也能用于高通量的基因表達(dá)研究,而其成本和時間消耗大大低于傳統(tǒng)測序技術(shù)。SOLiDTM系統(tǒng)還能夠為染色質(zhì)免疫共沉淀研究提供一種全新的高特異性和高準(zhǔn)確度的方法;其高敏感度使SOLiDTM系統(tǒng)既能對常規(guī)基因芯片上可檢測的基因表達(dá)譜進(jìn)行分析,又可以對以前必須通過實時PCR的方法才能看到的基因進(jìn)行檢測。

基因組所引進(jìn)SOLiDTM系統(tǒng),對于同中科院其它兄弟院所進(jìn)行廣泛的交流與合作提供更加有力的支撐(zhīchēng)作用,特別是在開展靶基因重測序研究、基因表達(dá)分析、MicroRNA(非編碼小分子RNA)的發(fā)現(xiàn)、染色質(zhì)免疫共沉淀研究以及其它物種全基因組序列測定等相關(guān)研究方面給予強(qiáng)大的支持。共二百五十四頁共二百五十四頁第二代測序技術(shù)(jìshù)之比較共二百五十四頁第三代測序技術(shù)(jìshù)“采用了高密度DNA(玻璃板)納米芯片技術(shù),在芯片上嵌入DNA納米球,然后用非連續(xù)、非連鎖聯(lián)合探針錨定連接(cPAL)技術(shù)來讀取序列,兩項技術(shù)的應(yīng)用減少了試劑的消耗和成像的時間”。該系統(tǒng)整合了文庫、陣列、測序分析、儀器以及軟件上的技術(shù)進(jìn)步。與目前流行的第二代測序技術(shù)相比,新方法能在消耗更少試劑的前提下獲得更多的數(shù)據(jù)。每臺機(jī)器能獲得1000Gb的數(shù)據(jù),比目前的測序技術(shù)提高了一個(yīɡè)數(shù)量級,也降低了整體的成本。共二百五十四頁第三代測序方法(fāngfǎ)1核酸外切(wàiqiē)酶測序法2合成測序法3納米孔測序法4透射電鏡測序技術(shù)共二百五十四頁核酸(hésuān)外切酶測序法共二百五十四頁合成(héchéng)測序法真實單分子測序法(tSMS)能量(néngliàng)共振轉(zhuǎn)移測序法(FRET)SMRT測序法(SMRT)共二百五十四頁合成(héchéng)測序法-tSMS共二百五十四頁合成(héchéng)測序法-FRET能量共振(gòngzhèn)轉(zhuǎn)移共二百五十四頁合成(héchéng)測序法-SMRT共二百五十四頁納米(nàmǐ)孔測序技術(shù)雜交輔助(fǔzhù)的納米孔測序法(HANS)寡聚物輔助的納米孔測序法共二百五十四頁透射電鏡測序技術(shù)(jìshù)

以單鏈線性DNA為模板,以三種重元素標(biāo)記(biāojì),一種不標(biāo)記(biāojì)的脫氧核苷酸為原料,合成其互補(bǔ)鏈,經(jīng)透射電鏡(TEM)檢測,則可見重元素標(biāo)記,其互補(bǔ)鏈則可由點(diǎn)的大小和強(qiáng)度被分辨出來共二百五十四頁第二三代測序技術(shù)(jìshù)比較共二百五十四頁測序平臺SOLiDSolexaGA454DNAFragment2-5ug2-5ug2-5ugPair-end2-5ug2-5ugMate-pair5-100ug5-100ug5-100ugRNA轉(zhuǎn)錄組10-20ug10ug10ugSmallRNA10-15ug10-15ugMicroRNA40-50ug40-50ug建庫時間1-2周1-2周1-2天上機(jī)時間單向6天雙向12天單向5天雙向10天10小時共二百五十四頁SequencingGlossaryReads.Acollectionofclonesthatover-samplethetargetgenome.Pair-endreads.Sequencereadsderivedfrombothendsofasequencing-libraryclone.Mate-pairreads.Sequencereadsderivedfrombothendsofamate-pairlibraryclonewhichinsertsizeisusually>1kb.Insertsize.Thesizeoftheclone-insertfromwhichaclone-endpairistaken.Contig.

Theresultofjoininganoverlappingcollectionofsequencereads.Scaffold.

Theresultofconnectingnon-overlappingcontigsbyusingpair-endreads.N50size.Asappliedtocontigsorscaffolds,thatsizeabovewhich50%oftheassembledsequencecanbefound.共二百五十四頁GenomeassemblystrategyContigassemblyScafffoldingInternalgapclosing/2010/11/4/R41共二百五十四頁RecentwholegenomesequencingprojectsTable.BasicinformationofRrecentlysequencedgenomes.OrganismGenomesizestrategyCoverageContigScafffolds#N50MaxTotal#N50MaxTotalHuman3.0GbSolexa45x2.76M1.5Kb18.8Kb2.18GbNRNRNRNRApple742.3MbSangr+4544.4x+12.5x122,14616,171NR603.9Mb1,629102KbNR598.3Castor320MbSanger4.59x54,00021.1kb190kb324Mb25,828496.5kb4.7Mb350.6MbGrapevine500MbSangr+4547x+4.2x58,61118.2Kb238kb531Mb2,0931.33Mb7.8Mb421MbPanda2.4GbSolexa74x200,60436,728434,6352.25Gb81,4961.22Mb6.05Mb2.30GbStraberry220Mb454+solexa+solid24.5x+6.4x+6.4x16,48728,072215,349202Mb3,2631.44Mb4.1Mb214MbCacoo430Mb454+sanger+solexa16.7x+44x25,91219.8kb190Kb291.44,792473.8Kb3415Kb326.9MbTomato900Mb454+sanger+solexa+solid31x+3.6x+82x+140x110,87255.7kbNR763Mb3,7614.45MbNR782MbPotato840Mb454+solexa+solid11x+106x+0.2x111,18731KbNR683Mb66,301387KbNR727Mb共二百五十四頁共二百五十四頁

FlowchartoftheWGSdenovoassemblyGenomicDNADNAfragmentation,constructfragmentedlibrariesGeneratesequencingreadsusing454technologySequencingerrorcorrectionOutputcontigsFillinintra-scaffoldgapsandgetthefinalscaffoldsGenomicDNADNAfragmentation,constructpaired-endlibrarieswithvariantinsertsizesGeneratesequencingreadsusingIlluminaGAtechnologySequencingpre-processOutputcontigsandminiscaffoldsSolexapart454partHybridassemblyandscffolding共二百五十四頁

454readsprocessRawreadsKmerevaluationQ20,removeadaptor,trimSequencingpre-processNewblerassemblyAssembledreadsUnassembledreadsUnigenecoverageKmerevaluationSolexamappingNr/NtblastContigstatusAssemblyHybridscaffolding共二百五十四頁

SolexareadsprocessRawreadsKmerevaluationSequencingpre-processSoapassemblyAssembledreadsUnassembledreadsUnigenecoverageKmerevaluationSolexamappingNr/NtblastContigstatusAssemblyMappingto454contigHybridscaffoldingCov/Comp共二百五十四頁longreadsassemblycontigsshortreadsA+C–B–scaffoldingA+B–C–scaffoldsFixgapHybridassembly共二百五十四頁ESTUnigeneScafAScafCScafBScafDNewScafABCDESTbasedAssemblyinshortreadsofNGS:ConstructeBIGerScaffording共二百五十四頁Rawsequencingreadspre-processingISignificanceandpurposeSequencinglibraryqualitycontrolSequencingbiasanalysisInheritedprosperitiesoncertainsecondgenerationsequencerGenomesequencingblackholeeffectTranscriptomesamplingandquantificationbiasReadyformappingReadyfordenovoassembly共二百五十四頁Rawsequencingreadspre-processingIISequencingreadsnumbersDuplicatesdetection,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論