基因組測序的技術發(fā)展現(xiàn)狀_第1頁
基因組測序的技術發(fā)展現(xiàn)狀_第2頁
基因組測序的技術發(fā)展現(xiàn)狀_第3頁
基因組測序的技術發(fā)展現(xiàn)狀_第4頁
基因組測序的技術發(fā)展現(xiàn)狀_第5頁
已閱讀5頁,還剩248頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基因組學 元素周期表的發(fā)現(xiàn)奠定了二十世紀物理、化學研究和發(fā)展的基礎元素周期表“基因組序列圖”將奠定二十一世紀生命科學研究和生物產業(yè)發(fā)展的基礎! “基因組”-生命科學的“元素周期表”人體解剖圖奠定了現(xiàn)代醫(yī)學發(fā)展的基礎生命的奧秘蘊藏于 “四字天書”之中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT基因組

2、學基因組學 1 1 基因組學概述基因組學概述 2 2 基因組圖譜的構建基因組圖譜的構建3 3 基因組測序基因組測序4 4 功能基因組學功能基因組學基因組學概念及范疇基因組學概念及范疇 基因組基因組(genome)是德國遺傳學家是德國遺傳學家H. Winkler在在1920年將年將gene(基因)和(基因)和chromosome(染色體染色體)兩兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展為在個體水平代表一個個體所有遺傳性狀的總和,在細為在個體水平

3、代表一個個體所有遺傳性狀的總和,在細胞水平代表一個細胞所有不同染色體(單倍體)的總和,胞水平代表一個細胞所有不同染色體(單倍體)的總和,在分子水平代表一個物種所有在分子水平代表一個物種所有DNA分子的總和。分子的總和。 基因組學概述基因組學概述n基因組(基因組(genomegenome),又稱染色體組),又稱染色體組n一個物種單倍體的染色體數(shù)目,一個物種單倍體的染色體數(shù)目,物種全物種全部遺傳信息的總和部遺傳信息的總和n物種遺傳信息的物種遺傳信息的“總詞典總詞典”n控制發(fā)育的控制發(fā)育的“總程序總程序”n生物進化歷史的生物進化歷史的“總檔案總檔案”基因組基因組(genome) 基因組基因組(gen

4、ome)是德國遺傳學家是德國遺傳學家H. Winkler在在1920年將年將gene(基因)和(基因)和chromosome(染色體染色體)兩兩個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部個詞縮合而創(chuàng)造的一個新詞,意思是指染色體上的全部基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展基因。幾十年來,隨著分子生物學的發(fā)展,其含義擴展為在個體水平代表一個個體所有遺傳性狀的總和,在細為在個體水平代表一個個體所有遺傳性狀的總和,在細胞水平代表一個細胞所有不同染色體(單倍體)的總和,胞水平代表一個細胞所有不同染色體(單倍體)的總和,在分子水平代表一個物種所有在分子水平代表一個物種所有DNA分子的總和

5、。分子的總和。 基因組學基因組學(genomics)n就是發(fā)展和應用就是發(fā)展和應用DNA制圖、測序新技術以及計算制圖、測序新技術以及計算機程序,分析生命體(包括人類)全部基因組結機程序,分析生命體(包括人類)全部基因組結構及功能的科學。構及功能的科學。19861986年提出,至今年提出,至今2020年,已經發(fā)展成為遺傳學中年,已經發(fā)展成為遺傳學中最重要的分支學科。最重要的分支學科。對物種的所有基因進行定位、作圖、測序和功能對物種的所有基因進行定位、作圖、測序和功能分析分析基因組學的基礎理論研究基因組學的基礎理論研究基因組學是要揭示下述四種整合體系的相互關系基因組學是要揭示下述四種整合體系的相互

6、關系: 基因組作為信息載體基因組作為信息載體 (堿基對、重復序列的整(堿基對、重復序列的整體守恒與局部不平衡的關系)體守恒與局部不平衡的關系) 基因組作為遺傳物質的整合體基因組作為遺傳物質的整合體 (基因作為功能和基因作為功能和結構單位與遺傳學機制的關系結構單位與遺傳學機制的關系) 基因組作為生物化學分子的整合體基因組作為生物化學分子的整合體 (基因產物作基因產物作為功能分子與分子、細胞機制的關系)為功能分子與分子、細胞機制的關系) 物種進化的整合體物種進化的整合體 (物種在地理與大氣環(huán)境中的物種在地理與大氣環(huán)境中的自然選擇)自然選擇)基因組學研究的最終目標基因組學研究的最終目標u 獲得生物體

7、全部基因組序列獲得生物體全部基因組序列u 鑒定所有基因的功能鑒定所有基因的功能u 明確基因之間的相互作用關系明確基因之間的相互作用關系u 闡明基因組的進化規(guī)律闡明基因組的進化規(guī)律經典遺傳學經典遺傳學 在在2020世紀初,遺傳學剛剛誕生的時候,遺傳世紀初,遺傳學剛剛誕生的時候,遺傳學家的工作主要是鑒別感興趣的基因,確定這學家的工作主要是鑒別感興趣的基因,確定這些基因在染色體上的位置。些基因在染色體上的位置。 第一個環(huán)節(jié):尋找自發(fā)突變體,或者利用物第一個環(huán)節(jié):尋找自發(fā)突變體,或者利用物理、化學因素誘發(fā)突變。理、化學因素誘發(fā)突變。 第二個環(huán)節(jié):通過連鎖分析確定新基因與已第二個環(huán)節(jié):通過連鎖分析確定新

8、基因與已知基因的相互關系,繪制遺傳連鎖圖。知基因的相互關系,繪制遺傳連鎖圖。幾個代表物種的基因組大小幾個代表物種的基因組大小物種物種基因組大小/bp基因組大小/bpT4噬菌體T4噬菌體2.0102.0105 5大腸桿菌(大腸桿菌(Escherichia coli) )4.2104.2106 6酵母(酵母(Sccharomyces cerevisiae) )1.5101.5107 7擬南芥(擬南芥(Arabidopsis thaliana) )1.0101.0108 8秀麗小桿線蟲(秀麗小桿線蟲(Caenorhbditis elagans) )1.0101.0108 8果蠅(果蠅(Drosoph

9、ila melanogaster) )1.65101.65108 8水稻(水稻(Oryza sativa) )3.89103.89108 8小白鼠(小白鼠(Mus musculus) )3.0103.0109 9人類(人類(Homo sapiens) )3.3103.3109 9玉米玉米(Zea mays) )5.4105.4109 9普通小麥(普通小麥(Triticum aestivum) )1.6101.6101010基因組學的分類 3基因組學(根據(jù)所研究的生物體種類分類)結構基因組學功能基因組學1基因組學(根據(jù)系統(tǒng)特征分類) 2基因組學(根據(jù)與其它學科的關系分類)基因組繪制和測序基因和基

10、因組組織基因組調節(jié)網絡結構蛋白質結構特征轉錄組學蛋白組學代謝組學基礎基因組學應用基因組學生化基因組學遺傳基因組學進化基因組學生理基因組學計算基因組學生態(tài)基因組學工業(yè)基因組學農業(yè)基因組學環(huán)境基因組學醫(yī)學基因組學植物基因組學動物基因組學人類基因組學微生物基因組學基因組學的研究內容基因組學的研究內容q 結構基因組學結構基因組學q 功能基因組學功能基因組學q 蛋白質組學蛋白質組學結構基因組學(結構基因組學(structural genomics) 基因定位基因定位 基因組作圖基因組作圖 測定核苷酸序列測定核苷酸序列功能基因組學(功能基因組學(functional genomics) 又稱后基因組學(又

11、稱后基因組學(postgenomics)postgenomics)q 基因的識別、鑒定、克隆基因的識別、鑒定、克隆q 基因結構、功能及其相互關系基因結構、功能及其相互關系q 基因表達調控的研究基因表達調控的研究蛋白質組學(蛋白質組學(proteomics)n鑒定蛋白質的產生過程、結構、功能和相鑒定蛋白質的產生過程、結構、功能和相互作用方式互作用方式遺傳學與基因組學的里程碑 圖中所示的螺旋展示了遺傳學和基因組學重要進展的里程碑,從孟德爾遺傳法則的發(fā)現(xiàn)和其在20世紀初被重新發(fā)現(xiàn)1開始。 DNA被確立是遺傳的物質基礎 2、DNA結構的確定3、遺傳代碼的闡明4、DNA重組技術的發(fā)展5,6、以及自動化程

12、度日益提高的DNA測序技術的建立7-10,為1990年啟動人類基因組計劃(HGP)奠定了基礎 研究功能基因組學的挑戰(zhàn)n闡釋基因功能n鑒別和表征生命的分子機構n描繪基因調節(jié)網絡n系統(tǒng)水平上而非單個細胞水平上對生物系統(tǒng)的認識n計算機上的挑戰(zhàn)n多學科協(xié)作基因組的進化基因組的進化(1 1)基因組大小的進化)基因組大小的進化 包括基因組的含量、基因組的結構以及基因包括基因組的含量、基因組的結構以及基因的數(shù)量等幾個方面。的數(shù)量等幾個方面。(2 2)基因組的分子進化)基因組的分子進化 DNA DNA序列的進化:基因的不同區(qū)域進化速率序列的進化:基因的不同區(qū)域進化速率不同。內含子中堿基對趨異進化速率大于外顯子

13、;不同。內含子中堿基對趨異進化速率大于外顯子;編碼序列中同義突變的進化速率大于非同義突變,編碼序列中同義突變的進化速率大于非同義突變,非同義突變的進化速率最低。假基因的進化速率非同義突變的進化速率最低。假基因的進化速率最高。最高。 多基因家族的進化:通過基因擴增和不均多基因家族的進化:通過基因擴增和不均等交換形成多拷貝基因,在通過突變積累、基等交換形成多拷貝基因,在通過突變積累、基因重排和自然選擇等因素形成多基因家族或新因重排和自然選擇等因素形成多基因家族或新的基因。如珠蛋白基因家族的進化。的基因。如珠蛋白基因家族的進化。外顯子混編:來自不同基因的多個外顯子相互外顯子混編:來自不同基因的多個外

14、顯子相互連接,或基因內部的外顯子重復。連接,或基因內部的外顯子重復。基因水平轉移:遺傳物質從一個物種通過各種基因水平轉移:遺傳物質從一個物種通過各種方式轉移到另一個物種的基因組中。如轉化、方式轉移到另一個物種的基因組中。如轉化、轉導、接合、轉染等。轉導、接合、轉染等。范圍和一般方法n結構基因組學n轉錄物組學n蛋白質組學n代謝物組學基因組學的發(fā)展歷程年里程碑和事件參考文獻1985-1988美國科學院和研究委員會討論、辯論制定人類基因組計劃(HGP)Albers,19981990人類基因組計劃在美國正式開始Burris,19981995第一個自由存活生物,Haemophius influenzae

15、 鳥槍法測序完成Fleischmann,19951996芽殖酵母測序完成第一個真核生物基因組Goffeau,199619981998第一個多細胞生物秀麗線蟲測序完畢微陣列和基因組學一起列入最高十項科學突破C. Elegans,1998新聞編委會,19982000全基因組鳥槍法完成果蠅的全基因組測序Adams,20002000美國前總統(tǒng)克林頓宣布即將完成的HGP是人類描繪最奇妙的圖譜Marshall,20002000第一個模式植物擬南芥全基因組測序完成Genome Intiative2001人類基因組序列草圖的兩個版本分別在nature和science上發(fā)表Venter,20012002兩個水稻

16、亞種基因組序列草圖完成Yu,20022 基因組圖譜的構建基因組圖譜的構建基因組計劃的主要任務是獲得全基因組序列基因組計劃的主要任務是獲得全基因組序列但是,現(xiàn)在的測序方法每次只能測但是,現(xiàn)在的測序方法每次只能測8008001000bp1000bp大量的測序片段要拼接大量的測序片段要拼接要知道序列在要知道序列在ChrChr上的位置才能正確拼接上的位置才能正確拼接基因組計劃的第一個環(huán)節(jié):基因組計劃的第一個環(huán)節(jié): 構建基因組圖譜構建基因組圖譜基因組圖譜基因組圖譜n遺傳圖譜遺傳圖譜(genetic map)n物理圖譜物理圖譜(physical map)遺傳圖譜遺傳圖譜(genetic map) 采用采用

17、遺傳分析的方法遺傳分析的方法將基因或其它將基因或其它DNADNA序列標定在染色體上構建連鎖圖。序列標定在染色體上構建連鎖圖。遺傳標記遺傳標記q有可以識別的標記,才能確定目標的方位有可以識別的標記,才能確定目標的方位及彼此之間的相對位置。及彼此之間的相對位置。q構建遺傳圖譜就是尋找基因組不同位置上構建遺傳圖譜就是尋找基因組不同位置上的特征標記。的特征標記。q包括:包括: 形態(tài)標記形態(tài)標記 細胞學標記細胞學標記 生化標記生化標記 DNADNA分子標記分子標記多態(tài)性(多態(tài)性(polymophism)所有的標記都必須具有多態(tài)性所有的標記都必須具有多態(tài)性!v 花色:白色、紅色花色:白色、紅色v 株高:高

18、、矮株高:高、矮v 血型:血型:A A、B B、O O型型v 淀粉:糯、非糯淀粉:糯、非糯所有多態(tài)性都是基因突變的結果!所有多態(tài)性都是基因突變的結果!形態(tài)標記形態(tài)標記形態(tài)性狀:株高、顏色、白化癥等形態(tài)性狀:株高、顏色、白化癥等又稱表型標記又稱表型標記數(shù)量少數(shù)量少很多突變是致死的很多突變是致死的受環(huán)境、生育期等因素的影響受環(huán)境、生育期等因素的影響q 最早建立的果蠅連鎖圖,就是利用控制最早建立的果蠅連鎖圖,就是利用控制果蠅眼睛的形狀、顏色,軀體的顏色、果蠅眼睛的形狀、顏色,軀體的顏色、翅膀的形狀等形態(tài)性狀作為標記,分析翅膀的形狀等形態(tài)性狀作為標記,分析它們連鎖關系及遺傳距離,繪制而成的。它們連鎖關

19、系及遺傳距離,繪制而成的。q 控制性狀的其實是基因,所以形態(tài)標記控制性狀的其實是基因,所以形態(tài)標記實質上就是基因標記。實質上就是基因標記。果果蠅蠅連連鎖鎖圖圖細胞學標記細胞學標記v明確顯示遺傳多態(tài)性的染色體結構特征明確顯示遺傳多態(tài)性的染色體結構特征和數(shù)量特征和數(shù)量特征 染色體的核型染色體的核型 染色體的帶型染色體的帶型 染色體的結構變異染色體的結構變異 染色體的數(shù)目變異染色體的數(shù)目變異v優(yōu)點:不受環(huán)境影響優(yōu)點:不受環(huán)境影響v缺點:數(shù)量少、費力、費時、對生物體缺點:數(shù)量少、費力、費時、對生物體的生長發(fā)育不利的生長發(fā)育不利生化標記生化標記v 又稱蛋白質標記又稱蛋白質標記v 就是利用蛋白質的多態(tài)性作

20、為遺傳標記。就是利用蛋白質的多態(tài)性作為遺傳標記。 如:同工酶、貯藏蛋白如:同工酶、貯藏蛋白v 優(yōu)點:數(shù)量較多,受環(huán)境影響小優(yōu)點:數(shù)量較多,受環(huán)境影響小v 缺點:受發(fā)育時間的影響、有組織特異缺點:受發(fā)育時間的影響、有組織特異性、只反映基因編碼區(qū)的信息性、只反映基因編碼區(qū)的信息DNADNA分子標記分子標記簡稱分子標記簡稱分子標記以以DNADNA序列的多態(tài)性作為遺傳標記序列的多態(tài)性作為遺傳標記優(yōu)點:優(yōu)點:v 不受時間和環(huán)境的限制不受時間和環(huán)境的限制v 遍布整個基因組,數(shù)量無限遍布整個基因組,數(shù)量無限v 不影響性狀表達不影響性狀表達v 自然存在的變異豐富,多態(tài)性好自然存在的變異豐富,多態(tài)性好v 共顯性

21、,能鑒別純合體和雜合體共顯性,能鑒別純合體和雜合體限制性片段長度多態(tài)性限制性片段長度多態(tài)性(restriction fragment length polymorphism,RFLP)v DNADNA序列能或不能被某一酶酶切,相當于一對序列能或不能被某一酶酶切,相當于一對等位基因的差異。等位基因的差異。 v 如有兩個如有兩個DNADNA分子(一對染色體),一個具有分子(一對染色體),一個具有某一種酶的酶切位點,而另一個沒有這個位點,某一種酶的酶切位點,而另一個沒有這個位點,酶切后形成的酶切后形成的DNADNA片段長度就有差異,即多態(tài)片段長度就有差異,即多態(tài)性。性。v 可將可將RFLPRFLP作

22、為標記,定位在基因組中某一位作為標記,定位在基因組中某一位置上。置上。v人類基因組中有人類基因組中有10105 5個個RFLPRFLP位點,每一位點只位點,每一位點只有兩個等位基因。有兩個等位基因。RFLPRFLP分析分析RFLP標記位共顯性標記標記位共顯性標記微衛(wèi)星微衛(wèi)星(microsatellite)標記標記v微 衛(wèi) 星 又 稱 為微 衛(wèi) 星 又 稱 為 簡 單 重 復 序 列 (簡 單 重 復 序 列 ( s i m p l e s i m p l e sequence repeatsequence repeat,SSRSSR)。)。v這種重復序列的重復單位很短,常常只有這種重復序列的重

23、復單位很短,常常只有2 2個、個、3 3個或個或4 4個核苷酸個核苷酸v如一條染色體如一條染色體TCTGAGAGAGACGCTCTGAGAGAGACGC 另一染色體另一染色體TCTGAGAGAGAGAGAGAGACGCTCTGAGAGAGAGAGAGAGACGC,就構成,就構成了多態(tài)性。了多態(tài)性。遺傳圖譜的構建方法遺傳圖譜的構建方法 v 理論基礎理論基礎: 連鎖與交換連鎖與交換v 基本方法基本方法: 兩點測驗法和三點測驗法兩點測驗法和三點測驗法植物遺傳圖譜的構建植物遺傳圖譜的構建v 選擇研究材料(親本)選擇研究材料(親本)v 構建分離群體構建分離群體v 遺傳標記檢測遺傳標記檢測v 標記間的連鎖

24、分析標記間的連鎖分析選擇親本選擇親本 要求親緣關系遠,遺傳差異大要求親緣關系遠,遺傳差異大 但又不能相差太大以導致引起子代不育。但又不能相差太大以導致引起子代不育。 對備選材料進行多態(tài)對備選材料進行多態(tài)( (差異差異) )性檢測,綜性檢測,綜合測定結果,選擇有一定量多態(tài)性的一對合測定結果,選擇有一定量多態(tài)性的一對或幾對材料作為遺傳作圖親本?;驇讓Σ牧献鳛檫z傳作圖親本。構建作圖群體構建作圖群體 遺傳標記的染色體定位遺傳標記的染色體定位v 利用遺傳學方法或其它方法將少數(shù)標記利用遺傳學方法或其它方法將少數(shù)標記錨定在染色體上,作為確定連鎖群的參錨定在染色體上,作為確定連鎖群的參照系。照系。v 常用的方

25、法:常用的方法: 單體分析單體分析 三體分析三體分析 代換系分析代換系分析 附加系分析附加系分析標記間的連鎖分析標記間的連鎖分析v利用在兩個親本間有多態(tài)性的標記分析利用在兩個親本間有多態(tài)性的標記分析分離群體中所有個體的基因型分離群體中所有個體的基因型v根據(jù)連鎖交換的情況,確定標記之間的根據(jù)連鎖交換的情況,確定標記之間的連鎖關系和遺傳距離連鎖關系和遺傳距離v有計算機軟件可以應用有計算機軟件可以應用水稻遺傳圖水稻遺傳圖v 1994 1994年,水稻第一張高密度遺傳圖譜年,水稻第一張高密度遺傳圖譜 927927個位點,個位點, 13831383個標記個標記v 19981998年,年,11571157

26、個位點,個位點,22752275個標記個標記v 20002000年,年,32673267個標記個標記v 高密度的遺傳圖譜為基因組測序和遺傳高密度的遺傳圖譜為基因組測序和遺傳研究奠定了堅實的基礎。研究奠定了堅實的基礎。人類遺傳圖譜的構建人類遺傳圖譜的構建v 不可能根據(jù)需要選擇親本,設計雜交組合,不可能根據(jù)需要選擇親本,設計雜交組合,構建分離群體!構建分離群體!v 只能檢測現(xiàn)存家庭連續(xù)幾代成員的基因型只能檢測現(xiàn)存家庭連續(xù)幾代成員的基因型v 家系分析法家系分析法v 資料有限、必須借助于統(tǒng)計學方法資料有限、必須借助于統(tǒng)計學方法現(xiàn)有的人類遺傳圖譜現(xiàn)有的人類遺傳圖譜v 1 12222號染色體號染色體v 8

27、 8個家系個家系134134個成員個成員v X X染色體,染色體,1212個家系個家系170170個成員個成員v 53645364個個SSRSSR標記標記v 23352335個位點個位點v 標記間的平均距離標記間的平均距離599kb599kb物理圖譜的構建物理圖譜的構建v 用用分子生物學方法分子生物學方法直接檢測直接檢測DNADNA標標記在染色體上的實際位置繪制成的圖譜記在染色體上的實際位置繪制成的圖譜稱為物理圖譜。稱為物理圖譜。v 有遺傳圖譜為什么還要構建物理圖譜?有遺傳圖譜為什么還要構建物理圖譜? 遺傳圖譜的缺陷遺傳圖譜的缺陷v 分別率有限分別率有限v 人類只能研究少數(shù)減數(shù)分裂事件,不能人

28、類只能研究少數(shù)減數(shù)分裂事件,不能獲得大量子代個體獲得大量子代個體v 測序要求每個標記的間隔小于測序要求每個標記的間隔小于100kb100kbv 實際是實際是599kb599kb遺傳圖譜的缺陷遺傳圖譜的缺陷n精確性不夠精確性不夠n經典遺傳學認為,交換是隨機發(fā)生的經典遺傳學認為,交換是隨機發(fā)生的n基因組中有些區(qū)域是重組熱點基因組中有些區(qū)域是重組熱點n倒位、重復等染色體結構變異會限制交倒位、重復等染色體結構變異會限制交換重組換重組酵酵母母遺遺傳傳圖圖與與物物理理圖圖比比較較A A 遺傳圖遺傳圖B B 物理圖物理圖物理作圖的方法物理作圖的方法1 1、限制酶作圖、限制酶作圖2 2、依靠克隆的基因組作圖、

29、依靠克隆的基因組作圖3 3、熒光原位雜交、熒光原位雜交4 4、序列標簽位點作圖、序列標簽位點作圖限制酶作圖(限制酶作圖(restriction mapping)限制酶作圖(限制酶作圖(restriction mapping)熒光原位雜交熒光原位雜交(fluorescent in situ hybridization,F(xiàn)ISH)熒光原位雜交熒光原位雜交(fluorescent in situ hybridization,F(xiàn)ISH)熒光原位雜交熒光原位雜交(fluorescent in situ hybridization,F(xiàn)ISH)熒光原位雜交熒光原位雜交(fluorescent in situ

30、 hybridization,F(xiàn)ISH)人類基因組物理圖人類基因組物理圖v 1987 1987年,年,RFLPRFLP圖譜,圖譜,403403個標記,個標記,10Mb10Mbv 1994 1994年,年,58005800個標記,個標記,0.7Mb0.7Mbv 1996 1996年,年,1700017000多個標記,多個標記,100kb100kbv 完全適應全基因組測序的要求完全適應全基因組測序的要求遺傳圖與物理圖的整合遺傳圖與物理圖的整合v有些標記既是遺傳標記,又是物理標記有些標記既是遺傳標記,又是物理標記 RFLPRFLP標記標記 SSRSSR標記標記 某些基因序列某些基因序列v借助這些標記

31、可以將遺傳圖和物理圖整借助這些標記可以將遺傳圖和物理圖整合起來合起來3 3 基因組測序基因組測序反應所需物質:反應所需物質:DNA模板、引物、模板、引物、DNA聚合聚合 酶、酶、dNTP、緩沖液、緩沖液每個循環(huán)包括:每個循環(huán)包括:變性(變性(90)、退火()、退火(54 )、延伸()、延伸(72 )ATGCCGTAGGCCTAGC TAGGCCTAGCTCGGA ATGCCGTAGGCCTAGCTCGGA基因組基因組DNABAC文庫文庫根據(jù)物理圖譜根據(jù)物理圖譜正確定位的正確定位的BAC 或或contig用于霰彈法測用于霰彈法測序的候選克隆序的候選克隆用于霰彈法測序用于霰彈法測序的亞克隆的亞克隆

32、測序并組裝測序并組裝完整的基因完整的基因組序列組序列逐步克隆法(逐步克隆法(Clone by Clone) 全基因組霰彈法全基因組霰彈法 (Whole Genome Shot-gun)基因組基因組DNA 霰彈法克隆霰彈法克隆測序并進行測序并進行全基因組序全基因組序列組裝列組裝完整的基因完整的基因組序列組序列 BAC by BACWhole Genome Shotgun the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the

33、methods described in this issue. Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001) “WorkingDraft”(90%; 4X)FinishedGenome(99.99%; 8X)Gap1Gap2Chromosome工作草稿(框架圖)與完成圖BAC by BAC The sequence of the human genomeC. Venter et al.Science 16 Feb. 291: 1304 1351, 2001人類基因組計劃研

34、究的主要成果和進展表現(xiàn)在這人類基因組計劃研究的主要成果和進展表現(xiàn)在這“四張圖四張圖”上上 遺傳圖譜遺傳圖譜 又稱為連鎖圖譜(又稱為連鎖圖譜(linkage maplinkage map),指),指基因或基因或DNADNA標志在染色體上的相對位置標志在染色體上的相對位置與遺傳距離與遺傳距離物理圖譜物理圖譜 以定位的以定位的DNADNA標記序列如標記序列如STSSTS作為路標,作為路標,以以DNADNA實際長度即實際長度即bp、kb、Mb為圖距的為圖距的基因組圖譜?;蚪M圖譜。轉錄圖譜轉錄圖譜 利用利用EST(expressed sequence tags 表達表達序列標簽)作為標記所構建的分子遺

35、傳序列標簽)作為標記所構建的分子遺傳圖譜圖譜序列圖譜序列圖譜 通過基因組測序得到的,以通過基因組測序得到的,以A A、T T、G G、C C為標記單位的基因組為標記單位的基因組DNADNA序列序列 物理圖譜的構建物理圖譜的構建大片段克隆的篩選大片段克隆的篩選霰彈法測序與霰彈法測序與“工作框架圖工作框架圖”的構建的構建序列的全組裝與序列的全組裝與“完成圖完成圖”構建構建物理圖譜的制作物理圖譜的制作 物理圖譜物理圖譜是以特異的是以特異的DNADNA序列為標志所展示的染色體圖。序列為標志所展示的染色體圖。標志之間的距離或圖距以物理距離如堿基對(標志之間的距離或圖距以物理距離如堿基對(base pai

36、rbase pair;bpbp,Kb , Mb)Kb , Mb)表示。最精細的物理圖是核苷酸順序圖,最粗略的物表示。最精細的物理圖是核苷酸順序圖,最粗略的物理圖是染色體組型圖。理圖是染色體組型圖。 STSSTS圖譜圖譜是最基本和最為有用的染色體物理圖譜之一,是最基本和最為有用的染色體物理圖譜之一,STSSTS(Sequence Tagged Site)Sequence Tagged Site)本身是隨機地從人類基因組上選擇本身是隨機地從人類基因組上選擇出來的長度在出來的長度在200200300bp300bp左右的特異性短序列(每個左右的特異性短序列(每個STSSTS在基在基因組中是唯一的,因組

37、中是唯一的,STSSTS圖譜就是以圖譜就是以STSSTS為路標(平均每為路標(平均每100Kb100Kb一一個),將個),將DNADNA克隆片段有序地定位到基因組上??寺∑斡行虻囟ㄎ坏交蚪M上。 STS的來源的來源隨機基因組序列隨機基因組序列表達基因序列,如表達基因序列,如EST遺傳標記序列,如微衛(wèi)星標記遺傳標記序列,如微衛(wèi)星標記有關有關STSSTS的信息可在基因組數(shù)據(jù)庫的信息可在基因組數(shù)據(jù)庫GDBGDB中找到中找到 http:/gdbwww. gdb. orgq確定各確定各STS序列及其序列及其在基因組中的位置在基因組中的位置q大插入片段基因組文大插入片段基因組文庫的構建(庫的構建(BAC

38、文庫)文庫)q 以特定以特定STS為標記篩為標記篩 選并定位克隆選并定位克隆q含有含有STS的克隆在基的克隆在基因組中排序因組中排序基因組數(shù)據(jù)庫(GDB)中至少含有24568 個STS路標信息 作為載體的基本要求 能在宿主細胞中進行獨立的復制能在宿主細胞中進行獨立的復制 具有多克隆位點,可插入外源具有多克隆位點,可插入外源 DNADNA片段片段 有合適的篩選標記,如抗藥性有合適的篩選標記,如抗藥性 大小合適,易于分離純化大小合適,易于分離純化 拷貝數(shù)多拷貝數(shù)多 文庫的概念文庫的概念 含有某種生物體全部基因的隨機片段的重組含有某種生物體全部基因的隨機片段的重組DNADNA克隆群體克隆群體 載體:

39、載體:能攜帶外源能攜帶外源DNADNA進入宿主細胞進入宿主細胞的工具,常用的載體有質粒載體、噬的工具,常用的載體有質粒載體、噬菌體載體、細菌人工染色體等菌體載體、細菌人工染色體等宿主:宿主:能容納外源能容納外源DNADNA片段的生物體,片段的生物體,常用的有大腸桿菌、酵母等常用的有大腸桿菌、酵母等NotI、SacI脈沖場凝膠電泳得200Kb左右的大片段DNA 純化后與載體連接 電轉化,將連接產物導入大腸桿菌感受態(tài)細胞插有外源DNA片段的BAC載體在含有氯霉素的固體培養(yǎng)基中培養(yǎng)每一個菌落為帶有相同外源DNA片段的單克隆BAC克隆的篩選克隆的篩選“STS-PCR反反應池應池”方案篩方案篩選種子克隆

40、選種子克隆特定的特定的STS標標記記 相互間具有重疊片段的BAC克隆根據(jù)STS信息組裝成contig,并定位于基因組上Contig每一個菌落為帶有相同外源DNA片段的單克隆Regional mappingRegional mappingMinimal tiling path selected for sequencing.Regional mappingstSG50796stSG50796WI-21858WI-21858WI-20982WI-20982SGC-34652SGC-34652EST325005EST325005Bda37h09Bda37h09sts-N34454sts-N34454

41、stSG-22642stSG-22642stSG22463stSG22463IB262IB262SGC-100057SGC-100057SGC-11218SGC-11218SGC-77734SGC-77734 SGC-12613SGC-12613SGC-79997SGC-79997D3S4170D3S4170WI-13469WI-13469SGC-104744SGC-104744WI-7400WI-7400SGC-82788SGC-82788sts-N30615sts-N30615SGC-106678SGC-106678WI-3006WI-3006D3S4125D3S4125 stSG3157

42、1stSG31571SGC-86097SGC-86097SGC-104738SGC-104738 sts-T03421sts-T03421 stSG81116stSG81116DM1-2b11sDM1-2b11sA004Q43A004Q43WI-10858WI-10858SGC-15279SGC-15279stSG3143stSG3143WI-8499WI-8499 D3S3525D3S3525D3S3630D3S3630 SGC-11976 SGC-11976 WI-6116WI-6116WI-2053WI-2053SGC-84074SGC-84074SGC-77858SGC-77858D3

43、S3706D3S3706SGC-102094SGC-102094 WI-13611WI-13611NRU18-13sNRU18-13sWI-21921WI-21921CHLC.GATA44a05CHLC.GATA44a05D3S1304D3S1304sts-T58150sts-T58150SGC-82964SGC-82964 WI-1341WI-1341D3S3591D3S3591605m01229 e21279b12299n03198p1741l18233p0137i04324k11163m22Beijing CenterMapped on 3p by sequence from other

44、 center114k09204c23728k15429p24499n06399k19106b10129j10113l1013f06600o17322f0976o22263j0830m15320c08250a15294h24140b10137g22South centerMapped on 3p by fingerprint from other center265o10717m12762o12156h01324k15283k15572b0261i09534j21166f03497i24497i24121d03121d03211k13161d20274o146i21116k05255k1581

45、2i02North centerMapped not on 3p by fish1120h22566o1463o01757o1626f1026f10 453a03586c02483g20507d0625c11344o05Mapped not on 3p by fish260k16263p03341o12560g03772p01344l093d22489o22794g03Beijing and South 306h05621c18438g1582o03181f22622p03320k0124b1657d0657d06470 e10STS markers 385a18416n08785a0797c

46、1625f0125f01167p17167p17277d17669 e03194c09Beijing and North210b1795 e11101a04101a0499d1099d10487j12590a20156b21End certified 710 e0410h06508a20508a20173f11173f117m247m24211b19291p2144l1444l14481o07Phase 3Phase 3731 e12731 e12811m11811m11372k09194d21245a0616k1516k15318i14318i14529b1753 e12542k24Mapp

47、ed not on 3p by sequence from NCBI392m07319i18 454f24238a09238a09264h03157 e16350a17Mapped on 3p by fish673f20453f03489d19194i05? ?Sequenced BACs without mapping information93a0193a01360 e14244g03329a02611h22611h2270b0570b05135 e1674 e04124l0821j2321j23IB1403IB1403SGC-12699SGC-12699sts-F21241sts-F21

48、241WI- 6061WI- 6061stSG16459stSG16459WI-6949WI-6949 stSG15038stSG15038sts-M91858sts-M91858WI-17502WI-17502 WI-7625WI-7625WI-7071WI-7071AB000410AB000410sts-F21841sts-F21841sts-L15409sts-L15409A004Z22A004Z22stSG31652stSG31652WI-16427WI-16427stSG43815stSG43815A007593A007593WI-11598WI-11598A008O42A008O4

49、2D3S4194D3S4194stSG4279stSG4279WI-14394WI-14394sts-N95054sts-N95054stSG32055stSG32055stSG15465stSG15465WI-11041WI-11041stSG47554stSG47554stSG3350stSG3350D3S3589D3S3589SGC-12045SGC-12045D3S1263D3S1263stSG47397stSG47397 SGC-84455SGC-84455 D3S3610D3S3610SGC-10790SGC-10790D3S3691D3S3691A002R42A002R42stS

50、G50845stSG50845stSG2582stSG2582WI-31307WI-31307A004X28A004X28D3S3601D3S3601A001T39A001T39stSG62586stSG62586WI-15608WI-15608sts-H83694sts-H83694stSG47347stSG47347WI-5650WI-5650WI-20823WI-20823202a21 105k13334l221087o20593j10169k17309m10813n2383m12 19 e08 203c04481h17356a0713b04449 e2125o17715i04642 e

51、22298m15224p21267l16407i02488o087f24481b18128a05380o24474f16327h1716m03470i10 398j1558i13424h06325l061016h17134k10299h13220d10220d10126l04900o2218f0358b17 1022p15193k15586c12588p09173m24572m141082a181082a18266 e23275j11270i10270i10333a0234l0634l06ctb-159n23ctb-159n23168l03ctc-237n12ctc-237n12382a21c

52、tc-371o18ctc-371o18126l09163d23AC055767AC055767767c01502k05502k05326o24ctb-140o19ctb-140o19415k13224m20167k17167k17219m19219m19266j06438j01627c01659g04659g04AC007791AC007791263i01263i01596j09996c06338p06338p06606c06606c06ctc-243a06ctc-243a06ctc-371o18ctc-371o18357l2494a1494a14380a2270i1170i11citb-24

53、3a06citb-243a06af176815ctb-177n07ctb-177n07115g03115g03109j15781a02412a07412a07429f161020a11ctb-187p01ctb-187p01622i12402p1145b16439f04105h193pterBeijing MapBAC Pooling Protocol 1,152 (plates) X 384 (wells/plate) X 1 (BAC/well) = 442,368 BAC 48X8 (板) X 384 ( 孔/板 ) X 1 ( BAC/孔 ) = 147,456 BAC Each BA

54、C clone contain 150 Kbp human insert 147,456 BAC clones 對全基因組的覆蓋率: 147,456 BAC clones X 150 Kbp = 7.3728 The genome DNA 3,000,000 Kbp 共共48個個每組每組 8 個個每每8個個96孔板組成孔板組成1個個superpool,384個個96孔板組成孔板組成48個個superpools 48 superpools Column poolsColumn pools Row poolsRow pools 1 2 3 4 5 6 7 8 9 10 11 12第八板第八板第二板

55、第二板Plate poolsPlate pools第一板第一板 plate pools,row pools,column pools的構成的構成 1 2 3 4 5 6 7 8 9 10 11 12超級池(超級池(8個個96孔板,孔板,共共768個克?。﹤€克?。┌宄兀ò宄兀?6個克?。﹤€克?。┬谐兀?2個克隆)列池(列池(8個克?。﹤€克隆)大大減少篩選的工作量,降低成本,所得篩選結果準確可靠大大減少篩選的工作量,降低成本,所得篩選結果準確可靠 28 VS 768sheet of superpools, plate pools, row pools, column pools 一一 BAC Sc

56、reening前前48個樣品為引物個樣品為引物OGG1.51對對superpool(sp)的篩選結果的篩選結果后后48個樣品為引物個樣品為引物OGG1.52對對superpool(sp)的篩選結果的篩選結果 引物引物OGG1.52對應對應sp#27,34,45的的plate,row,column pools的篩選結果的篩選結果BAC clone 確定確定 (+為陽性克隆為陽性克隆) 引物引物OGG1.52的的Colony-PCR STSSTS的密度尚未達到繪制高精度物理圖譜的要求,且在基因組中的分的密度尚未達到繪制高精度物理圖譜的要求,且在基因組中的分布不均勻,造成很多區(qū)域沒有陽性克隆覆蓋布不

57、均勻,造成很多區(qū)域沒有陽性克隆覆蓋, ,形成空洞。因此需用指紋圖形成空洞。因此需用指紋圖譜(譜(FPCFPC法)或末端序列(法)或末端序列(Walking by End Sequence)Walking by End Sequence)步移等手段對種子步移等手段對種子克隆進行延伸,形成連續(xù)克隆群。利用延伸方法篩選得到的克隆稱為延克隆進行延伸,形成連續(xù)克隆群。利用延伸方法篩選得到的克隆稱為延伸克隆。伸克隆。 Contig 1Contig 2重疊序列重疊序列重疊序列重疊序列延伸引物延伸引物篩選到的延伸克隆篩選到的延伸克隆20 kb300 bpMolecular weightmarker every

58、 5th lane- BAC clones 在96深孔 板中培養(yǎng)- Hind III 完全酶切- 1% 瓊脂糖凝膠電泳 指指 紋紋 圖圖 譜譜 法法 (Walking by Fingerprinting database) 挑取靠近空洞的種子克隆,酶切構建其指紋圖譜,在FPC數(shù)據(jù)庫中進行比對,搜索含有此克隆的重疊克隆群信息,從中確定覆蓋空洞區(qū)域的克隆,達到延伸目的。Hind III 完全酶切Hind III 完全酶切FPC數(shù)據(jù)庫數(shù)據(jù)庫中比對中比對Clone AClone BClone CCABcontig搭建中克隆的錯位搭建中克隆的錯位 末端序列步行法末端序列步行法 (Walking by E

59、nd Sequence) 挑取靠近空洞的種子克隆進行末端測序,然后在基因組數(shù)據(jù)庫中進行比對,確定專一性的序列片段作為新的STS路標。最后設計新路標的PCR引物,按照STSPCR“反應池”方案篩選新的克隆,達到延伸的目的 ??寺】寺?50A18350A18序列輸入序列輸入 end sequence databaseend sequence database的查詢結果的查詢結果四、四、Clone Identification 1、STS-PCR 2、BAC end sequencing 3、Fingerprinting 4、FISH CK2CK1CK2CK113f06267l16481o07250

60、a15204c23340j13對對1515個克隆進行個克隆進行HindIIIHindIII酶切后電泳結果酶切后電泳結果 “工作框架圖工作框架圖”繪制繪制根據(jù)序列與STS database進行blastn比較結果,將克隆定位末端序的比較,判定延伸在contig外的一端序列。并可及時進行walking,篩選新的克隆 霰彈法測序組裝與Finishing工作流程圖工作流程圖 Shotgun Sequencing I :RANDOM PHASEShotgun Sequencing II:ASSEMBLYShotgun Sequencing III: FINISHINGShotgun Sequencing

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論