第九章 基因組與比較基因組學(xué)_第1頁(yè)
第九章 基因組與比較基因組學(xué)_第2頁(yè)
第九章 基因組與比較基因組學(xué)_第3頁(yè)
第九章 基因組與比較基因組學(xué)_第4頁(yè)
第九章 基因組與比較基因組學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第九章第九章 基因組與比較基因組學(xué)基因組與比較基因組學(xué) 9.1 人工染色體構(gòu)建人工染色體構(gòu)建 9.2 新的測(cè)序策略新的測(cè)序策略-全基因組鳥槍法測(cè)序全基因組鳥槍法測(cè)序 9.3 全基因組序列分析全基因組序列分析-基因組學(xué)的新內(nèi)容基因組學(xué)的新內(nèi)容 9.4 比較基因組學(xué)比較基因組學(xué)(Comparative genomics) 9.1 人工染色體構(gòu)建人工染色體構(gòu)建 1983年,美國(guó)的年,美國(guó)的Dana-Farber癌癥研究所和哈佛大癌癥研究所和哈佛大學(xué)醫(yī)學(xué)院的教授首次在學(xué)醫(yī)學(xué)院的教授首次在Nature上發(fā)表文章,報(bào)道了構(gòu)建上發(fā)表文章,報(bào)道了構(gòu)建YAC(Yeast Artificial Chromosom

2、e)庫(kù)的過程。)庫(kù)的過程。1987年,年,Burke等人發(fā)現(xiàn),僅僅帶有等人發(fā)現(xiàn),僅僅帶有ARS序列序列(autonomous replicating sequence) 的載體雖然能夠被復(fù)制,但極易在的載體雖然能夠被復(fù)制,但極易在有絲分裂時(shí)丟失。即使在選擇培養(yǎng)基上,也只有有絲分裂時(shí)丟失。即使在選擇培養(yǎng)基上,也只有5%-20%的子代細(xì)胞帶有的子代細(xì)胞帶有ARS載體。加入載體。加入Centromeres (CEN)能顯著提高)能顯著提高ARS質(zhì)粒在有絲分裂時(shí)的穩(wěn)定性,質(zhì)粒在有絲分裂時(shí)的穩(wěn)定性,90%以上子代細(xì)胞帶有該載體。以上子代細(xì)胞帶有該載體。CEN還能顯著降低拷貝還能顯著降低拷貝數(shù),從數(shù),從2

3、0-50/細(xì)胞降為細(xì)胞降為1-2/細(xì)胞。(細(xì)胞。(Science, 236:806-812)。)。 人工染色體含有三種必需成分:著絲粒、端粒和復(fù)人工染色體含有三種必需成分:著絲粒、端粒和復(fù)制起點(diǎn)。制起點(diǎn)。 著絲粒著絲粒(CEN)位于染色體中央,呈紐扣狀結(jié)構(gòu),在位于染色體中央,呈紐扣狀結(jié)構(gòu),在有絲分裂時(shí)結(jié)合微管并調(diào)控染色體的運(yùn)動(dòng),也是姐妹有絲分裂時(shí)結(jié)合微管并調(diào)控染色體的運(yùn)動(dòng),也是姐妹染色單體配對(duì)時(shí)的最后位點(diǎn),接收細(xì)胞信號(hào)而使姐妹染色單體配對(duì)時(shí)的最后位點(diǎn),接收細(xì)胞信號(hào)而使姐妹染色體分開。染色體分開。 端粒端粒(TEL):主要功能是防止染色體融合、降解、):主要功能是防止染色體融合、降解、確保其完整

4、復(fù)制。端粒酶以其自身確保其完整復(fù)制。端粒酶以其自身RNA為模板,在染為模板,在染色體端部添加上端粒重復(fù)序列,并參與端粒長(zhǎng)度和細(xì)色體端部添加上端粒重復(fù)序列,并參與端粒長(zhǎng)度和細(xì)胞增殖的調(diào)控。胞增殖的調(diào)控。 復(fù)制起點(diǎn)復(fù)制起點(diǎn): DNA復(fù)制通常由起始蛋白與特定的復(fù)制通常由起始蛋白與特定的DNA序列相互作用開始。序列相互作用開始。DNA合成的起始位點(diǎn)和合成的起始位點(diǎn)和DNA復(fù)制復(fù)制起點(diǎn)起點(diǎn)(遺傳位點(diǎn)遺傳位點(diǎn))所需的所需的Cis靶區(qū)常位于同一段長(zhǎng)約靶區(qū)常位于同一段長(zhǎng)約100bp的的DNA上。上。 YAC的主要缺點(diǎn)的主要缺點(diǎn) 1存在高比例的嵌合體,即一個(gè)存在高比例的嵌合體,即一個(gè)YAC克隆含有兩個(gè)本克隆含有

5、兩個(gè)本來(lái)不相連的獨(dú)立片段;來(lái)不相連的獨(dú)立片段;2部分克隆子不穩(wěn)定,在轉(zhuǎn)代培養(yǎng)中可能會(huì)發(fā)生缺失部分克隆子不穩(wěn)定,在轉(zhuǎn)代培養(yǎng)中可能會(huì)發(fā)生缺失或重排;或重排;3難與酵母染色體區(qū)分開,因?yàn)殡y與酵母染色體區(qū)分開,因?yàn)閅AC與酵母染色體具與酵母染色體具有相似的結(jié)構(gòu)。有相似的結(jié)構(gòu)。4操作時(shí)容易發(fā)生染色體機(jī)械切割。操作時(shí)容易發(fā)生染色體機(jī)械切割。 以細(xì)菌寄主系統(tǒng)為基礎(chǔ)的克隆載體形成嵌合體的頻以細(xì)菌寄主系統(tǒng)為基礎(chǔ)的克隆載體形成嵌合體的頻率較低,轉(zhuǎn)化效率高,又易于分離??茖W(xué)家用率較低,轉(zhuǎn)化效率高,又易于分離??茖W(xué)家用染色體染色體建造建造法用法用F質(zhì)粒及其調(diào)控基因構(gòu)建細(xì)菌載體,克隆大質(zhì)粒及其調(diào)控基因構(gòu)建細(xì)菌載體,克隆

6、大片段片段DNA。該質(zhì)粒主要包括。該質(zhì)粒主要包括oriS, repE(控制(控制F質(zhì)粒質(zhì)粒復(fù)制)和復(fù)制)和parA、 parB(控制拷貝數(shù))等成分。(控制拷貝數(shù))等成分。 BAC的優(yōu)點(diǎn)的優(yōu)點(diǎn) 1 易于用電擊法轉(zhuǎn)化易于用電擊法轉(zhuǎn)化E.coli(轉(zhuǎn)化效率比轉(zhuǎn)化酵母高(轉(zhuǎn)化效率比轉(zhuǎn)化酵母高10-100倍);倍); 2 超螺旋環(huán)狀載體,易于操作;超螺旋環(huán)狀載體,易于操作; 3 F質(zhì)粒本身所帶的基因控制了質(zhì)粒的復(fù)制;質(zhì)粒本身所帶的基因控制了質(zhì)粒的復(fù)制; 4 很少發(fā)生體內(nèi)重排。很少發(fā)生體內(nèi)重排。 有人把人類染色體端粒有人把人類染色體端粒DNA上單個(gè)上單個(gè)-衛(wèi)星衛(wèi)星DNA單單元多聚化形成元多聚化形成1Mb左

7、右的大片段并與人類基因組左右的大片段并與人類基因組DNA混合,產(chǎn)生了能被復(fù)制、能正常分裂并得到長(zhǎng)期穩(wěn)定混合,產(chǎn)生了能被復(fù)制、能正常分裂并得到長(zhǎng)期穩(wěn)定保存的人工合成的染色體,長(zhǎng)度約為保存的人工合成的染色體,長(zhǎng)度約為6-10Mb,稱為,稱為MAC或或HAC。 9.2 新的測(cè)序策略新的測(cè)序策略-全基因組鳥槍法測(cè)序全基因組鳥槍法測(cè)序 對(duì)某基因組文庫(kù)全部克隆片段進(jìn)行末端序列測(cè)定對(duì)某基因組文庫(kù)全部克隆片段進(jìn)行末端序列測(cè)定中未測(cè)到的堿基數(shù),即缺口中未測(cè)到的堿基數(shù),即缺口(gap),與已測(cè)定的總堿基,與已測(cè)定的總堿基數(shù)相關(guān)。隨著已測(cè)定堿基數(shù)的增加,缺口的總堿基數(shù)數(shù)相關(guān)。隨著已測(cè)定堿基數(shù)的增加,缺口的總堿基數(shù)目

8、會(huì)按照泊松公式的一個(gè)推論(目會(huì)按照泊松公式的一個(gè)推論(P=e-m)迅速減小。其)迅速減小。其中中P為基因組中某個(gè)堿基未被測(cè)定的概率,為基因組中某個(gè)堿基未被測(cè)定的概率,m為所測(cè)定為所測(cè)定的堿基數(shù)與基因組大小相比的倍數(shù)。的堿基數(shù)與基因組大小相比的倍數(shù)。m越大越大P值越小。值越小。當(dāng)當(dāng)m值達(dá)到值達(dá)到5(即隨機(jī)測(cè)定的堿基數(shù)達(dá)到基因組(即隨機(jī)測(cè)定的堿基數(shù)達(dá)到基因組5倍倍時(shí)),基因組中未測(cè)定的堿基數(shù)為基因組總堿基數(shù)的時(shí)),基因組中未測(cè)定的堿基數(shù)為基因組總堿基數(shù)的0.67%(e-5=0.0067)。對(duì)流感嗜血桿菌這樣大的基因組。對(duì)流感嗜血桿菌這樣大的基因組(1.83Mb),可能留有,可能留有128個(gè)平均長(zhǎng)度

9、為個(gè)平均長(zhǎng)度為100bp的缺口。的缺口。 全基因組鳥槍法測(cè)序的主要步驟全基因組鳥槍法測(cè)序的主要步驟 v 第一,建立高度隨機(jī)、插入片段大小為第一,建立高度隨機(jī)、插入片段大小為2kb左右的基因左右的基因組文庫(kù)。組文庫(kù)。克隆數(shù)要達(dá)到一定數(shù)量,即經(jīng)末端測(cè)序的克克隆數(shù)要達(dá)到一定數(shù)量,即經(jīng)末端測(cè)序的克隆片段的堿基總數(shù)應(yīng)達(dá)到基因組隆片段的堿基總數(shù)應(yīng)達(dá)到基因組5倍以上。倍以上。v 第二,高效、大規(guī)模的末端測(cè)序。第二,高效、大規(guī)模的末端測(cè)序。對(duì)文庫(kù)中每一個(gè)克對(duì)文庫(kù)中每一個(gè)克隆,進(jìn)行兩端測(cè)序,隆,進(jìn)行兩端測(cè)序,TIGR在完成流感嗜血桿菌的基因在完成流感嗜血桿菌的基因組時(shí),使用了組時(shí),使用了14臺(tái)測(cè)序儀,用三個(gè)月時(shí)

10、間完成了必需臺(tái)測(cè)序儀,用三個(gè)月時(shí)間完成了必需的的28,463個(gè)測(cè)序反應(yīng),測(cè)序總長(zhǎng)度達(dá)個(gè)測(cè)序反應(yīng),測(cè)序總長(zhǎng)度達(dá)6倍基因組。倍基因組。v 第三,序列集合。第三,序列集合。TIGR發(fā)展了新的軟件,修改了序列發(fā)展了新的軟件,修改了序列集合規(guī)則以最大限度地排除錯(cuò)誤的連鎖匹配。集合規(guī)則以最大限度地排除錯(cuò)誤的連鎖匹配。v 第四,填補(bǔ)缺口。第四,填補(bǔ)缺口。有兩種待填補(bǔ)的缺口,一是沒有相有兩種待填補(bǔ)的缺口,一是沒有相應(yīng)模板應(yīng)模板DNA的物理缺口,二是有模板的物理缺口,二是有模板DNA但未測(cè)序的但未測(cè)序的序列缺口。他們建立了插入片段為序列缺口。他們建立了插入片段為15-20kb的的文庫(kù)以文庫(kù)以備缺口填補(bǔ)。備缺口填

11、補(bǔ)。 鳥槍法測(cè)序的缺點(diǎn)鳥槍法測(cè)序的缺點(diǎn) 對(duì)鳥槍法的改進(jìn)對(duì)鳥槍法的改進(jìn) (1) Clone contig法。首先用稀有內(nèi)切酶把待測(cè)基因組降法。首先用稀有內(nèi)切酶把待測(cè)基因組降解為數(shù)百解為數(shù)百kb以上的片段,再分別測(cè)序。以上的片段,再分別測(cè)序。 (2) 靶標(biāo)鳥槍法靶標(biāo)鳥槍法(direted shotgun)。首先根據(jù)染色體上已。首先根據(jù)染色體上已知基因和標(biāo)記的位置來(lái)確定部分知基因和標(biāo)記的位置來(lái)確定部分DNA片段的相對(duì)位置,片段的相對(duì)位置,再逐步縮小各片段之間的缺口。再逐步縮小各片段之間的缺口。 一些常見的縮寫一些常見的縮寫 SSLPs, simple sequence length polymorp

12、hisms; STRs, simple tandem repeats; SNPs, single nucleotide polymorphisms. LINEs, long interspersed nuclear elements; SINEs, short interspersed nuclear elements; LTR, long terminal repeat. FISH, Fluorescent in situ Hybridization; STS, Sequence Tagged Site EST, End Sequence Tag. 9.3 全基因組序列分析全基因組序列分析-

13、基因組學(xué)的新內(nèi)容基因組學(xué)的新內(nèi)容 1數(shù)據(jù)存放。數(shù)據(jù)存放。2堿基百分含量分析。無(wú)論是堿基百分含量分析。無(wú)論是GC富含區(qū)還是富含區(qū)還是AT富含富含區(qū),都可能是一些特殊功能的區(qū)域。區(qū),都可能是一些特殊功能的區(qū)域。肺炎支原體肺炎支原體GC百分含量高和百分含量高和GC百分含量低的區(qū)域?qū)Π俜趾康偷膮^(qū)域?qū)?yīng)于重組值較低的區(qū)域,包括著絲粒和端粒,而尿殖應(yīng)于重組值較低的區(qū)域,包括著絲粒和端粒,而尿殖道支原體道支原體GC百分含量最低的區(qū)域?qū)?yīng)于百分含量最低的區(qū)域?qū)?yīng)于rRNA和和tRNA。流感嗜血桿菌流感嗜血桿菌GC百分含量高的區(qū)域也對(duì)應(yīng)于百分含量高的區(qū)域也對(duì)應(yīng)于6個(gè)個(gè)rRNA基因。基因。 3.ORF分析。首先

14、要用多個(gè)不同的軟件來(lái)要找到并估分析。首先要用多個(gè)不同的軟件來(lái)要找到并估測(cè)基因組中的每一個(gè)測(cè)基因組中的每一個(gè)ORF。 (1)通過流感嗜血桿菌能量代謝類群的通過流感嗜血桿菌能量代謝類群的ORF分析,了解分析,了解到在這種生物中缺乏三羧酸循環(huán)到在這種生物中缺乏三羧酸循環(huán)(TCA)中必需的三個(gè)中必需的三個(gè)酶,即檸檬酸合成酶基因、異檸檬酸脫氫酶基因和順酶,即檸檬酸合成酶基因、異檸檬酸脫氫酶基因和順烏頭酸酶基因。由此推斷流感嗜血桿菌烏頭酸酶基因。由此推斷流感嗜血桿菌TCA缺失,不缺失,不能合成谷氨酸,因?yàn)楣劝彼岬墓w是能合成谷氨酸,因?yàn)楣劝彼岬墓w是TCA的中間產(chǎn)生的中間產(chǎn)生物物-酮戊二酸。酮戊二酸。 (2)在尿殖道支原體基因組中有一個(gè)稱為在尿殖道支原體基因組中有一個(gè)稱為MgPa的的ORF??疾烊蚪M,共發(fā)現(xiàn)有考察全基因組,共發(fā)現(xiàn)有9個(gè)與個(gè)與MgPa同源的重復(fù)序列,同源的重復(fù)序列,這些重復(fù)序列之間發(fā)生重組可能誘導(dǎo)尿殖道支原體群這些重復(fù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論