全基因組測序_第1頁
全基因組測序_第2頁
全基因組測序_第3頁
全基因組測序_第4頁
全基因組測序_第5頁
已閱讀5頁,還剩76頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、任科教師任科教師: 余愛麗余愛麗生命科學(xué)院生命科學(xué)院 分子生物分子生物學(xué)與生物信息學(xué)系學(xué)與生物信息學(xué)系 基因組就是一個(gè)物種中所有基因的整體組成。 基因組有兩層意義:遺傳物質(zhì)和遺傳信息。 要揭開生命的奧秘,就需要從整體水平研究基因的存在、基因的結(jié)構(gòu)與功能、基因之間的相互關(guān)系。 Zea mays 8,000Homo sapiens 3,000Oryza sativa 400Drosophila melanogaster 165Arabidopsis thaliana 100Saccharomyces cerevisiae 12E.coli 4.6Genome Size (Mb)什么是什么是C 值?

2、值?C值悖理:值悖理: 生物的復(fù)雜性與基因組的大小并不完全成比生物的復(fù)雜性與基因組的大小并不完全成比例增加例增加細(xì)菌細(xì)菌真菌真菌等等動(dòng)物動(dòng)物陰影部分為一個(gè)門內(nèi)陰影部分為一個(gè)門內(nèi)C-值的范圍值的范圍重復(fù)順序重復(fù)順序 高度重復(fù)順序:高度重復(fù)順序: 長度:幾個(gè)長度:幾個(gè)幾千個(gè)幾千個(gè)bp 拷貝數(shù):幾百個(gè)拷貝數(shù):幾百個(gè)上百萬個(gè)上百萬個(gè) 首尾相連,串聯(lián)排列首尾相連,串聯(lián)排列 集中分布于染色體的特定區(qū)段(如端粒,著絲粒等)集中分布于染色體的特定區(qū)段(如端粒,著絲粒等) 也稱衛(wèi)星也稱衛(wèi)星DNA 中度重復(fù)順序:中度重復(fù)順序: 一般分散于整個(gè)基因組中;一般分散于整個(gè)基因組中; 長度和拷貝數(shù)差別很大長度和拷貝數(shù)差別

3、很大 單一順序:單一順序: 基因主要位于單一順序基因主要位于單一順序 動(dòng)物中單一順序約占動(dòng)物中單一順序約占50 植物中單一順序約占植物中單一順序約占20 DNA 的復(fù)性的復(fù)性 遵循二級(jí)反應(yīng)動(dòng)力學(xué),可表述為:遵循二級(jí)反應(yīng)動(dòng)力學(xué),可表述為:dCt / dt = -KC02 反應(yīng)達(dá)反應(yīng)達(dá) t 時(shí),單鏈時(shí),單鏈DNA濃度濃度 = CtC0 = 單鏈單鏈 DNA起始濃度起始濃度 K 復(fù)性速度常數(shù)復(fù)性速度常數(shù)順序復(fù)雜性Cot(1/2) = 1/K (mol. Sec / L) 常數(shù)常數(shù) Ct/C0 0101C0t(1/2) C0t(1/2) C0t(1/2)值與基因組復(fù)雜性成正比。值與基因組復(fù)雜性成正比。

4、 是遺傳信息的物理和功能單位,包含是遺傳信息的物理和功能單位,包含產(chǎn)生產(chǎn)生一條多肽鏈或功能一條多肽鏈或功能RNA所必需的全部核苷酸所必需的全部核苷酸序列。序列。 基因分類:基因分類: 編碼編碼RNA的基因,如的基因,如rRNA基因,基因,snRNA基因等;基因等; 編碼蛋白質(zhì)的基因編碼蛋白質(zhì)的基因2. 什么是基因?什么是基因?基因的不連續(xù)性基因的不連續(xù)性Intron 和和Exon: 大多數(shù)真核生物蛋大多數(shù)真核生物蛋白質(zhì)基因的編碼順白質(zhì)基因的編碼順序序(Exon)都被或長都被或長或短的非編碼順序或短的非編碼順序(Intron)隔開隔開基因家族基因家族 一群具有一群具有一致的一致的或或相似相似順序

5、順序的基因的基因, ,有的還擔(dān)負(fù)有的還擔(dān)負(fù)類似的生物學(xué)功能類似的生物學(xué)功能, , 可以相互補(bǔ)償可以相互補(bǔ)償, , 比如比如: :E2f E2f transcription factor transcription factor 假基因假基因(Pseudogene) 來源于功能基因來源于功能基因 但已失去活性但已失去活性 的的DNA序列序列產(chǎn)生假基因的原因有產(chǎn)生假基因的原因有:1. 由重復(fù)產(chǎn)生的假基因由重復(fù)產(chǎn)生的假基因;2. 加工的假基因加工的假基因, 由由RNA反轉(zhuǎn)錄為反轉(zhuǎn)錄為cDNA 后再整合后再整合到基因組中到基因組中;3. 殘缺的基因殘缺的基因(Truncated gene) 重迭基因有

6、以下幾種情況:重迭基因有以下幾種情況:*一個(gè)基因完全在另一個(gè)基因內(nèi)部一個(gè)基因完全在另一個(gè)基因內(nèi)部*部分重疊部分重疊* 兩個(gè)基因共用少數(shù)堿基對兩個(gè)基因共用少數(shù)堿基對 *一個(gè)基因完全在另一個(gè)一個(gè)基因完全在另一個(gè)基因內(nèi)部基因內(nèi)部如:如:B和和A, E和和D 其讀碼結(jié)構(gòu)互不相同其讀碼結(jié)構(gòu)互不相同 -ATG-/-AATGCC -/-ATAACG-/-TAA-A*BATGCCN-NNATAA*部分重疊部分重疊 如:如: K和和C *兩個(gè)基因共用少數(shù)兩個(gè)基因共用少數(shù)堿基對堿基對 如:如: D和和J-TAATG-D 終止密碼子終止密碼子J 起始密碼子起始密碼子A 克隆于質(zhì)粒中DNA用堿或熱變性B M13克隆單

7、鏈DNAC 噬??寺NAD PCR產(chǎn)生單鏈DNAA 高酶活性B 無53外切酶活性C 無35外切酶活性ddATP/ddCTP/ddGTP/ddTTP 的3碳原子連接的是氫原子,不是羥基哌啶1 ATACGTTA2 GTTAGATC3 ACGTTAGA4 CGTTAGAT5 GTTAGATCDNA 樣品 TATGCAATCTAG與基因芯片上 65,000 種可能的八聚體進(jìn)行雜交從而形成特定的結(jié)合圖形計(jì)算機(jī)分析雜交圖象并由探針的重疊情況推導(dǎo)樣品的核酸序列1 ATACGTTA3 TACGTTAG4 ACGTTAGA2 CGTTAGAT5 GTTAGATC3 TACGTTAG4 ACGTTAGA2 CG

8、TTAGAT互補(bǔ)序列為:ATACGTTAGATC樣品序列為:TATGCAATCTAG利用基因芯片進(jìn)行雜交測序的原理ABCABCABCABC小片段測序小片段測序計(jì)算機(jī)拼裝計(jì)算機(jī)拼裝ABC小片段測序小片段測序計(jì)算機(jī)拼裝計(jì)算機(jī)拼裝鳥槍法鳥槍法(Shotgun)測序的問題測序的問題 CAATGCATTAGCAGCCAATGCGAP錯(cuò)裝錯(cuò)裝解決辦法:通過相鄰已知順序作為探針篩選已有的基因組文庫解決辦法:利用其它宿主菌與載體重新構(gòu)建文庫 先將染色體打成比較大的片段先將染色體打成比較大的片段(幾十幾十-幾百幾百Kb), 利用利用分子標(biāo)記將這些大片段排成重疊的克隆群分子標(biāo)記將這些大片段排成重疊的克隆群(Con

9、tig), 分別分別測序后拼裝測序后拼裝. 這種策略叫這種策略叫基于克隆群基于克隆群(contig-based)的策的策略略.ABCABC大片段大片段contig小片段測序拼裝小片段測序拼裝兩種策略的比較兩種策略的比較鳥槍法策略鳥槍法策略 指導(dǎo)測序指導(dǎo)測序策略策略不需背景信息不需背景信息 構(gòu)建克隆群構(gòu)建克隆群 (遺傳、物理圖譜遺傳、物理圖譜)時(shí)間短時(shí)間短 需要幾年的時(shí)間需要幾年的時(shí)間 需要大型計(jì)算機(jī)需要大型計(jì)算機(jī)得到的是草圖得到的是草圖(Draft) 得到精細(xì)圖譜得到精細(xì)圖譜 5.1 人類基因組計(jì)劃的目的n闡明人類基因組30億個(gè)堿基對的序列,發(fā)現(xiàn)所有人類基因,并搞清其在染色體上的位置;n破譯人

10、類全部遺傳信息,使人類第一次在分子水平上全面地認(rèn)識(shí)自我;n解碼生命、了解生命的起源、了解生命體生長發(fā)育的規(guī)律;n認(rèn)識(shí)種屬之間和個(gè)體之間存在差異的起因、認(rèn)識(shí)疾病產(chǎn)生的機(jī)制以及長壽與衰老等生命現(xiàn)象、為疾病的診治提供科學(xué)依據(jù)。5.2 人類基因組草圖的完成 2000年6月26日是人類歷史上值得紀(jì)念的一天。人類基因組的工作草圖已經(jīng)繪制完畢并于這天向全世界公布。最終完成圖要求測序所用的克隆能忠實(shí)地代表常染色體的基因組結(jié)構(gòu),序列錯(cuò)誤率低于萬分之一。隨機(jī)測序與序列組裝方法和指導(dǎo)測序與序列組裝方法相結(jié)合進(jìn)行序列組裝5.4 人類基因組測序結(jié)果 基因數(shù)是基因數(shù)是3萬、萬、4萬還是萬還是10萬萬 人類遺傳基因數(shù)量比原

11、先估計(jì)的少很多。目前研究表明,人類基因組中約有3萬至4萬個(gè)蛋白編碼基因,僅僅是果蠅基因數(shù)目的兩倍,人有而鼠沒有的基因只有300個(gè)。此結(jié)論是由兩大科研小組的數(shù)據(jù)是從DNA水平上得出的;而“人類有10萬多個(gè)基因”則是從RNA水平上得出的結(jié)論。所以,這些數(shù)據(jù)不能推翻“人類有10萬個(gè)基因”的說法。人類基因組研究的驚人發(fā)現(xiàn) 19號(hào)染色體是含基因最豐富的染色體,而13號(hào)染色體含基因量最少目前已經(jīng)發(fā)現(xiàn)和定位了26000多個(gè)功能基因,其中尚有42%的基因尚不知道功能人類基因組中存在“熱點(diǎn)”和大片“荒漠”。在染色體上有基因成簇密集分布的區(qū)域,也有大片的區(qū)域只有“無用DNA” 不包含或含有極少基因的成分?;蚪M上

12、大約有14的區(qū)域沒有基因的片段。 353的基因包含重復(fù)的序列。這說明那些原來被認(rèn)為是“垃圾”的DNA也起重要作用,應(yīng)該被進(jìn)一步研究。什么是單核苷酸多態(tài)性 人類999的基因密碼是相同的,而差異不到01,不同人群僅有140萬個(gè)核苷酸差異。這些差異是由“單一核苷酸多樣性”(SNP)產(chǎn)生的,它構(gòu)成了不同個(gè)體的遺傳基礎(chǔ),個(gè)體的多樣性被認(rèn)為是產(chǎn)生遺傳疾病的原因。在整個(gè)基因組序列中,人與人之間的變異僅為萬分之一,從而說明人類不同“種屬”之間并沒有本質(zhì)上的區(qū)別。 5.5 人類基因組計(jì)劃的意義 隨著人類基因組逐漸被破譯,一張生命之圖將被繪就,人們的生活也將發(fā)生巨大變化。人類基因研究的意義在于它可以支持和推動(dòng)生命科學(xué)中一系列重要的基礎(chǔ)性研究。如基因組遺傳語言的破譯,基因的結(jié)構(gòu)與功能關(guān)系,生命的起源和進(jìn)化,細(xì)胞發(fā)育、生產(chǎn)、分化的分子機(jī)理,疾病發(fā)生的機(jī)理等。5.6 人類基因組計(jì)劃的論理學(xué)6. 后人類基因組計(jì)劃 伴隨著人類基因組計(jì)劃的迅速進(jìn)展,基因的全序列逐步被完整的測出,會(huì)出現(xiàn)大量的不知道任何功能信息的序列。因此,在HGP完成之后,即全部人類基因被定序之后,還需要:n破解貯存于基因組之中的遺傳語言;n識(shí)別、分離、鑒定和克隆所有基因;n搞清每個(gè)基因的功能及基因之間的相互作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論