已閱讀5頁,還剩141頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2020 1 15 1 第三章基因 基因組和基因組學 基因的化學本質是DNA 它是遺傳信息的物質載體 傳遞著支配生命活動的指令 是構建生物體藍圖中的一頁 也是可以人工操作用于改造生命屬性的元件 2020 1 15 2 基因組是指生物體的細胞中一套完整的遺傳信息 包括所有的基因和基因間區(qū)域 專門研究基因組結構和功能的學科 稱為基因組學 它主要通過基因組作圖 基因測序和基因定位等方法來研究基因組結構和變異 2020 1 15 3 第一節(jié)基因的概念 一 對基因的認識對基因的認識和研究大體上可以分為三個階段 1 在20世紀50年代以前 主要從細胞的染色體水平上進行研究 屬于基因的染色體遺傳學階段 2 50年代以后 主要從DNA大分子水平上進行研究 屬于基因的分子生物學階段 2020 1 15 4 3 最近20多年來 由于重組DNA技術的完善和應用 人們改變了從表型到基因的傳統(tǒng)研究途徑 而能夠直接從克隆目的基因出發(fā) 研究基因的功能及其與表型的關系 使基因的研究進入了反向生物學階段 反向生物學是指利用重組DNA技術和離體定向誘變的方法研究結構已知基因的相應功能 在體外使基因突變 再導入體內 檢測突變的遺傳效應 即以表型來探索基因的結構和功能 2020 1 15 5 二 基因概念的擴展分子生物學和分子遺傳學的不斷發(fā)展 特別是DNA分子克隆技術 DNA序列的快速測定 以及核酸分子雜交技術等現(xiàn)代實驗手段的不斷涌現(xiàn) 為進一步深入研究基因結構和功能提供了條件 移動基因 斷裂基因 假基因 重疊基因 等有關基因的新概念 豐富了對基因本質的認識 2020 1 15 6 1 移動基因移動基因 movablegenes 又稱轉位因子 transposableelements 由于它可以從染色體基因組上的一個位置轉移到另一個位置 甚至在不同染色體之間躍遷 因此也稱跳躍基因 jumpinggenes 2020 1 15 7 轉位和易位是兩個不同的概念 易位是指染色體發(fā)生斷裂后 通過同另一條染色體斷端連接轉移到另一條染色體上 此時 染色體斷片上的基因也隨著染色體的重接而移動到新的位置 轉位則是在轉位酶的作用下 轉位因子或是直接從原來位置上切離下來 然后插入染色體新的位置 或是染色體上的DNA序列轉錄成RNA 隨后反轉錄為cDNA 再插入染色體上新的位置 這樣 在原來位置上仍然保留轉位因子 而其拷貝則插入新的位置 也就是使轉位因子在基因組中的拷貝數(shù)又增加一份 2020 1 15 8 2 斷裂基因或不連續(xù)基因通過對真核生物編碼基因的研究發(fā)現(xiàn) 在編碼序列中間插有與氨基酸編碼無關的DNA間隔區(qū) 這些間隔區(qū)稱為內含子 intron 內元 介入序列或間隔子 而編碼區(qū)則稱為外顯子 exon 外元或表達子 含有內含子的編碼序列稱為不連續(xù)基因或斷裂基因 splitgenes 2020 1 15 9 斷裂基因最早是在腺病毒中發(fā)現(xiàn)的 Sharp及其同事在R 嚕噗 R loop 實驗中發(fā)現(xiàn) 腺病毒的hexon基因在與其相對應的成熟轉錄產物mRNA進行雜交時 會出現(xiàn)DNA嚕噗環(huán) 圖3 1 說明 mRNA分子與其模板DNA相比 丟失了一些基因片段 后來證實 這些片段是在mRNA加工過程中從初級轉錄本上被 剪切出去 的 2020 1 15 10 2020 1 15 11 內含子的起源和它存在的生物學意義是一個極其誘人的研究課題 但是目前還不完全清楚 可能與基因的分子進化相關 2020 1 15 12 斷裂基因在表達時首先轉錄成初級轉錄產物 即前體mRNA或核內不均一RNA hnRNA 然后經過刪除和連接 除去無關的DNA內含子序列的轉錄物 稱為成熟的mRNA分子 這種刪除內含子 連接外顯子的過程 稱為RNA拼接 RNAsplicing 圖3 2 2020 1 15 13 2020 1 15 14 例外 現(xiàn)在已經知道 并非所有的內含子都 含而不顯 有些內含子可以編碼蛋白質 這些蛋白質的功能與內含子序列的刪除或傳播擴散相關 如1980年 Church等人發(fā)現(xiàn)酵母線粒體細胞色素氧化酶基因的內含子產物是該基因mRNA前體進行拼接的反式作用因子 2020 1 15 15 真核生物的外顯子也并非都 顯 編碼氨基酸 除了tRNA基因和rRNA基因的外顯子是理所當然地不顯以外 幾乎全部的蛋白質基因的首尾兩個外顯子都只有部分核苷酸序列編碼氨基酸 還有完全不編碼氨基酸的外顯子 如人類尿激酶基因的第一個外顯子的88個核苷酸序列 2020 1 15 16 3 假基因有些基因核苷酸序列與相應的正常功能基因基本相同 但卻不能合成出功能蛋白質 這些失活基因稱為假基因 pseudogene 通常用 表示 1977年在爪蟾的5S基因家族中首先發(fā)現(xiàn)了假基因 以后在珠蛋白基因家族 免疫球蛋白基因家族以及組織相容性抗原基因家族中也都發(fā)現(xiàn)了假基因 2020 1 15 17 如 珠蛋白基因編碼血紅蛋白的珠蛋白鏈 人類珠蛋白基因由分別位于不同染色體上的兩個相關的基因家族 和 組成 其中 人類的 簇分布在50kb范圍的DNA上 包含5個有功能的基因 兩個 和一個假基因 1 兩個 基因只有一個氨基酸的差別 第136位在 G中為Gly 而在 A為Ala 2020 1 15 18 簇含有3個功能基因 3個假基因和1個未知功能的 基因 排列順序為 2 1 2 1 圖3 3 序列分析表明 1基因同三個有功能的 珠蛋白基因DNA序列相似 1基因同有功能的 2基因的序列相似性為73 只是假基因中含有很多突變 如起始密碼子ATG變成GTG 5 端的兩個內含子也有突變 可能導致RNA拼接的破壞 在編碼區(qū)內也存在許多點突變和缺失 2020 1 15 19 2020 1 15 20 假基因的來源 來源一 1假基因被認為是由 珠蛋白基因復制產生的 開始復制生成的基因是有功能的 后來在進化中產生了一個失活突變 由于該基因是復制產生的 所以盡管失去了功能 但是不至影響到生物體的存活 隨后在假基因中又積累了更多的突變 從而形成了現(xiàn)今的假基因序列 2020 1 15 21 除了重復的假基因外 在真核生物的染色體基因組中還存在著一類加工的假基因 processedpseudogene 這類假基因不與 親本基因 連鎖 結構與轉錄本而非 親本基因 相似 如都沒有啟動子和內含子 但在基因的3 端都有一段延伸的腺嘌呤短序列 類似mRNA3 末端的polyA尾巴 這些特征表明 假基因的來源二 這類假基因很可能來自加工后的RNA的DNA拷貝 稱為加工的假基因 2020 1 15 22 4 重疊序列傳統(tǒng)的基因概念把基因看作彼此獨立的 非重疊的實體 但是 隨著DNA測序技術的發(fā)展 在一些噬菌體和動物病毒中發(fā)現(xiàn) 不同基因的核苷酸序列有時是可以共用的 也就是說 它們的核苷酸序列可以是彼此重疊的 這種具有獨立性但使用部分共同序列的基因稱為重疊基因 overlappinggenes 或嵌套基因 nestedgenes 2020 1 15 23 如 大腸桿菌 X174噬菌體單鏈DNA共有5387個核苷酸 如果使用單一的讀碼結構 它最多只能編碼1795個氨基酸 按每個氨基酸的平均分子量為110計算 該噬菌體所合成的全部蛋白質總分子量最多為197000 2020 1 15 24 但實際測定發(fā)現(xiàn) X174噬菌體共編碼11種蛋白質 總分子量高達262000 如何設計實驗解釋 1977年 Sanger等人測定了 X174噬菌體的核苷酸序列 發(fā)現(xiàn)它的一部分DNA能夠編碼兩種不同的蛋白質 從而解釋了上述矛盾 2020 1 15 25 根據Sanger等人的研究 X174噬菌體DNA中存在兩種不同的重疊基因 第一種是一個基因的核苷酸序列完全包含在另一個基因的核苷酸序列中 例如 B基因位于A基因之中 E基因位于D基因中 只是它們的讀碼結構不同 因此編碼不同的蛋白質 圖3 4 2020 1 15 26 第二種類型 兩個基因的核苷酸序列的末端密碼子相互重疊 例如 A基因終止密碼子的3個核苷酸TGA 與C基因的起始密碼子ATG相互重疊了2個核苷酸 D基因的終止密碼子TAA與J基因的起始密碼子ATG重疊了一個核苷酸 后來在G4病毒的單鏈環(huán)狀DNA基因組中還發(fā)現(xiàn)三個基因共有一段重疊的DNA序列 2020 1 15 27 不僅在細菌 噬菌體和病毒等低等生物基因組中存在重疊序列 在一些真核生物中也存在不同于原核生物的其它類型的重疊序列 有一種特殊的重疊基因 一個基因的編碼序列完全寓居于另一個基因的內含子序列中 例如果蠅的GART基因 該基因編碼參與嘌呤生物合成的酶蛋白 的內含子中寓居著一個與之無關的編碼蛹角質膜蛋白 cuticleprotein 的基因 但是它的轉錄方向與GART基因相反 2020 1 15 28 重疊基因是近年來在基因結構與功能研究上的一個非常有意義的發(fā)現(xiàn) 它修正了關于各個基因的多核苷酸序列彼此分立 互不重疊的傳統(tǒng)觀念 目前在 X174噬菌體 G4噬菌體以及一些病毒和少數(shù)真核基因中發(fā)現(xiàn)了重疊基因的現(xiàn)象 但是 它是否具有普遍意義 特別是在真核生物中是否廣泛存在 都還有待于進一步深入研究 2020 1 15 29 三 基因的種類和結構 1 基因的種類基因按其功能主要分為結構基因 調控基因和RNA基因 1 結構基因 structuregene 結構基因是能決定某些多肽鏈 蛋白質 或酶分子結構的基因 結構基因的突變可導致特定蛋白質 或酶 一級結構的改變 2020 1 15 30 2 調控基因 regulatorgene 調控基因是具有調節(jié)控制結構基因表達功能的基因 調控基因的突變可以影響一個或多個結構基因的功能 導致蛋白質 或酶 量或活性的改變 3 RNA基因 有的基因只轉錄不翻譯 如核糖體RNA基因和轉運RNA基因 產物分別為rRNA和tRNA 2020 1 15 31 圖3 6原核基因的典型結構 2 基因的結構 2020 1 15 32 圖3 5真核基因的典型結構 2020 1 15 33 真核生物基因以單順反子的形式存在 編碼單基因產物 原核生物的基因以多順反子的形式存在 轉錄產生的mRNA 可同時編碼兩種甚至數(shù)種基因產物 2020 1 15 34 四 生物體內基因的大小和數(shù)目 1 基因的大小真核生物中 由于內含子序列的存在 基因比實際編碼蛋白質的序列要大得多 外顯子的大小與基因的大小沒有必然的聯(lián)系 與整個基因相比 編碼蛋白質的外顯子要小得多 大多數(shù)外顯子編碼的氨基酸數(shù)小于100 2020 1 15 35 內含子通常比外顯子大得多 因此基因的大小取決于它所包含的內含子的長度 一些基因的內含子特別長 例如哺乳動物的二氫葉酸還原酶基因含有6個外顯子 其mRNA的長度為2kb 但基因的總長度達25 31kb 含有長達幾十kb的內含子 內含子之間也有很大的差別 大小從幾百個堿基對到幾萬個堿基對不等 2020 1 15 36 基因的大小還與所包含的內含子的數(shù)目有關 在不同的基因中 內含子的數(shù)目變化很大 有些斷裂基因含有一個或少數(shù)幾個內含子 如珠蛋白基因 某些基因含有較多的內含子 如雞卵清蛋白基因有7個內含子 伴清蛋白基因含有16個內含子 2020 1 15 37 由于基因的大小取決于內含子的長度和數(shù)目 導致酵母和高等真核生物的基因大小差異很大 大多數(shù)酵母基因小于2kb 很少有超過5kb的 而高等真核生物的大多數(shù)基因長度在5 100kb之間 2020 1 15 38 表3 1不同生物的平均基因大小 2020 1 15 39 2 基因的數(shù)目從基因組的大小可以粗略地算出基因的數(shù)目 雖然一些基因通過選擇性表達可以產生一個以上的產物 但這種現(xiàn)象并不常見 對基因數(shù)目的計算影響不大 2020 1 15 40 為準確地確定基因數(shù)目 需要知道整個基因組的DNA序列和基因密度 目前已知酵母基因組的全序列 其基因密度較高 平均每個開放閱讀框 openreadingframe ORF 為1 4kb 基因間的平均分隔為600bp 即大約70 的序列為開放閱讀框 其中約一半基因是已知的基因或與已知基因有關的基因 其余是新基因 因此可推測未發(fā)現(xiàn)基因的數(shù)目 2020 1 15 41 表3 2不同生物的基因數(shù)目 2020 1 15 42 如果不知道基因組的基因密度 就難以估計基因數(shù)目 可采取的方法有 基因分離鑒定計算表達基因的數(shù)目突變分析 2020 1 15 43 五 基因簇與重復基因1 基因家族和基因簇基因家族 genefamily 是真核生物基因組中來源相同 結構相似 功能相關的一組基因 盡管基因家族各成員序列上具有相關性 但序列相似的程度以及組織方式不同 其中大部分有功能的家族成員之間相似程度很高 有些家族成員間的差異很大 甚至有無功能的假基因 2020 1 15 44 基因家族的成員在染色體上的分布形式是不同的 有些基因家族的成員在特殊的染色體區(qū)域上成簇存在 另一些基因家族的成員在整個染色體上廣泛地分布 甚至可存在于不同的染色體上 2020 1 15 45 根據家族成員的分布形式 可以把不同的基因家族分為成簇存在的基因家族 clusteredgenefamily 即基因簇以及散布的基因家族 interspersedgenefamily 2020 1 15 46 1 基因簇 genecluster 基因家族的各成員緊密成簇排列成大段的串聯(lián)重復單位 定位于染色體的特殊區(qū)域 它們是同一個祖先基因擴增的產物 基因簇中也包括沒有生物功能的假基因 通?;虼貎雀餍蛄虚g的同源性大于基因簇間的序列同源性 2020 1 15 47 2 散布的基因家族 家族成員在DNA上無明顯的物理聯(lián)系 甚至分散在多條染色體上 各成員在序列上有明顯差別 其中也含有假基因 但這種假基因與基因簇中的假基因不同 它們來源于RNA介導的轉座作用 2020 1 15 48 按照基因家族成員之間序列相似的程度 可把基因家族分為以下幾類 1 經典的基因家族 家族中各基因的全序列或至少編碼序列具有高度的同源性 如rRNA基因家族和組蛋白基因家族 在進化過程中 這些家族成員有自動均一化的趨勢 它們的特點是 各成員間有高度的序列一致性 甚至完全相同 拷貝數(shù)高 常有幾十個甚至幾百個拷貝 非轉錄的間隔區(qū)短而且一致 2020 1 15 49 2 基因家族各成員的編碼產物上具有大段的高度保守氨基酸序列 這對基因發(fā)揮功能是必不可少的 基因家族的各基因中有部分十分保守的序列 但總的序列相似性卻很低 3 家族各成員的編碼產物之間只有一些很短的保守氨基酸序列 從DNA水平上看 這些基因家族成員之間的序列同源性更低 但其基因編碼產物具有相同的功能 因為在蛋白質中存在發(fā)揮生物功能所必不可少的保守區(qū)域 2020 1 15 50 4 超基因家族 genesuperfamily 家族中各基因序列間沒有同源性 但其基因產物的功能相似 蛋白質產物中雖沒有明顯保守的氨基酸序列 但從整體上看卻有相同的結構特征 如免疫球蛋白家族 2020 1 15 51 2 重復序列除了基因家族外 染色體上還有大量無轉錄活性的重復DNA序列家族 主要是基因以外的DNA序列 重復序列有兩種組織形式 一種是串聯(lián)重復DNA 成簇存在于染色體的特定區(qū)域 另一種是散布的重復DNA 重復單位并不成簇存在 而是分散于染色體的各個位點上 來源于RNA介導的轉座作用 散布的重復序列家族的許多成員是可轉移的元件 是不穩(wěn)定的 可轉移到基因組的不同位置 2020 1 15 52 1 串聯(lián)重復DNA有些高度重復DNA序列的堿基組成和浮力密度同主體DNA有區(qū)別 在浮力密度梯度離心時 可形成不同于主DNA帶的衛(wèi)星帶 稱為衛(wèi)星DNA 衛(wèi)星DNA由非常短的串聯(lián)重復DNA序列組成 這些序列一般對應于染色體上的異染色質區(qū)域 2020 1 15 53 有些高度重復序列的堿基組成與主體DNA相差不大 不能通過浮力密度梯度離心法分離 但可以通過其它方法鑒定 如限制性作圖 這樣的DNA序列稱為隱蔽衛(wèi)星DNA 2020 1 15 54 根據重復單位的大小 這些非編碼的高度重復的DNA序列可以進一步分為衛(wèi)星DNA satelliteDNA 小衛(wèi)星DNA minisatelliteDNA 微衛(wèi)星DNA microsatelliteDNA 三類 表3 3 2020 1 15 55 表3 3人類基因組的主要串聯(lián)重復序列 2020 1 15 56 2 散布的重復DNA重復序列以散在方式分布于基因組內 根據重復序列的長短不同 可以分為短散布元件和長散布元件 短散布元件的重復序列長度在500bp以下 在人基因組中的重復拷貝數(shù)達10萬以上 長散布元件的重復序列在1000bp以上 在人類基因組中有上萬份拷貝 2020 1 15 57 在人類基因組中有一種中等重復序列 長約300bp 30萬個成員分散分布在單倍體基因組中 在其170bp處有一個限制性酶AluI的酶切位點 因此被稱為Alu基因家族 Alufamily 人類基因組中 大約平均每隔6kb左右就有一個Alu序列 一般出現(xiàn)在內含子或基因附近 可以作為人類DNA片段的特征標記 2020 1 15 58 Alu家族的廣泛存在暗示它可能具有一定的功能 部分Alu序列中有14bp與乳頭瘤病毒 乙型肝炎病毒的復制起始區(qū)有同源性 因此推測Alu家族可能和真核基因組的復制區(qū)相連接 但是Alu家族的成員數(shù)要比推測的復制區(qū)多10倍 2020 1 15 59 第二節(jié)基因組 基因組 genome 一詞最早出現(xiàn)于1922年 指的是單倍體細胞中所含的整套染色體 近年來 學術界更多地把基因組定義為整套染色體中的全部基因 隨著對不同生物的基因組DNA的測序 人們發(fā)現(xiàn) 對基因組這個名詞需要做出更精確的定義 現(xiàn)在認為 基因組指的是細胞或生物體中所有的DNA 包括所有的基因和基因間隔區(qū)域 2020 1 15 60 原核生物基因組就是原核細胞內構成染色體的一個DNA分子 真核生物有細胞核 染色體位于細胞核內 所以真核生物的核基因組是指單倍體細胞核內整套染色體所含有的DNA分子 除了核基因組以外 真核細胞內還有細胞器基因組 即動物細胞和植物細胞的線粒體基因組以及存在于植物細胞的葉綠體基因組 2020 1 15 61 目前已經完成了多種模式生物如大腸桿菌 酵母菌 線蟲 果蠅和小鼠以及芥南菜等的基因組測序工作 2001年 人類基因組的測序工作也基本完成 2020 1 15 62 一 原核生物基因組原核生物的遺傳信息是雙鏈脫氧核糖核酸分子 DNA 在原核生物中有兩類DNA分子 一是染色體 攜帶了細胞生存和繁殖所必需的所有遺傳信息 二是質粒 是細胞核外獨立存在的DNA分子 與細胞的生長沒有必然的關系 2020 1 15 63 1 細菌染色體的結構所有已知的原核生物的染色體都由DNA的四種不同堿基構成 腺嘌呤 A 鳥嘌呤 G 胸腺嘧啶 T 胞嘧啶 C 每個物種具有特定的平均G C含量 變化范圍從24 支原體 到76 微球菌 多數(shù)為50 左右 2020 1 15 64 原核生物一般只有一個染色體即一個DNA分子 但是在不同生長條件下 染色體分子可能有一個 兩個 甚至更多的拷貝 例如 當大腸桿菌在適宜的生長培養(yǎng)基中培養(yǎng)時 可以有四個以上的染色體拷貝 2020 1 15 65 2 其它自主的遺傳物質 質粒和噬菌體質粒是細菌染色體外的可以自主復制的DNA分子 大多數(shù)質粒都是環(huán)狀超螺旋雙鏈DNA 稱為共價閉合環(huán)狀分子 細胞中質粒DNA分子具有穩(wěn)定的拷貝數(shù) 正常生理條件下 其拷貝數(shù)在世代之間保持不變 2020 1 15 66 質粒DNA和寄主細胞染色體DNA分離 密度梯度離心 當含有溴化乙錠 EtBr 的氯化銫 CsCl 溶液加到大腸桿菌裂解液中時 染色體DNA和質粒DNA因為結合的EtBr分子數(shù)不同而具有不同的密度 在密度梯度離心時形成不同的平衡條帶 達到分離目的 圖3 7 2020 1 15 67 圖3 7氯化銫密度梯度離心法制備質粒 2020 1 15 68 噬菌體是以細菌為寄主的病毒 噬菌體被一層蛋白包膜覆蓋 可以在細菌外生存 再結合到細菌上 噬菌體由兩類生物大分子組成 即蛋白質和核酸 一種病毒顆粒具有一種類型的核酸 2020 1 15 69 噬菌體的核酸 最常見的是雙鏈線性DNA 此外也有雙鏈環(huán)狀DNA 單鏈環(huán)狀DNA 單鏈線性DNA以及單鏈RNA等多種形式 2020 1 15 70 圖3 8噬菌體的生長周期 識別如HIV 2020 1 15 71 適當條件下 噬菌體基因組DNA開始表達噬菌體的殼體蛋白 噬菌體組裝所需蛋白等 在宿主細胞內完成子代噬菌體的組裝 并裂解宿主細胞 釋放子代噬菌體 進入裂解期 噬菌體需要結合到宿主細胞上才能生長和繁殖 2020 1 15 72 二 真核生物基因組大多數(shù)真核生物基因組包含于細胞核內 大部分DNA序列不編碼蛋白質 1 C值矛盾與基因組大小一個單倍體基因組的全部DNA含量總是恒定的 這是物種的一個特征 通常稱為該物種的C值 不同物種的C值差異很大 從小于106bp到1011bp 由圖3 9可見 隨著生物的進化 生物體的結構和功能越復雜 其C值就越大 2020 1 15 73 圖3 9單倍體基因組DNA含量在低等真核生物中與形態(tài)復雜性有一定的正相關 但在高等真核生物中卻非如此 它們的單倍體基因組DNA含量變化不定 2020 1 15 74 在結構 功能很相似的同類生物中 甚至在親緣關系非常接近的物種之間 C值可以相差數(shù)十倍乃至上百倍 突出的例子是兩棲動物 C值小的可以低至109bp以下 C值大的可以高達1011bp 而哺乳類動物C值均在109bp 這種現(xiàn)象稱為C值矛盾 2020 1 15 75 2 重復序列真核生物基因組序列包括三種類型 分別是快復性組分即高度重復序列 占總DNA的25 中度復性成分即中度重復序列 占總DNA的30 慢復性組分即非重復序列 占總DNA的45 2020 1 15 76 3 細胞器基因組除了在低等的真核生物中有一些線性的細胞器DNA外 大多數(shù)真核生物中 細胞器基因組都是環(huán)狀非重復DNA序列 每個細胞中有多個細胞器 因此有多個獨立存在的細胞器基因組 2020 1 15 77 1 線粒體基因組動物細胞線粒體基因組比較小 人 鼠和牛的線粒體基因組都只有16 5kb 與核DNA相比 線粒體DNA所占的比例不到1 酵母線粒體基因組很大 釀酒酵母的線粒體基因組為84kb 而且每個線粒體中有4個拷貝 2020 1 15 78 圖3 10人線粒體基因組 2020 1 15 79 現(xiàn)代研究發(fā)現(xiàn)線粒體DNA的重要性 線粒體有自己的蛋白質合成體系 其中rRNA和tRNA均由線粒體自身基因組編碼合成 線粒體tRNA比核基因編碼的tRNA要小 核糖體也比較小 其RNA聚合酶 氨酰 tRNA合成酶和核糖體蛋白質均由核基因編碼 但卻是細胞器專用的 不同于細胞質中的蛋白質合成系統(tǒng) 2020 1 15 80 線粒體中其它蛋白質的合成也常常由核基因和線粒體基因共同參與 如酵母線粒體中ATP合成酶 細胞色素c氧化酶的各亞基 細胞色素bc1復合物都是核基因組和細胞器基因組共同編碼的 2020 1 15 81 2 葉綠體基因組葉綠體基因組相對來說比較大 從高等植物的140kb到低等真核生物的200kb 葉綠體基因組可編碼與蛋白質合成有關的rRNA和tRNA 以及大約50種蛋白質 包括RNA聚合酶和一些核糖體蛋白 2020 1 15 82 4 染色體和染色質染色體是細胞在有絲分裂時遺傳物質存在的特定形式 是間期細胞染色質結構緊密包裝的結果 染色體和染色質是真核生物遺傳物質存在的兩種不同形態(tài) 反映了它們處于細胞分裂周期的不同功能階段 兩者不存在成分上的差異 2020 1 15 83 染色質 chromatin 是指真核生物細胞核中 在細胞分裂期間能被堿性染料著色的物質 由DNA 組蛋白 非組蛋白和少量RNA組成 是細胞分裂間期遺傳物質的存在形式 染色質由最基本的單位 核小體成串排列而成的 2020 1 15 84 染色質根據形態(tài)特征和染色性能可分為兩種類型 常染色質 euchromatin 和異染色質 heterochromatin 常染色質中DNA的包裝比 packingration 約為1000 2000 即DNA的實際長度是染色質長度的1000倍 2000倍 2020 1 15 85 構成常染色質的DNA主要是單一序列DNA和中度重復序列DNA 常染色質中并非所有基因都具有轉錄活性 處于常染色質狀態(tài)只是基因轉錄的必要條件 而不是充分條件 2020 1 15 86 異染色質分為結構異染色質或組成型異染色質和兼性異染色質 結構異染色質指的是除復制期外 在整個細胞周期均處于聚縮狀態(tài) DNA包裝比在整個細胞周期中基本沒有較大變化的異染色質 主要包括衛(wèi)星DNA序列 著絲粒區(qū) 端粒 次縊痕和染色體臂的某些節(jié)段等 2020 1 15 87 兼性異染色質是指在某些細胞類型或一定的發(fā)育階段 原來的常染色質聚縮 并喪失基因轉錄活性 變?yōu)楫惾旧| 兼性異染色質的總量隨不同細胞類型而變化 一般胚胎細胞含量很少 而高度特化的細胞含量較多 說明隨著細胞分化 較多的基因漸次以聚縮狀態(tài)而關閉 再也不能接近基因活化蛋白 染色質的緊密折疊壓縮可能是關閉基因活性的一種途徑 2020 1 15 88 最典型的例子就是哺乳動物雌性個體中的兩個X染色體中有一個隨機失活 失去轉錄活性而導致異染色質化 2020 1 15 89 5 染色體功能實現(xiàn)的三要素任何真核生物染色體的生物學功能都嚴格依賴于三種DNA序列結構 復制起點 著絲粒和端粒 2020 1 15 90 1 復制起點 ARS DNA序列分析發(fā)現(xiàn) 不同來源的ARS序列包含一段11 14bp的高度同源的富含AT的共有序列及其上下游各200bp左右的區(qū)域 這是維持ARS功能所必需的 絕大多數(shù)真核細胞的染色體 含有多個復制起點 以確保染色體快速復制 2020 1 15 91 2 著絲粒DNA序列 CEN 著絲粒就是細胞分裂過程中染色體與紡錘絲 spindlefiber 結合的區(qū)域 因此 著絲粒在細胞分裂過程中對于母細胞中的遺傳物質能否均衡地分配到子細胞中去是至關重要的 缺少著絲粒的染色體片斷 就不能和紡錘絲相連 在細胞分裂過程中容易丟失 2020 1 15 92 CEN序列的共同特點是含有兩個相鄰的核心區(qū) 80 90bp的AT區(qū) 11bp的保守區(qū) 缺失損傷試驗和插入突變實驗發(fā)現(xiàn)一旦傷及這兩個核心區(qū)序列 CEN即喪失生物學功能 2020 1 15 93 3 端粒DNA序列 TEL 端粒由一系列短重復序列構成 在人類的DNA里 端粒長約10至15kb 由重復的GGGTTA組成 其它生物端粒的重復序列也多為T和G 端粒的重復序列不是染色體DNA復制時連續(xù)合成的 而是由端粒酶 telomerase 合成 添加到染色體末端的 2020 1 15 94 2020 1 15 95 端粒酶是由RNA和蛋白質組成的核糖核蛋白 具有逆轉錄酶的性質 可以以特異的內在RNA為模板 合成端粒重復序列 添加到染色體的3 端 端粒與細胞壽命有關 在細胞內起著細胞分裂計時器的作用 端粒長度與細胞分裂次數(shù)和細胞的衰老有關 腫瘤細胞具有端粒酶活性 使癌細胞獲得無限增殖的能力 2020 1 15 96 三 人類基因組計劃 人類基因組計劃 HumanGenomeProject HGP 和 曼哈頓原子彈計劃 人類登月計劃 一起被譽為二十世紀科學史上的三個里程碑 1985年5月 美國能源部正式提出開展人類基因組的測序工作 形成了能源部的 人類基因組計劃 草案 1986年 美國生物學家 諾貝爾獎獲得者RenatoDulbecco在 Science 上發(fā)表短文首次提出人類基因組計劃的設想 2020 1 15 97 并建議組織國家級和國際級的項目來進行這方面的研究 1986年3月美國能源部在召開的一次專門會議上 正式提出實施測定人類基因組全順序的計劃 1988年4月 國際人類基因組織 HUGO 成立 1988年10月美國能源部和美國國立衛(wèi)生研究院達成協(xié)議 共同管理和實施這一計劃 1990年10月由美國國會批準正式啟動HGP研究 隨后法國 英國 意大利 德國 日本等也相繼宣布開始各自的HGP研究 中國于1987年在 863計劃 中開始設立人類基因組研究課題 2020 1 15 98 人類基因組計劃是一項國際性的研究計劃 目標是通過以美國為主的全球性的國際合作 在大約15年的時間里完成人類24條染色體的基因組作圖和DNA全長序列分析 進行基因的鑒定和功能分析 人類基因組計劃的最終目標是確定人類基因組所攜帶的全部遺傳信息 并確定 闡明和記錄組成人類基因組的全部DNA序列 2020 1 15 99 具體任務有以下幾個方面 1 基因組作圖繪制兩大人類基因組圖譜 即遺傳連鎖圖譜和物理圖譜 遺傳連鎖圖譜是通過家譜分析和遺傳性狀的連鎖分析而建立的 物理圖譜是通過對構成人類基因組的脫氧核糖核酸分子的化學測定而繪制的 包括限制酶切圖譜 排序的脫氧核糖核酸克隆庫以及對表達基因或無特征 功能不清 的脫氧核糖核酸片段的低分辨圖譜 2020 1 15 100 所有圖譜的目標都是把有關基因的遺傳信息 按其在每條染色體上相對位置線性地系統(tǒng)地排列出來 2020 1 15 101 2 基因組測序 genomesequencing 基因組的核苷酸順序是分辨率最高的物理圖譜 就人而言 意味著要排出30億個核苷酸的順序 同時 測定其它生物的基因組順序 以便與人類基因組進行比較研究 3 基因識別 geneidentification 在作圖 基因定位和測序的同時 識別出基因的序列 設法克隆基因 以及著手研究基因的生物學功能 2020 1 15 102 4 模式生物 modelorganism 研究從模式生物獲得的數(shù)據資料 可以為人類基因組的研究進行技術的探索和經驗的積累 有助于闡明人類的生物學規(guī)律 常用的模式生物有大腸桿菌 酵母菌 線蟲 果蠅和小鼠等 在研究植物基因組時常用的模式生物是擬南芥菜 Arabideopisthaliana 2020 1 15 103 斑馬魚小鼠 2020 1 15 104 5 發(fā)展生物信息學和計算機學隨著基因組研究的開展 全世界各個實驗室每天都產生大量的數(shù)據 其中包括DNA測序 蛋白質的氨基酸序列 基因組作圖標記與定位等 涉及數(shù)據的收集 甄別 組裝 詮釋 分配和使用等各個環(huán)節(jié) 因此 需要建立各種類型的數(shù)據庫 發(fā)展新的計算機設備和軟件 使生物學同信息科學和計算機科學緊密結合 形成了生物信息學 bioinformatics 和計算生物學 computationalbiology 2020 1 15 105 第三節(jié)基因組學 基因組研究應該包括兩方面的內容 以全基因組測序為目標的結構基因組學和以基因功能鑒定為目標的功能基因組學 結構基因組學代表基因組分析的早期階段 以建立生物體高分辨率遺傳圖譜 物理圖譜和大規(guī)模測序為基礎 功能基因組學代表基因分析的新階段 是利用結構基因組學提供的信息系統(tǒng)地研究基因功能 以高通量 大規(guī)模的實驗方法以及統(tǒng)計與計算機分析為特征 2020 1 15 106 隨著人類基因組作圖和基因組測序工作的完成 當前的研究重心從結構基因組學轉移到功能基因組學 2020 1 15 107 一 結構基因組學結構基因組學的內容包括基因組作圖和基因組測序 2020 1 15 108 又稱染色體作圖 由于人的染色體巨大 不能直接用于測序 將人類基因組這一的研究對象進行分解 將其分為容易操作的小的結構區(qū)域 這個過程簡稱為染色體作圖 人類最大的1號染色體有263Mb 最小的21號染色體也有50Mb 根據使用的標記和手段的不同 染色體作圖可以分為遺傳連鎖作圖和物理作圖 2020 1 15 109 1 遺傳學圖又稱連鎖圖譜 linkagemap 它是以具有遺傳多態(tài)性 在一個遺傳位點具有一個以上的等位基因 在群體中的出現(xiàn)頻率皆高于1 的遺傳標記 為 路標 以遺傳學距離 在減數(shù)分裂事件中兩個位點之間進行交換 重組的百分率 1 的重組率稱為1cM 為圖距的基因組圖 2020 1 15 110 人類基因組遺傳連鎖圖的繪制需要應用多態(tài)性標記 人的DNA序列上平均每幾百個堿基會出現(xiàn)一些變異 variation 這些變異通常不產生病理性后果 并按照孟德爾遺傳規(guī)律由親代傳給子代 從而在不同個體間表現(xiàn)出不同 因而被稱為多態(tài)性 Polymorphism 現(xiàn)在的多態(tài)性標記主要有三種 2020 1 15 111 限制性片段長度多態(tài)性 RFLP RFLP是第1代標記 用限制性內切酶特異性切割DNA鏈 由于DNA的一個 點 上的突變所造成的能切與不能切兩種狀況 而產生不同長度的片段 等位片段 可用凝膠電泳顯示多態(tài)性 用作基因突變分析 基因定位和遺傳病基因的早期檢測等方面 2020 1 15 112 DNA重復序列的多態(tài)性標記人類基因的多態(tài)性較多的是由重復序列造成的 這也是人類基因組的重要特點之一 重復序列的多態(tài)性有小衛(wèi)星DNA多態(tài)性或不同數(shù)目的串聯(lián)重復 VNTR 的多態(tài)性和微衛(wèi)星的DNA多態(tài)性等多種 2020 1 15 113 指的是基因組DNA中有數(shù)十到數(shù)百個核苷酸片段的重復 重復的次數(shù)在人群中有高度變異 總長不超過20kb 是一種遺傳信息量很大的標記物 可以用Southern雜交或PCR法檢測 2020 1 15 114 是基因組中由1 6個堿基的重復 如 CA n GT n等產生的 以CA重復序列的利用度為最高 微衛(wèi)星DNA重復序列在染色體DNA中散在分布 其數(shù)量被認為可達五到十萬 是目前最有用的遺傳標記 第二代DNA遺傳標記多指STR標記 2020 1 15 115 單核苷酸多態(tài)性標記 SNP 是1996年美國MIT的E Lander提出的 被稱為 第三代DNA遺傳標記 這種遺傳標記的特點是單個堿基的置換 與第一代的RFLP及第二代的STR以長度的差異作為遺傳標記的特點不同 而且SNP的分布密集 每千個核苷酸中可出現(xiàn)一個SNP標記位點 2020 1 15 116 在人類基因組中有300萬個以上的SNP遺傳標記 這可能達到了人類基因組多態(tài)位點數(shù)目的極限 這些SNP標記以同樣的頻率存在于基因組編碼區(qū)或非編碼區(qū) 存在于編碼區(qū)的SNP約有20萬個 稱為cSNP codingSNP 2020 1 15 117 2 物理圖譜 physicalmap 是指DNA序列上兩點的實際距離 通常由DNA的限制酶片段或克隆的DNA片段有序排列而成 其基本單位是千堿基對 Kb 或百萬堿基對 Mb 連鎖圖譜 2020 1 15 118 物理圖譜反應的是DNA序列上兩點之間的實際距離 而遺傳圖譜則反應這兩點之間的連鎖關系 在DNA交換頻繁的區(qū)域 兩個物理位置相距很近的基因或DNA片段可能具有較大的遺傳距離 而兩個物理位置相距很遠的基因或DNA片段則可能因該部位在遺傳過程中很少發(fā)生交換而具有很近的遺傳距離 2020 1 15 119 全基因組的 鳥槍法 測序策略全基因組的 鳥槍法 測序策略 是指在獲得一定的遺傳和物理圖譜信息的基礎上 繞過建立連續(xù)的BAC克隆系的過程 直接將基因組DNA分解成小片段 進行隨機測序 并輔以一定數(shù)量的10kb克隆和BAC克隆的末端測序結果 在此基礎上進行序列拼接 直接得到待測基因組的完整序列 2020 1 15 120 2020 1 15 121 這一策略從一提出就受到質疑 并不為主流的公共領域所采納 1995年 由CraigVenter領導的私營研究所TIGR TheInstituteofGenomicResearch 將這種方法應用于對嗜血流感桿菌 H influenzae 全基因組的測序中 成功的測定了它的全基因組序列 該方法隨后在對包括枯草桿菌 大腸桿菌等20多種微生物的基因組測序中得到了成功的應用 2020 1 15 122 1998年 TIGR和PE公司聯(lián)合組建了一個新的Celera公司 宣布計劃采用全基因組的 鳥槍法 測序策略 在2003年底前測定人類的全部基因組序列 接著 Celera公司與加州大學伯克利果蠅計劃 BDGD 合作 僅用了4個月的時間 就用全基因組的 鳥槍法 測序策略完成了果蠅基因組120Mb的全序列測定和組裝 證明了這一技術路線的可行性 成為利用同一策略進行人類基因組測序的一次預實驗 2020 1 15 123 cDNA測序人類基因組中發(fā)生轉錄表達的序列 即基因 僅占總序列的約5 對這一部分序列進行測定將直接導致基因的發(fā)現(xiàn) 由于與重要疾病相關的基因或具有重要生理功能的基因具有潛在的應用價值 使得cDNA測序受到制藥工業(yè)界和研究機構的青睞 紛紛投入重金進行研究并搶占專利 2020 1 15 124 cDNA測序的研究重點首先放在基因表達的短CDNA序列 EST 測序 比較不同條件下 如正常組織和腫瘤組織 的EST測序結果 可以獲得豐富的生物學信息 如基因表達與腫瘤發(fā)生 發(fā)展的關系 其次 利用EST可以對基因進行染色體定位 2020 1 15 125 至2005年5月13日 公共數(shù)據庫內有26 858 818條EST 其中人類EST有6 057 800 更多的EST和全長cDNA則掌握在一批以基因組信息為產品的生物技術公司手中 2020 1 15 126 隨著研究的深入 EST測序固有的局限性變得日益顯著 首先 由于文庫構建的原因 絕大多數(shù)EST分布在基因的3 端 數(shù)據庫中代表基因5 上游信息的EST只占很小的比例 其次 EST的長度都在300 500bp之間 僅從EST中很難獲得基因結構的全部信息 如基因的不同拼接形式 2020 1 15 127 鑒于此 cDNA研究的熱點目前已由EST轉變?yōu)槿LcDNA研究 美國國立癌癥研究院 NCI 最近決定資助每年獲得2萬條全長cDNA的計劃 日本的人類基因組計劃也將獲得全長cDNA列為重點 到1999年底已獲得40 000條全長cDNA 為了獲得全長cDNA 除了利用cDNA末端快速擴增法 RACE 得到cDNA末端 主要是5 端 的序列以外 另外一個關鍵是構建高質量的全長cDNA文庫 2020 1 15 128 模式生物體的基因組測序意義 可以為人類基因組的研究進行技術的探索和經驗的積累 有助于人們在基因組水平上認識進化規(guī)律 可以通過對不同生物體中的同源基因的研究 以及利用模式生物體的轉基因和基因剔除術 knockout 等方法研究基因的功能 2020 1 15 129 人類基因組的測序1998年 由PE公司和TIGR合作成立的Celera公司宣布將在3年時間內完成人類基因組全序列的測定工作 建立用于商業(yè)開發(fā)的數(shù)據庫 并對一大批重要的人類基因注冊專利 面對私營領域的挑戰(zhàn) 公共領域的測序計劃也加快了步伐 2020 1 15 130 2000年6月25日 美 英 日 法 德和中國的16個測序中心或協(xié)作組獲得了占人類基因組21 1 的完成序列及覆蓋人類基因組65 7 的工作草圖 兩者相加達到86 8 同時 對整條染色體的精細測序也獲得突破性進展 1999年12月 英 日 美 加拿大和瑞典科學家共同完成了人類22號染色體的常染色體部分共33 4Mb的測序 2020 1 15 131 2001年2月15日 國際公共領域人類基因組計劃和美國的Celera公司分別在 Nature 和 Science 雜志上公布了人類基因組序列工作草圖 完成全基因DNA序列95 的測序 2003年4月14日 國際人類基因組測序共同負責人FrancisCollins博士宣布 人類基因組序列圖繪制成功 全基因組測序完成99 2020 1 15 132 二 功能基因組學 人類功能基因組學涉及眾多的新技術 包括生物信息學技術 生物芯片技術 轉基因和基因敲除技術 酵母雙雜交技術 基因表達譜系分析 蛋白質組學技術 高通量細胞篩選技術等等 以解決有關基因功能研究中的基本問題 基因何時開始表達 基因表達產物定位于何處 該基因將與其它哪些基因相互影響 該基因如出現(xiàn)突變將會導致什么后果等 2020 1 15 133 1 蛋白質組學是對蛋白質性質和功能的大規(guī)模研究 包括對蛋白質的表達水平 翻譯后修飾以及與其它分子的相互作用的研究 從而可以得到細胞進程在蛋白質水平上的宏觀映象 蛋白質作為mRNA的產物在細胞中行使著大部分的功能 但是蛋白質水平與mRNA水平之間并不一定有嚴格的線性關系 2020 1 15 134 實驗證明 組織中mRNA豐度與蛋白質豐度的相關性并不好 尤其對于低豐度蛋白質來說 相關性更差 蛋白質復雜的翻譯后修飾 蛋白質的亞細胞定位或遷移 蛋白質 蛋白質相互作用等都幾乎無法從mRNA水平來判斷 蛋白質本身的存在形式和活動規(guī)律 必須從直接對蛋白質的研究來解決 內容 蛋白質分離蛋白質分析蛋白質相互作用蛋白質
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年個人借款借條范本編制標準2篇
- 山地生態(tài)旅游項目租賃合同二零二五年度版2篇
- 2025年度個人創(chuàng)業(yè)貸款合同示范文本7篇
- 2025年度臨建板房施工現(xiàn)場廢棄物處理與施工合同4篇
- 2025年度高端門面租賃及品牌推廣合作協(xié)議4篇
- 2025版美容院美容師顧客滿意度調查與改進合同4篇
- 二零二五版智能科技門面租賃合同電子版4篇
- 2025年度高速公路監(jiān)控弱電系統(tǒng)工程合同范本4篇
- 2025年度煤礦安全監(jiān)控系統(tǒng)安裝與維護服務合同4篇
- 2025材皮木糠生物質顆粒生產合作協(xié)議3篇
- 2025年度版權授權協(xié)議:游戲角色形象設計與授權使用3篇
- 心肺復蘇課件2024
- 《城鎮(zhèn)燃氣領域重大隱患判定指導手冊》專題培訓
- 湖南財政經濟學院專升本管理學真題
- 全國身份證前六位、區(qū)號、郵編-編碼大全
- 2024-2025學年福建省廈門市第一中學高一(上)適應性訓練物理試卷(10月)(含答案)
- 《零售學第二版教學》課件
- 廣東省珠海市香洲區(qū)2023-2024學年四年級下學期期末數(shù)學試卷
- 房地產行業(yè)職業(yè)生涯規(guī)劃
- 江蘇省建筑與裝飾工程計價定額(2014)電子表格版
- MOOC 數(shù)字電路與系統(tǒng)-大連理工大學 中國大學慕課答案
評論
0/150
提交評論