第四章 基因與基因組的結(jié)構(gòu)分子生物學(xué)_第1頁
第四章 基因與基因組的結(jié)構(gòu)分子生物學(xué)_第2頁
第四章 基因與基因組的結(jié)構(gòu)分子生物學(xué)_第3頁
第四章 基因與基因組的結(jié)構(gòu)分子生物學(xué)_第4頁
第四章 基因與基因組的結(jié)構(gòu)分子生物學(xué)_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第第4 4章章 基因與基因組的結(jié)構(gòu)與功能基因與基因組的結(jié)構(gòu)與功能(Chapter 4 The Structre and Function of Gene and Genome) 河南科技大學(xué)農(nóng)學(xué)院河南科技大學(xué)農(nóng)學(xué)院 施江施江第第4 4章章 基因與基因組的結(jié)構(gòu)與功能基因與基因組的結(jié)構(gòu)與功能 4.14.1 基因的概念基因的概念 4.24.2 基因的命名基因的命名 4.34.3 基因組基因組 4.44.4 病毒及其基因組病毒及其基因組 4.54.5 細(xì)菌基因組細(xì)菌基因組 4.64.6 真核生物基因組真核生物基因組4.1 4.1 基因的概念基因的概念 18601860至至18701870年年 奧地利科

2、學(xué)家孟德爾根據(jù)豌豆雜交實(shí)驗(yàn)提出遺傳奧地利科學(xué)家孟德爾根據(jù)豌豆雜交實(shí)驗(yàn)提出遺傳因子概念,并總結(jié)出孟德爾遺傳定律。因子概念,并總結(jié)出孟德爾遺傳定律。19091909年年 丹麥植物學(xué)家和遺傳學(xué)家約翰遜丹麥植物學(xué)家和遺傳學(xué)家約翰遜(W.Johannsen(W.Johannsen) )首次提出首次提出“基因基因”這一名詞,用以表達(dá)孟德爾的遺傳因子概念。這一名詞,用以表達(dá)孟德爾的遺傳因子概念。19261926年年 摩爾根(摩爾根(MorganMorgan,美,美,19331933)的基因論。)的基因論。19411941年年 Beadle Beadle 和和TatumTatum(美,(美,19581958)

3、:一個(gè)基因一個(gè)酶學(xué)說。):一個(gè)基因一個(gè)酶學(xué)說。19441944年年 AveryAvery肺炎雙球菌轉(zhuǎn)化實(shí)驗(yàn)。肺炎雙球菌轉(zhuǎn)化實(shí)驗(yàn)。19521952年年 赫爾希(美,赫爾希(美,19691969)和蔡斯:噬菌體大腸桿菌感染實(shí)驗(yàn)。)和蔡斯:噬菌體大腸桿菌感染實(shí)驗(yàn)。19531953年年 美國人沃森(美國人沃森(WatsonWatson)和英國人克里克()和英國人克里克(CrickCrick)通過)通過實(shí)驗(yàn)提出了實(shí)驗(yàn)提出了DNADNA分子的雙螺旋模型(分子的雙螺旋模型(19621962)。)。19571957年年 BenzerBenzer提出一個(gè)順反子提出一個(gè)順反子, ,一條多肽鏈的概念。一條多肽鏈的概

4、念。19581958年年 CrickCrick提出中心法則。提出中心法則。19611961年年 JacobJacob和和MonodMonod(法,(法,19651965)提出了操縱子模型。)提出了操縱子模型。19511951年年 McClintockMcClintock(美,(美,19831983):在玉米中發(fā)現(xiàn)了遺傳因子可):在玉米中發(fā)現(xiàn)了遺傳因子可以轉(zhuǎn)移位置。以轉(zhuǎn)移位置。19691969年年分離出第一個(gè)基因。分離出第一個(gè)基因。19771977年年 Sharp P ASharp P A(加拿大)和(加拿大)和Roberts R JRoberts R J(美)發(fā)現(xiàn)真核生(美)發(fā)現(xiàn)真核生物基因中

5、的斷裂現(xiàn)象(物基因中的斷裂現(xiàn)象(19931993)。)。19781978年年 桑格桑格(F. Sanger(F. Sanger,英國)發(fā)現(xiàn)了重疊基因(測(cè)定了牛胰,英國)發(fā)現(xiàn)了重疊基因(測(cè)定了牛胰島素的一級(jí)結(jié)構(gòu)而獲得島素的一級(jí)結(jié)構(gòu)而獲得19581958年的諾貝爾化學(xué)獎(jiǎng),因設(shè)計(jì)出一種年的諾貝爾化學(xué)獎(jiǎng),因設(shè)計(jì)出一種測(cè)定測(cè)定DNADNA序列的方法而獲得序列的方法而獲得19801980年的諾貝爾化學(xué)獎(jiǎng))。年的諾貝爾化學(xué)獎(jiǎng))。 根據(jù)不同歷史時(shí)期的研究水平和特點(diǎn),基因研究大體根據(jù)不同歷史時(shí)期的研究水平和特點(diǎn),基因研究大體上分為三個(gè)發(fā)展階段上分為三個(gè)發(fā)展階段: : 在在2020世紀(jì)世紀(jì)5050年代以前,主要從

6、細(xì)胞的染色體水年代以前,主要從細(xì)胞的染色體水平上進(jìn)行研究,屬于平上進(jìn)行研究,屬于基因的染色體遺傳學(xué)階段;基因的染色體遺傳學(xué)階段; 2020世紀(jì)世紀(jì)5050年代之后,主要從年代之后,主要從DNADNA大分子水平上進(jìn)大分子水平上進(jìn)行研究,屬于行研究,屬于基因的分子生物學(xué)階段基因的分子生物學(xué)階段; 近近2020年來,由于重組年來,由于重組DNADNA技術(shù)的完善和應(yīng)用,人技術(shù)的完善和應(yīng)用,人們已經(jīng)改變了從表型到基因型的傳統(tǒng)研究基因的途徑,而們已經(jīng)改變了從表型到基因型的傳統(tǒng)研究基因的途徑,而能夠直接從克隆目的基因出發(fā),研究基因的功能及其與表能夠直接從克隆目的基因出發(fā),研究基因的功能及其與表型之間的關(guān)系,

7、使基因的研究進(jìn)入了型之間的關(guān)系,使基因的研究進(jìn)入了反向生物學(xué)階段。反向生物學(xué)階段。 基因:產(chǎn)生功能蛋白質(zhì)或基因:產(chǎn)生功能蛋白質(zhì)或RNARNA所必需的全部所必需的全部DNADNA序序列,包括外顯子、內(nèi)含子以及轉(zhuǎn)錄控制區(qū)。列,包括外顯子、內(nèi)含子以及轉(zhuǎn)錄控制區(qū)。一個(gè)一個(gè)典型的真核基因包括典型的真核基因包括 : : 編碼序列編碼序列外顯子外顯子(exon(exon) ); 插入外顯子之間的非編碼序列插入外顯子之間的非編碼序列內(nèi)含子內(nèi)含子(intron(intron) ); 5-5-端和端和3-3-端端非翻譯區(qū)非翻譯區(qū)(UTR)(UTR); 調(diào)控序列。調(diào)控序列。原核基因的典型結(jié)構(gòu)原核基因的典型結(jié)構(gòu) 4.

8、1.1 4.1.1 基因與基因與DNADNA分子的關(guān)系分子的關(guān)系 順反子是通過順反試驗(yàn)(順反子是通過順反試驗(yàn)(19571957年,年,S.BenzerS.Benzer通過通過T4T4噬菌體噬菌體感染大腸桿菌發(fā)現(xiàn))確定的,如果兩個(gè)位點(diǎn)可以互補(bǔ),則不屬感染大腸桿菌發(fā)現(xiàn))確定的,如果兩個(gè)位點(diǎn)可以互補(bǔ),則不屬于一個(gè)順反子;如兩個(gè)位點(diǎn)不可以互補(bǔ),則屬于同一個(gè)順反子。于一個(gè)順反子;如兩個(gè)位點(diǎn)不可以互補(bǔ),則屬于同一個(gè)順反子。說明:順反子說明:順反子既有功能上的既有功能上的完整性,又具完整性,又具有結(jié)構(gòu)上的可有結(jié)構(gòu)上的可分割性。分割性。4.1.2 4.1.2 基因與多肽鏈的關(guān)系基因與多肽鏈的關(guān)系 194119

9、41年年(Beadle G W & Beadle G W & Tatum E L,Tatum E L,美國,美國,19581958年獲得諾年獲得諾貝爾獎(jiǎng))貝爾獎(jiǎng)): :一種基因一種酶。一種基因一種酶。 19571957年年, ,鐮形紅細(xì)胞貧血癥鐮形紅細(xì)胞貧血癥的原因是由于血紅蛋白的的原因是由于血紅蛋白的- -鏈鏈的第的第6 6位氨基酸位氨基酸, ,由由Val(Val(纈氨酸纈氨酸,V),V)取代了取代了GluGlu( (谷氨酸谷氨酸,E),E)所致。所致。 基因的堿基序列與蛋白質(zhì)分基因的堿基序列與蛋白質(zhì)分子中氨基酸的序列之間的對(duì)應(yīng)關(guān)子中氨基酸的序列之間的對(duì)應(yīng)關(guān)系是通過遺傳密碼實(shí)現(xiàn)的。系是通過遺

10、傳密碼實(shí)現(xiàn)的。4.2 4.2 基因的命名基因的命名 大腸桿菌和其它細(xì)菌大腸桿菌和其它細(xì)菌: : 用三個(gè)小寫英文斜用三個(gè)小寫英文斜體字母表示基因的名稱。體字母表示基因的名稱。在三個(gè)小寫英文斜體字在三個(gè)小寫英文斜體字母后面加上一個(gè)斜體大寫字母表示其不同的基因母后面加上一個(gè)斜體大寫字母表示其不同的基因座,全部用正體時(shí)表示蛋白產(chǎn)物和表型。座,全部用正體時(shí)表示蛋白產(chǎn)物和表型。 如:如:laclac lacZ, lacY, lacA lacZ, lacY, lacA lacZ, lacY, lacA lacZ, lacY, lacA4.3 4.3 基因組基因組4.3.1 4.3.1 基因組的概念基因組的概

11、念 基因組(基因組(genome):genome):細(xì)胞或生物體完整單體的全套細(xì)胞或生物體完整單體的全套染色體中所有的染色體中所有的DNADNA,包括所有的基因和基因之間的間,包括所有的基因和基因之間的間隔序列。隔序列。 基因組的功能:貯存和表達(dá)遺傳信息?;蚪M的功能:貯存和表達(dá)遺傳信息。4.3.2 4.3.2 基因及基因組的大小與基因及基因組的大小與C C值悖理值悖理1. 1. 基因及基因組的大小基因及基因組的大小 基因的大小在很大程度上取決于其所含有的不編基因的大小在很大程度上取決于其所含有的不編碼序列,即內(nèi)含子的個(gè)數(shù)和每個(gè)內(nèi)含子的長度。一些碼序列,即內(nèi)含子的個(gè)數(shù)和每個(gè)內(nèi)含子的長度。一些基

12、因的內(nèi)含子特別長。基因的內(nèi)含子特別長。 一般地,隨著生物的進(jìn)化,生物體的結(jié)構(gòu)和功能一般地,隨著生物的進(jìn)化,生物體的結(jié)構(gòu)和功能就越復(fù)雜,其就越復(fù)雜,其C C值就越大值就越大(基因組由小到大,才能夠(基因組由小到大,才能夠保證遺傳信息量的增加)。保證遺傳信息量的增加)。2. 2. 基因組基因組DNADNA的的C C值與值與C C值悖理值悖理 C C值:真核生物單倍體基因組中的核苷酸數(shù)。值:真核生物單倍體基因組中的核苷酸數(shù)。 C C值矛盾:值矛盾:在結(jié)構(gòu)、功能很相似的同一類生物中,甚在結(jié)構(gòu)、功能很相似的同一類生物中,甚至是親緣關(guān)系非常緊密的物種之間,它們的至是親緣關(guān)系非常緊密的物種之間,它們的C C

13、值相差數(shù)值相差數(shù)1010乃至上百倍,人們把這種基因組的大小和物種的遺傳復(fù)雜乃至上百倍,人們把這種基因組的大小和物種的遺傳復(fù)雜度沒有直接相關(guān)性的現(xiàn)象叫做度沒有直接相關(guān)性的現(xiàn)象叫做C C值悖理或值悖理或C C值矛盾值矛盾( (C-Value Paradox) )。C C值矛盾表現(xiàn)在值矛盾表現(xiàn)在: : C C值不隨生物的進(jìn)化程度和復(fù)雜性而增加;值不隨生物的進(jìn)化程度和復(fù)雜性而增加; 親緣關(guān)系密切的生物親緣關(guān)系密切的生物C C值相差甚大;值相差甚大; 高等真核生物具有比用于遺傳高得多的高等真核生物具有比用于遺傳高得多的C C值。值。4.4 4.4 病毒及其基因組病毒及其基因組 病毒(病毒(virusvi

14、rus)是最簡(jiǎn)單的生物)是最簡(jiǎn)單的生物, ,外殼蛋白包外殼蛋白包裹著里面的遺傳物質(zhì)核酸。裹著里面的遺傳物質(zhì)核酸。 根據(jù)病毒基因組的核酸類型,將病毒分為:根據(jù)病毒基因組的核酸類型,將病毒分為: DNADNA病毒;病毒; RNARNA病毒。病毒。 根據(jù)宿主的不同,病毒又可分為:根據(jù)宿主的不同,病毒又可分為: 動(dòng)物病毒;動(dòng)物病毒; 植物病毒;植物病毒; 噬菌體。噬菌體。4.4.1 4.4.1 病毒基因組一般特點(diǎn)病毒基因組一般特點(diǎn) 1)1) 與細(xì)菌或真核細(xì)胞相比,與細(xì)菌或真核細(xì)胞相比,病毒的基因組很小,但病毒的基因組很小,但是不同的病毒之間其基因組相差很大是不同的病毒之間其基因組相差很大。 2)2)

15、病毒基因組可以由病毒基因組可以由DNADNA組成,也可以由組成,也可以由RNARNA組成,組成,每種病毒顆粒中只含有一種核酸,或?yàn)槊糠N病毒顆粒中只含有一種核酸,或?yàn)镈NADNA或?yàn)榛驗(yàn)镽NARNA,兩者,兩者一般不共存于同一病毒顆粒中。一般不共存于同一病毒顆粒中。 3)3) 基因重疊基因重疊, ,即同一段即同一段DNADNA片段能夠編碼兩種或兩種片段能夠編碼兩種或兩種以上的蛋白質(zhì)分子。以上的蛋白質(zhì)分子。 4) 4)病毒基因組的大部分是用來編碼蛋白質(zhì)的病毒基因組的大部分是用來編碼蛋白質(zhì)的。 5)5)病毒基因組病毒基因組DNADNA序列中功能上相關(guān)的蛋白質(zhì)的基因序列中功能上相關(guān)的蛋白質(zhì)的基因或或r

16、RNArRNA的基因往往叢集在基因組的一個(gè)或幾個(gè)特定的部位的基因往往叢集在基因組的一個(gè)或幾個(gè)特定的部位, ,形成一個(gè)功能單位或轉(zhuǎn)錄單元。它們可被一起轉(zhuǎn)錄成為含形成一個(gè)功能單位或轉(zhuǎn)錄單元。它們可被一起轉(zhuǎn)錄成為含有多個(gè)有多個(gè)mRNAmRNA的分子,稱為多順反子的分子,稱為多順反子mRNAmRNA,然后再加工成各,然后再加工成各種蛋白質(zhì)的模板種蛋白質(zhì)的模板mRNAmRNA。 6)6) 噬菌體(細(xì)菌病毒)的基因是連續(xù)的;噬菌體(細(xì)菌病毒)的基因是連續(xù)的;而真核細(xì)而真核細(xì)胞病毒的基因是不連續(xù)的,具有內(nèi)含子。胞病毒的基因是不連續(xù)的,具有內(nèi)含子。 4.4.2 4.4.2 病毒的核酸病毒的核酸 DNA/RNA

17、DNA/RNA 雙鏈雙鏈/ /單鏈單鏈 線狀線狀/ /環(huán)狀環(huán)狀 不分段不分段/ /分段分段 分段(分段(segmentedsegmented)病毒基因組:)病毒基因組:是基因組被分是基因組被分為兩個(gè)或兩個(gè)以上不同的核酸分子,但被包裝在同一為兩個(gè)或兩個(gè)以上不同的核酸分子,但被包裝在同一個(gè)病毒粒子內(nèi);個(gè)病毒粒子內(nèi); 多組分(多組分(multipartitemultipartite)基因組:)基因組:雖然也是分段雖然也是分段的,但它們的每個(gè)基因組片段卻是包裝在不同的病毒的,但它們的每個(gè)基因組片段卻是包裝在不同的病毒顆粒中的。顆粒中的。4.4.3 4.4.3 噬菌體基因組噬菌體基因組1.1.噬菌體基因

18、組噬菌體基因組 噬菌體基因組噬菌體基因組4.854.8510104 4 bpbp,包括,包括6161個(gè)基因。整個(gè)基個(gè)基因。整個(gè)基因組分為因組分為5 5個(gè)區(qū)域:頭部基因、尾部基因、調(diào)控區(qū)、復(fù)制個(gè)區(qū)域:頭部基因、尾部基因、調(diào)控區(qū)、復(fù)制控制區(qū)和晚期基因調(diào)控區(qū)??刂茀^(qū)和晚期基因調(diào)控區(qū)。19511951年年Esther LederbergEsther Lederberg發(fā)發(fā)現(xiàn)現(xiàn)K12K12中有原噬菌體,將其中有原噬菌體,將其命名為命名為。2. 2. X174X174噬菌體基因組噬菌體基因組 X174 X174 這種單鏈這種單鏈DNADNA是是SinsheimerSinsheimer于于19591959年

19、發(fā)現(xiàn)的。年發(fā)現(xiàn)的。X174X174噬菌體基因組噬菌體基因組是單鏈環(huán)狀的是單鏈環(huán)狀的DNADNA,含有,含有53875387個(gè)核苷酸個(gè)核苷酸(Frederick SangerFrederick Sanger于于19771977分析測(cè)定,分析測(cè)定,為此榮獲第二次諾貝爾獎(jiǎng)為此榮獲第二次諾貝爾獎(jiǎng) ) ,共,共1111個(gè)個(gè)基因,基因,3 mRNA3 mRNA,9 9個(gè)肽。個(gè)肽。特點(diǎn):特點(diǎn):(1 1)重疊基因(重疊基因(Overlapping Genes, Overlapping Genes, 嵌套基因)(理論上嵌套基因)(理論上17951795氨基酸,實(shí)際氨基酸,實(shí)際上上25002500氨基酸)氨基酸)

20、(2 2)基因之間的間隔區(qū)很?。ɑ蛑g的間隔區(qū)很?。?3 nt63 nt:RNARNA聚合酶的結(jié)合位點(diǎn)、轉(zhuǎn)錄終止信號(hào)等聚合酶的結(jié)合位點(diǎn)、轉(zhuǎn)錄終止信號(hào)等調(diào)控區(qū)域)。調(diào)控區(qū)域)。 近年來的研究發(fā)現(xiàn),重疊基因在真近年來的研究發(fā)現(xiàn),重疊基因在真核生物中也是廣泛存在的。核生物中也是廣泛存在的。噬菌體噬菌體X174的基因組的基因組(重疊基因)(重疊基因) 4.4.4 4.4.4 幾種病毒的基因組幾種病毒的基因組1. SV401. SV40病毒基因組病毒基因組 SV40SV40(猿猴空泡病毒或猴肉瘤病毒(猿猴空泡病毒或猴肉瘤病毒) )屬乳多空病屬乳多空病毒類,是最小的毒類,是最小的DNADNA病毒之一。病

21、毒之一。SV40SV40是猴子病毒,最初是猴子病毒,最初在猴腎細(xì)胞中分離出來,可引起人的培養(yǎng)細(xì)胞轉(zhuǎn)化,在猴腎細(xì)胞中分離出來,可引起人的培養(yǎng)細(xì)胞轉(zhuǎn)化,在倉鼠和人體內(nèi)可致腫瘤。在倉鼠和人體內(nèi)可致腫瘤。SV40SV40基因組只有基因組只有5 5個(gè)基因。個(gè)基因。SV40SV40基因組結(jié)構(gòu)特點(diǎn)基因組結(jié)構(gòu)特點(diǎn): : ,長,長5243 bp5243 bp, ,與與4 4種組蛋白(種組蛋白(H2AH2A、H2BH2B、H3H3及及H4H4) 。 早期基因含有早期基因含有2 2個(gè)重疊基因,編碼個(gè)重疊基因,編碼T T和和t t(T=tumor)T=tumor)抗原抗原 晚期基因含晚期基因含3 3個(gè)重疊基因,編碼個(gè)

22、重疊基因,編碼VP1VP1(主),(主),VP2VP2和和VP3VP3(次)(次)3 3種衣殼蛋白種衣殼蛋白 調(diào)控區(qū)位早、晚期基因之間,長約調(diào)控區(qū)位早、晚期基因之間,長約400 bp400 bp包括復(fù)制起點(diǎn),包括復(fù)制起點(diǎn),啟動(dòng)子和增強(qiáng)子,可調(diào)節(jié)基因組的復(fù)制及早、晚期基因的轉(zhuǎn)錄。啟動(dòng)子和增強(qiáng)子,可調(diào)節(jié)基因組的復(fù)制及早、晚期基因的轉(zhuǎn)錄。2. 2. 腺病毒基因組腺病毒基因組 腺病毒基因組是腺病毒基因組是36 Kb36 Kb(303038 Kb38 Kb)的線性雙鏈)的線性雙鏈DNADNA, 30304040個(gè)基因,緊靠?jī)蛇叺氖情L個(gè)基因,緊靠?jī)蛇叺氖情L100 bp-165 bp100 bp-165 b

23、p的末端重復(fù),其含的末端重復(fù),其含DNADNA復(fù)制起點(diǎn)和包裝信號(hào)。復(fù)制起點(diǎn)和包裝信號(hào)。 按轉(zhuǎn)錄時(shí)間的先后,將腺病毒基因大致區(qū)分為早按轉(zhuǎn)錄時(shí)間的先后,將腺病毒基因大致區(qū)分為早期(期(E1E14 4)和晚期轉(zhuǎn)錄單位()和晚期轉(zhuǎn)錄單位(L1L15 5)。)。 3. 3. 逆轉(zhuǎn)錄病毒基因組逆轉(zhuǎn)錄病毒基因組人免疫缺陷病毒的結(jié)構(gòu)模式圖人免疫缺陷病毒的結(jié)構(gòu)模式圖引物結(jié)合位點(diǎn)引物結(jié)合位點(diǎn)4.5 4.5 細(xì)菌基因組細(xì)菌基因組4.5.1 4.5.1 細(xì)菌基因組的一般特點(diǎn)細(xì)菌基因組的一般特點(diǎn) 1 1)單個(gè)染色體,單個(gè)染色體,一般呈環(huán)狀。一般呈環(huán)狀。 2 2)只有一個(gè)復(fù)制起點(diǎn)。)只有一個(gè)復(fù)制起點(diǎn)。 3 3)具有操縱子

24、結(jié)構(gòu))具有操縱子結(jié)構(gòu)。 4 4)重復(fù)序列少。)重復(fù)序列少。 5 5)很少有不編碼序列。)很少有不編碼序列。 6 6)基因組)基因組DNADNA具有多種調(diào)控區(qū)具有多種調(diào)控區(qū),如復(fù)制起始區(qū),如復(fù)制起始區(qū)OriCOriC ,復(fù)制終止區(qū)復(fù)制終止區(qū)TerCTerC , ,轉(zhuǎn)錄啟動(dòng)區(qū)和終止區(qū)等。轉(zhuǎn)錄啟動(dòng)區(qū)和終止區(qū)等。 7 7)常有轉(zhuǎn)座子插入)常有轉(zhuǎn)座子插入。4.5.2 4.5.2 細(xì)菌的染色體基因組細(xì)菌的染色體基因組 大腸桿菌基因組為環(huán)狀大腸桿菌基因組為環(huán)狀DNADNA分子,分子,4600 Kb,4600 Kb,總長度為總長度為1100110014001400m m,與蛋白質(zhì)形成擬核區(qū)域,為超螺旋結(jié)構(gòu),與

25、蛋白質(zhì)形成擬核區(qū)域,為超螺旋結(jié)構(gòu),約約3000-40003000-4000個(gè)基因,個(gè)基因,14001400個(gè)基因都已定位。多數(shù)為單拷個(gè)基因都已定位。多數(shù)為單拷貝蛋白質(zhì)基因,貝蛋白質(zhì)基因,rRNArRNA基因基因(rrn(rrn基因基因) )為多拷貝為多拷貝(7(7個(gè)拷貝個(gè)拷貝16S-23S-5S rRNA16S-23S-5S rRNA基因基因) )。4.6 4.6 真核生物基因組真核生物基因組4.6.1 4.6.1 真核生物基因組的特點(diǎn)真核生物基因組的特點(diǎn) 基因組大。基因組大。 有染色體結(jié)構(gòu)。有染色體結(jié)構(gòu)。 基因組中的基因組中的DNADNA與蛋白質(zhì)結(jié)合,形成的染色體存在于細(xì)胞核與蛋白質(zhì)結(jié)合,形

26、成的染色體存在于細(xì)胞核內(nèi)。內(nèi)。 轉(zhuǎn)錄和翻譯不偶聯(lián)。轉(zhuǎn)錄和翻譯不偶聯(lián)。 有重復(fù)序列。有重復(fù)序列。 轉(zhuǎn)錄產(chǎn)物為單順反子。轉(zhuǎn)錄產(chǎn)物為單順反子。 可移動(dòng)序列多??梢苿?dòng)序列多。 多數(shù)基因?yàn)閿嗔鸦?。多?shù)基因?yàn)閿嗔鸦颉?.6.2 4.6.2 真核生物基因組的結(jié)構(gòu)真核生物基因組的結(jié)構(gòu) 基因組結(jié)構(gòu)是指不同功能區(qū)域在整個(gè)基因組結(jié)構(gòu)是指不同功能區(qū)域在整個(gè)DNADNA分子分子中的分布情況。中的分布情況。 基因組中不同的區(qū)域具有不同的功能:基因組中不同的區(qū)域具有不同的功能: 有些區(qū)域編碼蛋白質(zhì)的結(jié)構(gòu)基因;有些區(qū)域編碼蛋白質(zhì)的結(jié)構(gòu)基因; 有些區(qū)域復(fù)制及轉(zhuǎn)錄的調(diào)控信號(hào);有些區(qū)域復(fù)制及轉(zhuǎn)錄的調(diào)控信號(hào); 有些區(qū)域的功能尚不

27、清楚。有些區(qū)域的功能尚不清楚。1. 1. 真核生物的斷裂基因(割裂基因,真核生物的斷裂基因(割裂基因,split genesplit gene) 19771977年年SharpSharp和和RobertsRoberts在研究腺病毒外殼蛋白基因和在研究腺病毒外殼蛋白基因和其其mRNAmRNA的合成時(shí)發(fā)現(xiàn)的合成時(shí)發(fā)現(xiàn)R R環(huán)。環(huán)。斷裂基因是指基因的編碼序列斷裂基因是指基因的編碼序列在在DNADNA分子上不是連續(xù)排列的,而是被不編碼的序列所隔分子上不是連續(xù)排列的,而是被不編碼的序列所隔開。開。 外顯子外顯子(exon(exon) ):編碼蛋白質(zhì)的序列。:編碼蛋白質(zhì)的序列。 內(nèi)含子內(nèi)含子(intron

28、(intron) ):非編碼序列。:非編碼序列。 R R環(huán)(取代環(huán))實(shí)驗(yàn)環(huán)(取代環(huán))實(shí)驗(yàn) mRNAmRNA與編碼單鏈與編碼單鏈DNADNA雜交雜交時(shí),不互補(bǔ)的時(shí),不互補(bǔ)的intronintron部分形成部分形成的環(huán)。的環(huán)。圖圖4.11 4.11 雞卵清蛋白的不雞卵清蛋白的不連續(xù)基因及其與連續(xù)基因及其與mRNAmRNA形成形成的的R R環(huán)環(huán)(1977)1993年獲諾貝爾獎(jiǎng)年獲諾貝爾獎(jiǎng) 斷裂基因的共同特性:斷裂基因的共同特性: (1 1)外顯子在基因中的排列順序與它在成熟外顯子在基因中的排列順序與它在成熟mRNAmRNA產(chǎn)產(chǎn)物中的排列順序相同。物中的排列順序相同。 (2 2)某種斷裂基因在所有組織

29、中都具有相同的內(nèi)含某種斷裂基因在所有組織中都具有相同的內(nèi)含子成分。子成分。 (3 3)在內(nèi)含子上發(fā)生的突變不影響蛋白質(zhì)的結(jié)構(gòu),在內(nèi)含子上發(fā)生的突變不影響蛋白質(zhì)的結(jié)構(gòu),所以其突變往往對(duì)生物體沒有影響。所以其突變往往對(duì)生物體沒有影響。2. 2. 真核生物基因的外顯子與內(nèi)含子及其相互關(guān)系真核生物基因的外顯子與內(nèi)含子及其相互關(guān)系(1 1)外顯子與內(nèi)含子的概念)外顯子與內(nèi)含子的概念 外顯子:是出現(xiàn)在外顯子:是出現(xiàn)在mRNAmRNA分子中的基因序列。分子中的基因序列。 內(nèi)含子:是被剪接而不出現(xiàn)在內(nèi)含子:是被剪接而不出現(xiàn)在mRNAmRNA分子中的基因分子中的基因序列。序列。 內(nèi)含子的特點(diǎn):內(nèi)含子的特點(diǎn): 不

30、同基因所含內(nèi)含子數(shù)目不同不同基因所含內(nèi)含子數(shù)目不同 不同來源內(nèi)含子分子大小不同不同來源內(nèi)含子分子大小不同 內(nèi)含子長度常常大于外顯子內(nèi)含子長度常常大于外顯子 進(jìn)化過程中,內(nèi)含子堿基序列變化顯著進(jìn)化過程中,內(nèi)含子堿基序列變化顯著 內(nèi)含子的普遍性:大部分真核基因都含有內(nèi)含子內(nèi)含子的普遍性:大部分真核基因都含有內(nèi)含子(2 2)外顯子與內(nèi)含子之間的連接位點(diǎn))外顯子與內(nèi)含子之間的連接位點(diǎn)核核mRNA內(nèi)含子的結(jié)構(gòu)特點(diǎn)內(nèi)含子的結(jié)構(gòu)特點(diǎn)(3) (3) 外顯子與內(nèi)含子之間的關(guān)系外顯子與內(nèi)含子之間的關(guān)系 選擇性剪接:一個(gè)基因的初始轉(zhuǎn)錄產(chǎn)物在不同的分選擇性剪接:一個(gè)基因的初始轉(zhuǎn)錄產(chǎn)物在不同的分化細(xì)胞、不同的發(fā)育階段、

31、甚至不同的生理狀態(tài)下,通化細(xì)胞、不同的發(fā)育階段、甚至不同的生理狀態(tài)下,通過不同的剪接方式,可以得到不同的成熟過不同的剪接方式,可以得到不同的成熟mRNAmRNA和蛋白產(chǎn)和蛋白產(chǎn)物,稱為選擇性剪接。物,稱為選擇性剪接。 在人類中,至少在人類中,至少40%40%的基因初始轉(zhuǎn)錄產(chǎn)物受到選擇的基因初始轉(zhuǎn)錄產(chǎn)物受到選擇性剪接的調(diào)控。性剪接的調(diào)控。 (4) (4) 內(nèi)含子的功能內(nèi)含子的功能 促進(jìn)重組。促進(jìn)重組。 增加了基因組的復(fù)雜性。增加了基因組的復(fù)雜性。 含有可讀框(含有可讀框(ORFORF)。)。 基因組中外顯子和內(nèi)含子是相對(duì)的,有些內(nèi)含子基因組中外顯子和內(nèi)含子是相對(duì)的,有些內(nèi)含子具有編碼序列,產(chǎn)生蛋

32、白質(zhì)或功能具有編碼序列,產(chǎn)生蛋白質(zhì)或功能RNARNA。 含有部分剪接信號(hào)。含有部分剪接信號(hào)。 產(chǎn)生核仁小產(chǎn)生核仁小RNARNA。 內(nèi)含子對(duì)基因表達(dá)有影響。內(nèi)含子對(duì)基因表達(dá)有影響。(5) (5) 蛋白質(zhì)結(jié)構(gòu)域與基因的外顯子蛋白質(zhì)結(jié)構(gòu)域與基因的外顯子/ /內(nèi)含子的關(guān)系內(nèi)含子的關(guān)系 大約有半數(shù)外顯子與蛋白質(zhì)的功能結(jié)構(gòu)域相一致。例如,大約有半數(shù)外顯子與蛋白質(zhì)的功能結(jié)構(gòu)域相一致。例如,磷酸丙糖異構(gòu)酶基因有磷酸丙糖異構(gòu)酶基因有9 9個(gè)外顯子,其編碼的蛋白質(zhì)有個(gè)外顯子,其編碼的蛋白質(zhì)有9 9個(gè)與之個(gè)與之對(duì)應(yīng)的結(jié)構(gòu)域。免疫球蛋白的功能結(jié)構(gòu)域與編碼這些蛋白的基對(duì)應(yīng)的結(jié)構(gòu)域。免疫球蛋白的功能結(jié)構(gòu)域與編碼這些蛋白的

33、基因的外顯子相對(duì)應(yīng)。但對(duì)于其他一些基因,外顯子與編碼蛋白因的外顯子相對(duì)應(yīng)。但對(duì)于其他一些基因,外顯子與編碼蛋白的功能結(jié)構(gòu)域并不相對(duì)應(yīng)。的功能結(jié)構(gòu)域并不相對(duì)應(yīng)。(6) (6) 不連續(xù)基因的分子進(jìn)化不連續(xù)基因的分子進(jìn)化 在真核生物的進(jìn)化過程中,斷裂基因的比例在逐漸增加。在真核生物的進(jìn)化過程中,斷裂基因的比例在逐漸增加。外顯子改組外顯子改組(exon(exon shuffling) shuffling)假說假說 :外顯子作為一種功能模:外顯子作為一種功能模塊,可以組裝到不同的基因內(nèi);在基因進(jìn)化中,經(jīng)常發(fā)生著外塊,可以組裝到不同的基因內(nèi);在基因進(jìn)化中,經(jīng)常發(fā)生著外顯子在不同基因之間的復(fù)制、遷移和吸納。

34、顯子在不同基因之間的復(fù)制、遷移和吸納。 3. 3. 真核生物基因組的序列異質(zhì)性真核生物基因組的序列異質(zhì)性(1) DNA(1) DNA序列的復(fù)性動(dòng)力學(xué)與序列重復(fù)頻度序列的復(fù)性動(dòng)力學(xué)與序列重復(fù)頻度 C C0 0t t曲線已經(jīng)成為一種比較曲線已經(jīng)成為一種比較DNADNA組分復(fù)性速率和組分復(fù)性速率和DNADNA序列復(fù)雜程序列復(fù)雜程度差異的指標(biāo)。度差異的指標(biāo)。 在不存在重復(fù)序列情況下,在不存在重復(fù)序列情況下, C CO Ot tl/2l/2與基因組大小呈正比。與基因組大小呈正比。 有重復(fù)序列的復(fù)性反應(yīng)中,有重復(fù)序列的復(fù)性反應(yīng)中,C C0 0t t1/21/2與與DNADNA序列的重復(fù)頻率成反比。序列的重

35、復(fù)頻率成反比。(2) (2) 真核生物基因組的序列類型真核生物基因組的序列類型1 1)單一拷貝的基因序列。又稱非重復(fù))單一拷貝的基因序列。又稱非重復(fù)(nonreplicative(nonreplicative) )序列,序列,在一個(gè)基因組中只有一個(gè)拷貝,真核生物的大多數(shù)在一個(gè)基因組中只有一個(gè)拷貝,真核生物的大多數(shù)編碼蛋白質(zhì)的基因都是單拷貝的。編碼蛋白質(zhì)的基因都是單拷貝的。 在單倍體基因組中只出現(xiàn)一次;在單倍體基因組中只出現(xiàn)一次; 復(fù)性速度很慢;復(fù)性速度很慢; 在基因組中占在基因組中占50-8050-80; 儲(chǔ)存了巨大的遺傳信息,編碼蛋白質(zhì);儲(chǔ)存了巨大的遺傳信息,編碼蛋白質(zhì); 尚不清楚確切數(shù)字;

36、尚不清楚確切數(shù)字; 斷裂基因。斷裂基因。2 2)低度重復(fù)序列(輕度重復(fù)序列)低度重復(fù)序列(輕度重復(fù)序列) 在一個(gè)基因組中有在一個(gè)基因組中有2 21010個(gè)拷貝,常常是一些編碼個(gè)拷貝,常常是一些編碼蛋白質(zhì)的基因,也對(duì)應(yīng)于慢復(fù)性組分。典型的例子有:蛋白質(zhì)的基因,也對(duì)應(yīng)于慢復(fù)性組分。典型的例子有:珠蛋白基因、細(xì)胞骨架蛋白基因。珠蛋白基因、細(xì)胞骨架蛋白基因。3 3)中度重復(fù))中度重復(fù)(nxxlemtelyrepetitive(nxxlemtelyrepetitive) )序列序列 對(duì)應(yīng)于中間復(fù)性組分,有幾百個(gè)拷貝。中度重復(fù)序列對(duì)應(yīng)于中間復(fù)性組分,有幾百個(gè)拷貝。中度重復(fù)序列所包含的范圍很大,有非編碼序列

37、,如靈長類動(dòng)物特有的所包含的范圍很大,有非編碼序列,如靈長類動(dòng)物特有的AluAlu 序列;也有編碼序列,如序列;也有編碼序列,如rRNArRNA基因、基因、tRNAtRNA基因和組蛋基因和組蛋白基因等。其他中度重復(fù)序列一般是不編碼的序列,它們白基因等。其他中度重復(fù)序列一般是不編碼的序列,它們可能在基因調(diào)控中起重要的作用。可能在基因調(diào)控中起重要的作用。 復(fù)性速度快于單拷貝復(fù)性速度快于單拷貝順序,慢于高度重復(fù)順順序,慢于高度重復(fù)順序。序。 所占比例在不同種屬所占比例在不同種屬之間差異很大。之間差異很大。 大多不編碼蛋白質(zhì)。大多不編碼蛋白質(zhì)。 大多數(shù)與單拷貝基因大多數(shù)與單拷貝基因間隔排列間隔排列,

38、,少數(shù)在基因組少數(shù)在基因組中成串排列在一個(gè)區(qū)域。中成串排列在一個(gè)區(qū)域。4 4)高度重復(fù)序列(衛(wèi)星)高度重復(fù)序列(衛(wèi)星DNADNA) 高度重復(fù)高度重復(fù)(highly reptitive(highly reptitive) )序列對(duì)應(yīng)于快復(fù)性序列對(duì)應(yīng)于快復(fù)性組分,在大多數(shù)高等真核生物基因組中重復(fù)頻率大組分,在大多數(shù)高等真核生物基因組中重復(fù)頻率大10106 6次以上的次以上的DNADNA序列。人類基因組內(nèi)占序列。人類基因組內(nèi)占20%20%左右。左右。 重復(fù)單位的序重復(fù)單位的序列長度為列長度為2-10 bp2-10 bp; 每一基因組有每一基因組有10105 5-10-106 6個(gè)拷貝;個(gè)拷貝; C

39、Co ot t1/21/2值小于值小于0.0010.001。高度重復(fù)DNA序列的堿基組成和浮力密度不同于主體DNA,在氯化銫密度梯度離心時(shí),可形成相對(duì)獨(dú)立于主DNA沉降帶的衛(wèi)星DNA沉降帶,因此稱為衛(wèi)星衛(wèi)星DNA(satellite DNA)富含A-T富含G-C主體DNA根據(jù)重復(fù)單位的大小,衛(wèi)星根據(jù)重復(fù)單位的大小,衛(wèi)星DNADNA(自在(自在DNADNA,伊甸園,伊甸園DNADNA)可以分為以下三類:可以分為以下三類: 衛(wèi)星衛(wèi)星DNADNA序列(簡(jiǎn)單重復(fù)序列,也被稱為結(jié)構(gòu)序列(簡(jiǎn)單重復(fù)序列,也被稱為結(jié)構(gòu)DNADNA):):長的串聯(lián)重復(fù)序列。幾百。如擬南芥的長的串聯(lián)重復(fù)序列。幾百。如擬南芥的3

40、3個(gè)衛(wèi)個(gè)衛(wèi)星星DNADNA:160 bp160 bp、180 bp180 bp、500 bp500 bp分別重復(fù)幾千次。分分別重復(fù)幾千次。分布在異染色質(zhì)區(qū):著絲粒和端粒。不轉(zhuǎn)錄。布在異染色質(zhì)區(qū):著絲粒和端粒。不轉(zhuǎn)錄。5%-6%5%-6%。 小衛(wèi)星小衛(wèi)星DNADNA序列(重復(fù)序列可變數(shù),序列(重復(fù)序列可變數(shù),VNTRsVNTRs):):短短的串聯(lián)重復(fù)序列。常的串聯(lián)重復(fù)序列。常15 bp15 bp。分布在常染色質(zhì)區(qū)??勺?。分布在常染色質(zhì)區(qū)??勺鱀NADNA指紋。不轉(zhuǎn)錄。指紋。不轉(zhuǎn)錄。 微衛(wèi)星微衛(wèi)星DNADNA序列(簡(jiǎn)單序列的重復(fù),序列(簡(jiǎn)單序列的重復(fù),SSRsSSRs):更):更短的串聯(lián)重復(fù)序列。

41、常短的串聯(lián)重復(fù)序列。常2-5 bp2-5 bp。如(。如(G G)n n、(、(C C)n n、(CACA)n n、(、(CTCT)n n、(、(ATAT)n n。在哺乳動(dòng)物基因組中,。在哺乳動(dòng)物基因組中,(CACA)n n重復(fù)可超過重復(fù)可超過30003000拷貝。分布在常染色質(zhì)區(qū)??截?。分布在常染色質(zhì)區(qū)。 4. 4. 真核細(xì)胞的基因家族和基因簇真核細(xì)胞的基因家族和基因簇 基因家族基因家族(gene family)(gene family)是真核生物基因組中來源是真核生物基因組中來源相同,結(jié)構(gòu)相似,功能相關(guān)的一組基因。相同,結(jié)構(gòu)相似,功能相關(guān)的一組基因。 基因家族可能由某一共同祖先基因經(jīng)重復(fù)和

42、突變產(chǎn)基因家族可能由某一共同祖先基因經(jīng)重復(fù)和突變產(chǎn)生。生。基因家族的特點(diǎn):基因家族的特點(diǎn): 基因家族的成員可以串聯(lián)排列在一起,形成基因家族的成員可以串聯(lián)排列在一起,形成基因簇基因簇(gene cluster)(gene cluster)或串聯(lián)重復(fù)基因或串聯(lián)重復(fù)基因(tandemly(tandemly repeated genes)repeated genes),如,如rRNArRNA、tRNAtRNA和組蛋白的基因;和組蛋白的基因; 有些基因家族的成員有些基因家族的成員也可位于不同的染色體也可位于不同的染色體上,稱為散布的基因家族。上,稱為散布的基因家族。如珠蛋白基因;如珠蛋白基因; 在基因家

43、族中發(fā)現(xiàn)有些成員不產(chǎn)生有功能的基基因家族中發(fā)現(xiàn)有些成員不產(chǎn)生有功能的基因產(chǎn)物,即因產(chǎn)物,即假基因假基因 。 按照基因結(jié)構(gòu)或轉(zhuǎn)錄方向,基因家族又可分為簡(jiǎn)單的按照基因結(jié)構(gòu)或轉(zhuǎn)錄方向,基因家族又可分為簡(jiǎn)單的多基因家族、復(fù)雜的多基因家族和受發(fā)育調(diào)控的復(fù)雜多基多基因家族、復(fù)雜的多基因家族和受發(fā)育調(diào)控的復(fù)雜多基因家族。因家族。(1 1)簡(jiǎn)單的多基因家族)簡(jiǎn)單的多基因家族 由結(jié)構(gòu)相同的一個(gè)或數(shù)個(gè)基因以串聯(lián)方式重復(fù)排列的由結(jié)構(gòu)相同的一個(gè)或數(shù)個(gè)基因以串聯(lián)方式重復(fù)排列的形式存在于染色體上。形式存在于染色體上。特點(diǎn):特點(diǎn):家族成員串聯(lián)排列在一起家族成員串聯(lián)排列在一起組成一個(gè)轉(zhuǎn)錄單位組成一個(gè)轉(zhuǎn)錄單位代表代表: : r

44、RNA rRNA基因家族基因家族 5S rRNA5S rRNA基因基因(2 2)復(fù)雜的多基因家族)復(fù)雜的多基因家族 復(fù)雜多基因家族:各個(gè)成員并不都相同,數(shù)個(gè)功能相關(guān)的基因復(fù)雜多基因家族:各個(gè)成員并不都相同,數(shù)個(gè)功能相關(guān)的基因串聯(lián)成簇由間隔序列分開,并作為獨(dú)立的轉(zhuǎn)錄單位分別轉(zhuǎn)錄出各自串聯(lián)成簇由間隔序列分開,并作為獨(dú)立的轉(zhuǎn)錄單位分別轉(zhuǎn)錄出各自的的mRNAmRNA。 特點(diǎn):特點(diǎn):家族成員串聯(lián)排列在一起家族成員串聯(lián)排列在一起 獨(dú)立的轉(zhuǎn)錄單位獨(dú)立的轉(zhuǎn)錄單位 如組蛋白基因家族(沒有內(nèi)含子,也沒有如組蛋白基因家族(沒有內(nèi)含子,也沒有3-polyA,3-polyA,并且不存并且不存在轉(zhuǎn)錄后的加工修飾過程)。在

45、轉(zhuǎn)錄后的加工修飾過程)。(3 3)受發(fā)育調(diào)控的復(fù)雜多基因家族)受發(fā)育調(diào)控的復(fù)雜多基因家族 功能相關(guān)的基因分別串聯(lián)成簇,在生物個(gè)體功能相關(guān)的基因分別串聯(lián)成簇,在生物個(gè)體發(fā)育過程中按一定的順序表達(dá)或關(guān)閉。發(fā)育過程中按一定的順序表達(dá)或關(guān)閉。特點(diǎn):特點(diǎn): 分布在不同的染色體上分布在不同的染色體上 獨(dú)立的轉(zhuǎn)錄單位獨(dú)立的轉(zhuǎn)錄單位 基因順序與表達(dá)順序相關(guān)基因順序與表達(dá)順序相關(guān)代表代表: : 珠蛋白基因家族珠蛋白基因家族(4 4)超基因家族)超基因家族 超基因家族超基因家族(Supergene(Supergene family family ,SuperfamilySuperfamily) ) :由基:由基因

46、家族和單基因組成的大基因家族,結(jié)構(gòu)上有程度不等的同源因家族和單基因組成的大基因家族,結(jié)構(gòu)上有程度不等的同源性,但功能不同。性,但功能不同。 它們是一個(gè)共同的祖先基因通過各種各樣的變異,產(chǎn)生的它們是一個(gè)共同的祖先基因通過各種各樣的變異,產(chǎn)生的結(jié)構(gòu)大致相同但功能卻不盡相似的一大批基因。這一大批基因結(jié)構(gòu)大致相同但功能卻不盡相似的一大批基因。這一大批基因分屬于不同的基因家族,但可以總稱為一個(gè)超基因家族。分屬于不同的基因家族,但可以總稱為一個(gè)超基因家族。 典型的例子有:典型的例子有: 免疫球蛋白超基因家族免疫球蛋白超基因家族 核受體超基因家族核受體超基因家族 細(xì)胞因子超基因家族細(xì)胞因子超基因家族 超級(jí)基

47、因超級(jí)基因(5 5)假基因)假基因(pseudogene(pseudogene) ) 1977 1977年年G.JacqG.Jacq等在爪蟾的等在爪蟾的5S5S基因系統(tǒng)中發(fā)現(xiàn),后基因系統(tǒng)中發(fā)現(xiàn),后來在珠蛋白基因簇、免疫球蛋白基因簇等均有發(fā)現(xiàn)。來在珠蛋白基因簇、免疫球蛋白基因簇等均有發(fā)現(xiàn)。 假基因:是一種核苷酸序列同其相應(yīng)的正常功能假基因:是一種核苷酸序列同其相應(yīng)的正常功能基因基本相同,但卻不能合成出功能蛋白質(zhì)的失活基基因基本相同,但卻不能合成出功能蛋白質(zhì)的失活基因。因。 假基因常用符號(hào)假基因常用符號(hào)表示,如表示,如1 1 表示與表示與1 1 相相似的假基因。似的假基因。 4 4:1 1。假基因

48、:假基因: 未加工的假基因(未加工的假基因(nonprocessed pseudogenenonprocessed pseudogene) 未加工的假基因是通過基因組未加工的假基因是通過基因組DNADNA重復(fù)產(chǎn)生的,經(jīng)常位于有重復(fù)產(chǎn)生的,經(jīng)常位于有功能的相同基因拷貝的附近,保留著祖先基因的組成特點(diǎn)。功能的相同基因拷貝的附近,保留著祖先基因的組成特點(diǎn)。 它們與有功能的同源基因有類似的結(jié)構(gòu),原來可能是有功能它們與有功能的同源基因有類似的結(jié)構(gòu),原來可能是有功能的基因,但由于缺失、倒位或突變等原因使該基因失去活性成為的基因,但由于缺失、倒位或突變等原因使該基因失去活性成為無功能基因。無功能基因。 加工

49、的假基因加工的假基因 加工的假基因也稱為反轉(zhuǎn)錄假基因(加工的假基因也稱為反轉(zhuǎn)錄假基因(retropseudogeneretropseudogene)是)是由由RNARNA反轉(zhuǎn)錄為反轉(zhuǎn)錄為cDNAcDNA后再隨機(jī)整合到基因組中而產(chǎn)生的。后再隨機(jī)整合到基因組中而產(chǎn)生的。 因此,它們?cè)诨蚪M中經(jīng)常是分散的,只在真核生物中被發(fā)因此,它們?cè)诨蚪M中經(jīng)常是分散的,只在真核生物中被發(fā)現(xiàn)。現(xiàn)。假基因的特點(diǎn):假基因的特點(diǎn):(1 1)缺少正常的內(nèi)含子。缺少正常的內(nèi)含子。(2 2)3 3末端有多聚腺苷酸。末端有多聚腺苷酸。(3 3)55端的結(jié)構(gòu)和端的結(jié)構(gòu)和mRNAmRNA的的55端十分相似。端十分相似。(4 4)兩

50、側(cè)有順向重復(fù)序列的存在。兩側(cè)有順向重復(fù)序列的存在。形成假基因的原因:形成假基因的原因:(1 1)缺乏有功能的調(diào)控區(qū),使其不能進(jìn)行正常的轉(zhuǎn)錄。缺乏有功能的調(diào)控區(qū),使其不能進(jìn)行正常的轉(zhuǎn)錄。(2 2)雖然能轉(zhuǎn)錄,但由于突變或缺失等,引起雖然能轉(zhuǎn)錄,但由于突變或缺失等,引起mRNAmRNA加工缺陷加工缺陷而不能翻譯。而不能翻譯。(3 3)mRNAmRNA的翻譯被提前終止。的翻譯被提前終止。(4 4)雖然能翻譯,但生成的是無功能的肽鏈。雖然能翻譯,但生成的是無功能的肽鏈。4.6.3 4.6.3 線粒體基因與基因組的結(jié)構(gòu)線粒體基因與基因組的結(jié)構(gòu)(mitochondrial genome, mtDNAmit

51、ochondrial genome, mtDNA) 線粒體最先由線粒體最先由AltmannAltmann(18941894)在動(dòng)物細(xì)胞中)在動(dòng)物細(xì)胞中發(fā)現(xiàn)。發(fā)現(xiàn)。 19621962年年RisRis和和19631963年年NassNass等分別觀察到線粒體等分別觀察到線粒體內(nèi)有內(nèi)有DNADNA。 mtDNAmtDNA一般都是一個(gè)環(huán)狀一般都是一個(gè)環(huán)狀DNADNA分子。不同物種的分子。不同物種的線粒體基因組的大小相差懸殊。線粒體基因組的大小相差懸殊。 已知的是哺乳動(dòng)物的線粒體基因組最?。ㄒ阎氖遣溉閯?dòng)物的線粒體基因組最?。?6.5 16.5 kbkb),植物的線粒體基因組最大(最小),植物的線粒體基

52、因組最大(最小100 kb100 kb)。)。 人類線粒體基因組為一環(huán)狀人類線粒體基因組為一環(huán)狀DNADNA分子,長度分子,長度為為16569bp16569bp,每個(gè)細(xì)胞平均含,每個(gè)細(xì)胞平均含800800個(gè)線粒體,每個(gè)線粒體,每個(gè)線粒體含個(gè)線粒體含1010個(gè)線粒體基因組拷貝。個(gè)線粒體基因組拷貝。 由于一個(gè)細(xì)胞里有幾百至上千個(gè)線粒體,由于一個(gè)細(xì)胞里有幾百至上千個(gè)線粒體,而且一個(gè)線粒體里也有而且一個(gè)線粒體里也有5-105-10個(gè)基因組拷貝,所個(gè)基因組拷貝,所以一個(gè)細(xì)胞里也就有許多個(gè)線粒體基因組。以一個(gè)細(xì)胞里也就有許多個(gè)線粒體基因組。 mtDNA mtDNA的特點(diǎn):的特點(diǎn): 突變率高突變率高,是核,

53、是核DNADNA的的1010倍左右。倍左右。 mtDNAmtDNA缺少組蛋白的保護(hù)。缺少組蛋白的保護(hù)。 線粒體內(nèi)線粒體內(nèi)DNADNA修復(fù)機(jī)制很少。修復(fù)機(jī)制很少。 線粒體內(nèi)進(jìn)行著大量的生物氧化過程,所產(chǎn)生的自由基線粒體內(nèi)進(jìn)行著大量的生物氧化過程,所產(chǎn)生的自由基對(duì)其對(duì)其DNADNA有損傷作用。有損傷作用。 因?yàn)榫拥募?xì)胞質(zhì)極少,子代的因?yàn)榫拥募?xì)胞質(zhì)極少,子代的mtDNAmtDNA基本上都是來自卵基本上都是來自卵細(xì)胞,所以細(xì)胞,所以mtDNAmtDNA是母性遺傳是母性遺傳(maternal inheritance)(maternal inheritance),且不發(fā),且不發(fā)生生DNADNA重組,因

54、此,具有相同重組,因此,具有相同mtDNAmtDNA序列的個(gè)體必定是來自一位共序列的個(gè)體必定是來自一位共同的雌性祖先。同的雌性祖先。 部分部分mtDNAmtDNA的密碼子不同于核內(nèi)的密碼子不同于核內(nèi)DNADNA的密碼子。的密碼子。 存在存在RNARNA編輯,編輯,3%5%3%5%。 基因密度大,有重疊基因,哺乳動(dòng)物線粒體無內(nèi)含子,基因密度大,有重疊基因,哺乳動(dòng)物線粒體無內(nèi)含子,酵母和植物線粒體有內(nèi)含子。酵母和植物線粒體有內(nèi)含子。4.6.4 4.6.4 葉綠體基因與基因組(葉綠體基因與基因組(Chloroplast Chloroplast genome, ct DNAgenome, ct DNA

55、)的結(jié)構(gòu)功能)的結(jié)構(gòu)功能 18801880年法國植物學(xué)家席姆佩爾(年法國植物學(xué)家席姆佩爾(SchimperSchimper)首次)首次發(fā)現(xiàn)葉綠體(發(fā)現(xiàn)葉綠體(ctct),并且證明葉綠體主要負(fù)責(zé)光合作),并且證明葉綠體主要負(fù)責(zé)光合作用。用。19621962年年KisKis和和PlantPlant首先報(bào)道葉綠體內(nèi)有首先報(bào)道葉綠體內(nèi)有DNADNA。 葉綠體葉綠體DNADNA(ct DNAct DNA)是雙鏈環(huán)狀,缺乏組蛋白)是雙鏈環(huán)狀,缺乏組蛋白和超螺旋。一般和超螺旋。一般140 kb140 kb大小,但不同物種的葉綠體大小,但不同物種的葉綠體DNADNA長短不一(長短不一(120-190 kb12

56、0-190 kb)。)。ct DNAct DNA中的中的GCGC含量與含量與核核DNADNA及及mtmt DNA DNA有很大的不同。因此可用有很大的不同。因此可用CsClCsCl密度梯密度梯度離心來分離度離心來分離ct DNAct DNA。 每個(gè)葉綠體中每個(gè)葉綠體中ct DNAct DNA的拷貝數(shù)隨著物種的不同而的拷貝數(shù)隨著物種的不同而不同(不同(20-4020-40)。但都是多拷貝的()。但都是多拷貝的(20-4020-40)。這些拷)。這些拷貝位于類核區(qū)。例如甜菜的葉細(xì)胞中每個(gè)類核體有貝位于類核區(qū)。例如甜菜的葉細(xì)胞中每個(gè)類核體有4 48 8個(gè)拷貝的個(gè)拷貝的ct DNAct DNA,而每個(gè)

57、葉綠體有,而每個(gè)葉綠體有4 41818個(gè)類核個(gè)類核體,每個(gè)細(xì)胞中約有體,每個(gè)細(xì)胞中約有4040葉綠體。葉綠體。葉綠體可分為葉綠體可分為3 3類:類:I I型型:是只含單拷貝:是只含單拷貝rRNArRNA基因。基因。 IIII型型:含兩個(gè)拷貝:含兩個(gè)拷貝rRNArRNA基因?;?。 IIIIII型型:含:含3 3個(gè)拷貝個(gè)拷貝rRNArRNA基因?;?。 ct DNAct DNA基因組的特點(diǎn):基因組的特點(diǎn): (1 1)植物葉綠體植物葉綠體DNADNA基因圖譜中包括四個(gè)基本區(qū)基因圖譜中包括四個(gè)基本區(qū)域:反向重復(fù)區(qū)域:反向重復(fù)區(qū)IRAIRA、反向重復(fù)區(qū)、反向重復(fù)區(qū)IRBIRB、小單拷貝區(qū)、小單拷貝區(qū)S

58、SCSSC、大單拷貝區(qū)、大單拷貝區(qū)LSCLSC。 (2 2)與核與核DNADNA不同,葉綠體不同,葉綠體DNADNA不含不含5-5-甲基胞嘧甲基胞嘧啶,也不與組蛋白結(jié)合。啶,也不與組蛋白結(jié)合。 (3 3)葉綠體使用核基因組通用的遺傳密碼。葉綠體使用核基因組通用的遺傳密碼。 (4 4)也是母性遺傳。也是母性遺傳。 (5 5)存在存在RNARNA編輯,編輯,0.13%0.13%。 (6 6)有內(nèi)含子(在有內(nèi)含子(在tRNAtRNA基因中,在蛋白質(zhì)編碼基因中,在蛋白質(zhì)編碼基因中)?;蛑校?。4.6.5 4.6.5 人類基因組簡(jiǎn)介人類基因組簡(jiǎn)介1.1. 人類基因組計(jì)劃人類基因組計(jì)劃(Human Gen

59、ome Project, HGP)(Human Genome Project, HGP)是由美國科學(xué)家是由美國科學(xué)家R.DulbeccoR.Dulbecco于于19861986年率先提出,年率先提出,由六個(gè)國家的科學(xué)家共同參加的旨在闡明人類基由六個(gè)國家的科學(xué)家共同參加的旨在闡明人類基因組因組3030億個(gè)緘基對(duì)的序列,發(fā)現(xiàn)所有人類基因,億個(gè)緘基對(duì)的序列,發(fā)現(xiàn)所有人類基因,破譯人類全部遺傳信息,使人類在分子水平上真破譯人類全部遺傳信息,使人類在分子水平上真正全面認(rèn)識(shí)自我的科學(xué)計(jì)劃。正全面認(rèn)識(shí)自我的科學(xué)計(jì)劃。 4040年代的曼哈頓(年代的曼哈頓(ManhattonManhatton)原子彈計(jì))原子彈

60、計(jì)劃劃 6060年代的阿波羅(年代的阿波羅(ApolloApollo)登月計(jì)劃)登月計(jì)劃 9090年代的人類基因組計(jì)劃年代的人類基因組計(jì)劃 (1 1)描繪遺傳圖譜(連鎖圖譜,推測(cè))描繪遺傳圖譜(連鎖圖譜,推測(cè))(2 2)制作物理圖譜(限制圖譜,真實(shí))制作物理圖譜(限制圖譜,真實(shí))(3 3)完成序列圖譜(測(cè)序測(cè)定,最精確)完成序列圖譜(測(cè)序測(cè)定,最精確) 3. HGP3. HGP測(cè)序步驟測(cè)序步驟 繪制染色體的低分辨率遺傳圖譜繪制染色體的低分辨率遺傳圖譜和物理圖譜,對(duì)和物理圖譜,對(duì)DNADNA進(jìn)行切割,插入進(jìn)行切割,插入酵母人工染色體或細(xì)菌人工染色體進(jìn)酵母人工染色體或細(xì)菌人工染色體進(jìn)行克隆,構(gòu)成重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論