版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第四章基因與基因組的結構1第1頁,共52頁,2023年,2月20日,星期二第一節(jié)、基因與基因的結構基因(gene):是DNA分子中含有特定遺傳信息的一段核苷酸序列,是遺傳物質的最小功能單位。
根據基因是否具有轉錄和翻譯功能分為:①編碼蛋白質的基因,它具有轉錄和翻譯功能,包括編碼酶和結構蛋白的結構基因以及編碼阻遏蛋白的調節(jié)基因;②只有轉錄功能而沒有翻譯功能的基因,包括tRNA基因和rRNA基因;③不轉錄的基因,對基因表達起調節(jié)控制作用,包括啟動基因和操縱基因,有時被統(tǒng)稱為控制基因。第2頁,共52頁,2023年,2月20日,星期二一、基因概念及其發(fā)展(一)經典遺傳學關于基因的串珠理論經典遺傳學認為基因是遺傳信息結構和功能的基本單位;即基因是最小的突變單位、重組單位和功能單位;基因位于染色體上,從結構和功能來看,它們以線性的形式相互連接(串珠理論,thebeadsonastringtheory)。(二)近代基因概念上述“三位一體”的基因概念在上世紀四十年代以前占統(tǒng)治地位。Benzer在上世紀50年代初通過噬菌體重組實驗,發(fā)現(xiàn)突變和重組可以發(fā)生在同一個基因內的不同亞單元中,從而對以上結果提出了挑戰(zhàn)。研究表明:基因可被分為更小的單位,串珠理論必須修正。Benzer提出了突變子(muton),重組子(recon)和順反子(cistron)來分別定義突變、重組和功能作為不可分割單位。第3頁,共52頁,2023年,2月20日,星期二1.順反子(Cistron)一個順反子是一段遺傳區(qū)域,在這一遺傳區(qū)域中的突變位點之間沒有互補作用。(1)順反子的概念來自順反測驗(cis-transtest):它是用于說明在同一染色體上(順式)或相對染色體上(反式)排列的突變位點之間的互補試驗。順式試驗實際是對照,如果兩個突變均在同一個基因組中,那么另一個基因組的兩個基因座均為野生型,其產物為正常的基因產物,細胞表現(xiàn)出野生表型;反式試驗才是真正的互補試驗,可以確定功能單位的邊界,如果反式排列時有互補作用,說明兩個突變位點處于不同的順反子中,如不能互補,說明它們屬于同一順反子。如果兩個突變在同一個基因中,那么它們以反式構型出現(xiàn)在細胞中時,每一基因組都攜帶有這一基因的突變體拷貝,因而在細胞中不能產生具有功能的產物,即不出現(xiàn)互補。如果突變位于不同基因中,當它們以反式構型出現(xiàn)時,那么每個基因組均可補償另一個基因組缺少的正常產物。當細胞具有所有基因產物時,表現(xiàn)為野生型。
第4頁,共52頁,2023年,2月20日,星期二
順式試驗反式試驗 突變位點位于同一順反子中突變位點于不同順反子中 ABABABAB+–++(2)不能互補的突變必然影響的是同一功能單位,能夠互補的突變必定影響不同的功能單位,通過順反試驗發(fā)現(xiàn)的遺傳功能單位稱為順反子。(3)基因是一個順反子,它是一個功能單位。一個順反子內存在許多突變位點,即存在許多突變子;一個順反子內可以發(fā)生交換出現(xiàn)重組,因此也可以有許多重組子。第5頁,共52頁,2023年,2月20日,星期二2.突變子(muton)突變子是基因內部變化后產生突變表型的最小單位,順反子內可能發(fā)生突變的最小單位,即核苷酸對。3.重組子(recon)
重組子是基因內部不能由重組而分開的基本單位,可進行重組的最小遺傳單位,可小到只有單個核苷酸對。(三)基因與順反子的關系1.在簡單基因組中基因與順反子等價
(1)在細菌中:基因是編碼區(qū)(多順反子)。(2)在真核細胞中:基因是轉錄的單位(單順反子)。2.復雜基因組中基因與順反子不等價在高等真核細胞的基因組中,基因和產物之間的關系較為復雜。(1)在反式剪接與RNA編輯的中,單個多肽鏈的合成需要多個基因表達,每個基因都是同一功能單位的部分并構成單個順反子。(2)一個基因通過多種剪接方式或其他選擇性信息的利用方式產生多種產物。第6頁,共52頁,2023年,2月20日,星期二第7頁,共52頁,2023年,2月20日,星期二3.重疊基因(overlappinggenes):也稱為嵌套基因(nestedgene),指是指兩個或兩個以上的基因共有一段DNA序列,或是指一段DNA序列成為兩個或兩個以上基因的組成部分。重疊基因有多種重疊方式。例如,大基因內包含小基因;前后兩個基因首尾重疊一個或兩個核苷酸;幾個基因的重疊,幾個基因有一段核苷酸序列重疊在一起,等等。重疊基因中不僅有編碼序列也有調控序列,說明基因的重疊不僅是為了節(jié)約堿基,能經濟和有效地利用DNA遺傳信息量,更重要的可能是參與對基因的調控。第8頁,共52頁,2023年,2月20日,星期二三、基因的結構(Geneorganization)1.基因的數量基因的功能取決于DNA的一級結構,一個DNA分子能攜帶多少基因呢?若以1000~1500bp編碼1個基因計算,猿猴病毒SV40基因組DNA有5000bp,可編碼5種基因。人類基因組DNA含3×109bp,理論上可編碼200萬以上的基因,因存在內含子而每個基因可長達5000~8000bp,少數可達20000bp。這樣推算人類基因組相當于40~60萬個基因;而現(xiàn)在知道人類基因組所含基因只有2~2.5萬個,只占全部基因組的3%,其余90%多屬于非編碼區(qū),其功能仍不清楚。2.編碼區(qū)和非編碼區(qū)一個基因組的核酸可分為編碼區(qū)和非編碼區(qū)兩類序列。(1)編碼區(qū)為mRNA、rRNA、tRNA以及其他各種RNA編碼。(2)非編碼區(qū)又可分為信號序列和非信號序列兩類。信號序列包括:復制起點、增強子、啟動子、終止子及一切由調節(jié)蛋白識別和結合的序列;非信號序列是指間隔區(qū)。第9頁,共52頁,2023年,2月20日,星期二3.一個完整基因的結構一個完整的結構基因常具備以下幾個組成部分:啟動子、編碼序列、終止子,以及基因在啟動子的上游或其它區(qū)域的調控序列。(1)編碼區(qū),又稱為開放閱讀框(ORF):可以翻譯成蛋白質的DNA區(qū)域,在細菌中,即為一個基因;在真核細胞中,編碼區(qū)可以被內含子隔斷。(2)轉錄單位(轉錄區(qū)域):可以轉錄為RNA的一段DNA區(qū)域。在真核細胞中即為一個基因;在細菌中可能包含多個基因。(3)非翻譯區(qū)或非編碼區(qū)(UTR,NCR):指轉錄單位中不能翻譯成蛋白的部分。又可分為5’UTR和3’UTR,這些序列往往具有調控功能;5’UTR控制核糖體的結合,還可能促進衰減子控制;而3’UTR在mRNA的穩(wěn)定性中起重要作用。(4)基因間隔區(qū):間隔區(qū)并非不含有信息,這信息不表現(xiàn)為核苷酸的順序,而表現(xiàn)為序列的長度。如MS2外殼蛋白結構基因上游的非編碼序列不得少于30nt,否則,翻譯效率要降低10倍;真核基因的內含子含有重要信息,如剪接位點等都有嚴格要求;果蠅乙醇脫氫酶基因Adh有兩個內含子,如缺失其中之一或兩個都缺失,則轉錄水平下降5倍。第10頁,共52頁,2023年,2月20日,星期二一個完整真核生物基因的結構包括:
(1)啟動子(promoter):是RNA聚合酶特異性識別和結合的DNA序列,位于結構基因轉錄起始點的上游-25bp處,本身不被轉錄;啟動子必須與轉錄因子結合才能被RNA聚合酶識別與結合;具有TATA盒。(2)上游啟動子元件(upstreampromoterelements):TATA盒上游的一些特定的DNA序列;反式作用因子能與這些元件結合調控基因的轉錄效率;上游啟動子元件包括CAAT盒(GCNCAATCT)、CACA盒(CCGCC)及GC盒(GCCACACCC)。(3)反應元件(responseelement):能介導基因對細胞外的某種信號產生反應的DNA序列,稱為反應元件。如糖皮質、激素反應元件。(4)增強子(enhancer):指能使和它連鎖的基因轉錄頻率明顯增加的DNA序列。其中含有多個能被反式作用因子識別與結合的順式作用元件,能增強鄰近基因的轉錄。(5)沉默子(silencer):又稱負增強子,負調控序列。(6)加尾信號:結構基因的最后一個外顯子中有一個保守序列AATAAA與下游一段GT豐富區(qū)或T豐富區(qū)共同構成polyA加尾信號;與RNA聚合酶結合的延長因子能識別這種結構并與之結合,然后在AAUAAA下游10~30個堿基的部位切斷RNA并加上polyA尾巴。第11頁,共52頁,2023年,2月20日,星期二4.基因命名法
基因的命名一般根據種屬習慣來命名。常用斜體表示基因的名稱,等位基因及其基因型,或在必要時表示基因轉錄而成的mRNA,而蛋白產物和表型用正體來表示。但是在研究不同生物的同一遺傳機制時,往往會產生一些混淆。在許多種屬中,基因由包括幾個字母和數字的符號來表示,一些種屬命名慣例(如果蠅、大腸桿菌)認為使用小寫字母表示隱性突變,而用第一個字母大寫來表示顯性突變。在其他一些種屬包括人的基因命名中,基因全由大寫字母表示?,F(xiàn)在,通過大規(guī)模的測序方法,更多的基因不斷被鑒定,因而十分需要一個統(tǒng)一的命名方法。第12頁,共52頁,2023年,2月20日,星期二大腸桿菌和其他細菌:用三個小寫字母表示一個操縱子,接著的大寫字母表示不同基因座。例如:lac操縱子;基因座lacZ,lacY,lacA;蛋白質LacZ,LacY,LacA。酵母:用三個字母表明基因功能,數字表示不同的基因座。啤酒酵母基因GAL4,CDC28;蛋白質GAL4,CDC28;非洲粟酒酵母基因gal4,cdc2;蛋白質Gal4,Cdc2。線蟲:用三個小寫字母表示突變表型,如存在不只一個基因座,用連字符后接數字表示。例如:基因unc-86,ced-9;蛋白質UNC-86,CED-9。果蠅:來自突變表型的描述可以用1-4個字母代表。例如基因white(w),tailless(tll);蛋白質White,Tailless。植物:雖然沒有適用于所有植物的慣用法,但大多數用1-3個小寫字母表示。Arabidopsis基因用果蠅的方法命名但使用大寫字母,例如基因AGAMOUS(AG),蛋白AGAMOUS。脊椎動物:一般以描述基因功能的1-4個小寫字母和數字表示其基因功能。例如基因sey,myc,蛋白Sey,Myc。人類:方法如脊椎動物但需大寫。例如基因MYC、ENO1,蛋白MYC、ENO1。第13頁,共52頁,2023年,2月20日,星期二5.基因的突變
基因突變是指出現(xiàn)在單個基因內部任何可遺傳的改變,又稱為點突變?;蛲蛔兛梢宰匀话l(fā)生,也可通過理化因素誘發(fā)。主要包括兩種情況:一是堿基替換:一個堿基對被另一堿基對替換,包括轉換和顛換。二是移碼突變:增加或減少一個或幾個堿基對?;蛲蛔兣c氨基酸順序的關系:(1)同義突變(samesensemutation):密碼子發(fā)生改變,但所編碼的氨基酸不變。(2)錯義突變(missensemutation):DNA中堿基對替換,使mRNA的某一密碼子改變,由它所編碼的氨基酸不同。很多錯義突變造成蛋白質的部分或完全失活,從而表現(xiàn)出突變性狀。(3)無義突變(nonsensemutation):堿基替換改變了mRNA上的一個密碼子,成為3個密碼子UAG,UAA和UGA中的一個時,就出現(xiàn)無義突變。第14頁,共52頁,2023年,2月20日,星期二第二節(jié)、基因組及其結構基因組(genome)
:是指含有一個生物體生長、發(fā)育和繁殖所需要的全部遺傳信息的整套核酸。核基因組是單倍體細胞核內的全部DNA分子;線粒體基因組和葉綠體基因組分別是指一個線粒體和葉綠體所包含的全部DNA分子?;蚪M中不同的區(qū)域具有不同的功能,有編碼區(qū)和非編碼區(qū),有些區(qū)域的功能尚不清楚。功能基因組:是指表達一定功能的全部基因所組成的DNA序列,包括編碼基因和調控基因?;蚪M結構:是指不同功能區(qū)域在整個DNA分子中的分布情況。
C值:是指單倍基因組DNA含量(haploidDNAcontent,C值)。不同的生物體,其基因組的大小和復雜程度各不相同。進化程度越高的生物體一般其基因組越大也越復雜,但不盡然,如肺魚的C值居然比人高10多倍;在親緣關系相近的物種間,C值仍然相差很大,兩棲類的不同物種間C值可相差100倍,被子植物不同物種間C值相差達1000倍,藻類5000倍,魚類350倍,節(jié)肢動物250倍,在原生動物不同物種間C值相差竟高達5800倍。因此,C值的大小并不說明遺傳復雜性的高低,而只說明基因組中DNA的多少。第15頁,共52頁,2023年,2月20日,星期二一、病毒基因組的結構
(一)病毒簡介病毒是最小的生命體,直徑只有20-300nm,其基本構造為一層外殼蛋白(capsid)包圍著核酸和數種酶;有些病毒在外殼蛋白外還有一層被膜(envelope),被膜內有病毒基因編碼的糖蛋白。病毒必需進入宿主細胞中借助宿主細胞內的一些酶和細胞器才能使病毒得以復制;外殼蛋白(或被膜)有保護病毒基因組和識別、侵襲特定宿主細胞的功能。第16頁,共52頁,2023年,2月20日,星期二1.病毒分類:病毒的遺傳物質是單鏈或雙鏈的DNA或RNA,根據病毒所含的核酸及復制策略分成7類:雙鏈DNA、單鏈DNA、雙鏈RNA、正單鏈RNA、負單鏈RNA、反轉錄RNA及反轉錄DNA病毒。第17頁,共52頁,2023年,2月20日,星期二2.病毒基因組的結構特點①不同病毒基因組大小差異較大。病毒的基因組很小,但不同病毒基因組相差甚大。如乙肝病毒DNA只有3kb大小,只編碼4種(6種)蛋白質;痘病毒的基因組為300kb,可編碼病毒復制所涉及的酶類,甚至包括核苷酸代謝的酶類等幾百種蛋白質,因此痘病毒對宿主的依賴性比乙肝病毒小。②病毒基因組是DNA或RNA。每種病毒顆粒中只含一種核酸,可以是單鏈或雙鏈、環(huán)狀或線性分子。大多數DNA病毒的基因組是雙鏈DNA分子;大多數RNA病毒的基因組是單鏈RNA分子。乳頭瘤病毒是環(huán)狀雙鏈DNA病毒,腺病毒的基因組是線性雙鏈DNA,脊髓灰質炎病毒是單鏈RNA病毒,呼腸孤病毒的基因組是雙鏈RNA。③多數RNA病毒的基因組是由連續(xù)的核糖核酸鏈組成,但有些病毒的基因組RNA由不連續(xù)的幾條核酸鏈組成。流感病毒由8條RNA分子構成;呼腸孤病毒由10個雙鏈RNA片段構成。第18頁,共52頁,2023年,2月20日,星期二④基因重疊:病毒基因組有基因重疊現(xiàn)象,即同一段DNA片段能夠編碼2種甚至3種蛋白質分子。線粒體和質粒DNA也有基因重疊現(xiàn)象;基因重疊使較小的基因組能夠攜帶較多的遺傳信息。⑤病毒基因組的大部分是編碼蛋白質的,只有非常小的部份不被翻譯。如X174中不翻譯的部份只占217/5375,不到5%,不翻譯的DNA順序通常是基因表達的控制序列。⑥病毒基因組DNA序列中功能相關的基因往往叢集存在,形成一個轉錄單元,稱為多順反子mRNA,然后再加工成各種蛋白質的模板mRNA。⑦除了反轉錄病毒外,病毒基因組都是單倍體,每個基因在病毒顆粒中只出現(xiàn)一次。反轉錄病毒基因組有兩個拷貝。⑧噬菌體的基因是連續(xù)的,而真核病毒的基因具有內含子,除正鏈RNA病毒外,真核細胞病毒的基因都是先轉錄成mRNA前體,再經加工才能切除內含子成為成熟的mRNA。有些真核病毒的內含子或其中的一部分,對某一個基因來說是內含子,而對另一個基因卻是外顯子,如SV40和多瘤病毒的早期基因。第19頁,共52頁,2023年,2月20日,星期二二、原核基因組的結構
原核基因組的結構特點在許多方面與病毒的基因組特點相似,但又有其獨特的結構和功能。1.原核染色體基因組結構特點①原核染色體基因組通常由一條環(huán)狀雙鏈DNA分子組成。整個染色體DNA幾乎全部由功能基因與調控序列所組成,有密碼子重疊和基因重疊現(xiàn)象;染色體聚集成一個類核(nucleoid)區(qū)域。第20頁,共52頁,2023年,2月20日,星期二②功能相關的基因構成操縱子,或高度集中,并常轉錄成為多順反子的mRNA。幾乎每個基因序列都與它所編碼的蛋白質序列呈線性對應狀態(tài)。③結構基因一般是單拷貝,但rRNA的基因往往是多拷貝。多拷貝的rRNA的基因有利于核糖體的快速組裝,便于在急需蛋白質合成時在短時間內生成的大量核糖體。④只有一個復制起始點;⑤基因是連續(xù)的,無內含子,轉錄后不需剪接;編碼順序一般不會重疊;⑥編碼區(qū)在基因組中所占比例遠遠大于真核基因組,小于病毒基因組;基因組中重復序列少;⑦細菌基因組中存在可移動的DNA序列,如:插入序列和轉座子。第21頁,共52頁,2023年,2月20日,星期二2.質粒(plasmid)(1)定義:存在于細菌染色體外能獨立復制、穩(wěn)定遺傳的共價閉合環(huán)狀DNA分子;(大小在1~200kb)。(2)質粒的分類a.按功能分為:R質粒:抗藥性質粒;F質粒(fertilityfactor):性質??蓻Q定細菌的性別;Col質粒:為大腸桿菌素質粒。b.根據質粒能否在細胞間進行傳遞分為:接合型質粒、可移動型質粒、自傳遞質粒。c.按復制機理分為:嚴緊型質粒(stringentplasmid):即低拷貝數質粒;松弛型質粒(relaxedplasmid):高拷貝數質粒。(3)質粒的特性a.能自主復制;b.質粒的不相容性(incompatibility)兩種親緣關系密切的不同質粒不能共存于一個宿主菌;c.質??梢赞D移。第22頁,共52頁,2023年,2月20日,星期二三、真核生物基因組結構
(一)真核生物基因組的特點①基因組遠大于原核生物的基因組,具有多個復制起點,而每個復制子的長度較小。如人的單倍體基因組有3×109bp,大約含有2~2.5萬個基因;而E.coli基因組約4×106bp,約有4000個基因。②真核生物基因組DNA與組蛋白等構成染色質,被包裹在核膜內,核外還存在遺傳成分(如線粒體DNA等);體細胞一般是二倍體(diploid),即有兩份同源的基因組。③真核生物基本上不存在操縱子結構,一個結構基因轉錄生成一條mRNA,即mRNA是單順反子,許多蛋白是由相同或不同的亞基構成,因此涉及多個基因的協(xié)調表達。④非編碼區(qū)存在大量重復序列,重復序列或集中成簇,或散在分布于基因間。⑤基因組中不編碼的區(qū)域多于編碼區(qū)域。并且,編碼蛋白質的基因一般是不連續(xù)的,即有外顯子和內含子,在轉錄后經剪接成成熟mRNA后,才能翻譯成蛋白質。人類基因組中可能僅有3%左右的序列是編碼區(qū)(codingregion)。第23頁,共52頁,2023年,2月20日,星期二(二)重復序列(repeatsequence)1.高度重復序列(highrepetitivesequences)高度重復序列在基因組中重復頻率可高達106以上,因此復性速度很快;序列長度一般為10~300bp的較短序列,在基因組中所占比例隨種屬而異,約占10~60%,人基因組中約占20%。(1)高度重復序列的種類
①反向重復序列:由兩個相同順序的互補拷貝在同一DNA鏈上反向排列而成;這種重復順序復性速度極快;序列長度100~1000
bp,約占人基因組的5%。第24頁,共52頁,2023年,2月20日,星期二②串聯(lián)重復序列:由2~172bp重復單位排列成串而形成的。由于堿基組成不同于其他部份,在等密度梯度離心時與主體DNA分開,稱衛(wèi)星DNA。串聯(lián)重復序列包括:
a.衛(wèi)星DNA(satelliteDNA):重復區(qū)涵蓋100kb~5Mb,大部分位于染色體著絲點。重復單位2bp~172bp。其中一種重復單位在170bp左右,為靈長類所獨有,非洲綠猴重復單位為172bp。人類為171bp,約占每個染色體的3~5%。
b.小衛(wèi)星(minisatellite)DNA:重復區(qū)域在0.1kb~20kb間。主要包括重復單位在9~80bp之間的可變數目串聯(lián)重復序列(variablenumberoftandemrepeats,VNTR)和端粒。VNTR大多位于非編碼區(qū),重復的數目隨個體差異很大,可用于DNA指紋分析;人類端粒的重復序列是TTAGGG,涵蓋10~15kb,老化后可能變短。
c.微衛(wèi)星(microsatellite)DNA:重復單元1~6bp的短串聯(lián)重復(shorttandemrepeats,STR),涵蓋區(qū)域小于150bp。微衛(wèi)星DNA里的重復數目亦隨個體而異,廣泛被用於DNA指紋;在人細胞組中衛(wèi)星DNA約占5-6%。衛(wèi)星DNA只發(fā)現(xiàn)于真核生物,占基因組10%~60%。第25頁,共52頁,2023年,2月20日,星期二③散布重復序列:可看成是一種轉座子(transposableelements),它們借DNA重組機制而轉移;經過許多代的遺傳累積,DNA的某段序列會散布各處;由于突變的結果,每個重復單位的序列并非完全相同。原位雜交技術證明衛(wèi)星DNA位于染色體的著絲點和端粒處
第26頁,共52頁,2023年,2月20日,星期二(2)高度重復順序的功能①參與復制水平的調節(jié):反向序列常存在于DNA復制起點區(qū)的附近;許多反向重復序列也是一些蛋白的結合位點。②參與基因表達的調控:DNA的重復順序可以轉錄到hnRNA分子中,有些反向重復順序可以形成發(fā)夾結構,對穩(wěn)定RNA分子免遭分解有作用。③參與轉座作用:轉座子的末端一般都包括反向重復順序;由于這種順序可以形成回文結構,因此在轉位作用中即能連接非同源的基因,又可被參與轉位的特異酶所識別。④與進化有關:高度重復順序的核苷酸序列具有種屬特異性,但相近種屬又有相似性。⑤同一種屬中不同個體的高度重復順序的重復次數不一樣,這可以作為每一個體的特征,即DNA指紋。⑥衛(wèi)星DNA成簇的分布在染色體著絲點附近,可能與減數分裂時染色體配對有關,即同源染色體之間的聯(lián)會可能依賴于具有染色體專一性的特定衛(wèi)星DNA順序。第27頁,共52頁,2023年,2月20日,星期二2.中度重復序列(moderaterepetitivesequences):指在基因組中重復頻率10~105的順序,序列長100~5000bp;在基因組中所占比例約占10~40%,分布于結構基因之間、基因簇中、以及內含子中。中度重復順序一般具有種特異性;在適當的情況下,可以應用它們作為探針區(qū)分不同種哺乳動物細胞的DNA。中度重復序列一般不編碼蛋白質,功能可能類似于高度重復順序;但也有些中度重復順序可以編碼蛋白質或rRNA的結構基因,如rRNA基因,tRNA基因,組蛋白基因,免疫球蛋白基因等。重復順序的長度不同,有重復順序平均長度為300bp的短分散片段(shortinterspersedrepeatedsegments,SINES),如Alu家族、Hinf家族等;以及重復順序平均長度3500~5000bp的長分散片段(LINES),如KpnⅠ家族等。幾種典型的中度重復順序如下:(1)Alu家族:Alu序列分散在整個哺乳動物基因組中,平均每5kb就有一個Alu序列;在間隔DNA、內含子中都有Alu序列,約占人基因組的3~6%;Alu序列長度約300bp,每個序列中有一個限制性內切酶Alu的切點(AG↓CT)而定名為Alu家族。第28頁,共52頁,2023年,2月20日,星期二a.Alu順序具有種的特異性:如人的Alu序列制備的探針只能用于檢測人的基因組中的Alu序列。
b.Alu家族的功能:由于在許多hnRNA中含有大量的Alu序列,而且,Alu序列含有與某些真核基因內含子剪接接頭相似的序列,因而,Alu序列可能參與hnRNA的加工與成熟。(2)KpnⅠ家族:用限制性內切酶KpnⅠ切靈長類動物的DNA,在電泳譜上可看到4個不同長度的片段,這就是KpnⅠ家族,占人體基因組的1%。KpnⅠ家族成員序列比Alu家族長,而且不均一,呈散在分布,屬于中度重復順序的長分散片段型。(3)Hinf家族:這一家族以319bp長度的串聯(lián)重復存在于人體基因組中,用限制性內切酶HinfⅠ消化人體DNA,可以分離到這一片段。Hinf家族在單位基因組內約有50~100個拷貝,分散在不同的區(qū)域。(4)多聚dT-dG家族:這一家族多個dT-dG雙核苷酸串聯(lián)在一起,分散于人體基因組中。在人基因組中,多聚dT-dG家族序列的平均長度為40bp。第29頁,共52頁,2023年,2月20日,星期二(5)rRNA基因:rRNA基因集中成簇存在,各重復單位中的rRNA基因都相同,這樣的區(qū)域稱為rDNA,如染色體的核仁組織區(qū)(nucleolusorganizerregion)即為rDNA區(qū)。真核生物的18S、5.8S和28SrRNA基因構成一個長7.5kb轉錄單位。在高等生物中,5SrRNA單獨轉錄的,而且其在基因組中的重復次數高于18S和28S基因。多個轉錄單位和不轉錄的間隔區(qū)(21~100bp)構成一個rRNA基因簇(rDNA簇),間隔區(qū)類似衛(wèi)星DNA的串聯(lián)重復順序,由于間隔區(qū)中的串聯(lián)重復次數不同,因此,不同間隔區(qū)的長短差異很大。第30頁,共52頁,2023年,2月20日,星期二(6)組蛋白基因:組蛋白基因在各種生物體內的拷貝數因種而異;組蛋白基因沒有一定的排列方式,在拷貝數大于100的基因組中串聯(lián)重復形成基因簇。在果蠅和非洲爪蟾中,5種組蛋白組成一個重復單位,也存在間隔區(qū),而且組蛋白基因的轉錄方向不一樣,多個重復單位形成串聯(lián)重復排列。哺乳動物的組蛋白基因一般呈散在分布或集成一小群;所有組蛋白基因都不含內含子,而且在序列上相應的組蛋白基因都很相似,從而編碼的組蛋白在結構上和功能上極相似。第31頁,共52頁,2023年,2月20日,星期二(三)單拷貝序列(singlecopysequences)
1.單拷貝序列在單倍體基因組中只出現(xiàn)一次或數次,又稱低度重復順序,占哺乳類基因組的50~80%,人基因組中約占65%,序列長750~2000bp,相當于一個結構基因的長度。
2.單拷貝序列中只有一小部分編碼蛋白質,其它部份的功能尚不清楚。
3.在基因組中,單拷貝序列一般與重復序列相間排列。
4.單拷貝基因通過基因擴增仍可合成大量的蛋白質,如一個蠶絲心蛋白基因可作為模板合成104個絲心蛋白mRNA,每個mRNA可存活4d,共合成105個絲心蛋白,這樣,在幾天之內,一個單拷貝絲心蛋白基因就可以合成109個絲心蛋白分子。(四)多基因家族與假基因
1.多基因家族(multigenefamily):多基因家族是一群具相似序列的基因,編碼結構和功能上相關聯(lián)的一個蛋白質家族;來源于某一祖先基因經過重復和變異所產生的一組基因(包括在結構和功能上相關的rRNA和tRNA基因)。第32頁,共52頁,2023年,2月20日,星期二①簡單多基因家族:各成員相同或基本相同,如5SRNA基因,在爪蟾中5SrRNA基因與非轉錄間隔區(qū)相間排列,組成一個重復單位,5SrRNA基因后面是一段并不轉錄的假基因。②復雜的多基因家族:各成員不完全相同,但功能相關,串聯(lián)在一起成為一個重復單位;如H2A、H2B、H3及H4屬于相同的組蛋白家族;果蠅的tRNA基因家族。③由發(fā)育階段控制的多基因家族:如人的-珠蛋白基因家族。成人的血紅蛋白A(HbA)占總血紅蛋白的97%,血紅蛋白A2(HbA2)占2%,其余1%是HbF。HbA是由2條鏈和2條鏈組成的四聚體(22),HbA2為22四聚體,HbAF為22四聚體。在哺乳動物中編碼血紅蛋白的-樣和-樣亞基的基因分別形成兩個不同的基因族,并存在于不同的染色體上。這兩個基因族是按不同的發(fā)育時期表達不同的基因。第33頁,共52頁,2023年,2月20日,星期二2.假基因(pseudogene):在多基因家族中,某些成員并不產生有功能的基因產物,這些基因稱為假基因。①非處理過假基因(nonprocessedpseudogenes):由成簇的重復基因突變而來,也稱傳統(tǒng)性假基因(conventionalpseudogenes),如珠蛋白基因家族里的。重復基因有多個副本,若其中幾個發(fā)生突變個體仍能生存而將此變異傳至后代。②處理過假基因(processedpseudogenes):處理過假基因大多來自于DNA重組。假基因可能是mRNA經反轉錄產生cDNA,再整合到DNA中形成的,因此該假基因沒有內含子;在這個過程中,可能同時會發(fā)生缺失,倒位或點突變等變化,而使假基因不能表達。3.超基因(Supergene):在一個基因簇內含有幾百個功能相關的基因。如人類主要組織相容性抗原復合體HLA和免疫球蛋白重鏈及輕鏈基因都屬于超基因。來源于一個共同的祖先基因通過各種各樣的變異,產生了結構大致相同但功能卻不盡相似的一大批基因。這一大批基因分屬于不同的基因家族,但可以總稱為一個基因超家族第34頁,共52頁,2023年,2月20日,星期二(五)自私DNA(selfishDNA)在哺乳動物基因組中有大量的非編碼序列,如高度重復序列,內含子,間隔DNA等,其中只有很小一部分具有調節(jié)功能,絕大部分都沒有功能。在這些非編碼序列中雖積累了大量缺失、重復或其它突變,但對生物并無影響,它們的功能似乎只是為了自身復制,稱這類DNA為自私DNA或寄生DNA(parasiteDNA),自私DNA的功能目前還不了解。(六)限制性片段長度多態(tài)性在同種生物的不同個體間,盡管其蛋白質產物的結構和功能完全相同或僅存在細微的差異,但在DNA水平卻存在差異,尤其在非編碼區(qū)差異更大;由于DNA順序上的大多數突變是不影響生物體表型的中性突變,因而無法用傳統(tǒng)的遺傳學方法來研究。分子生物學技術可從DNA水平上直接分析生物體的突變,若DNA序列中的某個堿基突變產生了某種限制性內切酶的位點。利用此限制性內切酶消化時會產生與正常不同的限制性片段;這樣,在同種生物的不同個體中會出現(xiàn)不同長度的限制性片段類型,即限制性片段多態(tài)性(RestrictionFragmentLengthPolymorphism,RFLP)。第35頁,共52頁,2023年,2月20日,星期二RFLP分為兩類型:①點多態(tài)性;②由于DNA分子內部發(fā)生較大的序列變化所產生的多態(tài)性。第36頁,共52頁,2023年,2月20日,星期二1.點多態(tài)性(pointpolymorphism):是由于限制性內切酶位點上發(fā)生了單個堿基突變而使這一限制性位點發(fā)生丟失或獲得而產生的多態(tài)性;這類多態(tài)性實際上是雙態(tài)的,即有(+)或無(-)。如:珠蛋白第6個Glu→Val引起貧血。對應于第5~7個aa的序列5‘-CCTGAGGAG-3’,包含MstII的識別序列CCTNAGG,兩旁最近的MstII切點是5’端1.2kb處和3’端0.2kb處,因此MstII能將正常的DNA切成1.2kb和0.2kb。變異的珠蛋白第6個aa的GAG突變成GTG,使MstII無法在此處切下,于是產生一個1.4kb的片段,這個差別能夠以珠蛋白的DNA做探針顯示出來。第37頁,共52頁,2023年,2月20日,星期二2.高變區(qū)DNA與DNA指紋(1)DNA分子內部發(fā)生較大的序列變化產生的多態(tài)性又可分成兩類:①由于DNA序列上發(fā)生了缺失、重復、插入所致。②是近年發(fā)現(xiàn)的所謂“高變區(qū)”。高變區(qū)(highlyvariableregion)是由多個串聯(lián)重復序列組成的,不同個體高變區(qū)內串聯(lián)重復的拷貝數不同而造成高變區(qū)長度不同,而使高變區(qū)兩側限制酶識別位點的固定位置隨高變區(qū)的大小而發(fā)生相對位移。這一類型的RFLP是由于高變區(qū)內串聯(lián)重復順序的拷貝數不同所產生的,其突出特征是限制性內切酶識別位點本身的堿基沒有發(fā)生改變,改變的只是它在基因組中的相對位置。(2)DNA指紋:人的衛(wèi)星DNA是由短的DNA片段(10bp左右)多次重復構成的,重復片段的組成和拷貝數在不同個體及基因組的不同位置上不同,提取不同個體的基因組DNA,用其切點能識別序列為4個堿基而又不切割該重復片段的限制性內切酶在重復片段的兩側切割基因組DNA,電泳分離,再與含有這些重復序列的特異性探針雜交,顯示有個體特異性的圖譜,即DNA指紋。第38頁,共52頁,2023年,2月20日,星期二DNA序列中有大量的單個堿基的替換,通常的技術只能檢測出影響到限制性內切酶識別位點上的突變;因為DNA的中性突變常以孟德爾共顯性遺傳方式遺傳給下一代,所以對這類突變檢測已廣泛用于遺傳病的診斷、產前診斷、親子鑒定以及法醫(yī)學上對罪犯的確認等。第39頁,共52頁,2023年,2月20日,星期二a.DNA指紋的圖譜取決于所用探針的核心序列(即重復序列中的重復單位)。目前有兩種探針,其核心序列分別為AGAGGTGGGCAGGTGG和AGGGCTGGAGG,這兩種序列在人體基因組中不同的位置重復次數不同,而在不同個體的基因組中,對應位置上這兩種核心序列的重復次數也不同,用這兩種探針之一與合適的酶切的人基因組DNA片段雜交,在不同的個體將得到不同的DNA指紋。
b.對由于高變區(qū)重復片段長度不同所引起的RFLP來說,在基因組上,某位置核心序列的重復次數在不同的個體不同。如在個體A為10個拷貝,個體B為15個拷貝,而個體C又可能為18個拷貝等。因此,在不同個體同一個相應位置上核心序列的重復次數是多態(tài)的;即使在基因組上的某位置核心序列的重復次數相同,被酶切出的長度相同,但在其它位置該序列重復次數可能不同,產生完全相同的機會小于6×10-9。第40頁,共52頁,2023年,2月20日,星期二c.DNA指紋技術用于親子鑒定和法醫(yī)上對罪犯的確認等領域。例如:總統(tǒng)、傳聞兒子及衛(wèi)星DNA:長久以來人們便一直認為EstonHemings是美國的杰佛遜總統(tǒng)和他的女黑奴SallyHemings所生。另外,ThomasWoodson家族的人亦認為他們是杰佛遜總統(tǒng)的后代。分析Y染色體的微衛(wèi)星DNA,杰佛遜總統(tǒng)并無其他兒子,因此用他的叔叔的后代的染色體來分析。共分析11個微衛(wèi)星區(qū)域,每個區(qū)域里的重復數目如下:杰佛遜總統(tǒng)的叔叔的后代15、12、4、11、3、9、11、10、15、13、7EstonHemings的后代15、12、4、11、3、9、11、10、15、13、7ThomasWoodson的后代14、12、5、11、3、10、11、13、13、13、7第41頁,共52頁,2023年,2月20日,星期二第三節(jié)、細胞器基因組一、線粒體基因組及其功能1.線粒體DNA的分子特點
(1)線粒體DNA(mtDNA)是雙鏈分子,是裸露的,一般為閉合環(huán)狀結構,但也有線性的。其分子量約為60×106道爾頓,長度為15~30m。mtDNA與核DNA有明顯的不同:(2)mtDNA與原核生物的DNA一樣,重復序列少;(3)mtDNA的浮力密度比較低;(4)mtDNA的堿基成分中G、C的含量比A、T少,如酵母mtDNA的G、C含量僅為21%;(5)mtDNA兩條單鏈的密度不同,一條稱為重鏈(H鏈),另一條稱為輕鏈(L鏈);(6)mtDNA單個拷貝非常小,僅為核基因組的十萬分之一。(7)線粒體基因組大小變化較大,從哺乳動物的約16kbp到高等植物的數10萬bp(如玉米的為570kbp)。第42頁,共52頁,2023年,2月20日,星期二
2.mtDNA的基因組的構成
(1)閉合環(huán)狀DNA;(2)基因數目和排列順序相同;(3)有D環(huán)和2個復制起始點;(5)基因間沒有間隔,不是每個基因都有自己的起動子。(6)某些蛋白質的密碼子與核基因通用密碼子不同;(7)mtDNA主要編碼rRNA和tRNA分子,同時還編碼少部分氧化呼吸鏈所需要酶類的亞基。
(8)人、鼠和牛的mtDNA的全序列是最早被測出來的,三種mtDNA均顯示相同的基本遺傳信息結構。每個都含有2個rRNA基因、22個tRNA基因和13個可能的蛋白質結構基因。5個基因編碼已知的蛋白質,但其他可能的蛋白質結構基因的產物及功能目前尚未確定。第43頁,共52頁,2023年,2月20日,星期二(9)高等植物的mtD
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 沈陽理工大學《產品創(chuàng)新設計》2021-2022學年第一學期期末試卷
- 合同到期了單位不續(xù)簽通知模板
- 2024年拉薩駕駛員客運資格證模擬考試題及答案詳解
- 2024簡單版機動車借款抵押合同
- 2024服裝制作合同
- 2024防水材料采購合同
- 2024深圳建設工程技術咨詢合同樣本
- 2024光伏發(fā)電安裝合同范本光伏發(fā)電安裝合同范本
- 2024教師聘用合同
- 2024幼兒園裝修改造工程施工合同
- 幼兒園繪本故事:《老虎拔牙》 課件
- 2021年上半年《系統(tǒng)集成項目管理工程師》真題
- 一個冬天的童話 遇羅錦
- GB/T 706-2008熱軋型鋼
- 實驗六 雙子葉植物莖的初生結構和單子葉植物莖的結構
- GB/T 25032-2010生活垃圾焚燒爐渣集料
- GB/T 13610-2020天然氣的組成分析氣相色譜法
- 《彩虹》教案 省賽一等獎
- 2023年湖南建筑工程初中級職稱考試基礎知識
- 沈陽機場航站樓擴建工程安裝施工組織設計
- 司法考試:證據法
評論
0/150
提交評論