基因家族的定義_第1頁
基因家族的定義_第2頁
基因家族的定義_第3頁
基因家族的定義_第4頁
基因家族的定義_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

什么是一種基因家族呢由一種共同的祖先基因通過重復(duplication)和突變(mutation)產(chǎn)生的、外顯子中含有相似的序列的一組有關基因被稱為基因家族(genefamily)?;蛑貜椭匾腥N方式:片段復制、串聯(lián)重復和逆轉錄轉座或其它轉座事件等,基因重復后能夠彼此形成基因簇(geneclusters),同一家族中的組員有時緊密的排列在一起,成為一種基因簇;更多的時候,它們卻分散在同一染色體的不同部位,甚至位于不同染色體上,含有各自不同的體現(xiàn)調控模式?;蛲蛔兪腔蚍肿舆M化的第一因素,由核苷酸替代、插入/缺失、重組和基因轉換等引發(fā)的突變基因或DNA序列,通過群體水平的遺傳漂變和/或自然選擇進行擴散,并最后在物種基因組中得以固定,這種方式產(chǎn)生的新基因普通拷貝數(shù)目不會增加,相對基因重復是非常少的,重要是影響基因的序列以及其編碼的蛋白。基因家族重要是指一組功效相似且核苷酸序列含有同源性的基因,是含有明顯相似性的一組基因,編碼相似的蛋白質產(chǎn)物。有時定義基因家族,從構造域角度來刻畫。如:一類基因,其編碼蛋白都含有同一種構造域,這一類基因是一種基因家族。例如MADS-box基因家族,這類基因都含有MADS-box構造域,尚有SET構造域基因家族。這個定義信息更偏向功效信息,普通來說構造域決定某種功效,由于構造域序列保守,易形成穩(wěn)定的三維構造。這與共同祖先的定義有些差別,諸多構造域難找得到其共同祖先。另外一種基因的共同祖先定義比較復雜的,越是歷史久遠的祖先,由于物種的在進化過程中發(fā)生了諸多丟失和增加事件。共同祖先是個相對的概念,例如植物的共同祖先,普通涉及藻類及其它綠色植物,而被子植物共同祖先,根據(jù)已經(jīng)測序的基因組,普通指單雙子葉之前就能夠。如果從共同祖先定義基因家族,諸多已知的基因家族就要被分成諸多個基因家族。有諸多網(wǎng)站(數(shù)據(jù)庫)專門收集構造域,例如Pfam和InterPro,這兩個數(shù)據(jù)庫內(nèi)容差不多。這些數(shù)據(jù)庫以Hmmer算法為基礎,根據(jù)Uniprot中包含的蛋白,進行序列連配找到保守的片段(構造域),再以這些序列使用Hmmer構建種子,保存這些種子。一種蛋白拿過來后,與這些種子比對,根據(jù)打分能判斷出這個蛋白是不是含有這個構造域,這也是判斷一種基因編碼蛋白是不是屬于這個家族?;蚣易宥x基因組進化中,一種基因通過基因重復產(chǎn)生了兩個或更多的拷貝,這些基因即構成一種基因家族。是含有明顯相似性的一組基因,編碼相似的蛋白質產(chǎn)物。在真核細胞中許多有關的基因常按功效成套組合,被稱為基因家族(genefamily)。同一家族中的組員有時緊密的排列在一起,成為一種基因簇;更多的時候,它們卻分散在同一染色體的不同部位,甚至位于不同染色體上,含有各自不同的體現(xiàn)調控模式。一組功效相似且核苷酸序列含有同源性的基因,可能由某一共同祖先基因經(jīng)重復和突變產(chǎn)生。多基因家族真核基因組的特點之一就是存在多基因家族(multigenefamily)。多基因家族是指由某一祖先基因通過重復和變異所產(chǎn)生的一組基因。多基因家族大致可分為兩類:一類是基因家族成簇地分布在某一條染色體上,它們可同時發(fā)揮作用,合成某些蛋白質,如組蛋白基因家族就成簇地集中在第7號染色體長臂3區(qū)2帶到3區(qū)6帶區(qū)域內(nèi);另一類是一種基因家族的不同組員成簇地分布不同染色體上,這些不同組員編碼一組功效上緊密有關的蛋白質,如珠蛋白基因家族。在多基因家族中,某些組員并不產(chǎn)生有功效的基因產(chǎn)物,這些基因稱為假基因(pseudogene)。假基因與有功效的基因同源,原來可能也是有功效的基因,但由于缺失,倒位或點突變等,使這一基因失去活性,成為無功效基因。與對應的正常基因相比,假基因往往缺少正?;虻膬?nèi)含子,兩側有順向重復序列。人們推測,假基因的來源之一,可能是基因通過轉錄后生成的RNA前體通過剪接失去內(nèi)含子形成mRNA,如果mRNA經(jīng)重復轉錄產(chǎn)生cDNA,再整合到染色體DNA中去,便有可能成為假基因,因此該假基因是沒有內(nèi)含子的,在這個過程中,可能同時會發(fā)生缺失,倒位或點突變等變化,從而使假基因不能體現(xiàn)。多基因家族的進化在進化過程中,基因家族如編碼rRNA的基因或編碼組蛋白的基因都是從共同的祖先基因通過重復(duplication)和歧化(divergence)進化而來的,它們含有相似或有關的功效。即使如此,但它們在發(fā)育過程中并不總是同時體現(xiàn)的,不同的組員可能在不同的發(fā)育階段和(或)不同的組織中體現(xiàn),如有些血紅蛋白基因家族組員在成體中體現(xiàn),而另某些則只在胎兒期體現(xiàn),這一事實闡明在基因調控水平發(fā)生了進化歧化(evolutionarydivergence)。在足夠時間的進化過程中,基因家族中某些組員的DNA序列可能歧化為可編碼一種含有新功效的蛋白,例如,乳清蛋白(lactalbumin)基因與溶菌酶基因就屬于同一種家族,前者編碼催化乳糖合成的酶的一種亞基,后者編碼的溶菌酶能降解某些細菌細胞壁的多糖化合物,但它們含有一種共同的特點就是都作用于碳水化合物。我們也已經(jīng)懂得,基因家族中的某些組員并不轉錄或轉錄本不翻譯成有功效的蛋白,即成為基因家族中的假基因。研究發(fā)現(xiàn),這些無功效的假基因缺少必要的啟動序列和缺少一種或多個具活性的組員中特有的內(nèi)含子序列。DNA重復普通是指DNA片段數(shù)的增加,它能夠是一種完整基因的重復(基因重復)、基因的一部分重復、一種完整染色體的重復(非整倍體)、或整個基因組的重復(多倍體)。基因家族是由于持續(xù)的基因重復所造成的。非整倍體常造成生物體的不育,而基因組重復只是使基因增加拷貝數(shù),并不產(chǎn)生新的基因,對基因組的復雜性并沒有變化。從基因組進化的角度來看,更多的是考慮單個基因或某些基因的重復,而不是整個基因組的重復。珠蛋白是一種多基因家族,在人類的第16號染色體上發(fā)現(xiàn)了7個類a珠蛋白基因,在第11號染色體上發(fā)現(xiàn)了6個類b珠蛋白基因,在動物甚至植物中也發(fā)現(xiàn)了珠蛋白基因,表明這是一種非常古老的基因家族。在多個動物中幾乎全部有功效的珠蛋白基因構造都相似,由3個外顯子構成,中間間隔著兩個內(nèi)含于。但珠蛋白基因的數(shù)量和次序在多個動物中是不同的。由于全部的珠蛋白基因的構造和次序都是相似的,因此它們存在著一種祖先珠蛋白基因(多半和現(xiàn)在存在的肌紅蛋白基因有關)。在約5億年前,祖先珠蛋白基因經(jīng)重復和歧化產(chǎn)生了原始的a珠蛋白基因和b珠蛋白基因,再追溯至8億年前,這個祖先珠蛋白基因本身也是通過基因重復而產(chǎn)生的,它的另一份拷貝進化為現(xiàn)今的肌紅蛋白(myoglobin)基因,肌紅蛋白基因的構成和珠蛋白基因相似,其重要功效也同珠蛋白同樣是貯存氧,因此我們能夠將三個外顯子構造當作是它們共同的祖先。植物的豆血紅蛋白(leghemoglobin)基因是和珠蛋白基因有關的,植物豆血紅蛋白基因存在著諸多原始的類型,它比肌紅蛋白基因多一種內(nèi)含子,但它與肌紅蛋白很相似。某些原始的魚類只有單個類型的珠蛋白鏈,因此它們必然是在珠蛋白基因尚未發(fā)生重復前就歧化了出來。在某些兩棲動物中含有a和b連鎖的珠蛋白基因,這是由祖先珠蛋白基因重復后經(jīng)突變形成的。后來進一步重復,在哺乳動物中形成了a珠蛋白家族和b珠蛋白家族。重復在進化中是經(jīng)常發(fā)生的,事實上,珠蛋白基因的拷貝數(shù)在某些人類群體中是有變化的,例如大部分人在16號染色體上有2個a基因(a1、a2,圖12-9),但有些個體在此染色體上只有1個,而另某些個體有3個甚至有4個a珠蛋白基因。此表明在多基因家族中基因的重復和缺失是恒定的進行過程。重復也能夠通過轉座而產(chǎn)生?;蚪M中的基因家族(來源于首席醫(yī)學網(wǎng))在人及高等有機體基因組中,有許多基因家族。有的基因家族組員多,有的基因家族組員少;有的基因家族組員功效相似,有的基因家族組員功效各異[1]。所謂多基因家族是指一類含有序列同源性及相似功效的基因;而基因超家族是指一類含有序列同源性而不具相似功效的基因。如果一類蛋白或基因含有共同來源的一種構造域,就屬于一種基因超家族,同一種基因可歸屬于兩個或多個基因超家族。有關基因家族的研究起始于二十世紀七十年代,目的是為闡明個體或群體遺傳差別與基因冗余(generedundancy)的關系。文獻表明:免疫球蛋白基因超家族與其它多基因家族進化的分子機制相似,染色體不等交換和基因轉換(geneconversion)造成了免疫球蛋白基因的進化。為闡明基因家族進化和變異的分子機制,應同時考慮染色體不等交換、基因突變、自然選擇及隨機漂變等因素。同一基因家族中不同組員的序列同源性取決于基因突變與染色體不等交換的頻率,也與自然選擇及隨機漂變有關[1]?;虺易宓囊环N重要特點是不同組員含有不同的體現(xiàn)模式(expressionpatterns),而同一多基因家族的不同組員往往含有相似的體現(xiàn)調控機制。因此,有必要闡明基因超家族組員其體現(xiàn)模式變化的誘因。某些大的基因超家族普通涉及數(shù)個單基因和幾個多基因家族,這些基因家族的形成是有機體進化的分子基礎?;蚪M中幾乎全部的基因可歸屬于一種或更多的基因超家族。同源性比較可用于分析不同基因間的進化關系;系統(tǒng)發(fā)生分析可剖析基因家族不同組員的有關性;基因進化樹可澄清基因拷貝數(shù)增加或基因重復(geneduplication)的歷史,同時,為識別不同種屬同源基因提供有益信息。1.基因家族在基因組中的分布成簇存在的基因家族許多重要的基因家族在基因組中成簇存在,也即同一基因家族的不同組員在基因組中重復串聯(lián)排列。這些成簇存在的基因是種系生殖細胞在減數(shù)分裂過程中,通過染色體不等交換和基因轉換形成的。某些多基因家族組員的拷貝數(shù)巨大,如核糖體RNA或組蛋白基因家族,這是由于有機體需要其大量的基因體現(xiàn)產(chǎn)物。在真核生物中,rRNA基因普通形成一種多基因家族。rRNA基因的一種重復單位包含一種轉錄區(qū)和一種非轉錄間隔區(qū),轉錄區(qū)涉及18S、和28SrRNA基因,該重復單位在基因組中重復數(shù)百次。rRNA多基因家族不同組員進化的分子機制一致,盡管不同種屬rRNA基因重復單位的序列有所差別,但同種屬rRNA基因重復單位之間的同源性很高。在高等有機體基因組中,核小體的四種核心組蛋白基因普通成簇存在,該基因簇在基因組中重復數(shù)十次,這些基因在細胞周期的S期同時體現(xiàn)。也有幾個組蛋白基因的體現(xiàn)與細胞周期無關,這類組蛋白基因的體現(xiàn)與普通的組織特異性基因相似。某些成簇存在的基因超家族組員功效各異,最典型是珠蛋白基因超家族(globingenesuperfamily)。哺乳類珠蛋白基因超家族由α樣珠蛋白基因家族、β樣珠蛋白基因家族和肌紅蛋白家族三個基因家族構成。前兩個基因家族由成簇存在的基因編碼,而肌紅蛋白由單個基因編碼。每個基因簇涉及胚胎期、成人期α或β珠蛋白基因及假基因。一種珠蛋白的編碼基因不止一種,例如:有兩個基因α1、α2編碼成人期α-珠蛋白,這兩個基因構成一種較小的多基因家族,含有共同的進化途徑[2]。含有成簇及散在存在組員的基因超家族某些基因超家族普通含有成簇和散在存在的組員,成簇存在的基因(普通構成多基因家族)含有相似功效的,而散在存在的基因往往含有不同的功效。但也有例外,如成簇存在的Hox基因家族組員其功效可能完全不同[3]。在人體基因組中,免疫球蛋白基因超家族包含有成簇及散在存在的組員,是含有多個功效各異的基因,該基因超家族的許多組員含有非免疫球蛋白的構造域,含有多個不同功效。免疫球蛋白基因家族是最大的基因超家族之一,該家族基因所編碼的多肽是血液中的不同抗體。免疫球蛋白由可變區(qū)(varible,V)、恒定區(qū)(constant,C)、多樣區(qū)(diversity,D)、結合區(qū)(joining,J)基因片段編碼。V、D、J區(qū)基因片段存在多個拷貝,免疫球蛋白由V、D、J區(qū)及輕、重鏈的不同組合構成,體細胞的突變也與免疫球蛋白的多樣性有關。通過不同組合產(chǎn)生足夠的多樣化抗體,進化過程中突變的積累尤為重要。分析可變區(qū)基因序列得知,抗原識別區(qū)多樣性的提高與自然選擇有關。MHC(majorhistocompatibilitycomplex)多基因家族屬于免疫球蛋白基因超家族,該多基因家族與臨床醫(yī)學親密有關,且有高度的多態(tài)性,引發(fā)了研究人員的關注。研究成果顯示:MHC等位基因中含有差別極小的短片段序列,很明顯是由其同源基因突變所致,基因重組促使MHC基因經(jīng)歷著動態(tài)的演變。序列相似性研究表明,使抗原識別位點氨基酸多樣性升高的自然選擇,促使MHC基因保持高度多態(tài)性[4]。同時,涉及抗原識別位點在內(nèi)的基因轉換也可產(chǎn)生有用的變異,為自然選擇提供物質基礎。另一典型的既含基因簇又含散在存在基因組員的基因家族是嗅覺受體(olfactoryreceptor)基因。該受體是一種含有七個跨膜域的膜蛋白,屬于G蛋白耦聯(lián)受體(G-protein-coupledreceptor,GPCR)基因超家族。其功效的多樣性由基因本身編碼,而并非由體細胞突變或不同基因片段組合使用所致。哺乳動物大概共有幾百個GPCR基因。這類基因在基因組中形成許多個基因簇,每個基因簇中含有多個組員及假基因。鲇魚基因組中的GPCR基因比哺乳類少得多,該基因家族在哺乳類動物祖先基因組內(nèi)完畢了擴展[5]。散在存在的基因家族許多散在存在的基因家族,普通認為是通過RNA逆轉錄、隨即整合到基因組中形成的。整合序列(integratedsequence)或逆轉錄序列(retrosequence)來源于基因的RNA轉錄本,因此無內(nèi)含子。大多數(shù)逆轉錄序列已變?yōu)椴痪吖πУ哪孓D錄假基因(retropseudogene),只有極少數(shù)逆轉錄序列保存了其功效。有功效的逆轉錄序列被稱為逆轉錄基因(retrogene)或剪接過的基因(processedgene)。位于人常染色體上的磷酸甘油酸激酶基因沒有內(nèi)含子,是一種逆轉錄基因,與其在X染色體上的原始基因相比,該基因的體現(xiàn)模式(expressionpatterns)發(fā)生了變化。與預期的狀況一致,大多數(shù)逆轉錄序列已變?yōu)槟孓D錄假基因[6]。例如:細胞色素C、甘油三磷酸脫氫酶、核糖體蛋白L32、β微管蛋白、精氨酰琥珀酸合成酶等基因。2.基因家族形成的分子機制基因重復和點突變基因發(fā)生重復的重要分子機制涉及多倍體化、串聯(lián)重復及逆轉錄轉座三種。在多倍體化過程中,基因組中全部基因皆被重復?;蜉^社區(qū)域的重復由上述后兩種機制完畢。多倍體化造成了許多基因家族的形成。串聯(lián)重復參加了成簇存在的基因家族的進化,重復的DNA區(qū)域能夠不大于或不不大于一種基因的長度,但在基因家族的進化過程中,整個基因的重復尤為重要。在種系生殖細胞的減數(shù)分裂過程中,染色體不等交換引發(fā)基因串聯(lián)重復。一旦一種基因簇形成,不等交換率就會升高。在含有相似功效組員的多基因家族中,頻繁的染色體不等交換造成了家族組員的協(xié)同進化。普通而言,點突變與染色體不等交換可引發(fā)同一基因家族內(nèi)的遺傳性變化,自然選擇和遺傳漂變對于同一基因家族組員的變異也有重要影響。在人體基因組中,含有功效的逆轉錄序列或整合序列極少,但有大量來源于逆轉錄的重復序列。豐度最高的重復序列有短的散在重復序列(shortinterspersedrepeats,SINES)和長的散在重復序列(longinterspersedrepeats,LINES),在這些重復序列中,Alu重復序列最多,基因組中超出了50萬個。人體Alu基因家族與7SLRNA含有序列相似性,7SLRNA在胞質中含量最多。在其它生物中,tRNA與SINES含有同源性,故7SLRNA、tRNA被認為是SINES的模板。人基因組LINES中含有一種逆轉錄酶基因,能夠完畢其序列本身的逆轉錄轉座。人體基因組中LINES的拷貝數(shù)大概有10萬個。大多數(shù)LINES發(fā)生缺失,不含有功效??傊?,當一種種系生殖細胞中含有適宜的RNA轉錄本及逆轉錄酶活性時,即可完畢逆轉錄轉座,大多數(shù)逆轉錄序列在其形成的過程中變成了無功效的逆轉錄假基因。自然選擇和隨機漂變?nèi)魏沃貜突蚧蚨嗫截惢颍绻惑w現(xiàn)且含有功效,則正經(jīng)歷著純化性自然選擇(purifyingselection),多拷貝基因的進化率比單個基因的突變率低諸多。多拷貝基因與單個基因受到的自然選擇限制程度有差別。自然選擇限制程度隨基因冗余而削弱,只要有一種基因保存其功效,有害的突變就有可能富集。對于大的多基因家族:如rRNA基因和組蛋白基因,有害突變的積累可被純化性自然選擇制止,純化性自然選擇能夠檢測到含有功效的完整基因的數(shù)目。使突變基因拷貝數(shù)增加或減少的協(xié)同進化有助于自然選擇。正向自然選擇(positiveselection)是在重復基因獲得新功效時發(fā)生的[7]。事實上,許多重復基因產(chǎn)生后,即加緊了氨基酸替代,氨基酸替代能夠通過計算同義及非同義突變的頻率進行預計。這類基因涉及靈長類胚胎血紅球蛋白,反芻動物腸溶菌酶、哺乳類視覺色素等等。某些狀況下,難以擬定氨基酸替代率的增加是由正向自然選擇引發(fā),或許是由基因冗余造成自然選擇限制程度削弱所致。基因重復的另一種后果是基因體現(xiàn)模式(expressionpatterns)發(fā)生變化,也即多拷貝基因的功效特化或亞功效化(subfunctionalization)。這種變化對于參加發(fā)育過程的轉錄因子及其它蛋白尤為重要,這類基因功效的變化與生物的形態(tài)學進化直接有關。分析果蠅轉錄因子的調控元件得知,其調控元件的序列正在發(fā)生顛換(turningover),在穩(wěn)定選擇條件下,該轉錄因子的功效仍能維持。當穩(wěn)定選擇條件發(fā)生變化時,該轉錄因子可被另一種轉錄因子替代,從而造成靶基因體現(xiàn)模式或體現(xiàn)調控機制發(fā)生變化,自然選擇和隨機漂變也與靶基因體現(xiàn)調控機制的變化有關?!緟⒖嘉墨I】1OhtaT.Evolutionofgenefamilies[J

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論