




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1第一章第一章 基因結(jié)構(gòu)和基因組基因結(jié)構(gòu)和基因組基因結(jié)構(gòu)(重點(diǎn))基因結(jié)構(gòu)(重點(diǎn))基因組學(xué)基因組學(xué)真核生物基因組結(jié)構(gòu)及特點(diǎn)真核生物基因組結(jié)構(gòu)及特點(diǎn)2一、基因結(jié)構(gòu)一、基因結(jié)構(gòu)1. 基因概念:基因概念:基因是一段具有特定功能和結(jié)構(gòu)的連基因是一段具有特定功能和結(jié)構(gòu)的連續(xù)的續(xù)的dna片斷,是編碼蛋白質(zhì)或片斷,是編碼蛋白質(zhì)或rna分子遺傳信息的基本遺傳單位。分子遺傳信息的基本遺傳單位。 3生物的性狀是經(jīng)由遺傳單位傳遞給下一代,這個(gè)概念在1900年由孟德?tīng)枺╣regor mendel)提出,1909年約翰森(wilhelm johanssen)將這個(gè)遺傳單位的概念冠上“gene”的名字,漢文將之翻譯成“基因
2、”,日本人則將之翻譯成“遺傳子”,更為直接。最早的觀念中,基因是前述的“遺傳單位”(unit of inheritance)。這是一個(gè)比較功能性的概念,它是一個(gè)自主單位(autonomous unit),能把性狀遺傳給后代。相對(duì)地,有人認(rèn)為基因是一個(gè)有形的物體(physical entity),它是染色體上面一段固定的序列。這兩派看法多年來(lái),各執(zhí)一詞,不相上下。 41920年代及1930年代早期alfred h sturtevant以hermann muller在果蠅研究上,發(fā)現(xiàn)基因在染色體上的位置改變時(shí),盡管基因結(jié)構(gòu)本身不變,其功能卻會(huì)變化而造成果蠅性狀的突變。實(shí)驗(yàn)中,他們將一個(gè)基因挪近所謂
3、異染色質(zhì)區(qū)(heterochromatin)時(shí),果蠅會(huì)產(chǎn)生所謂雜色(variegated)的表現(xiàn)型,也就是一個(gè)基因在某些細(xì)胞會(huì)表現(xiàn),卻在某些細(xì)胞不會(huì)表現(xiàn),而造成“雜色”,例如復(fù)眼中有些部分呈現(xiàn)白色,有些部分則呈現(xiàn)紅色。由於基因的功能似乎會(huì)因應(yīng)其所在位置而改變,以致有人甚至認(rèn)為基因根本不是一個(gè)固定而具體的單位(particulate gene),然而,在實(shí)際上卻又不能完全否定基因做為遺傳單位的概念。5在最新版的thompson & thompson genetics in medicine(2001),基因的定義是a sequence of chromosome dna that is requ
4、ired for production of a functional product,be it a polypeptide or a functional rna molecule。因此當(dāng)代對(duì)基因的定義除了被轉(zhuǎn)譯的dna序列本身之外,調(diào)控此一轉(zhuǎn)譯工作的dna序列也應(yīng)包含在內(nèi)。那麼基因的范疇到底何在? 假若基因是一個(gè)比較固定而具體的單位(particulate gene)則我們應(yīng)該可以找出界定基因的區(qū)隔(barrier or insulator)。然而學(xué)者費(fèi)盡心力卻遍尋不著能夠區(qū)別個(gè)別基因的結(jié)構(gòu)。因此,從學(xué)者無(wú)法找到能夠區(qū)隔個(gè)別基因的barrier or insulator來(lái)看,基因可能是一
5、個(gè)相當(dāng)具有伸縮性的結(jié)構(gòu)。另外一個(gè)觀察是,一個(gè)基因的功能取決於它對(duì)某些轉(zhuǎn)錄因子(transcriptional factor)的反應(yīng),而非本身在染色體上的位置,這個(gè)現(xiàn)象是frank grosveld在人類-globin locus control region首先觀察到。因此基因應(yīng)該是包含被轉(zhuǎn)錄的dna序列以及轉(zhuǎn)錄因子的結(jié)合區(qū)。這些轉(zhuǎn)錄因子的結(jié)合區(qū)可以延伸幾百個(gè)kilobase。最近的研究顯示人類的dach基因,其enhancer甚至在遠(yuǎn)達(dá)1mb的基因沙漠(gene desert)中。 6這個(gè)“基因包含轉(zhuǎn)錄因子結(jié)合區(qū)”的概念,使基因變成一個(gè)功能性而且可以彼此重疊的概念。意即,一段dna序列,可以
6、因?qū)D(zhuǎn)錄因子反應(yīng)的不同,可以有一種以上的基因功能,而一個(gè)基因的轉(zhuǎn)錄序列,可能是另一個(gè)基因的轉(zhuǎn)錄調(diào)控區(qū)。時(shí)至今日,基因的定義已經(jīng)不再是一段具有明顯邊界的固定dna序列(particulate gene),而是一個(gè)具有伸縮性(flexible)的功能性組合,它的范圍是以其(1)空間結(jié)構(gòu)與位置(2)對(duì)特定調(diào)控因子的反應(yīng)(3)對(duì)最終表現(xiàn)型的效果來(lái)決定。根據(jù)以上的論述,基因的基本條件有三:1、必須要有產(chǎn)出(product)2、必須要有功能 3、包含轉(zhuǎn)錄區(qū)及調(diào)控區(qū)。根據(jù)這三個(gè)條件,我們?nèi)绾稳穆L(zhǎng)的dna序列中找出基因呢?以下是五種常用的標(biāo)準(zhǔn)。71、open reading frames(orf) orf
7、是指位于start codon與stop codon之間的dna序列。以orf尋找基因較適用于原核生物或其他intron稀少的生物。當(dāng)生物的exon被隱藏在大段的intron時(shí),orf常常不易被找到。2、sequence features 分布特征 找出orf之后,利用基因通常gc較at多的特征,再加以驗(yàn)證。另外找尋splice site(ag、gt)可能也有助于基因的辨識(shí)。不過(guò)使用這些辨識(shí)原則的電腦軟件只能預(yù)測(cè)50的exon和20的基因。3、sequence conservation 比對(duì)不同生物的堿基序列也是辨識(shí)基因的利器,理論上,在不同生物均有的序列(conserved sequence
8、)應(yīng)該有其功能上的重要性,本身是基因的機(jī)會(huì)較大。利用不同生物來(lái)比對(duì)基因序列,必須這些生物間有相當(dāng)?shù)难莼嚯x(evolutionary distance),例如最近人類六號(hào)染色體的基因辨識(shí)是利用五種其他生物-大鼠、小鼠、河豚、綠色斑點(diǎn)河豚以及斑馬魚(yú)來(lái)進(jìn)行比對(duì)。當(dāng)然隨著所用生物的不同,比對(duì)出來(lái)的基因數(shù)目也會(huì)有所差異。84、evidence of transcription 藉由尋找基因產(chǎn)物-rna或蛋白質(zhì)也有助于基因的辨識(shí),其常用方法有microarray hybridization芯片雜交 、serial analysis of gene expression(sage)基因表達(dá)系列分析 ,cd
9、na mapping或sequencing of expressed sequence tag表達(dá)序列標(biāo)簽 。最近利用transposon轉(zhuǎn)位子來(lái)進(jìn)行大規(guī)模的gene tagging,結(jié)果從yeast的基因體上找出許多能轉(zhuǎn)錄蛋白質(zhì)的新區(qū)段,利用帶有標(biāo)記的cdna與含有人類染色體序列的microarray雜交,也找出人類染色體上以前未知的許多轉(zhuǎn)錄區(qū)段,但如果迄今尚未找到gene product就無(wú)法運(yùn)用此法來(lái)反推基因。 5、gene inactivation 藉由減消一個(gè)gene product的功能也是辨識(shí)基因的一個(gè)方法。通??梢杂胟nock out或用rnai來(lái)執(zhí)行此一工作。不過(guò)很多基因的g
10、ene product被減消之后往往還是看不到表現(xiàn)型,以致難以確定該基因的功能。這現(xiàn)象的主要原因是生物都有很大的功能重疊性(functional redundancy),此外基因功能檢測(cè)的方法也會(huì)影響其結(jié)果。9經(jīng)典遺傳學(xué)基因的概念:基因具有下列共性:(1)基因具有染色體的重要特征(即基因位于染色體上),能自我復(fù)制,相對(duì)穩(wěn)定,在有私分裂和減數(shù)分裂時(shí),有規(guī)律地進(jìn)行分配;(2)基因在染色體上占有一定的位置(即位點(diǎn)),并且是交換的最小單位,即在重組時(shí)不能再分割的單位:(3)基因是以一個(gè)整體進(jìn)行突變的,故它是一個(gè)突變單位;(4)基因是一個(gè)功能單位,它控制正在發(fā)育有機(jī)體的某一個(gè)或某些性狀,如白花、紅花等。
11、總之,經(jīng)典遺傳學(xué)認(rèn)為基因是一個(gè)最小的單位,不能分割,既是結(jié)構(gòu)單位,又是功能單位。分子遺傳學(xué)關(guān)于基因的概念:分子遺傳學(xué)的發(fā)展揭示了遺傳密碼的秘密,使基因的概念落實(shí)到具體的物質(zhì)上,即基因在dna分子上,一個(gè)基因相當(dāng)于dna分子上的一定區(qū)段,它攜帶有特定的遺傳信息。這類遺傳信息或被轉(zhuǎn)錄為rna,包括信使rna、轉(zhuǎn)移rna、核糖體rna;或者信使rna被翻譯成多肽鏈。另一方面,在精細(xì)的微生物遺傳分析中查明,基因并不是不可分割的最小單位,而是遠(yuǎn)為復(fù)雜得多的遺傳和變異的單位。10隨著現(xiàn)代遺傳學(xué)的發(fā)展,在分子水平上,根據(jù)重組、突變和功能將基因分成3個(gè)單位 (1)突變子:就是指性狀突變時(shí)產(chǎn)生突變的最小單位。一
12、個(gè)突變子可以小到只有一個(gè)堿基對(duì);(2)重組子:就是指性狀重組時(shí),可交換的最小單位。一個(gè)交換子可以只包含一個(gè)堿基對(duì);(3)順?lè)醋樱罕硎疽粋€(gè)起作用的單位,基本符合通常所述的基因的大小或略小。它包括它包括一段dna與一個(gè)多肽鏈合成相對(duì)應(yīng),平均為500-1500個(gè)堿基對(duì)。 1112基因概念的更新和不斷發(fā)展基因概念的更新和不斷發(fā)展 重疊基因(重疊基因(overlapping gene): : 一個(gè)基因的核苷酸與另一個(gè)基因的核苷酸之間存一個(gè)基因的核苷酸與另一個(gè)基因的核苷酸之間存 在這一定的重疊現(xiàn)象。在這一定的重疊現(xiàn)象。 1977年,維納(年,維納(weiner)在研究)在研究q0病毒的基因結(jié)構(gòu)時(shí),首先發(fā)病
13、毒的基因結(jié)構(gòu)時(shí),首先發(fā)現(xiàn)了基因的重疊現(xiàn)象。現(xiàn)了基因的重疊現(xiàn)象。1978年,費(fèi)爾(年,費(fèi)爾(feir)和桑戈?duì)枺┖蜕8隊(duì)枺╯angor)在研究分析)在研究分析x174噬菌體的核苷酸序列時(shí),也發(fā)現(xiàn)噬菌體的核苷酸序列時(shí),也發(fā)現(xiàn)由由5375個(gè)核苷酸組成的單鏈個(gè)核苷酸組成的單鏈dna所包含的所包含的10個(gè)基因中有幾個(gè)基個(gè)基因中有幾個(gè)基因具有不同程度的重疊,但是這些重疊的基因具有不同的讀碼因具有不同程度的重疊,但是這些重疊的基因具有不同的讀碼框架。以后在噬菌體框架。以后在噬菌體g4、ms2和和sv40中都發(fā)現(xiàn)了重疊基因。中都發(fā)現(xiàn)了重疊基因?;虻闹丿B性使有限的因的重疊性使有限的dna序列包含了更多的遺傳
14、信息,是生物序列包含了更多的遺傳信息,是生物對(duì)它的遺傳物質(zhì)經(jīng)濟(jì)而合理的利用,參與對(duì)基因的調(diào)控。對(duì)它的遺傳物質(zhì)經(jīng)濟(jì)而合理的利用,參與對(duì)基因的調(diào)控。 13暮已賞時(shí)花醒歸微去力馬酒如飛14移動(dòng)基因(移動(dòng)基因(movable gene):): 又叫轉(zhuǎn)座因子(又叫轉(zhuǎn)座因子(transposable element),可以從染色體的一個(gè)位置),可以從染色體的一個(gè)位置轉(zhuǎn)移到另一個(gè)位置。轉(zhuǎn)移到另一個(gè)位置。 15斷裂基因(斷裂基因(split gene): 基因的編碼序列在基因的編碼序列在dnadna分子上是不連續(xù)的,為不編碼的序列所隔分子上是不連續(xù)的,為不編碼的序列所隔開(kāi)。開(kāi)。2020世紀(jì)世紀(jì)7070年代中期
15、,法國(guó)生物化學(xué)家查姆幫(年代中期,法國(guó)生物化學(xué)家查姆幫(chamobon)chamobon)發(fā)現(xiàn)。發(fā)現(xiàn)。 19771977年被英國(guó)的查弗里斯和荷蘭的弗蘭威爾在研究兔年被英國(guó)的查弗里斯和荷蘭的弗蘭威爾在研究兔-球蛋白結(jié)構(gòu)球蛋白結(jié)構(gòu)時(shí)所證實(shí)時(shí)所證實(shí)。 假基因(假基因(pseudogene):): 是與功能性基因密切相關(guān)的是與功能性基因密切相關(guān)的dnadna序列,但是由于缺失、插入和序列,但是由于缺失、插入和無(wú)義突變失去閱讀框架而不能編碼蛋白質(zhì)產(chǎn)物。無(wú)義突變失去閱讀框架而不能編碼蛋白質(zhì)產(chǎn)物。19771977年,年,gjacpgjacp在在對(duì)非洲爪贍對(duì)非洲爪贍5srrna5srrna基因簇的研究后提出
16、了假基因的概念。基因簇的研究后提出了假基因的概念。 1670年代后,基因的概念隨著多學(xué)科滲透和實(shí)驗(yàn)手段日新月異又有突飛猛進(jìn)的發(fā)展,主要有以下幾個(gè)方面: 基因具重疊性。1977年桑格(f. sanger)領(lǐng)導(dǎo)的研究小組,根據(jù)大量研究事實(shí)繪制了共含有5375個(gè)核苷酸核苷酸的x174噬菌體dna堿基順序圖,第一次揭示了遺傳的一種經(jīng)濟(jì)而巧妙的編排b和e基因核苷酸順序分別與a和d基因的核苷酸順序的一部分互相重疊。當(dāng)然它們各有一套讀碼結(jié)構(gòu),且基因末端密碼也有重疊現(xiàn)象(a基因終止密碼子tga和c基因起始密碼子atg重疊2個(gè)核苷酸;d基因的終止密碼子taa與j基因起始密碼子atg互相重疊1個(gè)核苷酸,順序?yàn)閠a
17、atg) 內(nèi)含子和外顯子。人們?cè)谘芯啃‰u卵清蛋白基因時(shí)發(fā)現(xiàn)其轉(zhuǎn)錄形成的mrna只有該基因長(zhǎng)度的1/4,其原因是基因中一些間隔序列的轉(zhuǎn)錄物在rna成熟過(guò)程中被切除了。這些間隔序列叫內(nèi)含子,基因中另一些被轉(zhuǎn)錄形成rna的序列叫外顯子。小雞的卵清蛋白基因中至少含7個(gè)內(nèi)含子。因而從基因轉(zhuǎn)錄效果看,基因由外顯子和內(nèi)含子構(gòu)成。 17管家基因和奢侈基因。具有相同遺傳信息的同一個(gè)體細(xì)胞間其所利用的基因并不相同,有的基因活動(dòng)是維持細(xì)胞基本代謝所必須的,而有的基因則在一些分化細(xì)胞細(xì)胞中活動(dòng),這正是細(xì)胞分化、生物發(fā)育的基礎(chǔ)。前者稱為管家基因,而后者被稱為奢侈基因。 基因的游動(dòng)性。早在20世紀(jì)40年代美國(guó)遺傳學(xué)家麥克
18、林托克(b.mcclintock)在玉米研究中發(fā)現(xiàn)“轉(zhuǎn)座因子”,直至1980年夏皮羅(j.shapiro)等人證實(shí)了可移位的遺傳基因存在,說(shuō)明某些基因具有游動(dòng)性。為此,這位“玉米夫人”榮獲了1983年度諾貝爾獎(jiǎng)。18非編碼區(qū)非編碼區(qū)非編碼區(qū)非編碼區(qū)編碼區(qū)編碼區(qū)上游編碼區(qū)上游 編碼區(qū)下游編碼區(qū)下游 與與rna聚酶聚酶結(jié)合位點(diǎn)結(jié)合位點(diǎn)rna聚合酶能夠識(shí)別調(diào)控序列中的結(jié)合位點(diǎn),并與其結(jié)合。轉(zhuǎn)錄開(kāi)始后,rna聚合酶沿dna分子移動(dòng),并與dna分子的一條鏈為模板合成rna。轉(zhuǎn)錄完畢后,rna鏈釋放出來(lái),緊接著rna聚合酶也從dna模板鏈上脫落下來(lái)。 2. 原核生物的基因結(jié)構(gòu)原核生物的基因結(jié)構(gòu)19能夠轉(zhuǎn)錄
19、為相應(yīng)的信使rna,進(jìn)而指導(dǎo)蛋白質(zhì)的合成,也就是說(shuō)能夠編碼蛋白質(zhì)的區(qū)域。 位于編碼區(qū)上游和編碼區(qū)下游的dna序列,雖不能轉(zhuǎn)錄為信使rna,不能編碼蛋白質(zhì)但有調(diào)控遺傳信息表達(dá)的核苷酸序列,如啟動(dòng)子、終止子等。非編碼區(qū)(調(diào)控序列)編碼區(qū)(編碼序列) 原核基因的結(jié)構(gòu)原核基因的結(jié)構(gòu)20是位于基因是位于基因5 末端上游外測(cè)的一段長(zhǎng)度為末端上游外測(cè)的一段長(zhǎng)度為20200bp的非編碼核苷酸序列,其功能是與的非編碼核苷酸序列,其功能是與rna聚聚合酶結(jié)合形成轉(zhuǎn)錄起始復(fù)合物。合酶結(jié)合形成轉(zhuǎn)錄起始復(fù)合物。 啟動(dòng)子(啟動(dòng)子(promoter)終止子(終止子(terminatorterminator) 是位于一個(gè)基因
20、或者操縱子的末端,提供轉(zhuǎn)錄終是位于一個(gè)基因或者操縱子的末端,提供轉(zhuǎn)錄終止信號(hào)的區(qū)段止信號(hào)的區(qū)段 是指由啟動(dòng)子、結(jié)構(gòu)基因和終止子組成的一段是指由啟動(dòng)子、結(jié)構(gòu)基因和終止子組成的一段dna序列。序列。轉(zhuǎn)錄單元(轉(zhuǎn)錄單元(operonoperon)21在原核生物中只有一種在原核生物中只有一種rnarna聚合酶。聚合酶。所有的原核基因都是在同一種所有的原核基因都是在同一種rnarna聚合酶的作用下進(jìn)行轉(zhuǎn)錄的。聚合酶的作用下進(jìn)行轉(zhuǎn)錄的。 操縱子(操縱子(operator)功能上相關(guān)的幾個(gè)結(jié)構(gòu)基因前后相連,利用功能上相關(guān)的幾個(gè)結(jié)構(gòu)基因前后相連,利用一個(gè)共同的啟動(dòng)子和終止子,這種轉(zhuǎn)錄單元一個(gè)共同的啟動(dòng)子和終止
21、子,這種轉(zhuǎn)錄單元被稱為操縱子。被稱為操縱子。通常是先被轉(zhuǎn)錄成一條大的通常是先被轉(zhuǎn)錄成一條大的mrnamrna,再由同一,再由同一條條mrnamrna翻譯出幾個(gè)結(jié)構(gòu)蛋白。翻譯出幾個(gè)結(jié)構(gòu)蛋白。22235 3 -35ttgac-10tataat結(jié)構(gòu)基因結(jié)構(gòu)基因2. 原核生物的基因結(jié)構(gòu)原核生物的基因結(jié)構(gòu) pribnow盒;細(xì)菌轉(zhuǎn)錄單位起點(diǎn)上游約10bp處的保守區(qū)域,它可 能參與結(jié)合rna聚合酶;共有序列=tataat細(xì)菌轉(zhuǎn)錄單位起點(diǎn)上游約35bp處的保守六聚體;共有序列=ttgac 或tgttgaca orf的識(shí)別是證明一個(gè)新的dna序列為特定的蛋白質(zhì)編碼基因的部分或全部的先決條件。 24rnarna
22、轉(zhuǎn)錄起始轉(zhuǎn)錄起始-35-35區(qū)區(qū)-10-10區(qū)區(qū)ttgacattgacattaactttaacttttacatttacatatgattatgattttacatttacatatgtttatgttttgatattgatatataattataatctgacgctgacgtactgttactgtn n1717n n1616n n1717n n1616n n1616n n7 7n n7 7n n6 6n n7 7n n6 6a aa aa aa aa atrptrp trna trnatyrtyrlaclacrecreca aara ara badbad ttgaca ttgaca tataat tat
23、aat共有序列共有序列25對(duì)于任何給定的核酸序列(單鏈dna或mrna),根據(jù)密碼子的起始位置,可以按照三種方式進(jìn)行解釋。例如,序列attcgatcgcaa這三種閱讀順序稱為閱讀框(reading frames)caa a attcgatcgattcgatcgcaaattcgatcgca(1)(3)(2)26一個(gè)開(kāi)放閱讀框(一個(gè)開(kāi)放閱讀框(orf,open reading frame)是一個(gè)沒(méi)有終止編碼的密碼子序)是一個(gè)沒(méi)有終止編碼的密碼子序列。列。原核基因識(shí)別任務(wù)的重點(diǎn)是識(shí)別開(kāi)放閱讀原核基因識(shí)別任務(wù)的重點(diǎn)是識(shí)別開(kāi)放閱讀框,或者說(shuō)識(shí)別長(zhǎng)的編碼區(qū)域。框,或者說(shuō)識(shí)別長(zhǎng)的編碼區(qū)域。273.真核生物的
24、基因結(jié)構(gòu)真核生物的基因結(jié)構(gòu)pol:轉(zhuǎn)錄:轉(zhuǎn)錄rrnarrna(5s rrna5s rrna除外)除外)pol:轉(zhuǎn)錄蛋白質(zhì)編碼基因:轉(zhuǎn)錄蛋白質(zhì)編碼基因pol :轉(zhuǎn)錄編碼眾多小:轉(zhuǎn)錄編碼眾多小rrnarrna(包括(包括trnatrna和和 5s rrna5s rrna)的基因。)的基因。與原核生物基因的主要區(qū)別與原核生物基因的主要區(qū)別內(nèi)含子(內(nèi)含子(intron)(非編碼序列)(非編碼序列)在基因表達(dá)過(guò)程中,內(nèi)含子被從初級(jí)mrna分子剪切掉,形成成熟的功能功能mrna真核生物中有三種不同的真核生物中有三種不同的rna聚合酶聚合酶28編碼區(qū)非編碼區(qū)非編碼區(qū)非編碼區(qū)非編碼區(qū)與與rna聚酶聚酶結(jié)合位點(diǎn)
25、結(jié)合位點(diǎn)內(nèi)含子內(nèi)含子 外顯子外顯子 編碼區(qū)上游編碼區(qū)上游 編碼區(qū)下游編碼區(qū)下游 真核基因的結(jié)構(gòu)真核基因的結(jié)構(gòu)293、真核生物基因結(jié)構(gòu)、真核生物基因結(jié)構(gòu) 真核生物的結(jié)構(gòu)基因的真核生物的結(jié)構(gòu)基因的dna序列由編碼序列和非編序列由編碼序列和非編碼序列兩部分組成,編碼序列是不連續(xù)的,被非編碼序碼序列兩部分組成,編碼序列是不連續(xù)的,被非編碼序列分割開(kāi)來(lái),稱為斷裂基因(列分割開(kāi)來(lái),稱為斷裂基因(split gene)。)。1)、外顯子和內(nèi)含子外顯子和內(nèi)含子2)、側(cè)翼序列與調(diào)控序列)、側(cè)翼序列與調(diào)控序列啟動(dòng)子啟動(dòng)子增強(qiáng)子增強(qiáng)子終止子終止子 30上游上游增強(qiáng)子增強(qiáng)子-80caat-35tata下游下游增強(qiáng)子增
26、強(qiáng)子外顯子外顯子內(nèi)含子內(nèi)含子5 3 真核生物的基因結(jié)構(gòu)真核生物的基因結(jié)構(gòu)31a a、外顯子和內(nèi)含子、外顯子和內(nèi)含子在結(jié)構(gòu)基因中,編碼序列稱為在結(jié)構(gòu)基因中,編碼序列稱為外顯子外顯子( (exon),表達(dá)多表達(dá)多肽鏈部分。非編碼序列稱為肽鏈部分。非編碼序列稱為內(nèi)含子內(nèi)含子(intron),又稱插入,又稱插入序列序列內(nèi)含子能轉(zhuǎn)錄為信使rna 。珠蛋白 基因(1700bp)=3個(gè)外顯子+2個(gè)內(nèi)含子。dmd基因(2300kb)=79個(gè)外顯子+ 78 個(gè)內(nèi)含子。(迄今認(rèn)識(shí)的最大的基因) 32外顯子和內(nèi)含子外顯子和內(nèi)含子真核生物內(nèi)含子和外顯子 不是完全固定不變的,有時(shí)同一dna 鏈上的某一段dna序列,當(dāng)它
27、作為編碼某一多肽鏈的基因時(shí)是外顯子,而作為編碼另一多肽鏈時(shí),則是內(nèi)含子。這樣,同一基因卻可以轉(zhuǎn)錄兩種或兩種以上的mrna。真核生物某些結(jié)構(gòu)gene沒(méi)有內(nèi)含子,如組蛋白gene,干擾素gene等。它們多以基因簇形式存在,大多數(shù)的酵母結(jié)構(gòu)gene也沒(méi)有內(nèi)含子。33 5gt 5gtag3ag3法則法則 在每個(gè)外顯子和內(nèi)含子的接頭區(qū)都是一段高度保守的共有序列,內(nèi)含子的5端是gt,3端是ag,這種接頭方式稱為gt-ag法則,普遍存在于真核生物中,是rna剪接的識(shí)別信號(hào),轉(zhuǎn)錄后的前體ran中的內(nèi)含子剪接位點(diǎn)。34b b、側(cè)翼序列與調(diào)控序列、側(cè)翼序列與調(diào)控序列 每個(gè)結(jié)構(gòu)基因的第一個(gè)和最后一個(gè)外顯子的外側(cè),都
28、有一段不被轉(zhuǎn)錄的非編碼區(qū),稱為側(cè)翼序列(flanking sequence)。 它是基因的調(diào)控序列,對(duì)基因的有效表達(dá)起調(diào)控作用,包括:?jiǎn)?dòng)子、增強(qiáng)子、終止子等。35啟動(dòng)子啟動(dòng)子 啟動(dòng)子( promoter)是一段特定的核苷酸序列,位于gene轉(zhuǎn)錄起始點(diǎn)上游的100bp 范圍內(nèi),是rna聚合酶的結(jié)合部位,能促進(jìn)轉(zhuǎn)錄過(guò)程。promoter決定dna中的轉(zhuǎn)錄鏈。tata框(tata box)是一段高度保守序列,7個(gè)bp,tataa/ taa/t,位于轉(zhuǎn)錄起始點(diǎn)上游2530 bp(-3050)。tata框與轉(zhuǎn)錄因子tfii結(jié)合,再與rna 聚合酶ii形成復(fù)合物,從而準(zhǔn)確地識(shí)別轉(zhuǎn)錄起始位置,對(duì)轉(zhuǎn)錄水平有
29、定量效應(yīng)。36caat框(caat box):是一段保守序列,9bp,gggc/tcaatac, 位于轉(zhuǎn)錄起始點(diǎn)上游-70-80bp,轉(zhuǎn)錄因子ctf識(shí)別位點(diǎn)并與之結(jié)合,激活轉(zhuǎn)錄。gc框(gc box):順序?yàn)間gcggg,有兩個(gè)拷貝,位于caat box兩側(cè),與轉(zhuǎn)錄因子sp1結(jié)合。(sp1有鋅指區(qū)可以與dna結(jié)合,在n端有激活轉(zhuǎn)錄的作用)gc框有激活轉(zhuǎn)錄的功能。37增強(qiáng)子增強(qiáng)子 增強(qiáng)子(enhancer)包括啟動(dòng)子上游或下游的一段dna序列,可以增強(qiáng)啟動(dòng)子發(fā)動(dòng)轉(zhuǎn)錄,提高轉(zhuǎn)錄效率。 特點(diǎn):在任意位置都有效無(wú)方向性有組織特異性 例如:beta珠蛋白gene增強(qiáng)子是由串聯(lián)重復(fù)的兩個(gè)72bp長(zhǎng)的相同序
30、列組成,位于轉(zhuǎn)錄起點(diǎn)上游-1400bp或下游3300bp處,均可增強(qiáng)轉(zhuǎn)錄效率(活性)200倍。增強(qiáng)子在轉(zhuǎn)錄起始點(diǎn)的上下游一定范圍內(nèi)增強(qiáng)轉(zhuǎn)錄效率。作用可以是53,也可以是35方向。 38增強(qiáng)子(增強(qiáng)子(enhancerenhancer) 能使和它連鎖的基因轉(zhuǎn)錄頻率明顯增強(qiáng)的能使和它連鎖的基因轉(zhuǎn)錄頻率明顯增強(qiáng)的dnadna序列序列 增強(qiáng)效應(yīng)十分明顯。增強(qiáng)效應(yīng)十分明顯。增強(qiáng)效應(yīng)與其位置無(wú)關(guān),不論增強(qiáng)子以什么方增強(qiáng)效應(yīng)與其位置無(wú)關(guān),不論增強(qiáng)子以什么方 向排列(向排列(5353或或3535),還是在基因的上游),還是在基因的上游 或者下游,均表現(xiàn)出增強(qiáng)效應(yīng)。或者下游,均表現(xiàn)出增強(qiáng)效應(yīng)。增強(qiáng)子可遠(yuǎn)離轉(zhuǎn)錄起
31、始點(diǎn),通常在增強(qiáng)子可遠(yuǎn)離轉(zhuǎn)錄起始點(diǎn),通常在1 14kb4kb起作用。起作用。增強(qiáng)子沒(méi)有基因?qū)R恍裕瑢?duì)同源或者異源基因都有效增強(qiáng)子沒(méi)有基因?qū)R恍?,?duì)同源或者異源基因都有效許多增強(qiáng)子具有組織或者細(xì)胞特異性,說(shuō)明只有許多增強(qiáng)子具有組織或者細(xì)胞特異性,說(shuō)明只有 特定的蛋白質(zhì)參與才能發(fā)揮作用。特定的蛋白質(zhì)參與才能發(fā)揮作用。許多增強(qiáng)子還受到外部信號(hào)的調(diào)控。許多增強(qiáng)子還受到外部信號(hào)的調(diào)控。39沉默子(沉默子(silencersilencer) 在酵母交配型座位中首次發(fā)現(xiàn),動(dòng)物、人中也發(fā)現(xiàn)。在酵母交配型座位中首次發(fā)現(xiàn),動(dòng)物、人中也發(fā)現(xiàn)。屬于負(fù)調(diào)控元件,可不受距離和方向的限制。屬于負(fù)調(diào)控元件,可不受距離和方向的
32、限制。在真核生物細(xì)胞中對(duì)成簇基因的表達(dá)起重要作用。如在真核生物細(xì)胞中對(duì)成簇基因的表達(dá)起重要作用。如酵母菌酵母菌hmr的的e沉默子。沉默子。4041終止子終止子終止子(terminator)由一段回由一段回文序列以及特定的序列(文序列以及特定的序列(polya)5-aataaa-3組成。組成?;匚男蛄袨檗D(zhuǎn)錄終止號(hào)?;匚男蛄袨檗D(zhuǎn)錄終止號(hào)。polya為附加信號(hào)。終止子為反向重復(fù)為附加信號(hào)。終止子為反向重復(fù)序列,是序列,是rna聚合酶停止工作聚合酶停止工作的信號(hào),反向重復(fù)序列轉(zhuǎn)錄后,的信號(hào),反向重復(fù)序列轉(zhuǎn)錄后,可以形成發(fā)夾式結(jié)構(gòu),并且形成可以形成發(fā)夾式結(jié)構(gòu),并且形成一串一串u。發(fā)夾式結(jié)構(gòu)阻礙了。發(fā)夾式
33、結(jié)構(gòu)阻礙了rna聚合酶的移動(dòng)。一串聚合酶的移動(dòng)。一串u的的u與與dna模板中的模板中的a的結(jié)合不穩(wěn)定,的結(jié)合不穩(wěn)定,從模板上脫落下來(lái),終止轉(zhuǎn)錄。從模板上脫落下來(lái),終止轉(zhuǎn)錄。42調(diào)控序列調(diào)控序列調(diào)控序列(regulator sequence)包括啟動(dòng)子,增強(qiáng)子和終止子均屬于基因的順式調(diào)控因子(順式作用元件),是人類gene組中的一些特殊序列,起調(diào)控基因表達(dá)的作用。反式作用元件:tfii、ctf、sp1。43c cdnadnaa adnadna反式調(diào)節(jié)反式調(diào)節(jié)c c順式調(diào)節(jié)順式調(diào)節(jié) mrna mrna c c蛋白質(zhì)蛋白質(zhì)c cb ba a mrnamrna蛋白質(zhì)蛋白質(zhì)a aa a44原核細(xì)胞原核細(xì)
34、胞 真核細(xì)胞真核細(xì)胞不同點(diǎn)不同點(diǎn)相同點(diǎn)相同點(diǎn)原核細(xì)胞原核細(xì)胞真核細(xì)胞真核細(xì)胞不同點(diǎn)不同點(diǎn)編碼區(qū)是連續(xù)的編碼區(qū)是連續(xù)的編碼區(qū)是間隔的、編碼區(qū)是間隔的、不連續(xù)的不連續(xù)的相同點(diǎn)相同點(diǎn)都由能夠編碼蛋白質(zhì)的編碼區(qū)和具都由能夠編碼蛋白質(zhì)的編碼區(qū)和具有調(diào)控作用的非編碼區(qū)組成的有調(diào)控作用的非編碼區(qū)組成的原核細(xì)胞與真核細(xì)胞的基因結(jié)構(gòu)比較:45“內(nèi)含子”“外顯子”“編碼區(qū)”“非編碼區(qū)”? 二者都是對(duì)于基因而言的,編碼的部分為外顯子,不編碼的為內(nèi)含子,內(nèi)含子沒(méi)有遺傳效應(yīng)。 外顯子就是在成熟mrna中保留下的部分,也就是說(shuō)成熟mrna對(duì)應(yīng)于基因中的部分。 內(nèi)含子是指在mrna加工過(guò)程中被剪切掉的部分,在成熟mrna中
35、不存在的部分。 所謂mrna就是信使mrna,是將來(lái)可以翻譯成蛋白質(zhì)的一種核糖核酸。生物體的各種表型效應(yīng)都是由于基因的最終產(chǎn)物蛋白質(zhì)引起的。 雖然以前認(rèn)為內(nèi)含子是沒(méi)有什么功能的,但現(xiàn)在的研究認(rèn)為內(nèi)含子可能有一定的功能,比如在mrna加工過(guò)程中起幫助作用、可能對(duì)機(jī)體有一定的調(diào)控作用,并且內(nèi)含子只是對(duì)一個(gè)特定的基因而言是它的內(nèi)含子,此內(nèi)含子對(duì)于其它的基因而言,也有可能是外顯子或者外顯子的一部分。 外顯子是編碼區(qū)內(nèi)的有效編碼序列,內(nèi)含子是編碼區(qū)中的非編碼序列。兩者都能被轉(zhuǎn)錄為rna(確切地說(shuō),是hnrna),然后被rna加工機(jī)制把內(nèi)含子切掉,成為成熟的mrna然后就只剩下外顯子了 編碼區(qū)能被轉(zhuǎn)錄為r
36、na,非編碼區(qū)不能被轉(zhuǎn)為rna,大片是廢物,有些有重要的調(diào)控作用。內(nèi)含子能轉(zhuǎn)錄為信使rna46啟動(dòng)子與起始密碼有何不同啟動(dòng)子與起始密碼有何不同啟動(dòng)子是基因結(jié)構(gòu)中位于編碼區(qū)上游的核苷酸序列,是rna聚合酶結(jié)合位點(diǎn),能夠準(zhǔn)確地識(shí)別轉(zhuǎn)錄的起始點(diǎn)并開(kāi)始轉(zhuǎn)錄,有調(diào)控遺傳信息表達(dá)的作用。而起始密碼則是mrna上的三個(gè)相鄰堿基(aug,gug)。啟動(dòng)子不止三個(gè)堿基。 47終止子和終止密碼終止子和終止密碼有何不同有何不同終止子是在非編碼區(qū)內(nèi)緊靠轉(zhuǎn)錄終點(diǎn),調(diào)控遺傳信息表達(dá)的dna序列。它特殊的堿基排列順序能夠阻礙rna聚合酶的移動(dòng),并使其從dna模板鏈上脫離下來(lái),從而使轉(zhuǎn)錄工作結(jié)束。終止密碼位于mrna上,共有
37、三種:uaa、uag、uga。48二、基因組學(xué)二、基因組學(xué) genomics1.1.基因組(基因組(genomegenome) 是指單倍體細(xì)胞中所含有的全套遺傳物質(zhì)是指單倍體細(xì)胞中所含有的全套遺傳物質(zhì) 病毒:病毒:103 bp 如如x174x174噬菌體是單鏈環(huán)狀噬菌體是單鏈環(huán)狀dnadna,5 5 10 103 3 bpbp 細(xì)菌:細(xì)菌:106 bp 大腸桿菌染色體大腸桿菌染色體dnadna,4.7 4.7 10 106 6 bpbp 真核生物真核生物:109 bp 人的染色體人的染色體dnadna, 3.2 3.2 10 109 9 bpbp 49一)、基因組及表達(dá)的概念一)、基因組及表達(dá)
38、的概念* * 基因組基因組(genome)(genome)一個(gè)細(xì)胞或病毒所攜帶的全部遺傳信息或一個(gè)細(xì)胞或病毒所攜帶的全部遺傳信息或整套基因。整套基因。基因經(jīng)過(guò)轉(zhuǎn)錄、翻譯,產(chǎn)生具有特異生物學(xué)基因經(jīng)過(guò)轉(zhuǎn)錄、翻譯,產(chǎn)生具有特異生物學(xué)功能的蛋白質(zhì)分子的過(guò)程。功能的蛋白質(zhì)分子的過(guò)程。* * 基因表達(dá)基因表達(dá)(gene expression)(gene expression)基因表達(dá)是受調(diào)控的基因表達(dá)是受調(diào)控的50基因組學(xué)概念基因組學(xué)概念基因組學(xué)基因組學(xué)(genomics)(genomics)就是發(fā)展和應(yīng)用就是發(fā)展和應(yīng)用dnadna制圖、測(cè)序新技術(shù)以及計(jì)制圖、測(cè)序新技術(shù)以及計(jì)算機(jī)程序,分析生命體(包括人類
39、)全部基因組算機(jī)程序,分析生命體(包括人類)全部基因組結(jié)構(gòu)及功能。結(jié)構(gòu)及功能。51基因組學(xué)包括:基因組學(xué)包括:結(jié)構(gòu)基因組學(xué)結(jié)構(gòu)基因組學(xué)(structural genomics) (structural genomics) 功能基因組學(xué)功能基因組學(xué)(functional genomics)(functional genomics)比較基因組學(xué)比較基因組學(xué)(comparative genomics) (comparative genomics) 52* *結(jié)構(gòu)基因組學(xué)結(jié)構(gòu)基因組學(xué)結(jié)構(gòu)基因組學(xué)結(jié)構(gòu)基因組學(xué)(structural genomics)(structural genomics)是通過(guò)是通過(guò)
40、hgphgp的實(shí)的實(shí)施來(lái)完成的。施來(lái)完成的。human genome project,hgphgp的內(nèi)容就是制作高分辨率的人類遺傳圖和物理圖,的內(nèi)容就是制作高分辨率的人類遺傳圖和物理圖,最終完成人類和其它重要模式生物全部基因組最終完成人類和其它重要模式生物全部基因組dnadna序序列測(cè)定,因此列測(cè)定,因此hgphgp屬于結(jié)構(gòu)基因組學(xué)范疇。屬于結(jié)構(gòu)基因組學(xué)范疇。53第一期稱作“結(jié)構(gòu)基因組學(xué)”的15年計(jì)劃(19902005)的目標(biāo)是:(1)建立、維持和擴(kuò)充有關(guān)dna順序、遺傳標(biāo)志和基因位置、功能及其他有關(guān)信息的數(shù)據(jù)庫(kù)。(2)繪制人類染色體圖譜(遺傳圖譜)。(3)建立包括覆蓋整個(gè)染色體的排序dna克
41、隆庫(kù)在內(nèi)的材料庫(kù)。(4)發(fā)展分析dna的新儀器設(shè)備。(5)發(fā)展分析dna的技術(shù)。(6)對(duì)模式生物進(jìn)行類似工作。(7)測(cè)定人類基因組dna的全序列。(8)有關(guān)的社會(huì)學(xué)、倫理學(xué)、管理學(xué)和技術(shù)轉(zhuǎn)讓等問(wèn)題的研究。 54(一)物理制圖(一)物理制圖 (二)遺傳制圖(二)遺傳制圖 (三)基因組(三)基因組dnadna序列測(cè)定序列測(cè)定 (四)創(chuàng)建計(jì)算機(jī)分析管理系統(tǒng)(四)創(chuàng)建計(jì)算機(jī)分析管理系統(tǒng) hgphgp包括:包括:55hgphgp主要任務(wù)及內(nèi)容主要任務(wù)及內(nèi)容56通過(guò)通過(guò)hgphgp獲得的廣泛基因組信息組成了結(jié)構(gòu)基因獲得的廣泛基因組信息組成了結(jié)構(gòu)基因組學(xué)的基本內(nèi)容,是開(kāi)展功能基因組學(xué)的研究的組學(xué)的基本內(nèi)容,
42、是開(kāi)展功能基因組學(xué)的研究的基礎(chǔ);同時(shí)為詳盡研究每一個(gè)單基因遺傳病提供基礎(chǔ);同時(shí)為詳盡研究每一個(gè)單基因遺傳病提供“平臺(tái)平臺(tái)”,并將成為復(fù)雜的多基因遺傳病研究的,并將成為復(fù)雜的多基因遺傳病研究的發(fā)端發(fā)端57* *功能基因組學(xué)功能基因組學(xué)完成一個(gè)生物體全部基因組測(cè)序后即進(jìn)入后基因組完成一個(gè)生物體全部基因組測(cè)序后即進(jìn)入后基因組測(cè)序階段測(cè)序階段詳盡分析序列,描述基因組所有基因詳盡分析序列,描述基因組所有基因的功能,包括研究基因的表達(dá)及其調(diào)控模式,這就的功能,包括研究基因的表達(dá)及其調(diào)控模式,這就是功能基因組學(xué)(是功能基因組學(xué)(functional genomicsfunctional genomics)5
43、8(一)鑒定(一)鑒定dnadna序列中的基因序列中的基因(二)同源搜索設(shè)計(jì)基因功能(二)同源搜索設(shè)計(jì)基因功能 (三)實(shí)驗(yàn)性設(shè)計(jì)基因功能(三)實(shí)驗(yàn)性設(shè)計(jì)基因功能 (四)描述基因表達(dá)模式(四)描述基因表達(dá)模式 主要具體內(nèi)容包括以下方面主要具體內(nèi)容包括以下方面 59功能基因組學(xué)研究策略及主要內(nèi)容功能基因組學(xué)研究策略及主要內(nèi)容60* *比較基因組學(xué)比較基因組學(xué)比較基因組學(xué)比較基因組學(xué)(comparative genomics)(comparative genomics)涉涉及比較不同物種的整個(gè)基因組,以便深入理解及比較不同物種的整個(gè)基因組,以便深入理解每個(gè)基因組的功能和進(jìn)化關(guān)系。每個(gè)基因組的功能和進(jìn)
44、化關(guān)系。 61二二. .基因組學(xué)與醫(yī)學(xué)關(guān)系基因組學(xué)與醫(yī)學(xué)關(guān)系the relation between genomics and medicine62* *基因病的概念基因病的概念以基因組學(xué)為基礎(chǔ),從疾病和健康的角以基因組學(xué)為基礎(chǔ),從疾病和健康的角度考慮,人類疾病大多直接或間接地與基因度考慮,人類疾病大多直接或間接地與基因相關(guān),故有相關(guān),故有“基因病基因病”概念產(chǎn)生。根據(jù)這一概念產(chǎn)生。根據(jù)這一概念,人類疾病大致分為三類:概念,人類疾病大致分為三類:(一)單基因?。ㄒ唬﹩位虿?(二)多基因病(二)多基因病 (三)獲得性基因?。ㄈ┇@得性基因病 63是指受一對(duì)等位基因控制的遺傳病,有6600多種,
45、并且每年在以10-50種的速度遞增,單基因遺傳病已經(jīng)對(duì)人類健康構(gòu)成了較大的威脅。較常見(jiàn)的有紅綠色盲、血友病、白化病等。根據(jù)致病基因所在染色體的種類,通常又可分四類:常染色體顯性遺傳病 常染色體隱性遺傳病 x連鎖顯性遺傳病 x連鎖隱性遺傳病 y連鎖遺傳病連鎖遺傳病64多基因遺傳病是遺傳信息通過(guò)兩對(duì)以上致病基因的累積效應(yīng)所致的遺傳病,其遺傳效應(yīng)較多地受環(huán)境因素的影響。與單基因遺傳病相比,多基因遺傳病不是只由遺傳因素決定,而是遺傳因素與環(huán)境因素共同起作用。與環(huán)境因素相比,遺傳因素所起的作用大小叫遺傳度,用百分?jǐn)?shù)表示。如精神病中最常見(jiàn)的也是危害人類精神健康最大的疾病精神分裂癥,是多基因遺傳病,其遺傳度
46、為80,也就是說(shuō)精神分裂癥的形成中,遺傳因素起了很大作用,而環(huán)境因素所起的作用則相對(duì)較小。多基因遺傳病一般有家族性傾向,如精神分裂癥患者的近親中發(fā)病率比普通人群高出數(shù)倍,與患者血緣關(guān)系越近,患病率越高。多基因遺傳病的易患性是屬于數(shù)量性狀,它們之間的變異是連續(xù)的。孟德?tīng)柺竭z傳即單基因遺傳性狀是屬于質(zhì)量性狀,它們之間的變異是不連續(xù)的。65獲得性基因病是由病原微生物感染所致,不會(huì)遺傳,大多是病原微生物基因與人體基因相互作用的結(jié)果,如艾滋病、病毒性肝炎等即是。 66* *基因組學(xué)與腫瘤病因?qū)W基因組學(xué)與腫瘤病因?qū)W* *基因組學(xué)與流行病病因?qū)W基因組學(xué)與流行病病因?qū)W* *基因組學(xué)與醫(yī)學(xué)倫理、法律和社會(huì)問(wèn)題基
47、因組學(xué)與醫(yī)學(xué)倫理、法律和社會(huì)問(wèn)題67* *疾病相關(guān)基因的鑒定疾病相關(guān)基因的鑒定(一)檢測(cè)人類基因變異或突變(一)檢測(cè)人類基因變異或突變 (二)疾病時(shí)基因組差異表達(dá)分析(二)疾病時(shí)基因組差異表達(dá)分析 (三)染色體制圖定位及疾病相關(guān)基因克?。ㄈ┤旧w制圖定位及疾病相關(guān)基因克隆68除dna直接測(cè)序外,較常用的方法有單鏈構(gòu)象分析(single-strand conformational analysis, ssca)或單鏈構(gòu)象多態(tài)性(single-strand conformational polymorphism, sscp)、限制性片段長(zhǎng)度多態(tài)性(restriction fragment len
48、gth polymorphism, rflp)、變性梯度膠電泳(denaturing gradient gel electrophoresis, dgge)、異質(zhì)重疊分析(heteroduplex analysis, ha)、化學(xué)錯(cuò)配裂解(chemical mismatch cleavage, cmc)和蛋白質(zhì)刪除試驗(yàn)(protein truncation test, ptt)。當(dāng)前采用最多的就是“單核苷酸多態(tài)性”(single nucleotide polymorphisms, snps“snips”)分析。69眾所周知,每個(gè)人都攜帶有兩個(gè)不同的“基因組”,分別來(lái)自父母雙親。根據(jù)部分基因組序
49、列分析,兩個(gè)個(gè)體之間(雙胞胎除外)大約每500 1 000 bp就有一個(gè)堿基差異。如果一個(gè)堿基位置發(fā)生的變異在1%以上的人群存在,這個(gè)位點(diǎn)就被定義為snp位點(diǎn)。1999年以前只有數(shù)千個(gè)snp位點(diǎn)被鑒定;隨著phgp實(shí)施,至2000年這個(gè)數(shù)字增加了1 000倍,而且還準(zhǔn)確知道這些堿基變異的位點(diǎn)在基因組何處。目前(2002年)已發(fā)現(xiàn)1 420萬(wàn)個(gè)snp,其分布密度為1個(gè)/1.91kb;這就意味著,在基因組中90%以上任何20 kb的dna序列延伸將含有1個(gè)或更多的snp,這個(gè)密度在含基因的區(qū)域更高。“國(guó)際snp制圖工作小組”已經(jīng)在基因中鑒定出60 000個(gè)snps(“編碼”snps),即每1.08
50、 kb的基因序列就有一個(gè)snp;93%的基因都含有一個(gè)snp?;蚪M序列變異有的對(duì)人類疾病敏感,有的有保護(hù)作用。例如,apoe基因單個(gè)堿基變異與alzheimer病發(fā)病相關(guān)。細(xì)胞因子受體基因ccr5中一個(gè)單純?nèi)笔蛔儠?huì)導(dǎo)致對(duì)hiv或aids抗性。在全基因組snp制圖基礎(chǔ)上,通過(guò)比較病人和對(duì)照人群之間snps的差異,鑒定與疾病相關(guān)的snps,這一研究導(dǎo)致了“遺傳醫(yī)學(xué)”(genetic medicine)的發(fā)生。70snp的等位基因分型可采用寡核苷酸雜交分析(ologonucleotide hybridization analysis)(和等位基因特異寡核苷酸(allele-specific ol
51、ogonucleotide,aso)雜交進(jìn)行;大規(guī)模snps自動(dòng)分型通常是通過(guò)dna微點(diǎn)陣(dna microarrays)(dna芯片(dna chips)、基因芯片點(diǎn)陣(genechip arrays)和寡核苷酸點(diǎn)陣(oligonucleotide arrays)技術(shù)來(lái)實(shí)現(xiàn)的。71寡核苷酸雜交分析寡核苷酸雜交分析snpsnp和等位基因特異和等位基因特異寡核苷酸雜交寡核苷酸雜交 72dnadna芯片檢測(cè)的差異表達(dá)譜芯片檢測(cè)的差異表達(dá)譜73(二)疾病時(shí)基因組差異表達(dá)分析 實(shí)質(zhì)上就是將“基因病”概念與功能基因組學(xué)(轉(zhuǎn)錄組學(xué))原理、技術(shù)相結(jié)合,分析、鑒定與某一疾病或征候群相關(guān)的多個(gè)基因表達(dá)水平。當(dāng)
52、前開(kāi)展最多的就是dna芯片技術(shù)。為比較兩個(gè)dna或rna樣品(例如:一個(gè)樣品來(lái)自疾病受累細(xì)胞,另一來(lái)自正常細(xì)胞)相對(duì)豐度,分別將兩樣品標(biāo)記紅、綠不同顏色的熒光顏料,混合后與芯片上的dna或寡核苷酸探針(數(shù)千甚至上萬(wàn))雜交,故稱平行分子遺傳學(xué)分析(parallel molecular genetic analysis)。在同一雜交斑中,如果相同的分子在受累細(xì)胞含量或表達(dá)量高,則顯紅色,反之則顯綠色;如果兩種細(xì)胞含量或表達(dá)量相等,雜交結(jié)果顯黃色。通過(guò)熒光顯微鏡或激光共聚焦顯微鏡掃描系統(tǒng)就可獲得兩樣品的序列和相對(duì)豐度的信息,經(jīng)計(jì)算機(jī)分析可獲得基因分子差異表達(dá)圖。采用生物芯片不僅可發(fā)現(xiàn)腫瘤等疾病相關(guān)的
53、基因,還可通過(guò)藥物干預(yù)、無(wú)干預(yù)細(xì)胞差異表達(dá)分析,找到藥物作用的靶分子,揭示藥物作用機(jī)理。這就是藥理基因組學(xué)。 74(三)染色體制圖定位及疾病相關(guān)基因克隆 完成基因組全序列分析后,結(jié)合hgp發(fā)現(xiàn)的大量可利用的(多態(tài)性探針資料,stss資料,克隆資料,遺傳的、物理的和整合的圖譜資料,限制性片段、dna片段)序列資料,將會(huì)使疾病相關(guān)基因的克隆更為快捷、方便。在采用定位、或定位-侯選基因策略“克隆”一個(gè)疾病相關(guān)基因前,需要將尋找的疾病基因在染色體上定位。定位可依據(jù)染色體原位雜交(in situ hybridization)、染色體畸形(chromosomal abnormality)分析、連鎖分析(l
54、ikage analysis)等(參見(jiàn)遺傳學(xué))作出判斷。對(duì)疾病相關(guān)基因的克隆有下述幾種情況:已掌握疾病相關(guān)基因或其產(chǎn)物的確切信息;已掌握與疾病可能相關(guān)的基因預(yù)測(cè)資料;對(duì)疾病相關(guān)基因毫無(wú)所知。最后一種情況最多見(jiàn),隨著hgp測(cè)序工作的完成及轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)研究進(jìn)展,前兩種情況會(huì)逐漸增加。在大規(guī)模多態(tài)性全基因組掃描等確定病基因在染色體上的定位后,結(jié)合基因組信息查詢,采用適當(dāng)策略也可實(shí)現(xiàn)病基因克隆。根據(jù)以上不同情況,可采取以下4種策略獵取疾病基因,即功能基因克隆、侯選基因克隆、定位基因克隆及定位-侯選基因克隆。75三三、基因組學(xué)與腫瘤病因?qū)W(基因組學(xué)與腫瘤病因?qū)W(genomics and tumo
55、r etiology)在生命全過(guò)程中,人類細(xì)胞dna始終暴露于各種致癌因子,引起dna損傷;如果損傷未能及時(shí)修復(fù),或修復(fù)時(shí)發(fā)生錯(cuò)配,就會(huì)發(fā)生突變。一旦突變發(fā)生在某個(gè)關(guān)鍵基因,并改變其功能,就可能導(dǎo)致細(xì)胞異常增殖,異常增殖的細(xì)胞克隆的形成結(jié)局就是發(fā)生腫瘤。所以說(shuō),所有腫瘤的發(fā)生均可歸因于dna異常。目前,已鑒定出大約30個(gè)隱性癌基因(腫瘤抑制基因)和100多個(gè)顯性癌基因。過(guò)去常采用制圖策略發(fā)現(xiàn)這些隱性癌基因和顯性癌基因:首先將一些基因局限、定位在腫瘤病人的小部分基因組范圍內(nèi),然后在此范圍內(nèi)掃描突變,尋找出候選基因。然而,這種策略有一定的局限性,常發(fā)生制圖信息混亂或誤導(dǎo)。例如,某些顯性癌基因僅因一
56、個(gè)堿基置換,導(dǎo)致單個(gè)氨基酸變化而被激活;這種腫瘤基因變化在基因組中沒(méi)有明顯的“鑒定標(biāo)志物”,不能被制圖方法真正定位。76隨著基因組學(xué)的發(fā)展,發(fā)布的基因組序列和蛋白質(zhì)序列資料庫(kù)日益增長(zhǎng)、擴(kuò)大,使科學(xué)家有可能為發(fā)現(xiàn)新的腫瘤候選基因提出新的策略。策略之一是,利用已知的隱性癌基因和顯性癌基因氨基酸序列與根據(jù)基因組序列演繹的氨基酸序列進(jìn)行比較,如果二者的氨基酸序列存在50%以上的同源性或相似性,則基因組內(nèi)的這一序列可能為新的隱性癌基因或顯性癌基因。目前,盡管采用這種策略尚未獲得滿意結(jié)果,相信隨著轉(zhuǎn)錄組、蛋白質(zhì)組研究的深入,以及蛋白質(zhì)數(shù)據(jù)庫(kù)的擴(kuò)展,可能會(huì)取得進(jìn)展。還有一種策略是比較人類基因組與腫瘤基因組結(jié)
57、構(gòu)。目前正在實(shí)施的腫瘤基因組解剖工程(cancer genome anatomy project)就是想通過(guò)建立各種腫瘤的cdna文庫(kù),將其與基因組工作草圖進(jìn)行比較,發(fā)現(xiàn)可使腫瘤抑制基因失活,或顯性癌基因激活的堿基置換、插入和缺失,探索腫瘤發(fā)生時(shí)基因變化的不同類型。這一策略與下述事實(shí)相符:基因重排常導(dǎo)致癌基因激活,這種基因重排表現(xiàn)的染色體易位在白血病、淋巴瘤和肌肉瘤中極其常見(jiàn)?;蛑嘏趴蓪?dǎo)致嵌合轉(zhuǎn)錄本的出現(xiàn)。隨著腫瘤cdna文庫(kù)建設(shè),以及文庫(kù)測(cè)序工作的進(jìn)展,一定會(huì)發(fā)現(xiàn)新的腫瘤相關(guān)基因。 上述策略也適用于其它病因?qū)W研究和探索。 77四、基因組學(xué)與流行病病因?qū)W四、基因組學(xué)與流行病病因?qū)W(genom
58、ics and epidemic etiology) 完全的基因組序列測(cè)定將會(huì)加強(qiáng)所有疾病相關(guān)基因的鑒定。在當(dāng)前的遺傳醫(yī)學(xué)和流行病學(xué)研究中,醫(yī)學(xué)科學(xué)家希望通過(guò)對(duì)疾病相關(guān)基因及其產(chǎn)物進(jìn)行分類,揭示人類疾病的基本原理。有人將近1 000個(gè)病歷的發(fā)病基因(包括單基因病基因、臨床復(fù)雜疾病敏感性基因;不包括非遺傳性腫瘤、線粒體基因組),按編碼蛋白質(zhì)的功能分為14組;同時(shí)結(jié)合患者臨床表現(xiàn)、病理學(xué)特性、發(fā)病年齡、遺傳方式、頻率、嚴(yán)重程度、所涉組織范圍、與畸形/殘廢的關(guān)系進(jìn)行評(píng)分,進(jìn)而分析14組基因產(chǎn)物與發(fā)病表現(xiàn)的關(guān)系。結(jié)果顯示,在923例病人中發(fā)病原因最多的系由酶功能異常引起,占全部發(fā)病的31.2%;其次是
59、蛋白質(zhì)功能調(diào)節(jié)分子(包括調(diào)節(jié)蛋白質(zhì)穩(wěn)定性、激活、折疊等),占13.6%;受體、轉(zhuǎn)錄調(diào)節(jié)因子引起的疾病各占(大約)7%8%;細(xì)胞內(nèi)基質(zhì)、細(xì)胞外基質(zhì)相關(guān)疾病分別為6%7%;78其余如跨膜蛋白、離子通道、細(xì)胞信號(hào)分子、激素、細(xì)胞外轉(zhuǎn)運(yùn)蛋白、免疫球蛋白及其它基因編碼產(chǎn)物相關(guān)疾病分別占1%4%;此外尚有一些未知分子編碼基因約占6%。胚胎期和胎兒期發(fā)病由酶異常引起的為20%,轉(zhuǎn)錄因子引起為25%,其余超過(guò)5%的為蛋白質(zhì)功能調(diào)節(jié)蛋白、受體、細(xì)胞外基質(zhì)、通道和其它分子。出生1年內(nèi)酶發(fā)病占約46%47%,受體病約占10%,大于5%發(fā)病率的為蛋白質(zhì)功能調(diào)節(jié)蛋白、轉(zhuǎn)錄因子、受體、細(xì)胞內(nèi)基質(zhì)和細(xì)胞外基質(zhì)分子。青春期酶異常占31%32%,大于10%的是蛋白質(zhì)功能調(diào)節(jié)蛋白和受體,5%或以上者為轉(zhuǎn)錄因子、細(xì)胞內(nèi)基質(zhì)、細(xì)胞外基質(zhì)及跨膜轉(zhuǎn)運(yùn)蛋白。青壯年期酶相關(guān)疾病21%左右,調(diào)節(jié)蛋白異常略多于酶。50歲以上仍以酶(32%33%)和調(diào)節(jié)蛋白(21%22%)功能異常發(fā)病為主。這種流行病病因?qū)W調(diào)研分析可為臨床診斷、疾病防治提供重要線索。此外,基因組基因功能分類與疾病關(guān)系探索還可
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年血液凈化市場(chǎng)調(diào)查報(bào)告
- 湖北省鄖陽(yáng)中學(xué)2025年高二下化學(xué)期末統(tǒng)考試題含解析
- 2025年圖書(shū)館項(xiàng)目投資分析及可行性報(bào)告
- 中國(guó)商用wifi行業(yè)全景評(píng)估及投資規(guī)劃建議報(bào)告
- 2021-2026年中國(guó)燙發(fā)機(jī)市場(chǎng)全面調(diào)研及行業(yè)投資潛力預(yù)測(cè)報(bào)告
- 2025屆山西省臨汾市第一中學(xué)等五校高二下化學(xué)期末監(jiān)測(cè)模擬試題含解析
- 中國(guó)市政鑄件行業(yè)市場(chǎng)前景預(yù)測(cè)及投資價(jià)值評(píng)估分析報(bào)告
- 2025年中國(guó)艾灸儀行業(yè)市場(chǎng)調(diào)研分析及投資戰(zhàn)略咨詢報(bào)告
- 2025屆山西省朔州市第二中學(xué)化學(xué)高一下期末考試試題含解析
- 2025年中國(guó)口潔針行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- 放化療相關(guān)口腔黏膜炎預(yù)防及護(hù)理課件
- 2024時(shí)事政治必考試題庫(kù)附答案(完整版)
- 金融計(jì)量學(xué)智慧樹(shù)知到期末考試答案章節(jié)答案2024年山東管理學(xué)院
- 04SG518-3-門式剛架輕型房屋鋼結(jié)構(gòu)(有吊車)
- 基于“教-學(xué)-評(píng)”一體化的初中語(yǔ)文有效教學(xué)策略
- 安全隱患排查月報(bào)
- 硬核贏創(chuàng)新智慧樹(shù)知到期末考試答案2024年
- SIYB游戲模塊Ⅱ 學(xué)習(xí)供給與需求
- 科學(xué)認(rèn)識(shí)天氣智慧樹(shù)知到期末考試答案2024年
- (高清版)DZT 0064.15-2021 地下水質(zhì)分析方法 第15部分:總硬度的測(cè)定 乙二胺四乙酸二鈉滴定法
- 兵檢(征兵)心理測(cè)試題目3套匯編
評(píng)論
0/150
提交評(píng)論