




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究姓名:梁迪專業(yè):微生物學(xué)年級(jí):2013學(xué)號(hào):3130179二零一四年六月十五日轉(zhuǎn)錄學(xué)主要技術(shù)及其應(yīng)用研究摘要:轉(zhuǎn)錄組(transcriptome是特定組織或細(xì)胞在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出來(lái)的所有RNA的集合。轉(zhuǎn)錄組學(xué)研究能夠從整體水平研究基因功能以及基因結(jié)構(gòu),揭示特定生物學(xué)過(guò)程以及疾病發(fā)生過(guò)程中的分子機(jī)理。目前,轉(zhuǎn)錄組學(xué)研究技術(shù)主要包括兩種:基于雜交技術(shù)的微陣列技術(shù)(microarray和基于測(cè)序技術(shù)的轉(zhuǎn)錄組測(cè)序技術(shù),包括表達(dá)序列標(biāo)簽技術(shù)(Expression Sequence Tags Technology,EST、基因表達(dá)系列分析技術(shù)(Serial ana
2、lysis of gene expression,SAGE、大規(guī)模平行測(cè)序技術(shù)(Massively parallel signature sequencing,MPSS、以及RNA 測(cè)序技術(shù)(RNA sequencing,RNA-seq。文章主要介紹了以上轉(zhuǎn)錄組學(xué)主要研究技術(shù)的原理、技術(shù)特點(diǎn)及其應(yīng)用,并就這些技術(shù)面臨的挑戰(zhàn)和未來(lái)發(fā)展前景進(jìn)行了討論,為其今后的研究與應(yīng)用提供參考。關(guān)鍵詞:轉(zhuǎn)錄組學(xué);微陣列技術(shù);轉(zhuǎn)錄組測(cè)序技術(shù);應(yīng)用Study on the main technologies of transcriptomicsand their applicationAbstract: The t
3、ranscriptome is the complete set of transcripts for certain type of cells or tissues in a specific developmental stage or physiological condition. Transcriptome analysis can provide a comprehensive understanding of molecularmechanisms involved in specific biological processes and diseases from the i
4、nformation on gene structure and function. Currently, transcriptomics technology mainly includes microarry -based on hybridization technology and transcriptome sequencing-based on sequencing technology, involving Expression sequence tags technology, Serial analysis of gene expression, Massively para
5、llel signature sequencing and RNA sequencing. The detailed principles, technical characteristics and applications of the main transcriptomics technologies are reviewed here, and the challenges and application potentials of these technologies in the future are also discussed. This will present the us
6、eful information for other researchers. Keywords: transcriptomics ; microarray ; transcriptome sequencing; application隨著后基因組時(shí)代的到來(lái),轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等各種組學(xué)技術(shù)相繼出現(xiàn),其中轉(zhuǎn)錄組學(xué)是率先發(fā)展起來(lái)以及應(yīng)用最廣泛的技術(shù)1。1 轉(zhuǎn)錄組和轉(zhuǎn)錄組學(xué)轉(zhuǎn)錄組概念是最先由V eclalesuc和Kinzler等人于1997年提出2。轉(zhuǎn)錄組(transcriptome廣義上是指某個(gè)組織或細(xì)胞在特定生長(zhǎng)階段或生長(zhǎng)條件所轉(zhuǎn)錄出來(lái)的RNA總和,包括編碼蛋白質(zhì)的mRNA和各種
7、非編碼RNA,如rRNA、tRNA、snoRNA、snRNA、microRNA及其他非編碼RNA等。但狹義上通常僅以mRNA為研究對(duì)象。由轉(zhuǎn)錄組的定義可見(jiàn),其包含了特定的時(shí)間和空間限定,這與基因組的概念不同。因此,同一組織或細(xì)胞在不同生長(zhǎng)條件、生長(zhǎng)階段,其轉(zhuǎn)錄組是不同的。通過(guò)遺傳學(xué)中心法則我們可以知道,遺傳信息的傳遞是以信使RNA(mRNA為“橋梁”,從DNA傳遞到蛋白質(zhì)。由此可見(jiàn),轉(zhuǎn)錄組的研究不僅可以解釋細(xì)胞或組織的基因組的功能元件,揭示分子成分,還可以用來(lái)認(rèn)識(shí)生物學(xué)進(jìn)程和疾病發(fā)生機(jī)制3,4。轉(zhuǎn)錄組學(xué)(transcriptomics是功能基因組學(xué)(Functional Genomics研究的
8、重要組成部分,是一門在整體水平上研究細(xì)胞中所有基因轉(zhuǎn)錄及轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科5,6。隨著人類基因組計(jì)劃HGP( Human Genome Project的完成,科學(xué)家也逐漸認(rèn)識(shí)到對(duì)基因結(jié)構(gòu)序列的研究?jī)H僅是基因組學(xué)研究的一部分,并不能揭示所有的生命奧秘,所以接下來(lái)需要解決的問(wèn)題是:研究這些基因序列的功能、參與的生命過(guò)程、表達(dá)調(diào)控方式,以及這些基因在不同的時(shí)空條件下的表達(dá)差異等。這些問(wèn)題都需要功能基因組學(xué)技術(shù)來(lái)解決,而轉(zhuǎn)錄組學(xué)技術(shù)是功能基因組學(xué)研究的重要組成部分。對(duì)基因及其轉(zhuǎn)錄表達(dá)產(chǎn)物功能研究的功能基因組學(xué),將為疾病控制和新藥開(kāi)發(fā)、作物和畜禽品種的改良提供新思路,為人類解決健康問(wèn)題、食物問(wèn)題、能源問(wèn)
9、題和環(huán)境問(wèn)題提供新方法。2 轉(zhuǎn)錄組學(xué)研究的方法在早期,由于測(cè)序價(jià)格昂貴、基因序列數(shù)目有限,轉(zhuǎn)錄組學(xué)研究者只能進(jìn)行極少數(shù)特定基因的結(jié)構(gòu)功能分析和表達(dá)研究。最近十幾年,分子生物學(xué)技術(shù)的快速發(fā)展使高通量分析成為可能,這為真正意義上的轉(zhuǎn)錄組學(xué)的研究奠定了基礎(chǔ)。這些高通量研究方法主要可以分為兩類:一類是基于雜交的方法,主要是指微陣列技術(shù)(Microarray;一類是基于測(cè)序的方法,這類方法包括表達(dá)序列標(biāo)簽技術(shù)(Expression Sequence Tags Technology,EST、基因表達(dá)系列分析技術(shù)(Serial analysis of gene expression,SAGE、大規(guī)模平行測(cè)序
10、技術(shù)(Massively parallel signature sequencing,MPSS、RNA 測(cè)序技術(shù)(RNA sequencing, RNA-seq。其中,Microarray 和EST 技術(shù)是較早發(fā)展起來(lái)的先驅(qū)技術(shù),SAGE、MPSS 和RNA-seq 是高通量測(cè)序條件下的轉(zhuǎn)錄組學(xué)研究方法轉(zhuǎn)錄組學(xué)研究有助于了解特定生命過(guò)程中相關(guān)基因的整體表達(dá)情況,進(jìn)而從轉(zhuǎn)錄水平初步揭示該生命過(guò)程的代謝網(wǎng)絡(luò)及其調(diào)控機(jī)理。2.1 微陣列技術(shù)(Microarry微陣列技術(shù)是分子生物學(xué)領(lǐng)域具有里程碑式意義的重大突破,它可以同時(shí)測(cè)量不同樣本中成千上萬(wàn)個(gè)基因在不同環(huán)境和不同狀態(tài)下的表達(dá)水平?;虮磉_(dá)數(shù)據(jù)是基
11、于DNA 微陣列技術(shù)而產(chǎn)生的反映基因轉(zhuǎn)錄產(chǎn)物mRNA 豐度值的一組數(shù)據(jù)。數(shù)據(jù)中蘊(yùn)含著豐富的基因活動(dòng)信息,通過(guò)對(duì)這些數(shù)據(jù)中所隱含的基因活動(dòng)信息進(jìn)行分析,就可以解答一些生物學(xué)領(lǐng)域的問(wèn)題。如基因的表達(dá)在不同環(huán)境中有哪些差異,基因的表達(dá)在特定條件下有哪些變化,基因之間有哪些相關(guān)性,以及在不同條件下基因的活動(dòng)受到哪些影響等等7。DNA微陣列基本制作原理為大規(guī)模集成電路所控制的機(jī)器人在尼龍膜或硅片固相支持物表面,有規(guī)律地合成成千上萬(wàn)個(gè)代表不同基因的寡核苷酸“探針”,或液相合成探針后由陣列器(arrayer或機(jī)器人點(diǎn)樣于固相支持物表面。這些“探針”可與用放射標(biāo)記物32P或熒光物如熒光素、麗絲胺等標(biāo)記的目的材
12、中的DNA或cDNA互補(bǔ)核酸序列相結(jié)合,通過(guò)放射自顯影或激光共聚焦顯微鏡掃描后,對(duì)雜交結(jié)果進(jìn)行計(jì)算機(jī)軟件處理分析,獲得雜交信號(hào)的強(qiáng)度及分布模式圖,以此反映目的材料中有關(guān)基因表達(dá)強(qiáng)弱的表達(dá)譜。該技術(shù)仍以基因連鎖、連鎖不平衡、限制性長(zhǎng)度多態(tài)性、可變串聯(lián)重復(fù)序列及單核苷酸多態(tài)性標(biāo)記等基因定位方法為基礎(chǔ),采用分子雜交等多種技術(shù)方法為手段,進(jìn)行遺傳作圖,對(duì)不同材料中的多個(gè)基因表達(dá)模式進(jìn)行平行對(duì)比分析,是一種高產(chǎn)出的、新的基因分析方法。以尼龍膜為固相支持物的DNA微陣列和以硅片為固相支持物的DNA芯片,二者在原理上相同,僅在支持物及檢測(cè)手段等方面略有不同。在微陣列里最大的一類DNA microarray根
13、據(jù)探針?lè)肿拥臉?gòu)成又可以分為cDNA微陣列和寡核苷酸微陣列。(1cDNA微陣列cDNA微陣列是指對(duì)各種生物隨機(jī)克隆和隨機(jī)測(cè)序所得的cDNA片段進(jìn)行歸類,并把每一類cDNA 片段的代表克隆(代表一個(gè)獨(dú)立基因經(jīng)過(guò)體外擴(kuò)增,得到大小和序列不同的片段分別經(jīng)過(guò)純化后,利用機(jī)械手高速將它們高密度有序地點(diǎn)樣固定在玻片硅晶片或尼龍膜上,從而制備成cDNA微陣列,以此對(duì)各基因的表達(dá)情況進(jìn)行同步分析。它的特點(diǎn)是造價(jià)低、適用面廣、研制周期短、靈活性高。而缺點(diǎn)是點(diǎn)陣密度相對(duì)比較低。同時(shí),cDNA微陣列由于基因長(zhǎng)短不一,導(dǎo)致溶解溫度Tm各異,眾多的基因在同一張芯片上雜交,使得雜交條件很難同一,這樣也使得其分辨能力受到限制
14、。(2寡核苷酸微陣列寡核苷酸微陣列的主要原理與cDNA微陣列類似,主要是通過(guò)堿基互補(bǔ)配對(duì)原則進(jìn)行雜交,來(lái)檢測(cè)對(duì)應(yīng)片斷是否存在、存在量的多少。它與cDNA芯片的本質(zhì)差別在于寡核苷酸的探針片斷相對(duì)較短(一般是20-70nt的寡聚核苷酸序列。寡聚核苷酸微陣列的探針經(jīng)過(guò)優(yōu)化,長(zhǎng)度基本一致,并且Tm也相差不大,所以相比較cDNA微陣列它具有以下優(yōu)點(diǎn):1.無(wú)需擴(kuò)增,防止擴(kuò)增失敗影響實(shí)驗(yàn);2.減少非特異性雜交,能夠有效的區(qū)分同源序列的基因;3.雜交溫度均一,提高了雜交效率;4.減少了微陣列片上探針的二級(jí)結(jié)構(gòu)。上述特點(diǎn)使得寡核苷酸微陣列的應(yīng)用日益廣泛。但是當(dāng)寡核苷酸序列較短時(shí),單一的序列不足以代表整個(gè)基因,所
15、以又需要用多段序列,從而提高了制作成本。(1表達(dá)差異的研究1995年Schena等用了48個(gè)PCR擴(kuò)增的cDNA探針點(diǎn)制的微陣列片分析了野生型和轉(zhuǎn)基因的擬南芥中基因表達(dá)差異,并與Northern blot作了比較。發(fā)現(xiàn)Microarray能夠很好的檢測(cè)到基因表達(dá)水平上的差異,并且能夠在同一張玻片上使用不同的熒光染料同步進(jìn)行差異比較。近年來(lái),研究多集中于突變型與野生型、環(huán)境脅迫與正常生長(zhǎng)型、激素處理與未處理或者不同組織器官之間的比較。Ma等8利用寡核苷酸微陣列研究了玉米3個(gè)雄性不育突變體和可育植株花藥4個(gè)發(fā)育階段的基因表達(dá)情況,檢測(cè)到了近9200個(gè)正反義轉(zhuǎn)錄本。通過(guò)比較每個(gè)突變體與其可育花藥的基
16、因表達(dá)差異,篩選到了一大批可能與花藥分化相關(guān)的重要轉(zhuǎn)錄因子和調(diào)控因子。Schena等9用人外周血淋巴細(xì)胞的cDNA文庫(kù)構(gòu)建一個(gè)代表1 046個(gè)基因的cDNA微陣列,來(lái)檢測(cè)體外培養(yǎng)的T細(xì)胞對(duì)熱休克反應(yīng)后不同基因表達(dá)的差異。發(fā)現(xiàn)有5個(gè)基因在處理后存在非常明顯的高表達(dá),11個(gè)基因中度表達(dá)增加和6個(gè)基因表達(dá)明顯抑制。(2尋找可能致病基因或疾病相關(guān)基因Moch等利用腫瘤微陣列芯片(5184個(gè)cDNA片段發(fā)現(xiàn)了腎細(xì)胞癌的腫瘤標(biāo)志物基因,并與正常細(xì)胞進(jìn)行比較。在532份標(biāo)本中檢測(cè)到與胞漿纖維表達(dá)有關(guān)的一類基因陽(yáng)性率為51%-61%,命名為vimentin。追蹤觀察,有Vimentin表達(dá)的患者,預(yù)后極差。M
17、och等利用腫瘤微陣列芯片(5184個(gè)cDNA 片段發(fā)現(xiàn)了腎細(xì)胞癌的腫瘤標(biāo)志物基因,并與正常細(xì)胞進(jìn)行比較。在532份標(biāo)本中檢測(cè)到與胞漿纖維表達(dá)有關(guān)的一類基因陽(yáng)性率為51%-61%,命名為vimentin。(3基因點(diǎn)突變及多態(tài)性檢測(cè)現(xiàn)用于治療AIDS的藥物主要是病毒逆轉(zhuǎn)錄酶RT和蛋白酶PRO的抑制劑,但在用藥312月后常出現(xiàn)耐藥,其原因是rt、pro基因產(chǎn)生一個(gè)或多個(gè)點(diǎn)突變,rt基因四個(gè)常見(jiàn)突變位點(diǎn)是Asp67Asn、Lys70Arg、Thr215Phe/Tyr和Lys219Gln,四個(gè)位點(diǎn)均突變較單一位點(diǎn)突變后對(duì)藥物的耐受能力成百倍增加10。如將這些基因突變部位的全部序列構(gòu)建為DNA芯片,則可
18、快速地檢測(cè)待測(cè)病人是一個(gè)還是多個(gè)基因突變,這對(duì)指導(dǎo)治療和預(yù)后而具有十分重要的意義。Lee等11用含有135 000個(gè)探針的DNA微陣列分析了人線粒體基因組DNA多態(tài)性變化。該組探針互補(bǔ)于人線粒體基因組全長(zhǎng)16.6 kb,將之與不同個(gè)體來(lái)源的基因組DNA雜交,發(fā)現(xiàn)人線粒體基因組存在16 493位TC突變,16 223位CT等多位點(diǎn)突變的DNA多態(tài)性特征。DNA微陣列或芯片幾乎可用于所有核酸雜交技術(shù)的各個(gè)方面,而在同時(shí)比較各組織或同一組織在不同狀態(tài)下上成千上萬(wàn)個(gè)基因的表達(dá)狀況、DNA序列分析等方面具有更大的優(yōu)越性12. 有人譽(yù)贊“微陣列技術(shù)鋪平了通往21世紀(jì)的醫(yī)學(xué)之路”13,相信在不久的將來(lái), D
19、NA芯片或微陣列技術(shù)將會(huì)廣泛應(yīng)用于基礎(chǔ)及臨床醫(yī)學(xué)各個(gè)方面,而發(fā)揮出巨大的經(jīng)濟(jì)、社會(huì)效益。隨著微陣列技術(shù)的廣泛應(yīng)用,其內(nèi)在缺陷也日益暴露出來(lái),成為其發(fā)展的瓶頸。第一,技術(shù)水平還需要不斷提高。非特異性雜交是微陣列技術(shù)的亟待解決的問(wèn)題,目前,對(duì)于這個(gè)問(wèn)題,在實(shí)驗(yàn)中一般采用提高雜交溫度的方法,減少非特異性序列間的相互影響。然而在提高雜交溫度的同時(shí),又很可能造成微陣列靈敏性的降低,使一些應(yīng)該能夠檢測(cè)到的基因表達(dá)狀況得不到準(zhǔn)確的反映,研究者只能在其中尋找平衡;第二,不同時(shí)間不同地點(diǎn)不同平臺(tái)的微陣列結(jié)果難于比較。操作者本身造成的實(shí)驗(yàn)誤差不可避免,還有樣品DNA在取樣上的誤差,此外,由于實(shí)驗(yàn)儀器和操作平臺(tái)的差
20、別,包括不同實(shí)驗(yàn)地點(diǎn)的差別,也導(dǎo)致了相同樣本檢測(cè)到的表達(dá)基因相差很大14;第三,數(shù)據(jù)處理難度大。由于微陣列往往集成了成千上萬(wàn)個(gè)基因信息,而且微陣列信號(hào)中往往摻雜了大量的背景噪音,最終大量的微陣列數(shù)據(jù),如何與生物體內(nèi)在的因素相結(jié)合,所以,微陣列技術(shù)中最大的挑戰(zhàn)來(lái)源于數(shù)據(jù)的處理和數(shù)據(jù)的挖掘。2.2 表達(dá)序列標(biāo)簽技術(shù)(EST基因表達(dá)序列標(biāo)簽(expressed Sequence tags,ESTs為長(zhǎng)約200-800bp的cDNA部分序列。最早利用EST 技術(shù)是1991年Adms用人腦組織cDNA得到的EST進(jìn)行的,當(dāng)時(shí)人類基因組計(jì)劃剛剛開(kāi)始,一些科學(xué)家就主張cDNA測(cè)序應(yīng)該先于基因組測(cè)序進(jìn)行,原因
21、是基因組的編碼區(qū)代表了基因組絕大部分信息,而且是對(duì)我們直接有用的,而編碼區(qū)長(zhǎng)度只有總基因組長(zhǎng)度的3%因此可以用最低的代價(jià)、最短的時(shí)間獲取最多最有用的信息。有了EST的方法之后,人們可以用比cDNA測(cè)序更低的費(fèi)用而得到等量的信息,因此EST技術(shù)已成為目前發(fā)現(xiàn)新基因的強(qiáng)有力的信息工具。一個(gè)典型的真核生物mRNA分子由5-U TR (5 端轉(zhuǎn)錄非翻譯區(qū)、ORF (開(kāi)放閱讀框架、3-U TR (3 端轉(zhuǎn)錄非翻譯區(qū)和poly (A 四部分組成,其cDNA具有對(duì)應(yīng)的結(jié)構(gòu)。對(duì)于任何一個(gè)基因,其5-UTR 和3-U TR都是特定的,即每條cDNA的5端或3端的有限序列可特異性地代表生物體某種組織在特定的時(shí)空條
22、件下的一個(gè)表達(dá)基因。來(lái)自某一組織的足夠數(shù)量的ESTs可代表某種組織中基因的表達(dá)情況 1 。EST 的數(shù)目可以反映某個(gè)基因的表達(dá)情況,一個(gè)基因的拷貝數(shù)越多,其表達(dá)越豐富,測(cè)得的相應(yīng)EST 就越多。所以,通過(guò)對(duì)生物體EST的分析可以獲得生物體內(nèi)基因的表達(dá)情況和表達(dá)豐度。要獲得生物體EST 信息,通常應(yīng)先構(gòu)建其某個(gè)代表性組織的cDNA文庫(kù),然后從中隨機(jī)挑取大量克隆,根據(jù)載體的通用引物進(jìn)行測(cè)序,一般可以得到其5或3端的200-500 bp的堿基序列,然后將測(cè)得的EST序列與網(wǎng)上已有的EST數(shù)據(jù)庫(kù)進(jìn)行比較,根據(jù)同源性大小,可以初步鑒定出哪些EST 代表已知基因,哪些EST代表未知基因,并可以對(duì)生物體基因
23、的表達(dá)豐度進(jìn)行分析。以EST 分析基因表達(dá)豐度的原理是這樣的:基因x的高水平表達(dá)將導(dǎo)致高水平的mRNAx合成,而與mRNA x相對(duì)應(yīng)的cDNA在cDNA文庫(kù)中的含量也會(huì)很豐富。所以,在對(duì)cDNA 文庫(kù)中的大量克隆進(jìn)行隨機(jī)測(cè)序后,統(tǒng)計(jì)與基因x的mRNA相對(duì)應(yīng)的EST數(shù)目,就可估計(jì)原先mRNA群體中的mRNA x的豐度。而且,以與mRNA x相對(duì)應(yīng)的EST 數(shù)目除以所得到的EST 總數(shù),就可得到mRNA x 絕對(duì)豐度的估計(jì)值。White等人稱這種以cDNA 測(cè)序來(lái)估計(jì)基因表達(dá)水平的方法為“電子Northern”(electronic Northern 或“數(shù)字Northern”(digital N
24、orthern。EST構(gòu)建的技術(shù)路線為:提取樣品的總RNA 或帶有polyA的mRNA 構(gòu)建cDNA文庫(kù),隨機(jī)挑取大量克隆進(jìn)行EST測(cè)序?qū)y(cè)得的EST序列進(jìn)行組裝、拼接對(duì)網(wǎng)上己有的EST數(shù)據(jù)庫(kù)進(jìn)行同源性比較確定EST代表的是己知基因還是未知基因?qū)蜻M(jìn)行定位、結(jié)構(gòu)、功能檢測(cè)分析。(1基因組物理圖譜的繪制通過(guò)已知的EST序列設(shè)計(jì)引物對(duì)基因組BAC文庫(kù)進(jìn)行PCR能產(chǎn)生擴(kuò)增條帶的那個(gè)克隆就是EST在染色體上的位置,這個(gè)EST就可以被定位在幾號(hào)染色體上,進(jìn)而亞定位至染色體的某個(gè)區(qū)段。另外也可以用EST序列提供的探針與基因組BAC文庫(kù)雜交,同樣能將某個(gè)已知EST在染色體上定位和亞定位。EST 與STS(
25、特定序列位點(diǎn)在基因組作圖上有相同的作用,而且EST位點(diǎn)還直接與一個(gè)表達(dá)的基因位置相對(duì)應(yīng)。(2基因的電子克隆電子克隆技術(shù)是以算法為核心,以計(jì)算機(jī)和互聯(lián)網(wǎng)為工具,利用現(xiàn)有的表達(dá)序列標(biāo)簽(EST 和生物信息數(shù)據(jù)庫(kù),對(duì)其中大量EST進(jìn)行分類、整合、組裝,直接獲得大片段或cDNA 全長(zhǎng)的方法。由于EST 序列是全世界很多實(shí)驗(yàn)室隨機(jī)產(chǎn)生的,所以屬于同起來(lái), 通過(guò)EST assembly 程序在EST 庫(kù)中搜索與之高度重疊的EST ,并將它們組裝成一致序列(consensus sequence ,再用它檢索數(shù)據(jù)庫(kù)并逐次放寬匹配條件,重復(fù)組裝以獲得盡可能長(zhǎng)的或全長(zhǎng)cDNA 序列。電子克隆技術(shù)的出現(xiàn),可充分利用
26、現(xiàn)有的信息資源,別是利用其它模式生物的EST信息,快速發(fā)現(xiàn)有用基因。但該技術(shù)也有局限,如果參數(shù)限制條件太低,很可能會(huì)得到錯(cuò)誤結(jié)果;而參數(shù)條件限制太高,就可能沒(méi)有結(jié)果。對(duì)于所拼接出來(lái)的基因還需要從生物學(xué)意義上進(jìn)行分離和鑒定。(3分離鑒定新基因?qū)δ骋惶禺惤M織或某一生長(zhǎng)發(fā)育階段的cDNA文庫(kù)進(jìn)行隨機(jī)的部分測(cè)序,得到大量EST,將這些EST 作查詢項(xiàng)在dbEST中進(jìn)行同源查找,同時(shí)將由EST推出的氨基酸序列作為查詢項(xiàng)在PIR中查找類似物,很就可以識(shí)別這些基因到底是什么基因;對(duì)于那些在以上數(shù)據(jù)庫(kù)中沒(méi)有找到類似物的EST,再把它們置于6個(gè)ORF下,翻譯出推定的氨基酸序列,將可能的氨基酸序列作為查詢項(xiàng),在P
27、IR數(shù)據(jù)庫(kù)中查找類似物,果有類似物,就認(rèn)為這個(gè)EST代表著這個(gè)蛋白的基因。對(duì)于通過(guò)EST數(shù)據(jù)庫(kù)和PIR數(shù)據(jù)庫(kù)已識(shí)別的EST,還可以通過(guò)探針雜交從cDNA文庫(kù)中分離我們所感興趣的那個(gè)全長(zhǎng)cDNA克隆。對(duì)于那些在dbEST和PIR 數(shù)據(jù)庫(kù)中都沒(méi)有類似物的EST,就可能是完全新的基因,需要進(jìn)一步識(shí)別和研究它。(4 通過(guò)EST尋找SSR和SNP分子標(biāo)記從EST數(shù)據(jù)庫(kù)中篩選SSR和SNP的主要優(yōu)點(diǎn)在于,這樣篩選出來(lái)的SSR和SNP分子標(biāo)記直接與基因的編碼區(qū)相對(duì)應(yīng),即得到的往往是基因相關(guān)標(biāo)記(gene-associated markers;另外,從EST中篩選SSR和SNP 比從基因組中篩選費(fèi)用要小得多。
28、篩選的大致步驟為:EST重疊群的組裝;通過(guò)對(duì)大量重復(fù)的EST進(jìn)行序列比較,識(shí)別出候選SSR或SNP;對(duì)候選SSR或SNP進(jìn)行確認(rèn)??傊?通過(guò)對(duì)大量EST數(shù)據(jù)的歸納整理是尋找SSR和SNP以構(gòu)建高密度遺傳圖譜的最經(jīng)濟(jì)的方法。除了以上用途外,EST還在基因結(jié)構(gòu)分析(內(nèi)含子、外顯子識(shí)別、基因表達(dá)及重組蛋白表達(dá)的分析中具有重要作用。(5RNAi技術(shù)的研究結(jié)合GA TEW AY技術(shù)和基因轉(zhuǎn)化技術(shù)用于突變體庫(kù)建立的RNAi技術(shù),開(kāi)發(fā)出了pHellsgate 系列載體,將該技術(shù)與cDNA文庫(kù)構(gòu)建技術(shù)和大規(guī)模EST測(cè)序技術(shù)相結(jié)合,使得大規(guī)?;虻那贸蔀榱丝赡?。RNAi 指外源性雙鏈RNA (dsRNA 能抑
29、制細(xì)胞內(nèi)與其序列同源的基因的表達(dá)。在進(jìn)化上,這可能是生物調(diào)控基因表達(dá)及抵御病毒侵染或轉(zhuǎn)座子誘導(dǎo)DNA突變的一種共生有的生理機(jī)制。該技術(shù)最大的優(yōu)點(diǎn)就是可以獲得大規(guī)模的缺失突變體,為基因功能的研究提供了很好的研究工具,同時(shí)EST作為序列標(biāo)簽,可以很好地實(shí)現(xiàn)表型相關(guān)的基因克隆。EST技術(shù)己成為一種強(qiáng)有力的工具,幫助人們揭示基因組所包含的信息,使基因組研究進(jìn)入一個(gè)新的階段。隨著“后基因組”時(shí)代的到來(lái),生物信息學(xué)在基因功能研究中發(fā)揮著越來(lái)越重要的作用。而EST數(shù)據(jù)處理和分析是生物信息學(xué)分析的核心任務(wù)之一,它為新基因的克隆和功能分析提供了新的出發(fā)點(diǎn)。EST數(shù)據(jù)庫(kù)為新基因的發(fā)現(xiàn)和基因表達(dá)研究提供了大量的信息
30、和分析材料,也為DNA分子標(biāo)記的開(kāi)發(fā)奠定了基礎(chǔ)。但是,目前EST研究還存在許多問(wèn)題。第一,大量EST序列信息整理的問(wèn)題。隨著EST數(shù)據(jù)的不斷增加,利用生物信息學(xué)方法建立高通量、自動(dòng)化的EST數(shù)據(jù)分析平臺(tái),己成為EST研究急需解決的問(wèn)題之一;第二,EST文庫(kù)中基因表達(dá)豐度的問(wèn)題。植物基因組極其龐大,某一特定組織在特定時(shí)期的基因表達(dá)頻率各不相同。在獲取有用的、新的EST方面效率較低,人力物力浪費(fèi)嚴(yán)重;第三,就世界范圍來(lái)講,如何避免不同研究機(jī)構(gòu)對(duì)同一物種進(jìn)行重復(fù)測(cè)序,協(xié)調(diào)好科學(xué)家之間的分工,加快植物EST 計(jì)劃的進(jìn)程,也是一個(gè)需要解決的問(wèn)題。2.3新一代高通量測(cè)序技術(shù)(1基因表達(dá)系列分析技術(shù)(SAG
31、ESAGE技術(shù)是由Velculescu 等人15在1995 提出,是一種可以定量并同時(shí)分析大量轉(zhuǎn)錄本的方法。1998年,Powell16利用生物素標(biāo)記的PCR引物合成生物素標(biāo)記的接頭,并利用鏈霉抗生物素蛋白磁珠綁定接頭,這就有效地去除了一些多余的接頭,從而提高了SAGE技術(shù)分析的效率。SAGE 技術(shù)大致理論依據(jù)有兩點(diǎn):第一,來(lái)自cDNA特定位置的一段9-13bp 的序列能夠包含有足夠的信息作為確認(rèn)唯一一種轉(zhuǎn)錄物的SAGE標(biāo)簽(9個(gè)堿基能夠分辨49個(gè)不同轉(zhuǎn)錄物;第二,將來(lái)自不同cDNA 的SAGE 標(biāo)簽集于同一個(gè)克隆中進(jìn)行測(cè)序,就可以獲得連續(xù)的短序列SAGE標(biāo)簽,而這些SAGE標(biāo)簽可以顯示對(duì)應(yīng)的
32、基因的表達(dá)情況。SAGE 技術(shù)的主要技術(shù)路線:1將提取的總RNA,通過(guò)生物素標(biāo)記的oligo(dT引物合成cDNA,用錨定酶(一般為4 堿基的限制性內(nèi)切酶酶切,利用鏈霉抗生物素蛋白磁珠收集酶切后cDNA片段的3部分。2將收集的cDNA 片段分為兩等份,分別加上含有標(biāo)簽酶(一種類限制酶,在距離識(shí)別位點(diǎn)大概20 堿基處酶切DNA 雙鏈識(shí)別位點(diǎn)的接頭A 和B。3將連有接頭A 或B 的cDNA 短片段分別用標(biāo)簽酶酶切,再將兩份樣品混合,以連接形成雙標(biāo)簽,這樣就可以用與接頭A、B 互補(bǔ)的引物擴(kuò)增。4用錨定酶酶切PCR 富集的產(chǎn)物,得到雙標(biāo)簽片段,將10-50個(gè)標(biāo)簽序列置于一個(gè)克隆中進(jìn)行測(cè)序。5對(duì)得到的標(biāo)
33、簽數(shù)據(jù)進(jìn)行處理。為了適應(yīng)不同的試驗(yàn)需要,目前出現(xiàn)了許多新型SAGE 技術(shù),如superSAGE、robust longSAGE、PCR-SAGE、SAR-SAGE等17。雖然SAGE 技術(shù)可以快速、大量分析細(xì)胞或組織的基因表達(dá)狀態(tài),但不能完全保證檢測(cè)到一些低豐度的mRNA,因而限制該技術(shù)的應(yīng)用。(2大規(guī)模平行測(cè)序技術(shù)(MPSSMPSS 技術(shù)是由Brenner 等18在2000 年建立的以測(cè)序?yàn)榛A(chǔ)的大規(guī)模高通的基因分析技術(shù)。其方法的理論基礎(chǔ)19是:一個(gè)標(biāo)簽序列(一般10-20bp含有其對(duì)應(yīng)cDNA 的足夠識(shí)別信息,將標(biāo)簽序列與某種長(zhǎng)的連續(xù)分子連接在一起,可以便于克隆和測(cè)序分析,而每個(gè)標(biāo)簽序列的
34、出現(xiàn)頻率又能夠代表其相應(yīng)基因的表達(dá)量。MPSS 技術(shù)的方法包括兩個(gè)基本過(guò)程:第一,cDNA 片段、標(biāo)簽和微球體的結(jié)合;第二,測(cè)序反應(yīng)。具體步驟為:1利用生物素標(biāo)記的oligo(dT引物將mRNA 反轉(zhuǎn)錄成cDNA 雙鏈,再將合成的生物素標(biāo)記的cDNA 片段用Dpn 限制性內(nèi)切酶(酶切位點(diǎn)是GATC消化。2將消化并純化后的片段克隆到含有32bp TAG 序列的標(biāo)簽(tag載體中,這樣就可以通過(guò)與標(biāo)簽中序列互補(bǔ)的引物擴(kuò)增插入的片段,再通過(guò)酶切,獲得線性化的PCR 擴(kuò)增產(chǎn)物(含有cDNA 序列和特異性的32bp 標(biāo)簽序列。3每個(gè)微球體含有一種與32bp 標(biāo)簽序列互補(bǔ)的序列(anti-tag,PCR
35、擴(kuò)增產(chǎn)物片段通過(guò)32bp 標(biāo)簽與anti-tag 雜交,進(jìn)而連接到微球體上,每個(gè)微球體大概可以承載104-105個(gè)相同的cDNA 拷貝,將微球體排列在一個(gè)表面上。4測(cè)序反應(yīng)過(guò)程,將接頭、Bbv酶(S 型限制性酶,可以酶切距離識(shí)別位點(diǎn)9-13個(gè)堿基識(shí)別位點(diǎn)和識(shí)別序列(recognition sequence結(jié)合在微球體上的cDNA 片段上末端的4個(gè)游離堿基,加入16 種不同的熒光標(biāo)記的解碼器探針與接頭雜交,獲得相應(yīng)的熒光信號(hào),以讀取這4個(gè)堿基的序列,經(jīng)Bbv酶消化后,在cDNA 片段上再次產(chǎn)生4個(gè)堿基末端,去掉酶切序列后可以進(jìn)行下一輪的分析,這樣經(jīng)過(guò)5次反應(yīng)就可以測(cè)出每一個(gè)微球體上長(zhǎng)度為17bp
36、 的cDNA序列。該技術(shù)的特點(diǎn)是可以分析未知序列的基因、基因組覆蓋度高、能測(cè)得低表達(dá)豐度的基因、實(shí)驗(yàn)效率高,但要選擇合適的標(biāo)簽序列,如果出現(xiàn)基因和標(biāo)簽之間的非特異性,將容易產(chǎn)生分析錯(cuò)誤。(3RNA 測(cè)序技術(shù)(RNA-seq該技術(shù)首先將細(xì)胞中的所有轉(zhuǎn)錄產(chǎn)物反轉(zhuǎn)錄為cDNA文庫(kù)(利用最新的SMS技術(shù)可略去這一步,直接對(duì)RNA進(jìn)行測(cè)序20,然后將cDNA文庫(kù)中的DNA隨機(jī)剪切為小片段(或先將RNA片段化后再轉(zhuǎn)錄,在cDNA 兩端加上接頭利用新一代高通量測(cè)序儀測(cè)序,直到獲得足夠的序列,所得序列通過(guò)比對(duì)(有參考基因組或從頭組裝(denovoas-sembling,無(wú)參考基因組形成全基因組范圍的轉(zhuǎn)錄譜。(
37、1SAGE技術(shù)能夠同時(shí)檢測(cè)到大量的基因轉(zhuǎn)錄本,一個(gè)測(cè)序反應(yīng)可得到40個(gè)左右標(biāo)簽序列。同時(shí),由于SAGE技術(shù)的靈敏度很高,可以檢測(cè)出低豐度表達(dá)的基因,所以通過(guò)該技術(shù)不僅能夠很全面的獲得基因表達(dá)的數(shù)目、表達(dá)豐度等信息。因此,SAGE技術(shù)是一種預(yù)測(cè)基因數(shù)目和發(fā)現(xiàn)新基因的有效途徑。SAGE還可用于在不同生理狀態(tài)、不同環(huán)境、或不同生長(zhǎng)階段的細(xì)胞或組織的基因表達(dá)圖譜構(gòu)建,對(duì)不同狀態(tài)下基因表達(dá)水平的定量或定性比較。目前,通過(guò)SAGE技術(shù)對(duì)疾病組織與正常組織的基因表達(dá)差異的進(jìn)行比較應(yīng)用較多,而且己發(fā)現(xiàn)了許多在癌癥組織中上調(diào)表達(dá)的基因。這些上調(diào)基因,尤其那些是在正常組織中不表達(dá)或少量表達(dá)的基因,很可能成為有用的
38、腫瘤診斷和預(yù)測(cè)指標(biāo)或潛在的治療位點(diǎn)。(2MPSS一方面可提供某一cDNA在體內(nèi)特定發(fā)育階段的拷貝數(shù),另一方面還可測(cè)定出相應(yīng)cDNA 17 bp的序列,所以這就為在轉(zhuǎn)錄水平上進(jìn)行基因表達(dá)分析提供了強(qiáng)有力的定性和定量手段,很明顯,這一技術(shù)首先可以應(yīng)用于不同豐度基因的差異表達(dá)分析,制作基因轉(zhuǎn)錄圖譜,這無(wú)疑將加速新基因克隆和基因功能的分析。MPSS所獲得的基因序列可提供PCR引物,可通過(guò)比較Gen Bank EST 數(shù)據(jù)庫(kù)等進(jìn)行Pre-meiotic and tapetal cell types. Plant J, 2007, 50:637一648. 9 Schena M, Shalon D, Hel
39、ler R, et al. Parallel human genome analysis: microarray-based expression monitoring of 1000 genes.Proc Natl Acad Sci USA, 1996,93(20: 1061410619. 10 Lipshutz D, Morris D, Chee M,et al. Using oligonucleotide probe arrays to access genetic diversity. BioTechniques, 1995, 19(3: 442447 11 Lee M, Yang R
40、, Hubbell E,et al. Accessing genetics information with high-density DNA arrays. Science, 1996,274: 610613 12 Ramsay G. DNA chips: state-of-the art. Nature Biotechnology,1998,16: 4044. 13 Nelson N. Microarrays pave the way to 21stcenetury medicine. Journal of the National Cancer Institute, 1996,88(22
41、: 18031805. 14 Tan PK, Downey TJ, Spitznagel EL et al. Evaluation of gene expression measurements from commercial microarray platforms. ucleic Acids Res. 2003 Oct 1;31(19:5676-84. 15 Velculescu V E, Zhang L, Vogelstein B, et al. Serial analysis of gene expression J. Science, 1995, 270 (5235:484-487.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 硬化公路勞務(wù)合同協(xié)議
- 工礦企業(yè)銷售合同協(xié)議
- 江西省贛州市定南縣重點(diǎn)名校2025屆初三4月仿真模擬(六)生物試題試卷含解析
- 小金縣2024-2025學(xué)年小升初模擬數(shù)學(xué)測(cè)試卷含解析
- 貼膜客服培訓(xùn)課件
- 江蘇省啟東市呂四中學(xué)2025屆高三下學(xué)期大聯(lián)考卷Ⅰ英語(yǔ)試題試卷含解析
- 慢性心衰患者的麻醉管理
- 2025年初中數(shù)學(xué)聯(lián)考試題及答案
- 陜西省咸陽(yáng)市2025屆高三下學(xué)期高考模擬檢測(cè)(三)地理試題(含答案)
- 夢(mèng)想課件制作教程
- 珠寶行業(yè)中的區(qū)塊鏈技術(shù)
- 大數(shù)據(jù)時(shí)代下傳統(tǒng)會(huì)計(jì)受到的沖擊與應(yīng)對(duì)措施
- 斷親協(xié)議書(shū)模板
- TD/T 1061-2021 自然資源價(jià)格評(píng)估通則(正式版)
- 級(jí)進(jìn)模具畢業(yè)設(shè)計(jì)說(shuō)明書(shū)
- MOOC 知識(shí)創(chuàng)新與學(xué)術(shù)規(guī)范-南京大學(xué) 中國(guó)大學(xué)慕課答案
- 兒童呼吸機(jī)基本使用
- 手術(shù)替代治療方案
- 建筑工程項(xiàng)目管理績(jī)效評(píng)價(jià)指標(biāo)體系
- T-CNPPA 3025-2023 藥包材質(zhì)量協(xié)議管理指南
- 家庭教育講座活動(dòng)流程
評(píng)論
0/150
提交評(píng)論