EST技術(shù)及其在基因全長cDNA克隆上的應(yīng)用策略_第1頁
EST技術(shù)及其在基因全長cDNA克隆上的應(yīng)用策略_第2頁
EST技術(shù)及其在基因全長cDNA克隆上的應(yīng)用策略_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

二軍醫(yī)大學(xué)細胞生物學(xué)教研室;上海200433何志穎;姚玉成(綜述);胡以平(審校)關(guān)鍵詞:est技術(shù);“電子”基因克??;生物信息學(xué);基因摘要:隨著人類基因組計劃的順利進行,est技術(shù)被廣泛應(yīng)用于基因識別、繪制基因表達圖譜、尋找新基因等研究領(lǐng)域。利用人類基因組研究不斷產(chǎn)生的數(shù)據(jù),從ESTs即cDNA的部分序列入手,通過同源篩選,獲得基因部分乃至全長cDNA序列,避免或減輕了構(gòu)建與篩選cDNA文庫等繁鎖實驗室工作。本文從原理、應(yīng)用及其在科學(xué)研究上產(chǎn)生的影響等方面對est技術(shù)進行了概述。表達序列標(biāo)簽(expressedsequencetags,ESTs)是指從不同組織來源的cDNA序列。這一概念首次由Adams等于1991年提出。近年來由此形成的技術(shù)路線被廣泛應(yīng)用于基因識別、繪制基因表達圖譜、尋找新基因等研究領(lǐng)域,并且取得了顯著成效。在通過mRNA差異顯示、代表性差異分析等方法獲得未知基因的cDNA部分序列后,研究者都迫切希望克隆到其全長cDNA序列,以便對該基因的功能進行研究。克隆全長cDNA序列的傳統(tǒng)途徑是采用噬斑原位雜交的方法篩選cDNA文庫,或采用PCR的方法,這些方法由于工作量大、耗時、耗材等缺點已滿足不了人類基因組時代迅猛發(fā)展的要求。而隨著人類基因組計劃的開展,在基因結(jié)構(gòu)、定位、表達和功能研究等方面都積累了大量的數(shù)據(jù),如何充分利用這些已有的數(shù)據(jù)資源,加速人類基因克隆研究,同時避免重復(fù)工作,節(jié)省開支,已成為一個急迫而富有挑戰(zhàn)性的課題擺在我們面前,采用生物信息學(xué)方法延伸表達序列標(biāo)簽(ESTs)序列,獲得基因部分乃至全長cDNAycg,將為基因克隆和表達分析提供空前的動力,并為生物信息學(xué)功能的充分發(fā)揮提供廣闊的空間。文本將就EST技術(shù)的應(yīng)用并就其在基因全長cDNA克隆上的應(yīng)用作一較為詳細的介紹。1、ESTs與基因識別EST技術(shù)最常見的用途是基因識別,傳統(tǒng)的全基因組測序并不是發(fā)現(xiàn)基因最有效率的方法,這一方法顯得即昂貴又費時。因為基因組中只有2%的序列編碼蛋白質(zhì),因此一部分科學(xué)家支持首先對基因的轉(zhuǎn)錄產(chǎn)物進行大規(guī)模測序,即從真正編碼蛋白質(zhì)的mRNA出發(fā),構(gòu)建各種cDNA文庫,并對庫中的克隆進行大規(guī)模測序。Adams等提出的表達序列標(biāo)簽的概念標(biāo)志著大規(guī)模cDNA測序時代的到來。雖然ESTs序列數(shù)據(jù)對不精確,精確度最高為97%,但實踐證明EST技術(shù)可大大加速新基因的發(fā)現(xiàn)與研究。Medzhitov等通過果蠅黑胃TOLL蛋白進行dbEST數(shù)據(jù)庫檢索,該蛋白已證實在成熟果蠅抗真菌反應(yīng)中發(fā)揮重要作用,通過同源分析的方法,找到相應(yīng)的人類同源EST(登錄號為H48602),這為接下來研究人類TOLL同源蛋白的功能提供了很好的條件。hMSH5基因是從釀酒酵母菌MSH5存在30%的一致性,它與hMSH4特異性相互作用,在減數(shù)分裂和精子發(fā)生過程中發(fā)揮一定的作用。由此可見,應(yīng)用EST技術(shù),可以跳過生物分類學(xué)的界限,從生物模型的已識別基因迅速克隆出人和小鼠基因組相應(yīng)的更復(fù)雜的未知基因。生物間在核苷酸水平上的進貨差異阻礙了傳統(tǒng)意義上的雜交或以PCR為基礎(chǔ)的基因克隆策略,即使是親緣關(guān)系很接近的生物也不例外,如C.elegans和C.briggsae,它們僅在2?5千萬年前分化形成。而通過計算機進行dbEST進行數(shù)據(jù)庫篩選,其配制是電子雜交實驗,提供了一條更為廣泛的基因識別路線,這一路線允許基因組間存在差異,這使得基因識別與新基因克隆策略發(fā)生革命性變化,同時它也提供了一個足夠大小和復(fù)雜的基因數(shù)據(jù)庫,目前,ESTs數(shù)量正以平均每月10萬條的速度遞增。2、ESTs和物理圖譜構(gòu)建ESTs在多種以基因為基礎(chǔ)的人和植物基因組物理圖譜構(gòu)建中扮演著重要角色。在這一應(yīng)用中,從ESTs發(fā)展起來的PCR或雜交分析可用來識別YACs、BACs或其他含有大片段插入克隆類型的載體,它們是構(gòu)建基因組物理圖譜的基礎(chǔ),將EST與基因組物理圖譜相比較即可辨認出含有剩余基因序列的基因組區(qū)間,包括調(diào)控基因表達的DNA控制元件,對這些元件進行分析就有可能獲得對基因功能的詳細了解。物理圖譜與遺傳圖譜間的相互參考,形成一個用途更廣泛的綜合資源,獲得這張綜合圖譜后,研究人員就可以孟德爾遺傳特征為基礎(chǔ),將相關(guān)基因定位在基因組區(qū)間上,并且通過查詢以ESTs為基礎(chǔ)的藶圖譜,即可獲得這一區(qū)間上所有基因的名單。該綜合資源用途的大小取決于EST數(shù)據(jù)庫中擁有的基因數(shù)目。目前人和小鼠EST的不斷擴充使其應(yīng)用更加廣泛和便捷。3、 ESTs和基因組序列注釋EST數(shù)據(jù)庫并非完美無瑕,因為ESTs不能被剪切為單列序列位點識讀,故精確度只能達到97%,另夕卜,ESTS受制于表達傾向(expressionbias),因為產(chǎn)生ESTs的cDNA是組織中豐富的mRNA以一定比例反轉(zhuǎn)錄而成,因此,表達水平很低的EST數(shù)據(jù)庫中找到,而表達量高的基因在EST數(shù)據(jù)庫中卻過量存在。雖然可在起始mRNA或由它合成雙鏈cDNA時進行富集,減小cDNA文庫,但cDNA文庫中仍存在大量高豐度的cDNA克隆。因此,一個理想的cDNA文庫必須去除或盡量消除多科信息克隆的影響,這就涉及到cDNA文庫的前加工技術(shù);均等化(normalization),減少與豐富編碼基因相關(guān)的cDNA數(shù)目;消減雜交(subtractivehybridization),應(yīng)用序列標(biāo)記cDNA識別并去除文庫中多余的克降,這些技術(shù)的發(fā)展,使基因識別更依賴于EST技術(shù),甚至可通過該技術(shù)獲得精確的基因組DNA序列,在華盛頓大學(xué)基因組測序中心和Sanger中心的聯(lián)合攻關(guān)下,C.elegans基因組10億個堿基對的測序工作基本完成。因此ESTs是一系列基因?qū)ふ夜ぞ咧胁豢扇鄙俸蟛糠?,而這些工具都是基因組序列為基礎(chǔ)的。EST技術(shù)關(guān)于基因組DNA序列的其他應(yīng)用還包括對基因內(nèi)含子、夕是子排列的精確預(yù)測,選擇性接合事件的識別,反常基因組排列結(jié)構(gòu)的識別等。4、 ESTs與“電子”基因克隆利用計算機來協(xié)助克隆基因,稱為'電子”基因克隆(sillconcloning),是與定位克隆、定位候選克隆策略并列的方法之一,即采用生物信息學(xué)的方法延伸EST序列,以獲得基因部分乃至全長的cDNA序列。EST數(shù)據(jù)庫的迅速擴張,已經(jīng)并將繼續(xù)導(dǎo)致識別與克隆新基因策略發(fā)生革命性變化。4.1EST序列的獲取利用計算機來協(xié)助克隆的第一步是必須獲得感興趣的EST,在dbEST數(shù)據(jù)庫中找出EST的最有途徑是尋找同源序列,標(biāo)準(zhǔn):長脛lOObp,同源性50%以上、85%以下??赏ㄟ^數(shù)個萬維網(wǎng)界而使用BLAST檢索程度實現(xiàn),其中最常用的如NCBI(NationalCenterforBiotechnologyInformation)的eneBank、意大利Tigem的ESTmachine(包括EST提取者和EST組裝機器)、THC(TentativeHumanConsensusSequences)數(shù)據(jù)庫、ESTBlast檢索程序——通過英國人類基因組作圖項目資源中心(HumanGenomeMappingProjectResourceCenter,HGMP—RC)服務(wù)器上訪問。然后將檢出序列組裝為重疊群Contig),以此重疊群為被檢序列,重復(fù)進行BLAST檢索與序列組裝,延伸重疊樣系列,重復(fù)以上過程,直到?jīng)]有更多的重疊EST檢出或者說重疊群序列不能繼續(xù)延伸,有時可獲得全長的基因編碼序列。獲得這些EST序列數(shù)據(jù)后,再與GeneBank核酸數(shù)據(jù)庫進行相似性檢測,假如鳳有精確匹配基因,將EST序列數(shù)據(jù)據(jù)EST六種閱讀框翻譯成蛋白質(zhì),接著與蛋白質(zhì)序列數(shù)據(jù)庫進行比較分析。基因分析的結(jié)果大致有三種:第一是已知基因,是研究對象為人類已鑒定和了解的基因;第二是以前未經(jīng)鑒定的新基因;第三是未知基因,這部分基因之間無同種或異種基因的匹配。新基因和未知基因?qū)⑦M一步用于生物學(xué)研究。4.2基因的電子定位基因的電子定位采用NCBI的電子PCR程序進行檢索,尋找EST序列上是否存在序列標(biāo)簽位點(sequencetaggedsites,STS),STS作為基因組中的單拷貝序列,是新一代的遺傳標(biāo)記系統(tǒng),其數(shù)目多,覆蓋密度較大,達到平均每lkb—個STS或更密集。將尋找到的STS與相應(yīng)的染色體相比較,即可將此序列定位在該染色體上。4.3IMAGE克隆的索取許多ESTs所對應(yīng)的cDNA克隆可通過基因組及其表達的整合分子分析(intergratedmolecularanalysisofgenomesandtheirexpression,IMAGE)協(xié)定免疫索取,這與電子基因克隆相輔相成,IMAGE協(xié)定由美國LLNL國家實驗室主持,宗旨是共享排列好的cDNA文庫中的克隆重,大規(guī)模的EST測序項目如Merk&Cow公司投資的人類ESTs項目等都加入了IMAGE協(xié)定。當(dāng)研究者通過另外的途徑得到基因的部分序列,并通過同源性檢索后發(fā)現(xiàn)該片段與加入IMAGE協(xié)定的EST序列高度同源時,便可免費索取其原始克隆,可通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論