第5章 基因組序列詮釋5 +1強伯勤_第1頁
第5章 基因組序列詮釋5 +1強伯勤_第2頁
第5章 基因組序列詮釋5 +1強伯勤_第3頁
第5章 基因組序列詮釋5 +1強伯勤_第4頁
第5章 基因組序列詮釋5 +1強伯勤_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第五章基因組序列詮釋問題基因組序列所包含的全部遺傳信息是什么?基因組作為一個整體如何行使其功能?用什么方法尋找基因,研究基因地功能呢?1.尋找基因1.1根據(jù)開放讀框預(yù)測基因⑴起始密碼子ATG第一個ATG的確定(依據(jù)Kozak規(guī)則);Kozak規(guī)則是基于已知數(shù)據(jù)的統(tǒng)計結(jié)果.所謂Kozak規(guī)則,即第一個ATG側(cè)翼序列的堿基分布所滿足的統(tǒng)計規(guī)律.Kozak規(guī)則:若將第一個ATG中的堿基A,T,G分別標(biāo)為1,2,3位,則Kozak規(guī)則可描述如下:(1)第4位的偏好堿基為G;(2)ATG的5’端約15bp范圍的側(cè)翼序列內(nèi)不含堿基T;(3)在-3,-6和-9位置,G是偏好堿基;(4)除-3,-6和-9位,在整個側(cè)翼序列區(qū),C是偏好堿基。信號肽分析軟件(SignalPhttp://www.cbs.dtu.dk/services/signalP)

把預(yù)測過程中證實含完整mRNA5’端的序列翻譯為蛋白序列;然后用SignalP軟件對前50個氨基酸序列(從第一個ATG對應(yīng)的甲硫氨酸Met開始)進行評估,如果SignalP分析給出正面結(jié)果,則測試序列有可能為信號肽;⑵信號肽分析⑶終止密碼子

終止密碼子:TAA,TAG,TGAGC%=50%終止密碼子每64bp出現(xiàn)一次;GC%>50%終止密碼子每100-200bp出現(xiàn)一次;由于多數(shù)基因ORF均多于50個密碼子,因此最可能的選擇應(yīng)該是ORF不少于100個密碼子。⑷3’端的確認(rèn)

3’端的確認(rèn)主要根據(jù)Poly(A)尾序列,若測試DNA片段不含Poly(A)序列,則根據(jù)加尾信號序列“AATAAA”和BLAST同源性比較結(jié)果共同判斷。⑸非編碼序列、內(nèi)含子高等真核生物ORF閱讀的復(fù)雜性:基因間存在大量的非編碼序列(人類基因組中是70%)絕大多數(shù)基因含有非編碼的內(nèi)含子。高等真核生物多數(shù)外顯子長度少于100個密碼子,有的不到50個密碼子甚至更少;不能根據(jù)ORF長度判斷讀框的準(zhǔn)確性。編碼同一氨基酸的不同密碼子稱為同義密碼,其差別僅在密碼子的第3位堿基不同。不同種屬間使用同義密碼的頻率有很大差異:如人類基因中,

丙氨酸(Ale)密碼子多為GCA,GCC或GCT,而GCG很少蘇氨酸(Thr)密碼子多為ACA,ACC或ACT,而ACG很少⑹密碼子偏愛性⑺密碼子偏愛性高等植物207個基因單子葉植物53個,6個單子葉種群,18種氨基酸有16種氨基酸的密碼子搖擺堿基為G+C雙子葉植物154個,35個雙子葉種群,只有7種氨基酸的搖擺堿基是G+C,其余均為A+T密碼子偏倚codonbias,原因不明。⑻外顯子-內(nèi)含子邊界外顯子和內(nèi)含子的邊界有一些明顯的特征:如:內(nèi)含子的5‘端或稱供體位(donorsite)常見的順序為5’-AG↓GTAAGT-3’;3’端又稱受體位(acceptorsite),多為5‘PyPyPyPyPyPyCAG-3’(“Py”嘧啶核苷酸,T或C);但是由于邊界序列常有例外,僅適用于一定范圍。⑼上游控制序列幾乎所有基因(或操縱子)上游都有調(diào)控序列,它們可與DNA結(jié)合蛋白作用,控制基因表達。

通過同源性比較來預(yù)測mRNA的5’端,最常用的與轉(zhuǎn)錄起始位點相關(guān)的數(shù)據(jù)庫是真核啟動子數(shù)據(jù)庫(TheTRADATProject,EukaryoticPromoterDatabase,EPD.http://www.epd.unil.ch/)。

另外個別生物基因組的特有組成也可作為判別依據(jù),如脊椎動物基因組許多基因的上游都有CpG島。

⑽內(nèi)含子和外顯子序列差異內(nèi)含子受選擇壓力小,突變多。由于堿基C到A,內(nèi)含子A/T比例高內(nèi)含子A/T比例高,所以終止密碼子出現(xiàn)的頻率高。

⑾軟件預(yù)測采用NCBI的ORF預(yù)測軟件(ORFfinder:/gorf/orfig.cgi)判斷ORF的可能范圍?;蜃⑨屲浖礼enscan——重于信號指令:起始密碼、終止密碼、剪接受體位和供體位序列等FgeneSH——重于內(nèi)容指令:密碼子使用偏好、內(nèi)含子外顯子的差異等TWINSCAN和SGP2——根據(jù)相似性和一致性基因注釋軟件缺點外顯子注釋的準(zhǔn)確率<80%。誤拼和誤拆錯誤較多。容易忽略結(jié)構(gòu)較小的基因,特別是基因內(nèi)基因。線蟲基因的注釋19477個軟件預(yù)測11984個克隆驗證,未能預(yù)測到的cDNA和EST為4365個1.2同源查詢途徑

通過已存入數(shù)據(jù)庫中的基因順序與待查的基因組序列進行比較,從中查找可與之匹配的堿基順序及其比例,用于界定基因的方法稱為同源查詢。

相似性有如下幾種情況:

ADNA序列某些片段完全相同;B開放讀碼框(ORF)排列類似,如有長外顯子;C開放讀碼框翻譯成氨基酸序列的相似性;D模擬多肽高級結(jié)構(gòu)相似同源基因:氨基酸的一致性和相似性>25%同源性:homology起源于同一祖先但序列已經(jīng)發(fā)生變異的序列,分布在不同物種間的同源基因,只有是與非的區(qū)別。一致性:identity同源DNA序列的同一堿基位置上相同的堿基成員,或者蛋白質(zhì)中同一氨基酸位置相同的氨基酸成員的比例,用%表示。相似性:similarity同源蛋白質(zhì)的氨基酸序列中一致性氨基酸和可取代氨基酸所占的比例。比較氨基酸和基因的同源性?分子雜交可確定DNA片段是否含有表達順序Northernblot:指將待測DNA樣品標(biāo)記后與RNA雜交,以判斷RNA中是否含有DNA的轉(zhuǎn)錄產(chǎn)物。但在操作中存在一些問題1.3試驗確認(rèn)基因1977年J.C.Alwin首創(chuàng)Northernblotting

問題解決方案A某一基因的轉(zhuǎn)錄產(chǎn)物進行可變剪接或該基因為某一多基因家族的成員時,會出現(xiàn)多個雜交帶設(shè)計其他實驗區(qū)分心肌特異性蛋白問題解決方案B基因的表達具有組織特異性及發(fā)育階段的差別,而選擇的RNA樣品中不一定含有該基因產(chǎn)物盡可能多地收集各種不同發(fā)育時期及不同組織器官的RNA問題解決方案C某些基因產(chǎn)物豐度極低或不易提取適當(dāng)提高RNA上樣量,或先以已知的DNA序列設(shè)計引物從mRNA中擴增基因產(chǎn)物C基因表達產(chǎn)物豐度的問題擬Northern雜交——根據(jù)已知的DNA順序設(shè)計引物,從mRNA群體中擴增基因產(chǎn)物,再以DNA為探針與之雜交。動物園雜交——根據(jù)親緣關(guān)系相似的物種,其基因的編碼區(qū)相似性較高,而非編碼區(qū)的同源性很低的原理。DNA順序中基因位置的確定cDNA測序受兩個方面的影響:一是相關(guān)cDNA在cDNA文庫中出現(xiàn)的頻率;二是cDNA的完整性如何獲取基因全長cDNA序列?AcDNA文庫構(gòu)建BRACE技術(shù)干擾cDNA篩選基因的因素:目標(biāo)cDNA所占比例很低分成亞群進行篩選cDNA均一化

影響cDNA測序的因素與mRNA的反轉(zhuǎn)錄有關(guān)cDNA文庫構(gòu)建(CLONTECH)cDNA文庫構(gòu)建(CLONTECH)5’RACE(CLONTECH)3’RACE(CLONTECH)確定DNA順序中基因的位置A通過對全長cDNA序列的測序、對比,以及與基因組DNA的比較,確定基因所在的區(qū)域;B通過物種已建立遺傳圖和物理圖來確定基因的位置;利用計算機分析基因功能2、基因功能的預(yù)測2.1同源性確定基因功能2.2同源性分析在酵母基因組計劃中的應(yīng)用2.1同源性確定基因功能

種間同源基因或直系基因(orthologousgene):指不同物種之間的同源基因,它們來自物種分化以前的共同祖先

種內(nèi)同源基因或平行基因(paralogousgene)同一物種內(nèi)的同源基因,它們常常是多基因家族的不同成員同源基因一般不會有完全一致的核苷酸序列,因為不同的基因或不同的生物都會獨立地發(fā)生隨機突變,但它們有相似的序列,大部分未突變的核苷酸位置是相同的

同源性分析可以給出整個基因或其中某一區(qū)段功能的有關(guān)信息2.2同源性分析在酵母基因組計劃中的應(yīng)用酵母基因組大約含有6000個基因30%是通過傳統(tǒng)遺傳學(xué)分析得到的另外70%是用同源性分析獲得3.1基因失活在基因功能分析的作用3.2基因的超表達用于功能檢測3、實驗確認(rèn)基因功能3.1.1基因剔除(knock-out)最簡便的基因失活的方法.主要原理:在一段無關(guān)DNA片段的兩側(cè)連接與代換基因兩側(cè)相同的順序,將這一構(gòu)建導(dǎo)入目的細胞,由于同源片段之間的重組,可使無關(guān)片段取代靶基因,整合到染色體中。為了便于篩選,用于取代的外源DNA中含有報告基因。3.1基因失活在基因功能分析的作用tk胸苷激酶標(biāo)記基因←gangcyclovirneor新霉素抗性基因→G4183.1.2反義RNA

反義RNA是由基因的負(fù)鏈編碼,可與正義RNA(senseRNA)或DNA編碼順序結(jié)合,干擾mRNA的轉(zhuǎn)錄,加工和轉(zhuǎn)運,調(diào)控基因的表達。構(gòu)建反義RNA表達載體:將全目的基因或部分目的基因反向插入表達載體→轉(zhuǎn)化目標(biāo)生物→獲得轉(zhuǎn)基因個體或品系→分析轉(zhuǎn)基因植株在生理、生化、形態(tài)等方面的變異→判別目的基因的功能正義表達載體反義表達載體反義RNA作用機理:

A干擾翻譯的起始與延伸,可與翻譯起始順序及編碼序列結(jié)合形成雙鏈RNA,隨之被細胞降解。B與mRNA的引導(dǎo)順序結(jié)合,阻止核糖體的附著,使翻譯無法啟動。C反義RNA與mRNA形成雙鏈分子后,使RNA多聚酶脫離模板,轉(zhuǎn)錄終止。3.1.3RNA干涉

RNAi是通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論