可變剪接分析演示文稿_第1頁
可變剪接分析演示文稿_第2頁
可變剪接分析演示文稿_第3頁
可變剪接分析演示文稿_第4頁
可變剪接分析演示文稿_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

可變剪接分析演示文稿目前一頁\總數(shù)五十九頁\編于六點(優(yōu)選)可變剪接分析.目前二頁\總數(shù)五十九頁\編于六點主要內(nèi)容可變剪接介紹使用UCSCGenomebrowser分析可變剪接成因分析其它分析工具及數(shù)據(jù)庫基因表達譜目前三頁\總數(shù)五十九頁\編于六點一、可變剪接介紹可變剪接(alternativesplicing)即一個mRNA前體通過不同的內(nèi)含子去除方式可以獲得不同成熟mRNA。目前四頁\總數(shù)五十九頁\編于六點可變剪接示意圖目前五頁\總數(shù)五十九頁\編于六點可變剪接是生物多樣性的重要成因高等生物與低等生物的基因數(shù)量并沒有特別顯著的差別,如人的基因估計約30000-40000,小鼠的基因也為30000左右,而且人鼠基因有很多存在有很高的相似性。果蠅、線蟲等基因約為15000,基因數(shù)量的差別不足以解釋以上物種間存在的顯著差異。目前六頁\總數(shù)五十九頁\編于六點據(jù)估計,人40-60%的基因存在可變剪接形式。通過可變剪接,產(chǎn)生多種蛋白產(chǎn)物,放大了對不同物種基因組的差別,極大的擴展了不同物種的變化空間。可變剪接與蛋白質(zhì)組目前七頁\總數(shù)五十九頁\編于六點可變剪接的生理意義可變剪接與基因表達的時空性息息相關(guān),在不同時期,不同組織基因的表達形式可能不同,與物種發(fā)育的不同時期對應(yīng)??勺兗艚拥恼{(diào)控與生物體的健康息息相關(guān),其突變可以直接導(dǎo)致疾病。

目前八頁\總數(shù)五十九頁\編于六點1.1可變剪接背景知識內(nèi)含子剪接信號內(nèi)含子剪接需要區(qū)分外顯子及內(nèi)含子,識別信號主要包括內(nèi)含子5‘及3’末端序列及中間分支點(branchsite)附近的序列。目前九頁\總數(shù)五十九頁\編于六點內(nèi)含子剪接信號內(nèi)含子5‘剪接點稱為供體點(donorsite),3’剪接點稱為受體點(acceptorsite)。內(nèi)含子開始和末尾的兩對堿基最為保守,大多數(shù)情況為GU-AG(約占99.24%),少數(shù)為GC-AG(約占0.7%),極少數(shù)為AT-AC(0.05%)。除了這兩對保守堿基外,他們附近的堿基在不同物種間存在差異,但在物種內(nèi)有保守性。如如脊椎動物5’剪接信號AG|GUAAGU。目前十頁\總數(shù)五十九頁\編于六點內(nèi)含子剪接信號分支點(branchsite)通常位于3‘剪接點上游50bp,處于一段富含嘧啶的區(qū)域,分支點腺嘌呤附近區(qū)域為YNYURAY。目前十一頁\總數(shù)五十九頁\編于六點剪接識別信號目前十二頁\總數(shù)五十九頁\編于六點剪接體剪接由剪接體(spliceosome)催化完成。剪接體主要由幾個核糖蛋白亞基組成,每個亞基都由RNA鏈和蛋白組成。另外還有幾十個小多肽參與構(gòu)成剪接體。剪接體分主要剪接體(majorspliceosome)

和次要剪接體(minorspliceosome)。前者主要針對剪接信號為GU-AG模式的內(nèi)含子,包括U1,U2,U4,U5,U6等亞基,后者主要對應(yīng)AT-AC模式,由另外一組亞基組成。目前十三頁\總數(shù)五十九頁\編于六點剪接過程,U1結(jié)合donorsite,U2結(jié)合branchsite,U4,U5,U6連結(jié)U1,U2目前十四頁\總數(shù)五十九頁\編于六點1.2可變剪接的主要模式可變剪接主要有四種模式:內(nèi)含子不切割5’或3’切點競爭外顯子跳過外顯子互斥目前十五頁\總數(shù)五十九頁\編于六點可變剪接的主要模式內(nèi)含子不剪切切點競爭外顯子跳過外顯子互斥目前十六頁\總數(shù)五十九頁\編于六點可變剪接的結(jié)果由于采用不同的外顯子,導(dǎo)致編碼蛋白質(zhì)的不同,有時會出現(xiàn)蛋白提前終止,起到分子開關(guān)的作用。目前十七頁\總數(shù)五十九頁\編于六點1.3可變剪接的調(diào)控可變剪接的調(diào)控機制目前還不清楚。但越來越多的研究表明,可變剪接的調(diào)控是通過基因序列上的順式作用元件和核內(nèi)反式作用分子的相互作用進行的。目前十八頁\總數(shù)五十九頁\編于六點可變剪接的調(diào)控主要的順式作用元件有:

ESE:exonsplicingenhancer外顯子剪接增強子ISE:intronsplicingenhancer內(nèi)含子剪接增強子ESS:exonsplicingsilencer外顯子剪接沉默子ISS:intronsplicingsilencer內(nèi)含子剪接沉默子

目前十九頁\總數(shù)五十九頁\編于六點反式作用因子SR蛋白

因富含serine/arginine得名,該蛋白通常含有一至兩個RNA識別模體(RRM,RNARecognitionMotif),羧基端有RS結(jié)構(gòu)域(RS二肽富集區(qū))。

RRM負責(zé)介導(dǎo)RNA結(jié)合,決定各SR蛋白的底物特異性。RS結(jié)構(gòu)域主要參與蛋白-蛋白相互作用。目前二十頁\總數(shù)五十九頁\編于六點SR蛋白SR蛋白主要與外顯子剪接增強元件ESE結(jié)合,通過直接招募剪接體蛋白或是拮抗剪接抑制因子的作用來發(fā)揮作用。

SR蛋白主要對5’位點的選擇起作用:通過招募剪接體蛋白如U2AF或是U1-70K,在pre-mRNA的兩個或多個5’可變剪接位點中促進選擇使用距內(nèi)含子3’端較近的5’位點。

目前二十一頁\總數(shù)五十九頁\編于六點其它反式作用蛋白其它如hnRNP蛋白,多聚嘧啶序列結(jié)合蛋白(PTB),CELF蛋白家族等等也有各自不同的調(diào)節(jié)作用。ESE與SR蛋白的作用模式可能是可變剪接調(diào)控中最普遍的調(diào)控形式。已有實驗表明由于外顯子中剪接增強子序列的突變不能與SR蛋白結(jié)合可以導(dǎo)致外顯子的跳過(exonskipping)。

目前二十二頁\總數(shù)五十九頁\編于六點二、可變剪接的分析可變剪接的分析主要包括剪接體序列的校正,剪接體之間的比較,以及剪接機制的探索。目前二十三頁\總數(shù)五十九頁\編于六點剪接體序列的校正克隆試驗得到的mRNA往往不是全長,測序反應(yīng)也不能保證100%的正確,所以拿到一條序列首先要對其進行校正,盡可能保證使全長序列且無錯誤。校正可以通過剪接體序列與EST數(shù)據(jù)及基因組的比對進行。目前二十四頁\總數(shù)五十九頁\編于六點剪接體序列的校正與EST及基因組的比對可以到NCBI使用BLAST進行,根據(jù)多數(shù)原則進行修正。但這樣做每次只能查看一條序列,沒有一個總體的概念。因此我們推薦使用加州大學(xué)圣克魯茲分校提供的GenomeBrowser進行。目前二十五頁\總數(shù)五十九頁\編于六點2.1UCSCGenomeBrowserGenomeBrowser是美國加州大學(xué)圣克魯茲分校(UniversityofCalifornia,SantaCruz)開發(fā)的一套基因組注釋瀏覽工具。其特點是以基因組區(qū)域為單位把相關(guān)注釋信息整合在一個直觀的界面上。()

目前二十六頁\總數(shù)五十九頁\編于六點GenomeBrowser簡介GenomeBrowser可以理解為一個基因組的瀏覽器,選擇一定區(qū)域后,則會顯示在該區(qū)域內(nèi)的一系列性質(zhì),如圖譜信息(STS,FISHclone,chromosomeband),定位在該區(qū)域的已知基因情況以及通過基因預(yù)測軟件預(yù)測的基因情況,與該段基因組匹配的mRNA與EST信息,人與其它物種如小鼠,大鼠,黑猩猩基因組的比對情況等等,都直觀的顯示在一張圖上。目前二十七頁\總數(shù)五十九頁\編于六點GenomeBrowser使用GenomeBrowser提供一個與基因組比對的程序blat,用戶可以提交序列用blat進行基因組定位。目前二十八頁\總數(shù)五十九頁\編于六點Blat提交界面可以從下拉菜單中選擇不同基因組目前二十九頁\總數(shù)五十九頁\編于六點Blat結(jié)果可以看到QUERYAY174119為用戶提交序列,比對得分為742,提交序列全長774,其中4-755的序列可以匹配在16號染色體正鏈區(qū)域(66376615-66389357),有99.6%的匹配序列與提交序列完全相同?!癲etails”為比對的文本顯示,“browser”為在GenomeBrowser中查看結(jié)果

目前三十頁\總數(shù)五十九頁\編于六點Details結(jié)果圖中顯示有四個block,即提交序列可以分為四個區(qū)段與染色體上四個區(qū)域?qū)?yīng),即有四個外顯子。藍色區(qū)域為完全匹配,淺藍色為比對區(qū)域的邊緣序列,可以理解為外顯子邊界目前三十一頁\總數(shù)五十九頁\編于六點Details結(jié)果點擊每個block可以看到對應(yīng)的外顯子序列,block之間可以認為是內(nèi)含子序列,可以觀察是否符合GT-AG或是GC-AG模式目前三十二頁\總數(shù)五十九頁\編于六點GenomeBrowser中的結(jié)果基因圖中每個方塊對應(yīng)一個外顯子,方塊之間帶有箭頭的連線對應(yīng)基因組上的內(nèi)含子序列。箭頭的方向代表序列轉(zhuǎn)錄的方向(5’-3’)。目前三十三頁\總數(shù)五十九頁\編于六點GenomeBrowser中的結(jié)果基因跨度約12.7k。在該區(qū)域中有23個已知基因(根據(jù)SWISS-PROT,TREMBL,Refseq數(shù)據(jù)庫中的注釋),在本例中這23個基因都對應(yīng)著一個基因(cklfsf1)23個不同的剪接形式。

目前三十四頁\總數(shù)五十九頁\編于六點GenomeBrowser中的結(jié)果該組剪接體總體分為兩組,第一組包括上方20條序列,起始位點相同。第二組包括最后三條序列,其起始位點在第一組序列中的內(nèi)含子區(qū)域。兩組序列共有7個外顯子區(qū)域。目前三十五頁\總數(shù)五十九頁\編于六點GenomeBrowser中的結(jié)果從圖上看造成不同剪接體的原因有三種:轉(zhuǎn)錄起始位點不同。第二組序列起始點位于第一組序列內(nèi)含子區(qū)域,可能表明該附近區(qū)域可能有啟動子活性。外顯子的跳越現(xiàn)象。3,4,5,6外顯子均存在被切除的現(xiàn)象。剪接位點的偏移。在同一外顯子區(qū)域,外顯子的大小不同(對應(yīng)方塊的大小不同),可能是由于內(nèi)含子內(nèi)存在多個相鄰的剪接信號,導(dǎo)致不同的剪接結(jié)果。

目前三十六頁\總數(shù)五十九頁\編于六點查看EST支持GenomeBrowser提供的一個重要資源是EST在染色體上的定位信息,其基本做法是把EST數(shù)據(jù)與基因組作比對后,按照最好的匹配結(jié)果將EST唯一的定位到基因組上。

通過EST可以對不同剪接體提供佐證目前三十七頁\總數(shù)五十九頁\編于六點Genomebrowser中的EST數(shù)據(jù)分為兩個集合:已剪接EST集合(humaneststhathavebeenspliced)包括未剪接EST的所有EST集合(humanestsincludingunspliced)

后者包括前者。已剪接EST集合是與基因組比對后可以被分成多個外顯子結(jié)構(gòu),且外顯子之間的序列符合內(nèi)含子剪接位點模式(GT-AG模式)的EST。全部EST集合則不考慮是否含有剪接位點,其中可能有染色體污染和一些未經(jīng)剪接的EST數(shù)據(jù)。目前三十八頁\總數(shù)五十九頁\編于六點SplicedEST目前三十九頁\總數(shù)五十九頁\編于六點TotalESTs目前四十頁\總數(shù)五十九頁\編于六點EST數(shù)據(jù)選擇整條序列在染色體上以單外顯子形式出現(xiàn)很可能是染色體污染。一般優(yōu)先看已剪接EST數(shù)據(jù)對基因的支持情況,如數(shù)量不足再看包含未剪接EST的所有EST集合目前四十一頁\總數(shù)五十九頁\編于六點改變查看區(qū)域在browser里可以任意移動查看,改變位置的方法有兩種,一是直接輸入定位數(shù)字,二是通過窗口下方的方向箭頭移動。目前四十二頁\總數(shù)五十九頁\編于六點改變查看區(qū)域目前四十三頁\總數(shù)五十九頁\編于六點查看其它性質(zhì)有些注釋信息默認不顯示,用戶可以在browser下方選擇顯示。比如查看splicedEST目前四十四頁\總數(shù)五十九頁\編于六點使用GenomeBrowser獲得序列使用genomebrowser除了可以瀏覽基因的相關(guān)信息外,還可以很方便的獲取想得到的基因組序列。方法是通過browser上方的DNA連結(jié)。目前四十五頁\總數(shù)五十九頁\編于六點使用GenomeBrowser獲得序列出現(xiàn)的頁面框中為要獲得序列的位置,可以改變范圍或是包括任意長上游或下游序列,比如要分析啟動子序列,可以選取基因起始點上游1K的序列。(如果序列與基因組序列互補,應(yīng)向后取)目前四十六頁\總數(shù)五十九頁\編于六點2.2可變剪接成因分析從Genomebrowser中可以看到,上例中不同剪接體的形成的主要原因可能是采用了不同的啟動子或是出現(xiàn)了外顯子的跳過現(xiàn)象。這就促使我們考慮采用不同的手段預(yù)測可能導(dǎo)致這些剪接出現(xiàn)的原因。

目前四十七頁\總數(shù)五十九頁\編于六點(1)尋找潛在的啟動子ColdSpringHarbor的MichaelZhang小組開發(fā)的FirstEF程序針對第一外顯子和啟動子的預(yù)測,其準(zhǔn)確度在同類軟件中較高,因此選用該程序?qū)ξ覀冃蛄羞M行預(yù)測。實際上在genomebrowser中也包括firstexon預(yù)測結(jié)果。

該軟件網(wǎng)址目前四十八頁\總數(shù)五十九頁\編于六點FirstEF結(jié)果promoter區(qū)為預(yù)測的啟動子區(qū)域,exon為預(yù)測的第一個exon區(qū)域,點擊可查看具體位置信息。該程序預(yù)測66376104-66376673為啟動子區(qū)域,第一外顯子區(qū)域為66376604-66376834或是66376604-66377167。第一組序列的起始位置為66,376,615,第二組序列的起始位置為66,376,969。已有實驗證明第一組序列的啟動子可能在其上游約1.5Kb處,故此處的啟動子可能為第二組序列的啟動子。目前四十九頁\總數(shù)五十九頁\編于六點FirstEF預(yù)測單獨預(yù)測時可以先把基因序列定位到基因組上,在從上游多取1000bp,跟原序列一起去作預(yù)測。不能只提交上游序列,因為該程序同時預(yù)測第一外顯子,如不帶外顯子區(qū)則打分會低于閾值而無結(jié)果返回。

目前五十頁\總數(shù)五十九頁\編于六點其它啟動子預(yù)測軟件PromoterinspectorFunSitePCpGProDPromoter2.0

目前五十一頁\總數(shù)五十九頁\編于六點(2)外顯子跳過有試驗證明,很多外顯子的跳過是由于外顯子內(nèi)部的ESE(exonsplicingenhancer)序列發(fā)生突變,導(dǎo)致不能與SR蛋白結(jié)合而引起外顯子的跳過。因此可以考察跳過外顯子內(nèi)部的SR結(jié)合序列的情況目前五十二頁\總數(shù)五十九頁\編于六點SR蛋白結(jié)合序列預(yù)測已知的SR蛋白主要有四種,SF2/AF,SC35,SRp40,SRp55,各自有不同的RNA結(jié)合序列。同樣是由MichaelZhang實驗室開發(fā)的ESEfinder可以預(yù)測RNA中這些蛋白的結(jié)合位點。

目前五十三頁\總數(shù)五十九頁\編于六點提交序列2號外顯子預(yù)測目前五十四

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論