應用UCSC查找啟動子等_第1頁
應用UCSC查找啟動子等_第2頁
應用UCSC查找啟動子等_第3頁
應用UCSC查找啟動子等_第4頁
應用UCSC查找啟動子等_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

應用UCSC/Ensembl查找基因啟動子(promoter)、內(nèi)含子、外顯子序列promoter,基因,序列,Ensembl,UCSC本帖引用網(wǎng)址:/thread-47691-1-1.html啟動子的甲基化,轉(zhuǎn)錄因子與啟動子的結(jié)合調(diào)控基因的表達等研究領(lǐng)域一直較為熱門。本文圖文形式講解了啟動子的概念,利用UCSC如何查找一個基因的啟動子序列,以及外顯子和內(nèi)含子序列的顯示。有很多關(guān)于此方面的文章由于寫作在早期,近年來查詢數(shù)據(jù)庫網(wǎng)站的改版使得這些文章有些落伍,使用起來也不方便。本文是最新的關(guān)于查詢啟動子方法的文章,創(chuàng)作于2009/10/14,大家可以完全按此操作。在講述某個基因的啟動子查詢之間,我們有必要對基礎(chǔ)知識進行一下復習和總結(jié)。先看一下中心法則:ReplicatwnCBTranscriptionTranslationDNA,RNA,Protein^R啟動子是在DNA轉(zhuǎn)錄為RNA這一步過程中發(fā)揮作用的,在此要與DNA自身復制起始點(稱作復制子)和由mRNA翻譯為蛋白質(zhì)時的翻譯起始點(以起始密碼子ATG為標志)區(qū)別開來。DNAsequence-specifictranscriptionfactorsTBP(TATA-bindingprotein)定義:啟動子是參與特定基因轉(zhuǎn)錄及其調(diào)控的DNA序列。包含核心啟動子區(qū)域和調(diào)控區(qū)域。核心啟動子區(qū)域產(chǎn)生基礎(chǔ)水平的轉(zhuǎn)錄,調(diào)控區(qū)域能夠?qū)Σ煌沫h(huán)境條件作出應答,對基因的表達水平做出相應的調(diào)節(jié)。啟動子是RNA聚合酶特異性識別和結(jié)合的部位。啟動子方向性,位于轉(zhuǎn)錄起始點上游,本身并不被轉(zhuǎn)錄。DNA鏈上與RNA鏈的第一個核苷酸對應的堿基標記為+1(如下圖),由此堿基向上游(5’端)數(shù)的堿基順序數(shù)為負(-1,-2,......),向下游(3’端)數(shù)的堿基為正(+2,+3,......)一35-10*15'-TAGTCTArn^C-KTCATAGAAGCACTCIAJjSKO'CAATAGGTCCAC(;-3V-A-TCACXTA/LCrGTACTATCnTCGTGAGATGAIATAACACIT^TCCAGCTCC-3*I球RFM5J-AGGUCCACG..…….-一扈劫子的部位及其與赫兼鞭黛此典知土BM5區(qū)域:啟動子的范圍非常大,可以包含轉(zhuǎn)錄起始位點上游2000bp,有些特定基因的轉(zhuǎn)錄區(qū)內(nèi)部也存在著轉(zhuǎn)錄因子的結(jié)合位點,因此也屬于啟動子范圍??偨Y(jié)起來,也就是說啟動子約在與mRNA所對應的DNA序列之前約2000個左右的堿基。明白了啟動子的含義之后,我們以大鼠(rattusnorvegicus)的結(jié)締組織生長因子(CTGF)為例,應用UCSC基因組瀏覽器開始查找該基因的啟動子序列。網(wǎng)址為/。eno-meBrornformAtksQtfxMiHd.BM"TiS'■小■bWWPCjR1VlwOMaFM)Ht進入UCSC的主頁后,在其左側(cè)(如上圖)點擊第一項GenomeBrowser,進入基因組瀏覽器入口,如下圖

lh><lluiawAlLi略細Hj助RHiahh氏lh><lluiawAlLi略細Hj助RHiahh氏■可ww^gfSLmJk2M£kn?iriavoKV-tttfncraSTCBG"dmpve^krLXEkeLjn.■wnYl^acaaCramE"EecfKacsf--enKrtua^ktnfJ<ipOihlbaiie|nrrlc-i-Ghmm&rm?rUmwt[MlFK■MI'M'MHiW-Ki^MHr在Organism的下拉菜單中選擇Rat,在assembly的下拉菜單中選擇最新日期Nov.2004,在position框中鍵入CTGF,imagewidth選擇默認即可,如下圖所示:cUd^Eewomeas土Kub”po^itjonor&古ar出termimagewWhMamnnatwRatw:Nov理國寸cigfBOD|:‘茹茹'花C&.khw〉tQ「巳呂戶£奴成0甘寫乾userinterfacesettingsto也出wddsiMqitiinaoks|[唁Qnliqu陽bmck.middisplaygtehsiJ:;0111?偵門然后點擊Submit,返回的頁面如下:Known.frUII/UE*」審m匚LUimxmmiF.coLEecuveCiasiieaiau:csfazccE匚Ff£K£2£5flm§sSftIkLll3£2msLL13£15£■-c1昱!aatm旺el日日皿nswthsice*:psts-jss^.BhaiM口眠jM旦網(wǎng)割占壞巳*小^4平””平上"-£>4期-SMIi-auUM-bl?*、中二旦上1星軍3W"p±-se*^kdRelS^qGenesc51M4312S£^Ee^HtE':ivet.13jii#a??vtzlhiaeiefpth^litjctNoii-RatKeffieqGenesEMM^ElC-LS-541;comie^xive-”y_i吧caowrEhfaac-ar?zieEm.ZitI翌M躊J■奶T巽Ml"uxf?匚葉j.*w號■】EMM^ElC-LS-541;comie^xive-”y_i吧caowrEhfaac-aruxf?匚葉j.*w號■】土、2?十?3.Gafw<*i,=耕善”mz吊沖i&-iTE?M5akUMHT把"村那眼”-C&at■二皿偵1N上1,,D3:7&.CTW-云.■:血止21>杰須£蟲"叫方右-(SEiC31&LE342^25Sie-E'L"vstE2_3m■:喧tEaswuir㈣maTix〔滯■JiE-fcO-C"|VSiWRliE;Vtmumcwe!caamtETlt■&azv-feDandPT193QEt±J?Bg*瑋gar-ew^^gzavE^igi-3MC?1t*?*SXGWpFEeXETEtGTDff4ETQErra-SELFzSEEUE"J.F?「-(KH0ClC^e22EF=va『心m;;"樣汩土-[潘亍心畤戶口只:1”配血71;33日2■辨號顧BwawiiCTCT■耳EaiflB9:L:?%:Er&-TJ;@】ll?i|W-網(wǎng)二皿翼4。:1|1|1ccrsezxi^e*L33J*efiEse^Tivtiiss-jst參WdUH口I"li?t-?Cort;fl=t-tB”,BTETLJa'JV:iJJEMiFtfeq=CWEfe序5:*導W印m?iawthC&2*n-rgasco-rEfFrac^grfa<s^-arHalAlignedntUNzkSearchResultsBO&TJIDJ-AfettuBurra<T±njiumwesmClsbubijtwtbf1?g>o外MAStLMcDltAclobeN£C:^LI>?|ir?ovl?ee<UB~Aa^ehin--Di-vtg-i.ETjjpaKi-i-iilfzAMA,fcrc^iidectlte^xj:b^eijiwrlif-accax.Non-RAtAlightedhlU\ASe^kthK/mjI性結(jié)果顯示該基因的已知序列和相關(guān)mRNA序列,點擊KnownGene中的第一個序列,出現(xiàn)包含這序列的圖解概要。為了獲得這個區(qū)域更清晰的圖像,可以點擊緊靠zoomout的1.5X按鈕,如下圖:TiMiQ^iuiSdrurKHDWAC^HWEEnu?*FWfPB1TSC<^,iittniii,Broifl.^eranfcal?im.2M4土倔心舛口如日)■ew4^*^r』山11畝天iiwnEtM1頑站i討晅S^CS*]AfkillBI■h-L-nirns-dBiiathiw.lKmhjjwtkii^m

對于KnownGenes(已知基因)和預測的基因路徑來說,一般的慣例是以一個高的垂直線或塊狀表示每個編碼外顯子,以短的垂直線或塊狀表示5,端和3■h-L-nirns-dBiiathiw.lKmhjjwtkii^mg*mH>Ag*mH>AinriESTTnrksOH41土"ASgn/AFi。T的UltffosrtioDChsTOISLOSOEibeBifid%tark_mA*SEfclyftACtDSdMMVhid*V-*hiip**hwte*■PkmotyieaadDk£M£?^s-ad^itwu1337*9面日皿牯怡17仲伸珂向1姓■三ccllapsgallUs^ct^p-dQ^Tibclgmdpr炒rffiMiR11FtCraclcicfepkjiedTr如ki4代由舊右函il虹心viS?U9國頑c司lybe曲供*:用盜afs-ecott^acinu>df&Iexpand日11IKtjDQTL本例的搜尋目的來說,默認設(shè)置不是理想的設(shè)置。按照視圖利用頁面底部的TrackControls按鈕,將一些路徑設(shè)置為hide模式(即不顯示),其他設(shè)置為dense模式(所有資料密集在一條直線上);另一些路徑設(shè)置為full模式(每個特征有一個分開的線條,最多達300)。在考慮這些路徑內(nèi)究竟存在那些資料之前,對這些路徑的內(nèi)容和表現(xiàn)做一個簡要的討論是必要的,許多這些討論是由外界提供給UCSC的。EnsemblGenePredictions路徑由Ensembl提供。Ensembl基因通過許多方法來預測,包括與已知mRNA和蛋白質(zhì)進行同源性比較。若查詢啟動子區(qū)域,我們需要將EnsemblGenes選擇為dense或full模式,點擊Refresh,即刷新,出現(xiàn)下圖:

Rw+'Eaq圖中多出了EnsemblGenes的預測路徑,我們在紅框中圈出。點擊用于表達該序列的任何方塊出現(xiàn)以下頁面:Rw+'Eaq,!*iE,!*nEas-34<M-DC6725M.AFlSe2?SLiMiE0C4*tro?__Hutwt珥sfitH4tShFs點擊紅框中的條形深色方塊(不是EnsemblGenes文字),

HomaGen皿此GenomeBrowserElatTablesGeneSorterPCREnsecnblGfdcPreditti-ons(E>*SRNOT0G0^0fl20S28-LnseoililEns?mblG^Link:EKSRNQGOOQOOOLhg&Eu瞞mblTrjimE時ENMRNOT00QS02C皿En^mblProkin:£XSWOPOO^gjO^'lsPosifioit:血1立口”口河寸心知215Bftkd.!]pl2GenanikSize:j]1"Sfrind:-AlterneNani?ENS3O-'CG000(H)C150j6CDSStir!:smpWeCDSEnd:completerLink$tosequeii<?fr:■P「cdkMd?K?t&?P「偵utedniR\Afromgrnomicse<jutflce\Set或廣\Set或廣sthcn】。www.七Mwlnb乩com.cu

.?Geto~Ewww.七Mwlnb乩com.cu

.?Dmsi[而iupdM迎;200?-0"-lJ在此,我們選擇并點擊Linktosequence中的GenomicSequence,即顯示基因組序列,出現(xiàn)以下窗口:Home&inainiv^8vn(Mii?BrowntrB4alTabl?>iGamvSaiXtrFCRAHicnFAQhitIpGeDQiiilcS^HrnccGeneGefGenomicSeqiienteNearGen^Newifwew頊曲pfirfetb@ptDXAfisifiareikaefreifeafiae村Obaitadeujuim,vylbeTah-MBgs心ytfatmiflgueoewSfquiiuct1Rclri^atfty^ionOpliansiECDS&giUpwEaniIn-HMOhas石bwECDS&gi?OtoePASTAm^nSprrg-ns?OOneFASTArecordptfrrrpdo(fEWLirtrofl,Kc)ZhQEraIwes-w^tarana(門sadD?frs<fci*"DS&em{31□5p6tCTRisviCDSpart-fagfsocwaNq呷=瞅FASTArwardsNifat#cki*cAk^r^izisngemd忒acti-izinpwEDCqiadlup^tKim^bqilc^meLbcyiruyWCn£pr就主』nordc^S>*querKWEonrk^nlBgOpfi£>n^^'.uLJRCAOUpfKTCdfi-TOAlSgcmeCXfaikEep<a£i(*>uo-fc'efHcaseOffisNww,h'.uLJRCAOUpfKTCdfi-TOAlSgcmeCXfaikEep<a£i(*>uo-fc'efHcaseOffisNww,h、syhibs,coillcik同時另外一個非常重要的就是序列顯示方式了,這里我們在SequenceFormattingOptions選項里進行選擇。我們選擇上圖紅框里的內(nèi)容,即外顯子大寫,其余的小寫,也就是說mRNA的外顯子大寫,其余上下游非編碼區(qū)以及內(nèi)含子均為小寫。選擇完后提交,返回如下序列頁面:>=n4_en3Gene_ENSRNOTO0000020626range=czhtl:21327099-213322131'EttcccjtgtggcttcGca.cats.gtttggacjtttE.tt=t=tc!=tc!aaggacagcaaaagcgtgaggccaagttgcct£taEtaca.catgt=.gc.cttctctttgaggBBBtgtttggaaagsacst;tg~aaXbacbatgxtggaaatccttcctgcact;ccagsgactgcztcacacttczcbgczcacztcgcaczcgttsectgttg豈亡呂tgtgaetgcaetg-tm亡呂gcetg-tggetgg己11amu呂aggtaatcgtgtgcagatg^atgcggt;izmgetact;tgmmgtgg匚tagctcccttcccccaccgcccctccg11aa11g^tccatggatggactgaa.aaegttgtaasmuuggucaatttasatggacccttttcatgttataagt=ctgcagtatgcttcccccbbbctagtc11cg'cagatatactcacctttaacXCbCbcteagBageaecBBetatgagaggaagecBetettgggtgtaa.eeagBBgtmmmtgatg^tagtattag-gggsagesmtgggatggcsctagmmtetctctacctaceatgggsett;gg刊cacacBcacacacacacacacacaca.cacacacacacBcacargggggggg-ggegggag^agegagajagagagagagagagag己gbgagsgmgbgsgaefag~mgmgaat:m=mm~tmgtmczagg~ttctmmatgaatgcatagtacatgmmmugmgtuut;七mummgizmm匕g_*ttmmgmmmgagagaesagstta^gtaesetg'tttaeBttt&a.eateBB&g'geBcegaetaegcctg^ttctttccttgacttaaccaccctccactagcctgcsagccatttgBgtagcaBgaggg-cttcatcacttgtBgacacttggag-aagtcBgtaaeaa^gc:ttsgetvatagetgggttacagetagmcacaaccgtttaeegetttgetg-tcetaaa.aaatmmcmgmmummmutuummcbgeetegttagattatgggttttagga七mmgtmmmmmmmmmagcctgmacctctgtacagccatg-tLPmmmmtst;ctcaactgaacccccactggcctccttccttctget;tetttettctcccaccctmtgttccctga.cacttacctmuugamumGsgctat11ggtstgmmuuum匚aa^cttatsetaaaaactcaatg'izccag'tcattgtccttcczctctct^ja.ccttg'Bag-acaagtccttaczataabgagg^etg-aaBaatetcc:cfca^gaa.cat:gcHtcztt±atagteetggettteatstettttagee&eeaaBBBBcg,gttatetseagtgaeeaaaaatcsaaacgcctgtmttteagatmcagmmtt;tgcacataggcatttt:gggcgggg■己gggggtattteaset^actatBBgcacctttctcctctcagtsgascat;ccesgagac^t:a.esgtczc:ca.~tgabaesbbatctsasscagtgaaaaagabg"tbt:t:11tgaatttutm—.uuugtgg'tatctgcctcttCEgetaettgagtettgagaaatttttatateagtsgec&g'aBetggtammgcgatt;tttaagaag-ggmmgattcgmgmmat:satccttgttcatgtat:ttetaagttBtatttcatcaggaag-ggtgcgaag-aggatacegagaaagttttactto:ttggtgttg^tgetggaa=acacaacguuttctt:cct=ggccagctabbgtgtgccaget1111cbgacggaggsbtgtg-gbgtgtcaaggggtcaggatcBBtccgg'tgtgagttgBtgag-gcBggBag-gtggggaggastgegaggastgteectgttt^tgtaggseteeattesgttetctggegagccggeegcccggacrcgtataaaagccagegeea第一個人寫字母以后就是mRNA序列,之前的小寫字母序列即為啟動子區(qū)域了。人家在做后序的甲基化分析、轉(zhuǎn)錄因子結(jié)合位點分析等便可以復制下來了。剛才我們提到第一個人寫字母以后就是mRNA序列,但該序列包含

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論