




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 1.Promoter Prediction/seq_tools/promoter.html2. PlantCARE(plant cis-acting regulatory elements), a database of plant cis-acting regulatory elementshttp:/bioinformatics.psb.ugent.be/webtools/plantcare/html/3. promoter 2.0 prediction server http:/www.cbs.dtu.dk/se
2、rvices/Promoter/4.啟動(dòng)子分析網(wǎng)址:1 /seq_tools/promoter.html2 http:/alggen.lsi.upc.es/recerca/menu_recerca.html3 http:/www.cbs.dtu.dk/services/Promoter/4 /molb470/ . s/solorz/index.html5 /molbio/proscan/http:/bip.weizmann.ac.il/toolbo . t
3、ers.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/s
4、ervices/Promoter//molbio/proscan//molbio/signal/常用啟動(dòng)子分析網(wǎng)址:http:/bip.weizmann.ac.il/toolbox/seq_analysis/promoters.html#databases/seq_tools/promoter.html.sg/promoter/CGrich1_0/CGRICH.htmhttp:/www.gene-http:/ihome.cuh
5、.hk/b400559/arraysoft_pathway.html#Promoterhttp:/www.dna.affrc.go.jp/PLACE/signalup.htmlhttp:/intra.psb.ugent.be:8080/PlantCARE/http:/www.cbs.dtu.dk/services/Promoter//molbio/proscan//molbio/signal/ 首先就是想直接查找有沒有人做過這條基因的啟動(dòng)子,在pubmed中輸入genename+pro
6、moter 接著就想看看有沒有數(shù)據(jù)庫可以直接給出啟動(dòng)子序列的,很幸運(yùn)竟然發(fā)現(xiàn)一個(gè)極好的啟動(dòng)子搜索講義網(wǎng)站,如下,.il/workshops/bgu/promoterworkshop.html 第一步就是要找到基因確定基因所在基因組區(qū)域,其中列出很多網(wǎng)站,不過偶還是習(xí)慣genbank,在gene欄中search某個(gè)基因,不要搞錯(cuò)基因種 屬!進(jìn)入后即可看到該基因的詳細(xì)條目,別眼花,就點(diǎn)擊右側(cè)link欄的Map viewer鏈接,進(jìn)入即可看到該基因在染色體上的形象定位,鼠標(biāo)懸停在基因的起始位點(diǎn)時(shí),即可在瀏覽器下方的狀態(tài)欄中顯示該位點(diǎn)在染色體上的明確定位,
7、 比如110997788,結(jié)合給出的基因跨度,比如110778899-117708899,即可大概確定該啟動(dòng)子在基因組中的大概定位,即 110778899-110997788; 第二步搞清楚基因組狀態(tài),我沒搞太清楚,不過其中給的一個(gè)鏈接來查出啟動(dòng)子所在克?。ú槌隹寺√?hào)可以購買)/genome/guide/mouse/該鏈接中的clonefinder工具可以做到,只要提交你要查找的基因officialname就可以返回一個(gè)clonelist; 第三步搜索啟動(dòng)子,其中可以用啟動(dòng)子數(shù)據(jù)庫和啟動(dòng)子預(yù)測軟件,當(dāng)然如果啟動(dòng)子數(shù)據(jù)庫中有
8、最好,但很失望給出的數(shù)據(jù)庫均不能查到!只好用啟動(dòng)子預(yù)測軟件,使用了幾個(gè)在線預(yù)測工具后覺得下面這個(gè)速度賊快,推薦http:/www.cbs.dtu.dk/services/Promoter/我把該基因的dna序列submit之后返回了很多個(gè)PolII識(shí)別位點(diǎn),到底哪個(gè)是呢?我個(gè)人理解啟動(dòng)子應(yīng)該是翻譯起始位點(diǎn)附近,所以在這個(gè)dna序列 中定位翻譯起始位點(diǎn)即可找到最近的Highly likely prediction,那么怎么定位呢?利用blast2這個(gè)利器,只要把dna和mrna序列粘貼進(jìn)去提交就ok,正好在翻譯起始位點(diǎn)上游幾百bp有個(gè) 識(shí)別位點(diǎn),ok!啟動(dòng)子序列就是翻譯起始位點(diǎn)上游大概1kb長度
9、的序列了!直接用ensemble數(shù)據(jù)庫的話,可以直接知道基因外顯子和起始位點(diǎn)的位置,然后直接可以查到之前的序列,再選3k-4k的長度預(yù)測就比較方便了。啟動(dòng)子及轉(zhuǎn)錄因子結(jié)合位點(diǎn)數(shù)據(jù)庫及預(yù)測工具 (2009-05-14 23:54:56)轉(zhuǎn)載忽然感覺很GUILTY的,BLOG里竟然不放一點(diǎn)點(diǎn)和研究有關(guān)的重要工具。換了電腦之后才發(fā)現(xiàn),很多有用的鏈接都沒有COPY下來,于是,從頭開始做吧。這是Andrew給我的他的PAPER里的有關(guān)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的數(shù)據(jù)庫,還有其他網(wǎng)友整理的,都很有用,這個(gè)星期有空再核下幾個(gè)重要基因的SNP。 PROMOTER FINDING AND ANALYS
10、IS PROGRAMS ON THE INTERNET-TRANSPLORER (TRANScription exPLORER)Dnanalyze (TF mapping)Dragon Promoter Finder 1.2 (TSS finder and promoter region analysis)FunSiteP 2.1HCtata (TATA signal prediction)McPromoter Ver.3MatInspector (Search for TF binding sites)ModelGenerator and ModelInspectorNNPP2.1 (TSS
11、 finder)PromoterInspector (Strand non-specific promoter region finder)Promoter2.0 (TSS finder)Promoter Scan II (Promoter region prediction)RGSiteScanSignal Scan (Search for Eukaryotic Transcriptional Elements)TESS (Search for Transcription Elements)TFSEARCH (Predicts TF binding sites based on TRANSF
12、AC data)TRANSFAC (TF database and a number of associated programs)TSSG and TSSWPROMOTER 2.0 http:/www.cbs.dtu.dk/services/Promoter/通常確定啟動(dòng)子的算法可以分成兩種,一種根據(jù)啟動(dòng)子區(qū)各種轉(zhuǎn)錄信號(hào),如TATA 盒、CCAAT 盒,結(jié)合對(duì)這些保守信號(hào)及信號(hào)間保守的空間排列順序的識(shí)別進(jìn)行預(yù)測。如PROMOTER 2.0, 用神經(jīng)網(wǎng)絡(luò)方法確定TATA 盒、CCAAT盒、加帽位點(diǎn)(cap site) 和GC 盒(GCbox) 的位置和距離, 識(shí)別含TATA 盒的啟
13、動(dòng)子。PROMOTER SCAN /molbio/proscan/根據(jù)轉(zhuǎn)錄因子結(jié)合部位在基因組中分布的不平衡性,將轉(zhuǎn)錄因子結(jié)合部位分布密度與TATA 盒的權(quán)重矩陣(weight matrix) 結(jié)合起來,從基因組DNA中識(shí)別出啟動(dòng)子區(qū)3 。但上述程序預(yù)測的假陽性率較高,PROMOTER 210 每23kb 出現(xiàn)一個(gè)假陽性;PRO2MOTER SCAN 平均每19kb 出現(xiàn)一個(gè)假陽性。PromoterInspector http:/www.genomatix.de/products/
14、PromoterInspector/PromoterInspector2.html另一種方法根據(jù)啟動(dòng)子區(qū)序列的特征進(jìn)行預(yù)測。Promo2terInspector 從一組訓(xùn)練序列中提取出啟動(dòng)子區(qū)的環(huán)境特征,并將外顯子、內(nèi)含子和3端非翻譯區(qū)的特征與啟動(dòng)子區(qū)加以區(qū)分,從而在基因組中確定啟動(dòng)子位置FirstEF /tools/FirstEF/近來還有一些程序?qū)⑸鲜龇椒ㄅcCpG 島(CpG islands) 信息相結(jié)合。CpG島是一段200 bp 或更長的DNA 序列,核苷酸G + C 的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+ C 含
15、量的50 %以上。許多脊椎動(dòng)物的啟動(dòng)子區(qū)都與CpG島的位置重合。FirstEF ( http :/ / rulai1cshl1org/ tools/ FirstEF/ ) 搜索通過5UTR 定位技術(shù)構(gòu)建的第一外顯子數(shù)據(jù)庫,識(shí)別第一剪切點(diǎn)(first splicing donor site) ,結(jié)合CpG 島信息,確定啟動(dòng)子區(qū)。這種方法使預(yù)測的敏感性和特異性都明顯提高。該程序預(yù)測含CpG島的啟動(dòng)子的敏感性和特異性都高于90 % ,預(yù)測不含CpG島的啟動(dòng)子的精確性相對(duì)略低。TRRD 數(shù)據(jù)庫 http:/wwwmgs.bionet.nsc.ru/mgs/dbases/trrd4/ 收錄了
16、真核基因調(diào)控區(qū)結(jié)構(gòu)和基因表達(dá)方式的信息,每個(gè)條目對(duì)應(yīng)一個(gè)基因。應(yīng)用權(quán)重矩陣數(shù)據(jù)庫搜索轉(zhuǎn)錄因子結(jié)合部位的程序包括SIGNAL SCAN /molbio/signal/MatInspector http:/www.genomatix.de/products/index.html轉(zhuǎn)錄因子搜索程序( transcriptional factor search ,TF2 SEARCH ) http:/www.cbrc.jp/research/db/TFSEARCH.html等等。盡管基于PWM 的搜索比較敏感,但它最大的缺點(diǎn)就是假陽性率過
17、高,在預(yù)測的結(jié)果中有很多結(jié)合部位并不真正具有生物學(xué)功能。COMPEL 數(shù)據(jù)庫 http:/compel.bionet.nsc.ru/new/index.html經(jīng)實(shí)驗(yàn)確定的復(fù)合元件不多,COMPEL 數(shù)據(jù)庫中收錄了近200 條經(jīng)實(shí)驗(yàn)確定的復(fù)合元件的信息。如果轉(zhuǎn)錄因子結(jié)合部位的預(yù)測結(jié)果中包含復(fù)合元件,顯然比單個(gè)元件更有可能具有生物學(xué)功能。Co - Bind 程序通過建立兩個(gè)轉(zhuǎn)錄因子結(jié)合部位的PWM 及其復(fù)合作用的模型,可以預(yù)測序列中的復(fù)合元件。還有一些程序利用COMPEL 數(shù)據(jù)庫中已知的復(fù)合元件去搜索基因組序列。Consensus /p
18、ub/consensus/AlignACE /cgi-bin/alignace.pl等是用來搜索高含量基序(overrepresented motif finding) 的一些算法,可以對(duì)一組基因簇中的基因調(diào)控區(qū)進(jìn)行比較,以發(fā)現(xiàn)其中存在的高含量的基序,調(diào)控元件可能就存在于這些基序之中。摘自tjogzt's的BLOG,有些挺好的收錄 1. NCBI上的Finding Promoter (NCBI推薦的) (http:/www.ncbi.nlm.
19、/Class/NAWBIS/Modules/DNA/dna21b.html) Promoter Scan from the Bioinformatics and Molecular Analysis section of NIH. TFSearch from the Computational Biology Research Center of Japan. &
20、#160; DRAGON Gene Start Finder from the DRAGON Genome Explorer site. 2. Promoter 2.0 Prediction Server (http:/www.cbs.dtu.dk/services/Promoter/) Promoter2.0 predicts transc
21、ription start sites of vertebrate PolII promoters in DNA sequences. It has been developed as an evolution of simulated transcription factors that interact with sequences in promoter regions. It b
22、uilds on principles that are common to neural networks and genetic algorithms. 3. TFSEARCH (http:/www.cbrc.jp/research/db/TFSEARCH.html) Searching Transcription Factor Binding Sites (ver 1.3) 4. Neural Net
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 培訓(xùn)行業(yè)品牌推廣策略計(jì)劃
- 2024年西安市臨潼區(qū)人民醫(yī)院招聘筆試真題
- 金融行業(yè)保安工作的綜合分析與建議計(jì)劃
- 深度剖析前后端分離架構(gòu)試題及答案
- 數(shù)據(jù)分析在倉庫中的應(yīng)用計(jì)劃
- 2024年湖南省數(shù)據(jù)局遴選公務(wù)員筆試真題
- 2025年軟件設(shè)計(jì)師進(jìn)階試題及答案工具
- 個(gè)人能力評(píng)估與提升的月度方案計(jì)劃
- 2025年軟考設(shè)計(jì)師重點(diǎn)試題及答案
- 2025軟件設(shè)計(jì)師考試核心試題及答案
- 獸醫(yī)藥理學(xué) 第15章 特效解毒藥
- 空乘人員職業(yè)形象設(shè)計(jì)與化妝(169張課件)
- 會(huì)計(jì)工作年限證明個(gè)人承諾書
- 物業(yè)公共秩序管理課件
- 系桿拱橋工程測量施工方案
- 淺談摩托艇的安全管理
- 女性功能治療方案ppt課件
- 公路工程計(jì)量與計(jì)價(jià)考試B本科
- 醫(yī)用耗材分類目錄 (低值 ╱ 高值)
- 短、中、長距離游泳項(xiàng)目的體能訓(xùn)練方法及特征研究
- 淺談歌曲《我的祖國》
評(píng)論
0/150
提交評(píng)論