




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、Chapter 5 基因結(jié)構(gòu)預測基因結(jié)構(gòu)預測與基因表達分析與基因表達分析蛋白質(zhì)序列蛋白質(zhì)序列翻翻譯譯調(diào)控元件分析調(diào)控元件分析編碼區(qū)預測編碼區(qū)預測基因結(jié)構(gòu)分析基因結(jié)構(gòu)分析選擇性剪切選擇性剪切SNP序列比對序列比對功能注釋功能注釋KEGGGO系統(tǒng)發(fā)育樹系統(tǒng)發(fā)育樹蛋白質(zhì)理化性質(zhì)蛋白質(zhì)理化性質(zhì)二級結(jié)構(gòu)預測二級結(jié)構(gòu)預測結(jié)構(gòu)域分析結(jié)構(gòu)域分析重要信號位點分析重要信號位點分析三級結(jié)構(gòu)預測三級結(jié)構(gòu)預測基因預測和基因結(jié)構(gòu)分析基因預測和基因結(jié)構(gòu)分析u生物信息學中的重要內(nèi)容之一生物信息學中的重要內(nèi)容之一u預測編碼蛋白質(zhì)的基因預測編碼蛋白質(zhì)的基因u排除重復序列排除重復序列u確定開放閱讀框(確定開放閱讀框(open re
2、ading frame, ORF)內(nèi)含子內(nèi)含子/外顯子外顯子剪切位點識別;選擇性剪切分析剪切位點識別;選擇性剪切分析 (一)(一) 基因預測的基本分析內(nèi)容基因預測的基本分析內(nèi)容u確定基因的調(diào)控區(qū)確定基因的調(diào)控區(qū)核心啟動子核心啟動子/轉(zhuǎn)錄因子結(jié)合位點轉(zhuǎn)錄因子結(jié)合位點/轉(zhuǎn)錄啟始位轉(zhuǎn)錄啟始位點的識別;轉(zhuǎn)錄終止信號的預測;點的識別;轉(zhuǎn)錄終止信號的預測; CpG 島的識別等島的識別等 ATG TGA5-UTR3-UTRExon 1Exon 2Promoter (二)(二) 基因預測的基本方法基因預測的基本方法 1. 序列相似性搜索序列相似性搜索基因組基因組DNA序列序列 在在6個閱讀框中進行翻譯并與蛋白
3、質(zhì)數(shù)據(jù)庫中的序個閱讀框中進行翻譯并與蛋白質(zhì)數(shù)據(jù)庫中的序列進行比較分析(如列進行比較分析(如Blastx) 對對EST數(shù)據(jù)庫中同一生物的數(shù)據(jù)庫中同一生物的cDNA序列進行比較序列進行比較分析(如分析(如Blastn)確定基因數(shù)目和對應的確定基因數(shù)目和對應的ORFu 分析舉例:水稻分析舉例:水稻Xa21基因區(qū)段基因區(qū)段DNA序列(序列(U37133)v CDS:1-2677 bp處和處和3521-3921 bp處處v Blastx分析結(jié)果分析結(jié)果(檢索蛋白質(zhì)數(shù)據(jù)庫):與(檢索蛋白質(zhì)數(shù)據(jù)庫):與水稻蛋白質(zhì)序列比較水稻蛋白質(zhì)序列比較v Blastn分析結(jié)果分析結(jié)果(檢索(檢索est other數(shù)據(jù)庫)
4、:數(shù)據(jù)庫):與水稻與水稻cDNA序列比較序列比較 取決于數(shù)據(jù)庫中取決于數(shù)據(jù)庫中EST數(shù)據(jù)的數(shù)量和長度數(shù)據(jù)的數(shù)量和長度 通過通過“Tree view”查看與查看與U37133序列序列同源的其它同源的其它EST序列序列 有些蛋白質(zhì)序列是推測獲得的有些蛋白質(zhì)序列是推測獲得的Blastx結(jié)果結(jié)果與與cDNA的比對結(jié)果的比對結(jié)果 2. 根據(jù)模式序列預測基因根據(jù)模式序列預測基因u 各種基因預測軟件各種基因預測軟件u 取決于人們?nèi)Q于人們對已知基因結(jié)構(gòu)特征的認識對已知基因結(jié)構(gòu)特征的認識u 采用統(tǒng)計學方法采用統(tǒng)計學方法v 基于一個或多個已知序列模式對未知序基于一個或多個已知序列模式對未知序列進行分類列進行分類
5、v 密碼子偏愛性密碼子偏愛性v 對發(fā)現(xiàn)的模式進行統(tǒng)計檢驗對發(fā)現(xiàn)的模式進行統(tǒng)計檢驗 啟動子結(jié)構(gòu)啟動子結(jié)構(gòu) 外顯子、內(nèi)含子外顯子、內(nèi)含子u 原核微生物(大腸桿菌原核微生物(大腸桿菌lexA基因的基因的DNA模式)模式)v LexA repressor的結(jié)合位點(啟動子區(qū)段)的結(jié)合位點(啟動子區(qū)段) CTGNNNNNNNNNNCAGv 與與RNA聚合酶相互作用位點(聚合酶相互作用位點(-10至至-35的啟動的啟動子區(qū))子區(qū)) TTGACA和和TATAATv 核糖體結(jié)合位點(轉(zhuǎn)錄起始位點后)核糖體結(jié)合位點(轉(zhuǎn)錄起始位點后) GGAGGu 真核生物真核生物v 基因結(jié)構(gòu)復雜基因結(jié)構(gòu)復雜v 已知外顯子、內(nèi)含
6、子外顯子邊界、啟動子序已知外顯子、內(nèi)含子外顯子邊界、啟動子序列特征列特征基因預測方法基因預測方法 不同方法預測不同方法預測 核酸序列出現(xiàn)頻率統(tǒng)計法 同源比較法 隱馬爾可夫模型法 決策樹方法 語言學方法 神經(jīng)網(wǎng)絡分析法 訓練數(shù)據(jù)集有針對性訓練數(shù)據(jù)集有針對性 原核生物vs.真核生物 動物vs.植物基因預測軟件基因預測軟件基因結(jié)構(gòu)分析工具基因結(jié)構(gòu)分析工具GENSCAN/GENSCAN.htmlWeb/LinuxGeneMarkhttp:/www.ebi.ac.uk/genemark/ /GeneMark/
7、WebGene Finder/tools/genefinder/(Dr. Michael Zhang )WebFGENESHhttp:/ LinuxFgeneSB/ FgeneSVhttp:/ /generation/WebGeneBuilder http:/r.it/webgene/genebuilder.html WebFGENESH+ /+http:/ Web/LinuxGenomeScan /genomescan.html WebGeneWise http:/www
8、.sanger.ac.uk/Software/Wise2/ WebGRAIL/grailexp/Web/Linux/WindowsBCM Gene Finder/seq-search/gene-search.htmlWebu 目前還沒有一個基因預測工具可以完全正確地預測一個目前還沒有一個基因預測工具可以完全正確地預測一個基因組中的所有基因基因組中的所有基因(Mathe C, Sagot MF, Schiex T, Rouze P. Current methods of gene pr
9、ediction, their strengths and weaknesses. Nucleic Acids Res. 30 (19):4103-4117, 2002)u 目前最好的基因預測工具預測一個基因組中的所有外顯目前最好的基因預測工具預測一個基因組中的所有外顯子的準確率最多達到子的準確率最多達到75%,預測基因結(jié)構(gòu)的準確率,預測基因結(jié)構(gòu)的準確率100相似度相似度95%S.Gupta et al., Genome wide identification and classification of alternative splicing based on EST data, 2004,
10、 20(16): 2579-2585基因周圍調(diào)控序列分析基因周圍調(diào)控序列分析 CpG島 位于真核生物基因轉(zhuǎn)錄起始位點上游,GC含50% ,長度200bp 轉(zhuǎn)錄起始位點(Transcription start site, TSS) PY2CAPY5 核心啟動子(Core promoter element) TATA box,Pribnow box 上游啟動子元件(Upstream promoter element) CAAT box,GC box,SP1,Otc 轉(zhuǎn)錄終止信號 AAUAAA,UUUUUU 操縱子、終止子、增強子、沉默子啟動子數(shù)據(jù)庫啟動子數(shù)據(jù)庫TransFac http:/www.
11、gene- EPD http:/www.epd.isb-sib.ch/ TRRD http:/wwwmgs.bionet.nsc.ru/mgs/gnw/trrd Jasparhttp:/jaspar.cgb.ki.se/cgi-bin/jaspar_db.plZhang Lab/software/index1.htm DBTSShttp:/dbtss.hgc.jp/index.htmlMIRAGE/ Bacillus subtilis http:/dbtbs.hgc.jp/ Drosophila melanogaste
12、r /labs/Kadonaga/DCPD.html E. coli /ecoli_matrices/ Human /mfrith/HPD.html PlantProm http:/ Planthttp:/www.dna.affrc.go.jp/PLACE http:/oberon.fvms.ugent.be:8080/PlantCARE/index.html Saccharomyces cerevisiae /j
13、ian/ CpG Island 分析分析CpG Island http:/ finderhttp:/ Network Promoter Prediction/seq_tools/promoter.htmlWebSoftberry: BPROM, TSSP, TSSG, TSSWhttp:/ ftp:/ariane.gsf.de/pub/win95_NT/ConsInspector.exeWindows/LinuxCister/mfrith/cister.shtmlWeb Promoter預測Cis-regulator
14、y elements analysisPlantCARE轉(zhuǎn)錄終止信號預測轉(zhuǎn)錄終止信號預測Hcpolyahttp:/r.it/webgene/wwwHC_polya.htm1Web POLYAHhttp:/ /tools/polyadq/polyadq_form.htmlWeb編碼區(qū)綜合分析舉例編碼區(qū)綜合分析舉例CpG島分析No調(diào)控序列所在位置Cister結(jié)果:881- 896 CCAAT908- 923 CCAAT轉(zhuǎn)錄終止信號GetOrfGenScan735 - 773 964 - 1020 1054 - 1146 1112 - 1156 1341 -
15、1625 1054-1490(1054-1145, 1268-1490 )CCTAGTCCAGACGCCATGGGT比對分析(Blastx,Blastn,Blastp)Blastx結(jié)果: gamma globin:1054-11461266-1493 /mfrith/HPD.htmlHuman gene 5HSA004013: -10001000基因表達分析基因表達分析利用已發(fā)表基因芯片數(shù)據(jù)分析目標基因的表達情況 GEO serves as a public repository for a wide range of high-throughput expe
16、rimental data. These data include single and dual channel microarray-based experiments measuring mRNA, miRNA, genomic DNA (arrayCGH, ChIP-chip, and SNP), and protein abundance, as well as non-array techniques such as serial analysis of gene expression (SAGE), mass spectrometry peptide profiling, and
17、 various types of quantitative sequence data.GEO數(shù)據(jù)庫查詢數(shù)據(jù)庫查詢根據(jù)關鍵詞查詢或或根據(jù)GEO accession查詢可下載這兩種格式作進一步分析探針探針不同處理條件下的基因表達量不同處理條件下的基因表達量TXT格式如何判斷目標基因所對應的芯片探針?根據(jù)soft格式文件中探針的注釋信息利用PlantGDB數(shù)據(jù)庫中的PLEXdb Probe Match工具查詢選擇數(shù)據(jù)庫選擇數(shù)據(jù)庫粘貼目標基因粘貼目標基因CDS序列序列其它資源其它資源GenevestigatorGenevestigator is a reference expression dat
18、abase and meta-analysis system. It allows biologists to study the expression and regulation of genes in a broad variety of contexts by summarizing information from hundreds of microarray experiments into easily interpretable results. A user-friendly interface allows you to visualize gene expression
19、in many different tissues, at multiple developmental stages, or in response to large sets of stimuli, diseases, drug treatments, or genetic modifications. This type of meta-analysis is core to understanding the spatio-temporal-response regulation of genes, to identify or validate biomarkers, and to find out which subnetworks are commonly affected in different diseases and conditions.注冊后可以免費試用以軟件以軟件Genevestigator tool的形式在的形式在PC機上打開進行操作。目機上打開進行操作。目前整合了擬南芥、水稻、人、老鼠等物種的基因芯片表達數(shù)據(jù)前整合了擬南芥、水稻、人、老鼠等物種的基因芯片表達數(shù)據(jù)Plant Expression DatebaseArrayexpresshttp:/www.ebi.ac.uk/microarray-as/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五年級上冊數(shù)學教學設計-第三單元第1課時 因數(shù)與倍數(shù) 北師大版
- 一年級下冊數(shù)學教案-綜合實踐 趣味拼擺| 青島版(五四學制)
- 學習2025年雷鋒精神六十二周年主題活動實施方案 (3份)-54
- 2025年河南測繪職業(yè)學院單招職業(yè)適應性測試題庫帶答案
- 2025年廣西安全工程職業(yè)技術(shù)學院單招職業(yè)技能測試題庫含答案
- 2025年廣東金融學院單招職業(yè)適應性測試題庫完整
- 2025年貴州航天職業(yè)技術(shù)學院單招職業(yè)技能測試題庫一套
- 2025福建省安全員考試題庫及答案
- 2025年度幼兒園教職工被辭退勞動權(quán)益保護合同
- 2025年度幼兒園實習教師培養(yǎng)與就業(yè)服務協(xié)議
- 安徽華星化工有限公司殺蟲單廢鹽資源化處理項目環(huán)境影響報告書
- 平安健康文明主題班會
- 消防工程管理辦法附流程圖
- 雨水管道中粗砂回填
- 金庸群俠傳x最完整攻略(實用排版)
- 團意操作流程詳解課件
- SH/T 0356-1996燃料油
- GB/T 9846.4-2004膠合板第4部分:普通膠合板外觀分等技術(shù)條件
- GB/T 17836-1999通用航空機場設備設施
- GB/T 13012-2008軟磁材料直流磁性能的測量方法
- 2023年全國高中生物聯(lián)賽競賽試題和答案
評論
0/150
提交評論