核酸與蛋白質(zhì)序列分析-1.ppt_第1頁
核酸與蛋白質(zhì)序列分析-1.ppt_第2頁
核酸與蛋白質(zhì)序列分析-1.ppt_第3頁
核酸與蛋白質(zhì)序列分析-1.ppt_第4頁
核酸與蛋白質(zhì)序列分析-1.ppt_第5頁
已閱讀5頁,還剩32頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2020 2 12 1 鄭連友E mail lianyouzh 吉林大學(xué)藥學(xué)院基因工程教研室 生物信息學(xué) 2020 2 12 2 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 第六章 核酸和蛋白質(zhì)序列分析 2020 2 12 3 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 第一節(jié) 核酸序列分析 三 DNA序列分析基礎(chǔ)四 DNA序列分析方法 2020 2 12 4 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 三 DNA序列分析基礎(chǔ) 1 DNA序列分析內(nèi)容DNA序列分析 基因序列 基因表達(dá)調(diào)控信息尋找基因牽涉到兩個(gè)方面的工作 識(shí)別與基因相關(guān)的特殊序列信息預(yù)測(cè)基因的編碼區(qū)域結(jié)合兩個(gè)方面的結(jié)果確定基因的位置和結(jié)構(gòu)基因表達(dá)調(diào)控信息隱藏在基因的上游區(qū)域 在組成上具有一定的特征 可以通過序列分析識(shí)別這些特征 2020 2 12 5 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 2 DNA序列功能位點(diǎn)在DNA序列中 除了基因之外 還包含許多其它信息 這些信息大部分與核酸的結(jié)構(gòu)特征相關(guān)聯(lián) 通常決定了DNA與蛋白質(zhì)或者DNA與RNA的相互作用 存放這些信息的DNA片段稱為功能位點(diǎn) 如啟動(dòng)子 Promoter 基因終止序列 Terminatorsequence 剪切位點(diǎn) Splicesite 等 2020 2 12 6 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 功能位點(diǎn) functionalsite 與特定功能相關(guān)的位點(diǎn) 是生物分子序列上的一個(gè)功能單元 或者是生物分子序列上一個(gè)較短的片段 功能位點(diǎn)又稱為功能序列 functionalsequence 序列模式 motif 信號(hào) signal 等 核酸序列中的功能位點(diǎn)包括轉(zhuǎn)錄因子結(jié)合位點(diǎn) 轉(zhuǎn)錄剪切位點(diǎn) 翻譯起始位點(diǎn)等 在蛋白質(zhì)序列分析中 常使用序列模式這個(gè)名詞 蛋白質(zhì)的序列模式往往與蛋白質(zhì)結(jié)構(gòu)域或者作用部位有關(guān) 2020 2 12 7 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 DNA序列功能位點(diǎn)示意圖 2020 2 12 8 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 基因組序列中若干個(gè)相鄰的功能位點(diǎn)組合形成功能區(qū)域 functionalregion 功能位點(diǎn)分析的任務(wù) 發(fā)現(xiàn)功能位點(diǎn)特征 識(shí)別功能位點(diǎn) 2020 2 12 9 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 利用共有序列搜索功能位點(diǎn)共有序列 consensus 又稱一致性片段共有序列是關(guān)于功能位點(diǎn)特征的描述 它描述了功能位點(diǎn)每個(gè)位置上核苷酸進(jìn)化的保守性例如 NTATN利用共有序列進(jìn)行功能位點(diǎn)分析牽涉到兩個(gè)方面的問題 如何構(gòu)造共有序列如何利用共有序列在給定的核酸序列上搜索尋找功能位點(diǎn) 并計(jì)算所找到的功能位點(diǎn)的可靠性 2020 2 12 10 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 3 基因識(shí)別 基因識(shí)別是生物信息學(xué)領(lǐng)域里的一個(gè)重要研究?jī)?nèi)容基因識(shí)別問題 在近幾年受到廣泛的重視 當(dāng)人類基因組研究進(jìn)入一個(gè)系統(tǒng)測(cè)序階段時(shí) 急需可靠自動(dòng)的基因組序列翻譯解釋技術(shù) 以處理大量已測(cè)定的但未知功能或未經(jīng)注釋的DNA序列 2020 2 12 11 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 1 原核基因識(shí)別特點(diǎn) 長(zhǎng)開放閱讀框 高基因 簡(jiǎn)單的基因結(jié)構(gòu) 原核基因組中的GC含量高重點(diǎn)在于識(shí)別編碼區(qū)域 2020 2 12 12 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 非翻譯區(qū)域 untranslatedregions UTR 編碼區(qū)域兩端的DNA 有一部分被轉(zhuǎn)錄 但是不被翻譯 這一部分稱為非翻譯區(qū)域5 UTR 基因上游區(qū)域的非翻譯區(qū)域3 UTR 基因下游區(qū)域的非翻譯區(qū)域 2020 2 12 13 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 對(duì)于任何給定的核酸序列 單鏈DNA或mRNA 根據(jù)密碼子的起始位置 可以按照三種方式進(jìn)行解釋 例如 序列ATTCGATCGCAA 1 ATTCGATCGCAA 2 ATTCGATCGCAA 3 ATTCGATCGCAA這三種閱讀順序稱為閱讀框 readingframes 2020 2 12 14 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 一個(gè)開放閱讀框 ORF openreadingframe 是一個(gè)沒有終止編碼的密碼子序列 原核基因識(shí)別任務(wù)的重點(diǎn)是識(shí)別開放閱讀框 或者說識(shí)別長(zhǎng)的編碼區(qū)域 2020 2 12 15 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 基于基因密碼子特性的識(shí)別方法辨別編碼區(qū)域與非編碼區(qū)域的一種方法是檢查終止密碼子的出現(xiàn)頻率終止密碼子出現(xiàn)的期望次數(shù)為 每21個(gè) 64 3 密碼子出現(xiàn)一次終止密碼子 2020 2 12 16 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 基本思想 如果能夠找到一個(gè)比較長(zhǎng)的序列 其相應(yīng)的密碼子序列不含終止密碼子 則這段序列可能就是編碼區(qū)域 基本算法 掃描給定的DNA序列 在三個(gè)不同的閱讀框中尋找較長(zhǎng)的ORF 遇到終止密碼子以后 回頭尋找起始密碼子 這種算法過于簡(jiǎn)單 不適合于處理短的ORF或者交疊的ORF 2020 2 12 17 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 真核基因遠(yuǎn)比原核基因復(fù)雜 一方面 真核基因的編碼區(qū)域是非連續(xù)的 編碼區(qū)域被分割為若干個(gè)小片段 另一方面 真核基因具有更加豐富的基因調(diào)控信息 這些信息主要分布在基因上游區(qū)域 2 真核基因識(shí)別問題 2020 2 12 18 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 真核基因結(jié)構(gòu)示意圖 真核基因遠(yuǎn)比原核基因復(fù)雜 一方面 真核基因的編碼區(qū)域是非連續(xù)的 編碼區(qū)域被分割為若干個(gè)小片段 另一方面 真核基因具有更加豐富的基因調(diào)控信息 這些信息主要分布在基因上游區(qū)域 2020 2 12 19 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 真核基因識(shí)別基本思路找出基因兩端的功能區(qū)域 轉(zhuǎn)錄啟動(dòng)區(qū) 終止區(qū)在啟動(dòng)區(qū)下游位置尋找翻譯起始密碼子識(shí)別轉(zhuǎn)錄剪切位點(diǎn)剪切給體位點(diǎn)剪切接受體位點(diǎn) 2020 2 12 20 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 真核基因識(shí)別的主要方法從頭算方法 或基于統(tǒng)計(jì)的方法 根據(jù)蛋白質(zhì)編碼基因的一般性質(zhì)和特征進(jìn)行識(shí)別 通過統(tǒng)計(jì)值區(qū)分外顯子 內(nèi)含子及基因間區(qū)域 基于同源序列比較的方法利用數(shù)據(jù)庫中現(xiàn)有與基因有關(guān)的信息 如EST序列 蛋白質(zhì)序列 通過同源比較 幫助發(fā)現(xiàn)新基因 2020 2 12 21 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 四 DNA序列分析方法 2020 2 12 22 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 1 遮蔽重復(fù)序列 在進(jìn)行任何真核生物序列的基因辨識(shí)分析之前 最好把散布和簡(jiǎn)單的重復(fù)序列找出來并從序列中除去 雖然這些重復(fù)序列可能正好覆蓋了由RNA聚合酶 轉(zhuǎn)錄的部分區(qū)域 它們幾乎不會(huì)覆蓋啟動(dòng)子和外顯子編碼區(qū) 這樣 這些重復(fù)序列的定位能為其它基因特征的定位提供重要的反面信息 重復(fù)序列還常常會(huì)攪亂其它分析 特別是在數(shù)據(jù)庫搜索中 2020 2 12 23 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 所用程序 1 CENSORhttp www girinst org censor 2 Repeatmaskerhttp www repeatmasker org 2020 2 12 24 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 2 開放閱讀框分析 ORF 1 http www expasy org tools dna html 2 http www ncbi nlm nih gov gorf 3 http exon gatech edu GeneMark 2020 2 12 25 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 3 數(shù)據(jù)庫搜索TBLSTNhttp www ncbi nlm nih gov blast 2020 2 12 26 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 4 啟動(dòng)子分析 2020 2 12 27 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 1 啟動(dòng)子查詢http www epd isb sib ch 2020 2 12 28 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 2 啟動(dòng)子分析http thr cit nih gov molbio proscan 2020 2 12 29 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 5 內(nèi)含子剪接位點(diǎn) 2020 2 12 30 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 1 GRAIL http compbio ornl gov Grail 1 3 5 內(nèi)含子剪接位點(diǎn) 2020 2 12 31 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 2 SIM4 http pbil univ lyon1 fr sim4 php 2020 2 12 32 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 6 CpG島分析 CpG島 是指哺乳動(dòng)物基因啟動(dòng)子及其附近大量的CpG位點(diǎn) CpG表示指C G以磷酸基連接 事實(shí)上基因組中60 90 的CpG都被甲基化 未甲基化的CpG成簇地組成CpG島 位于結(jié)構(gòu)基因啟動(dòng)子的核心序列和轉(zhuǎn)錄起始點(diǎn) 有實(shí)驗(yàn)證明超甲基化阻遏轉(zhuǎn)錄的進(jìn)行 2020 2 12 33 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 CpG島工具用來查找一條DNA序列中CpG島 使用Gardiner GardenandFrommer 1987 描述的方法 用一個(gè)200bp的窗口移過序列 每次移一個(gè)堿基對(duì) 進(jìn)行計(jì)算 CpG島定義為Y值大于0 6并且GC含量大于50 的200bp序列區(qū)域 只有符合以上標(biāo)準(zhǔn) 才輸入結(jié)果 CpG島經(jīng)常在脊椎動(dòng)物基因的5 區(qū)域發(fā)現(xiàn) 因此 這個(gè)程序可用來在基因組序列中查找潛在的基因 2020 2 12 34 生物信息學(xué) 第六章 核酸和蛋白質(zhì)序列分析 1 WEBGENE的CpG分析r it cg

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論