基因組研究-功能基因分析課件_第1頁
基因組研究-功能基因分析課件_第2頁
基因組研究-功能基因分析課件_第3頁
基因組研究-功能基因分析課件_第4頁
基因組研究-功能基因分析課件_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、11基因組學(xué)研究功能基因分析現(xiàn)代生物學(xué)實(shí)驗(yàn)技術(shù)1大家好2要求:掌握常用的序列比對工具能構(gòu)建進(jìn)化樹能夠預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)、疏水區(qū)、跨膜區(qū)等能夠進(jìn)行簡單的同源建模分析了解KEGG數(shù)據(jù)庫的檢索2大家好3序列比對BLAST應(yīng)用3大家好4 同源性(homology): 指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具有共同祖先的結(jié)論,屬于質(zhì)的判斷。 A和B的關(guān)系上,是同源序列,或者非同源序列兩種關(guān)系。而說A和B的同源性為80都是不科學(xué)的。相似性(similarity): 是指一種直接的數(shù)量關(guān)系,如部分相同或相似的百分比或其它一些合適的度量。比如說,A序列和B序列的相似性是80,或者4/5。生物序列的同源性

2、序列間相似性越高,它們是同源序列的可能性就更高4大家好5Blast程序評價序列相似性的兩個數(shù)據(jù)Score:使用打分矩陣對匹配的片段進(jìn)行打分,這是對各對氨基酸殘基(或堿基)打分求和的結(jié)果,一般來說,匹配片段越長、 相似性越高,則Score值越大。E value:在相同長度的情況下,兩個氨基酸殘基(或堿基)隨機(jī)排列的序列進(jìn)行打分,得到上述Score值的概率的大小。E值越小表示隨機(jī)情況下得到該Score值的可能性越低。我們在獲得一個Blast結(jié)果時需要看這兩個指標(biāo)。 如果Blast獲得的目標(biāo)序列的Score值越高并且E-value越低表明結(jié)果越可信,反之越不可信.5大家好6主要的BLAST程序(功能

3、)6大家好71.登陸blast主頁組裝的基因組序列庫基本blast特定的BLAST所有的BLAST基因數(shù)據(jù)庫7大家好88核酸數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對蛋白質(zhì)序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列蛋白質(zhì)數(shù)據(jù)庫中比對核酸序列核酸數(shù)據(jù)庫中比對蛋白質(zhì)序列8大家好9Fasta格式文件9大家好1010什么是fasta格式?怎么建立?新建一個txt文本文件,命名如: bph.txtFasta的格式: 序列名稱序列10大家好1111大家好12121.序列信息部分填入查詢(query)的序列序列范圍(默認(rèn)全部)選擇搜索數(shù)據(jù)庫如果接受其他參數(shù)默認(rèn)設(shè)置,點(diǎn)擊開始搜索12大家好1313去冗余GenBank編碼序列

4、PDB + SwissProt + PIR + PRF13大家好14常用的檢索數(shù)據(jù)庫1414大家好15以下列蛋白序列為例,進(jìn)行BLAST搜索: P1MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLD

5、RLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQA15大家好1616大家好1717大家好1818基因名來源物種一致程度,登錄號18大家好19所選序列下載序列19大家好20Cluster比對20大家好21Clustalx的工作界面(多序列比對模式)21大家好2

6、2Clustal的工作原理Clustal輸入多個序列快速的序列兩兩比對,計(jì)算序列間的距離,獲得一個距離矩陣。鄰接法(NJ)構(gòu)建一個樹根據(jù)進(jìn)化樹,漸進(jìn)比對多個序列。22大家好23Clustalx的輸出結(jié)果.aln格式文件這個文件是默認(rèn)輸出,可以轉(zhuǎn)換成各種格式,而且很多軟件都支持這種格式。.dnd格式文件引導(dǎo)樹。就是根據(jù)兩兩序列相似值構(gòu)建的一個指導(dǎo)后面多重聯(lián)配的啟發(fā)樹不能做進(jìn)化分析。進(jìn)化分析要考慮的所有同源位點(diǎn)的一個綜合效應(yīng),因此應(yīng)該用.aln格式文件專門做進(jìn)化分析。23大家好24多序列比對實(shí)例輸入文件的格式(fasta):KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTND

7、MK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK.KPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLENDAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD1CSN HYKVGRRIGEGSFGVIFEGTNLLNN不留空格24大家好25第一步:輸入序列文件。25大家好2626大家好2727大家好28建議用treeview 打開outtree,然后可以編輯28大家好2929大家好30建樹軟件-mega30大家好31MEGA5可以識別fasta格式文件將17-RNASE1.fasta

8、.txt重命名為17-RNASE1.fasta建樹軟件-mega31大家好3232大家好33ClustalW參數(shù)設(shè)置33大家好34多序列聯(lián)配后結(jié)果34大家好35以.meg格式保存結(jié)果35大家好36回到MEGA主窗口打開所保存的文件(.meg)36大家好37點(diǎn)擊按鈕打開文件窗口37大家好38顯示保守位點(diǎn) 顯示變異位點(diǎn)38大家好39回到MEGA主窗口構(gòu)建進(jìn)化樹當(dāng)前打開的文件選擇鄰接法建樹39大家好40選擇Bootstrap檢驗(yàn)40大家好4141大家好42蛋白質(zhì)二級結(jié)構(gòu)預(yù)測42大家好43蛋白質(zhì)結(jié)構(gòu)為什么如此重要的?氨基酸序列只有折疊成特定的空間結(jié)構(gòu)才具有相應(yīng)的活性和相應(yīng)的生物學(xué)功能DNA 序列蛋白質(zhì)

9、序列蛋白質(zhì)結(jié)構(gòu)轉(zhuǎn)錄&翻譯折疊43大家好44為什么要研究蛋白質(zhì)結(jié)構(gòu)?生物體中許多重要的功能由蛋白質(zhì)完成分析蛋白質(zhì)結(jié)構(gòu)、功能及其關(guān)系是蛋白質(zhì)組計(jì)劃中的一個重要組成部分分析蛋白質(zhì)結(jié)構(gòu)有助于藥物設(shè)計(jì)研究有助于了解蛋白質(zhì)相互作用,這對于生物學(xué)、醫(yī)學(xué)和藥學(xué)都是非常重要44大家好45蛋白質(zhì)二級結(jié)構(gòu)-helix (30-35%)-螺旋-sheet / -strand (20-25%)-折疊Coil (40-50%) 無規(guī)則卷曲Loop 環(huán)-turn -轉(zhuǎn)角45大家好4646蛋白質(zhì)3D 結(jié)構(gòu)螺旋折疊環(huán)或轉(zhuǎn)角轉(zhuǎn)角或卷曲46大家好4747大家好48JPred預(yù)測結(jié)果螺旋折疊48大家好49二級結(jié)構(gòu)預(yù)測網(wǎng)站PHDJPR

10、EDPSIPREDNNPREDICTChou and Fassman49大家好50預(yù)測蛋白質(zhì)的理化性質(zhì)50大家好51部分預(yù)測工具Compute pI/Mw(ExPASy)計(jì)算蛋白序列的等電點(diǎn)和分子量TGREASE計(jì)算蛋白質(zhì)序列疏水性工具TMHMM蛋白質(zhì)跨膜區(qū)預(yù)測More51大家好52等電點(diǎn),分子量預(yù)測工具52大家好5353大家好5454大家好55TGREASE疏水性參數(shù)高正值的氨基酸具有更大的疏水性而低負(fù)值的氨基酸具有更強(qiáng)的親水性55大家好5656大家好57蛋白質(zhì)跨膜區(qū)預(yù)測(TMHMM)57大家好5858大家好5959大家好60信號肽分析60大家好61SignalP軟件2.0版()對信號肽分析

11、。61大家好62信號肽的作用一般是幫助蛋白質(zhì)穿膜用的,跟蛋白質(zhì)的細(xì)胞定位有關(guān)系。62大家好63同源建模蛋白質(zhì)三維結(jié)構(gòu)預(yù)測63大家好643D預(yù)測是可能的,因?yàn)椋盒蛄行畔Q定三級結(jié)構(gòu)序列相似性 (30%)傾向于結(jié)構(gòu)相似性3D預(yù)測是必須的,因?yàn)椋篋NA 序列 蛋白質(zhì)序列 空間結(jié)構(gòu)64大家好6565大家好6666大家好67蛋白質(zhì)結(jié)構(gòu)預(yù)測方法:同源建模法(Comparative homology modeling)依據(jù)蛋白序列與已經(jīng)結(jié)構(gòu)蛋白比對信息構(gòu)建3D模型折疊識別法(Threading fold recognition)尋找與未知蛋白最合適的模板,進(jìn)行序列與結(jié)構(gòu)比對,最終建立結(jié)構(gòu)模型從頭預(yù)測法(Ab

12、 initio/de novo methods)根據(jù)序列本身來從頭預(yù)測蛋白質(zhì)結(jié)構(gòu)67大家好68同源建?;驹恚?1、一個蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。由一級結(jié)構(gòu),在理論上,足以獲取其二級、三級結(jié)構(gòu)。 2、三級結(jié)構(gòu)的保守型遠(yuǎn)遠(yuǎn)大于一級結(jié)構(gòu)的保守型。應(yīng)用限制:模板蛋白和目標(biāo)蛋白的序列一致性需要大于30%68大家好69SWISS-MODELSWISS-MODEL: 網(wǎng)址非專業(yè)人士應(yīng)用最為廣泛的一個在線建模服務(wù)器。特點(diǎn):簡單、自動化、對學(xué)術(shù)團(tuán)隊(duì)免費(fèi)。Automated mode:自動模式,可以稱為是最傻瓜的方式提交自己的氨基酸序列+郵箱即可適用:一致性較高時69大家好7070大家好71郵箱模

13、型命名氨基酸序列71大家好7272大家好73KEGG數(shù)據(jù)庫73大家好7474大家好75特點(diǎn)KEGG是一個整合了基因組、化學(xué)和系統(tǒng)功能信息的數(shù)據(jù)庫。把從已經(jīng)完整測序的基因組中得到的基因目錄與更高級別的細(xì)胞、物種和生態(tài)系統(tǒng)水平的系統(tǒng)功能關(guān)聯(lián)起來是KEGG數(shù)據(jù)庫的特色之一。人工創(chuàng)建了一個知識庫,這個知識庫是基于使用一種可計(jì)算的形式捕捉和組織實(shí)驗(yàn)得到的知識而形成的系統(tǒng)功能知識庫。它是一個生物系統(tǒng)的計(jì)算機(jī)模擬。與其他數(shù)據(jù)庫相比,KEGG 的一個顯著特點(diǎn)就是具有強(qiáng)大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關(guān)系,這樣可以使研究者能夠?qū)ζ渌芯康拇x途徑有一個直觀全面的了解。75大家好7676大家好7777大家好7878大家好79甲硫醇4-甲氧基-2-氧丁酸79大家好80某物質(zhì)的特定代謝途徑雙擊可以查到酶或基因的序列信息描述80大家好81實(shí)驗(yàn)內(nèi)容 實(shí)驗(yàn)材料: 根據(jù)導(dǎo)師給定的或?qū)嶒?yàn)室相關(guān)課題,選擇一種酶或基因,作為目標(biāo)序列;若沒有,從生化代謝途

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論