蛋白質(zhì)二級結(jié)構(gòu)+預(yù)測軟件課件_第1頁
蛋白質(zhì)二級結(jié)構(gòu)+預(yù)測軟件課件_第2頁
蛋白質(zhì)二級結(jié)構(gòu)+預(yù)測軟件課件_第3頁
蛋白質(zhì)二級結(jié)構(gòu)+預(yù)測軟件課件_第4頁
蛋白質(zhì)二級結(jié)構(gòu)+預(yù)測軟件課件_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件

蛋白質(zhì)二級結(jié)構(gòu)的預(yù)測通常被認為是蛋白結(jié)構(gòu)預(yù)測的第一步,二級結(jié)構(gòu)是指α螺旋和β折疊等規(guī)則的蛋白質(zhì)局部結(jié)構(gòu)元件。不同的氨基酸殘基對于形成不同的二級結(jié)構(gòu)元件具有不同的傾向性。按蛋白質(zhì)中二級結(jié)構(gòu)的成分可以把球形蛋白分為全α蛋白、全β蛋白、α+β蛋白和α/β蛋白等四個折疊類型。預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的算法大多以已知三維結(jié)構(gòu)和二級結(jié)構(gòu)的蛋白質(zhì)為依據(jù),用過人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等技術(shù)構(gòu)建預(yù)測方法。目前較為常用的幾種方法有:PHD、PSIPRED、Jpred、PREDATOR、PSA,其中最常用的是PHD。PHD結(jié)合了許多神經(jīng)網(wǎng)絡(luò)的成果,每個結(jié)果都是根據(jù)局部序列上下文關(guān)系和整體蛋白質(zhì)性質(zhì)(蛋白質(zhì)長度、氨基酸頻率等)來預(yù)測殘基的二級結(jié)構(gòu)。那么,最終的預(yù)測是這些神經(jīng)網(wǎng)絡(luò)每個輸出的算術(shù)平均值。這種結(jié)合方案被稱為陪審團決定法(jurydecision)或者稱為所有勝利者(winner-take-all)法。PHD被認為是二級結(jié)構(gòu)預(yù)測的標(biāo)準(zhǔn)??偟膩碚f,二級結(jié)構(gòu)預(yù)測仍是未能完全解決的問題,一般對于α螺旋預(yù)測精度較好,對β折疊差些,而對除α螺旋和β折疊等之外的無規(guī)則二級結(jié)構(gòu)則效果很差。PredictProtein在預(yù)測中應(yīng)用了略為不同的方法。首先,蛋白質(zhì)序列被作為查詢序列在SWISS-PROT庫中搜索相似的序列。當(dāng)相似的序列被找到后,一個名為MaxHom的算法被用來進行一次基于特征簡圖的多序列比對。MaxHom用迭代的方法來構(gòu)造比對:當(dāng)?shù)谝淮嗡阉鱏WISS-PROT后,所有找到的序列與查詢序列進行比對,并構(gòu)造出一個比對后的特征簡圖。然后,這個簡圖又被用來在SWISS-PROT中搜索新的相似序列。由MaxHom產(chǎn)生的多序列比對隨后被置入一個神經(jīng)網(wǎng)絡(luò),用PHD的方法進行預(yù)測。SOPMA:位于法國里昂的CNRS(CentreNationaldelaRechercheScientifique)使用獨特的方法進行蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。它不是用一種,而是5種相互獨立的方法進行預(yù)測,并將結(jié)果匯集整理成一個“一致預(yù)測結(jié)果”。這5種方法包括:Garnier-Gibrat-Robson(GOR)方法、Levin同源預(yù)測方法、雙重預(yù)測方法、PHD方法和CNRS自己的SOPMA方法。簡單的說,SOPMA這種自優(yōu)化的預(yù)測方法建立了已知二級結(jié)構(gòu)序列的次級數(shù)據(jù)庫,庫中的每個蛋白質(zhì)都經(jīng)過基于相似性的二級結(jié)構(gòu)預(yù)測。然后用次級庫中得到的信息去對查詢序列進行二級結(jié)構(gòu)預(yù)測。其它特殊局部結(jié)構(gòu)的預(yù)測軟件其它特殊局部結(jié)構(gòu)包括膜蛋白的跨膜螺旋、信號肽、卷曲螺旋(CoiledCoils)等,具有明顯的序列特征和結(jié)構(gòu)特征,也可以用計算方法加以預(yù)測。卷曲螺旋COILS:卷曲螺旋預(yù)測方法,將序列與已知的平行雙鏈卷曲螺旋數(shù)據(jù)庫進行比較,得到相似性得分,并據(jù)此算出序列形成卷曲螺旋的概率。COILS算法將查詢序列在一個由已知包含卷曲螺旋蛋白結(jié)構(gòu)的數(shù)據(jù)庫中進行搜索。程序也將查詢序列與包含球狀蛋白序列的PDB次級庫進行比較,并根據(jù)兩個庫搜索得分的不同決定輸入序列形成卷曲螺旋的概率。COILS可以下載到VAX/VMS系統(tǒng)上使用,也可通過簡單的Web界面使用。MacStripe:一個基于Macintoshi系統(tǒng)的應(yīng)用程序,使用了Lupas的COILS的預(yù)測方法,能輸出較簡單的預(yù)測結(jié)果。MacStripe要求輸入文件為FASTA、PIR或其它普遍文件格式,并象COILS一樣產(chǎn)生一個圖形文件,包含形成卷曲螺旋的概率,以及用柱狀圖顯示七連體重復(fù)模式的連續(xù)性??缒^(qū)域TMpred:預(yù)測蛋白質(zhì)的跨膜區(qū)段和在膜上的取向,它根據(jù)來自SWISS-PROT的跨膜蛋白數(shù)據(jù)庫Tmbase,利用跨膜結(jié)構(gòu)區(qū)段的數(shù)量、位置以及側(cè)翼信息,通過加權(quán)打分進行預(yù)測。Tmpred的Web界面十分簡明。用戶將單字符序列輸入查詢序列文本框,并可以指定預(yù)測時采用的跨膜螺旋疏水區(qū)的最小長度和最大長度。輸出結(jié)果包含四個部分:可能的跨膜螺旋區(qū)、相關(guān)性列表、建議的跨膜拓撲模型以及代表相同結(jié)果的圖。基于組成的蛋白質(zhì)識別預(yù)測

AACompIdentAACompSimPROPSEARCH

二級結(jié)構(gòu)和折疊類預(yù)測

nnpredict

PredictproteinSOPMA

SSPRED

特殊結(jié)構(gòu)或結(jié)構(gòu)預(yù)測

COILS

MacStripe

與核酸序列一樣,蛋白質(zhì)序列的檢索往往是進行相關(guān)分析的第一步,由于數(shù)據(jù)庫和網(wǎng)絡(luò)技校術(shù)的發(fā)展,蛋白序列的檢索是十分方便,將蛋白質(zhì)序列數(shù)據(jù)庫下載到本地檢索和通過國際互聯(lián)網(wǎng)進行檢索均是可行的。

由NCBI檢索蛋白質(zhì)序列

可聯(lián)網(wǎng)到:“”進行檢索。

利用SRS系統(tǒng)從EMBL檢索蛋白質(zhì)序列

聯(lián)網(wǎng)到:”,可利用EMBL的SRS系統(tǒng)進行蛋白質(zhì)序列的檢索。通過EMAIL進行序列檢索

當(dāng)網(wǎng)絡(luò)不是很暢通時或并不急于得到較多數(shù)量的蛋白質(zhì)序列時,可采用EMAIL方式進行序列檢索。

蛋白質(zhì)基本性質(zhì)分析

蛋白質(zhì)序列的基本性質(zhì)分析是蛋白質(zhì)序列分析的基本方面,一般包括蛋白質(zhì)的氨基酸組成,分子質(zhì)量,等電點,親水性,和疏水性、信號肽,跨膜區(qū)及結(jié)構(gòu)功能域的分析等到。蛋白質(zhì)的很多功能特征可直接由分析其序列而獲得。例如,疏水性圖譜可通知來預(yù)測跨膜螺旋。同時,也有很多短片段被細胞用來將目的蛋白質(zhì)向特定細胞器進行轉(zhuǎn)移的靶標(biāo)(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白質(zhì)將被引向內(nèi)質(zhì)網(wǎng)。WEB中有很多此類資源用于幫助預(yù)測蛋白質(zhì)的功能。

跨膜區(qū)分析

有多種預(yù)測跨膜螺旋的方法,最簡單的是直接,觀察以20個氨基酸為單位的疏水性氨基酸殘基的分布區(qū)域,但同時還有多種更加復(fù)雜的、精確的算法能夠預(yù)測跨膜螺旋的具體位置和它們的膜向性。這些技術(shù)主要是基于對已知跨膜螺旋的研究而得到的。自然存在的跨膜螺旋Tmbase數(shù)據(jù)庫,可通過匿名FTP獲得(),參見表一

資源名稱網(wǎng)址說明

TMPRED基于對tmpred數(shù)據(jù)庫的統(tǒng)計分析PHDhtm...tprotein.htmlMEMSAT微機版本

蛋白質(zhì)序列含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位于膜的錨定蛋白或者離子通道蛋白等,從而,含有跨膜區(qū)的蛋白質(zhì)往往和細胞的功能狀態(tài)密切相關(guān)?!盎颉啊?/p>

卷曲螺旋分析

另一個能夠直接從序列中預(yù)測的功能motif是α-螺旋的卷曲排列方式。在這種結(jié)構(gòu)中,兩種螺旋通過其疏水性界面相互纏在一起形成一個十分穩(wěn)定的結(jié)構(gòu)。

蛋白質(zhì)卷曲的相關(guān)資源

資源網(wǎng)址

coiled-coil

蛋白質(zhì)功能預(yù)測

基于序列同源性分析的蛋白質(zhì)功能預(yù)測

到少有80個氨基酸長度范圍內(nèi)具有25%以上序列一致性才提示可能的顯著性意義。最快的工具如BlastP能很容易地發(fā)現(xiàn)顯著性片段,而無需使用十分耗時的BLITZ軟件。

基于NCBI/BLAST軟件的蛋白序列同源性分析

類似于核酸序列同源性分析,用戶直接將待分析的蛋白質(zhì)序列輸入NCBI/BLAST(),選擇程序BLASTP就可網(wǎng)上分析?;赪U/BLAST2軟件進行分析

華盛頓大學(xué)的BLAST軟件(dove.embl-heidelberg.dl/blast2)也可進行蛋白質(zhì)序列的同源性分析。

InterProScan綜合分析網(wǎng)站

InterProScan是EBI開發(fā)的一個集成了蛋白質(zhì)結(jié)構(gòu)域和功能位點的數(shù)據(jù)庫,其中把SWISS-PROT,TrEMBL.PROTSITE.PRINTS.PFAM.ProDom等數(shù)據(jù)庫提供的蛋白質(zhì)序列中的各種局域模式,如結(jié)構(gòu)域,motif等信息統(tǒng)一起來,提供了一個較為全央的分析工具。

蛋白質(zhì)的結(jié)構(gòu)功能域分析

簡單模塊構(gòu)架搜索工具(simplemodulararchitectureresearchtool,SMART)一個較好的蛋白質(zhì)結(jié)構(gòu)功能域的數(shù)據(jù),可用于蛋白質(zhì)結(jié)構(gòu)功能域的分析,所得到的結(jié)構(gòu)域同時提供相關(guān)的資源的鏈接

蛋白質(zhì)結(jié)構(gòu)預(yù)測

PDB數(shù)據(jù)庫

蛋白質(zhì)基本立體結(jié)構(gòu)數(shù)據(jù)庫(PDB,)其中有大量工具用于查看PDB數(shù)據(jù)庫中的結(jié)構(gòu),如rasmol,可用于顯于出蛋白質(zhì)的空間結(jié)構(gòu),下載地址:)

NRL-3D數(shù)據(jù)庫

是所有已知結(jié)構(gòu)蛋白質(zhì)的數(shù)據(jù)庫,可用于查詢蛋白序列時行相似性分析以確定其結(jié)構(gòu)

ISSD數(shù)據(jù)庫

蛋白質(zhì)序列數(shù)據(jù)庫,其每個條目包含一個基因的編碼序列,同相應(yīng)的氨基酸序列對比,并給出相應(yīng)的多肽鏈結(jié)構(gòu)數(shù)據(jù)。

HSSP數(shù)據(jù)庫

是根據(jù)同源性導(dǎo)出的蛋白質(zhì)二級結(jié)構(gòu)數(shù)據(jù)庫,每一條PDB項目都有一個對應(yīng)的HSSP文件,

蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫

對已知蛋白質(zhì)三維結(jié)構(gòu)進行手工分類得到的數(shù)據(jù)庫,位于劍橋的站點也提供BLAST檢索服務(wù)

MMDB蛋白質(zhì)分子模型數(shù)據(jù)庫

是ENTREZ檢索工具所使用的三維結(jié)構(gòu)數(shù)據(jù)庫,以ASN格式反蚋的PDB中的結(jié)構(gòu)和序列數(shù)據(jù)。NCBI同時提供一個配套的三維結(jié)構(gòu)顯示程序的Cn3D,

Dali/FSSP數(shù)據(jù)庫

基于PDB數(shù)據(jù)庫中現(xiàn)有的蛋白質(zhì)三維結(jié)構(gòu),用自動結(jié)構(gòu)對比程序Dali比較而形成的折疊單元和家庭分類庫。

蛋白質(zhì)二級結(jié)構(gòu)預(yù)測

基于序列進行蛋白質(zhì)二級結(jié)構(gòu)方面已有了大量文獻描述,本質(zhì)上,這些研究可被分為兩大類:基于單一序列的分析和基于多重序列對齊的分析。

文獻報道PHD程序是目前此方面的最好程序,提供了從二級結(jié)構(gòu)到折疊方面分析的多種資源。其網(wǎng)址為,也可通過email:predictprotein@embl-heidelberg.de進行數(shù)據(jù)分析。蛋白質(zhì)三級結(jié)構(gòu)預(yù)測

蛋白質(zhì)同源家庭的分析對于確立物種之間的親緣關(guān)系和預(yù)測新蛋白質(zhì)序列的功能有重要意義,同源蛋白質(zhì)(homolog)進一步劃分為直系同源(ortholog)和旁系同源(paralog),前者指不同物種中具有相同功能和共同起源的基因,后者則指在同一物種內(nèi)具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌紅蛋白。

蛋白質(zhì)分類數(shù)據(jù)庫(ProtoMap)

是對SWISS-PROT數(shù)據(jù)庫中的全部蛋白質(zhì)由計算機自動時行層次分類,把相關(guān)者聚集分極所得到的數(shù)據(jù)庫。

蛋白質(zhì)序列多重對齊分析及進化分析

如果發(fā)現(xiàn)一個未知蛋白質(zhì)序列和較多不同和種屬或同一種屬的蛋白質(zhì)序列具有較高的同源性(大于30%)那么提示待分析的蛋白質(zhì)序列可能是相應(yīng)家族的成員,從而可從分子時化的角度對蛋白質(zhì)序列進行綜合分析。

常用在線蛋白工具

BCMSearchLauncher

蛋白序列二級結(jié)構(gòu)預(yù)測綜合站點,從此出發(fā),輸入蛋白序列,可以根據(jù)需要,使用各種在線預(yù)測工具,包括Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMpred、SOUSI、Paircoil、ProteinHydrophilicity/HydrophobicitySearch、SOPM,使用十分方便。DAS

蛋白跨膜預(yù)測服務(wù)器、輸入蛋白序列,預(yù)測跨膜區(qū)域。

TopPred2

斯德哥爾摩大學(xué)理論化學(xué)蛋白預(yù)測服務(wù)器提供的膜蛋白拓撲學(xué)預(yù)測Topologypredictionofmembraneproteins在線工具

SOSUI

東京農(nóng)業(yè)科技大學(xué)(TokyoUniversityofAgricultureandTechnology)提供的膜蛋白分類和二級結(jié)構(gòu)預(yù)測在線工具。

PSIpred-MEMSAT2

本蛋白結(jié)構(gòu)預(yù)測服務(wù)器允許你提交一個蛋白序列,進行二級結(jié)構(gòu)預(yù)測與跨膜拓樸結(jié)構(gòu)預(yù)測,并將結(jié)果用EMAIL提供給您。

HMMTOP

預(yù)測蛋白序列的跨膜螺旋與拓撲結(jié)構(gòu)服務(wù)器

TMpred

預(yù)測蛋白序列跨膜區(qū)

TMHMM

預(yù)測蛋白的跨膜螺旋

ThePredictProteinserver

提供蛋白數(shù)據(jù)庫查詢,預(yù)測蛋白各種結(jié)構(gòu)的服務(wù)

SMART

提供蛋白序列,在結(jié)構(gòu)域數(shù)據(jù)庫中查詢,顯示出其結(jié)構(gòu)域及跨膜區(qū)等

SPLIT

膜蛋白二級結(jié)構(gòu)預(yù)測服務(wù)器

PRED-TMR

提供基于SwissProt數(shù)據(jù)庫統(tǒng)計分析的預(yù)測蛋白跨膜片段的服務(wù)

CoPreThi

基于INTERNET的JAVA程序,預(yù)測蛋白的跨膜區(qū)

TMAP

提供預(yù)測蛋白跨膜片段的服務(wù)

multalin

蛋白序列對照服務(wù)器,比較幾條蛋白序列的結(jié)構(gòu)。

ProteinSequenceAnalysis

巴斯德研究所提供的常用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論