蛋白質工程課程論文__第1頁
蛋白質工程課程論文__第2頁
蛋白質工程課程論文__第3頁
蛋白質工程課程論文__第4頁
蛋白質工程課程論文__第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、海 南 大 學蛋白質工程 課程論文題 目: 蛋白質高級結構預測的研究進展 學 號: 20 0 8 0 4 0 4 B 0 67 姓 名: 徐仁強 年 級: 2008級 學 院: 材料與化工 系 別: 生物工程系 專 業(yè): 生物工程 授課教師: 唐敏 完成日期: 2011 年 6 月 23 日 蛋白質高級結構預測的研究進展徐仁強材料與化工學院 生物工程2班摘要:蛋白質的高級結構預測問題是當今理論生物物理學領域中的研究熱點,不僅具有重要的理論價值,而且,對于蛋白質的結構與功能關系、蛋白質分子的從頭設計、藥物靶蛋白的研究等都具有十分重要的理論指導意義。本文主要介紹了蛋白質結構預測的原理、主要方法和研

2、究進展。詳細地綜述了幾種主要方法,并簡單地介紹了蛋白質結構預測的幾個不同階段,提出了在蛋白質結構預測方面存在的一些困難,還總結了蛋白質結構預測的發(fā)展趨勢。關鍵詞: 結構預測 二級結構 三維結構 總結與展望1 結構預測方法分類蛋白質分子是由20種不同的氨基酸通過共價鍵連接而成的線性多肽鏈,然而天然的球狀蛋白質分子的水溶液中并不是一條走向無規(guī)的橙散肽鏈,每一種蛋白質在天然條件下都有自己特定的空間結構。由于蛋白質的功能與其空間結構密切相關,蛋白質分子空間結構的知識已成為深人了解該蛋白質如何行使其生物功能的先決條件。僅僅依靠氨基酸序列預測蛋白質的結構及折疊機制被稱為“第二遺傳密碼”1問題。其中,蛋白質

3、折疊的預測方法主要是依靠殘基物理化學性質構建經(jīng)驗性的能量函數(shù),如CHARM2,AMBER3來預測蛋白質結構。這類方法一般包括以下四個部分:1蛋白質的一種表示方式;2與表示方式相對應的能量函數(shù);3能搜索出最優(yōu)結構的算法:4評價預測結果的方法。大多數(shù)此類方法都將蛋白質的表示方式進行了簡化,如HP模型,HPNX模型,并且主要是對C原子、C原子、肽鏈以及側鏈的質心位置進行預測。每種蛋白質的表示方式,都有與之相對應的能量函數(shù),用于指導我們尋找最優(yōu)的結構。在構造能量函數(shù)時,往往需要運用序列與結構數(shù)據(jù)庫中的統(tǒng)計信息來優(yōu)化能量函數(shù)中不同相互作用力的權值參數(shù)。能量函數(shù)的選擇對成功的預測蛋白質結構是很重要的4。能

4、量函數(shù)大致分為兩類:(1以統(tǒng)計為基礎的能量函數(shù):(2以物理性質為基礎的能量函數(shù)。1.1 以統(tǒng)計為基礎的能量函數(shù)該類方法對已知結構的蛋白質進行統(tǒng)計分析,建立序列到結構的映射模型,進而對未知結構的蛋白質根據(jù)映射模型直接從氨基酸序列預測結構。映射模型可以是定性的,也可以是定量的。它是進行蛋白質結構預測較為成功的一類方法。這一類方法包括經(jīng)驗性方法、結構規(guī)律提取方法、同源模型化方法等。Simon5以蛋白質的折疊與局部序列的折疊傾向具有一致性這個結論為基礎,從己知的結構數(shù)據(jù)庫中找出了一個給定序列片段的結構集合,估計了該片段的局部結構傾向性,從而形成了Rosetta方法的基礎。預測的結構是將片段集通過Mon

5、te Carlo過程組合起來,其打分函數(shù)是與結構域序列匹配的貝葉斯概率。1.2 以物理性質為基礎的能量函數(shù)理論分析方法是通過理論計算(如分子力學、分子動力學計算進行結構預測。該類方法假設折疊后的蛋白質取能量最低的構象。從原則上來說,我們可以根據(jù)物理、化學原理,通過計算來進行結構預測。例如,Scheraga?!碧岢隽艘晕锢硇再|為基礎的簡化模型。模型對CHARMM(Chemistry at HARvard Macromolecular Mechanics的能量函數(shù)進行了簡化,僅考慮了其中二面角和范德華力對能量的貢獻。該方法將蛋白質按其物理性質進行了分類,簡化了蛋白質的表示方式,同時通過對權值的調整

6、區(qū)分了不同類殘基之間的相互作用力。最近幾年對蛋白質折疊的研究已經(jīng)得到了迅猛發(fā)展,但其預測精度還是不能達到一大連理工大學碩士學位論文些領域的精度要求,如藥物設計領域。但在現(xiàn)階段,低精度的結構預測對于基因組注解來說還是足夠的。一些學者已經(jīng)開始了這個領域的研究。Baker通過將預測結構與PDB中己知結構進行比較,找出了相關蛋白質,并類推出了待預測蛋白質的一些功能,總而言之蛋白質折疊的研究在今后幾年還會有很大的發(fā)展。2 蛋白質二級結構預測二級結構預測被認為是預測三維結構所經(jīng)過的一個階段,即首先從一級結構預測出二級結構,然后把二級結構堆積成最后的三維結構。但由于目前的二級結構無法很好地考慮蛋白質中的長程

7、相互作用,所以預測準確率一直較低,因此從一級結構經(jīng)過二級結構到三級結構的方法進展緩慢。但值得注意的事,近年來隨著多重序列比較方法及其它方法的發(fā)展,二級結構預測的準確性在某種特定條件下有了很大的提高,如在有已知結構的蛋白質同源序列中,可進行序列比對的情況下,一些多重序列匹配比較好的序列的預測準確性可以達到88以上9-12。總的來說,二級結構預測仍是未能完全解決的問題,一般對于螺旋預測的精度較好,對折疊差一些,對于除螺旋和折疊等之外的無規(guī)則二級結構則效果更差。在二級結構預測方面,主要有以下幾種不同的方法,即立體化學方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學方法和人

8、工神經(jīng)網(wǎng)絡方法。較傳統(tǒng)的方法如ChouFasman方法,GOR方法,Lim方法等等,這類方法總的特點是以原子間距,扭角或氫鍵模式作為根據(jù),但在實際預測中,影響蛋白質構象的因素很難考慮周全。Chou-Fasman方法和GOR方法屬于概率統(tǒng)計方法,這類方法的缺點在于沒有充分考慮殘基間的長程作用。相反的,Lim方法基于物理化學方法預測蛋白質的二級結構,這一方法不僅考慮到短程相互作用,即共價鍵作用和離子鍵作用等,而且在一定程度上考慮了長程相互作用,包括范德華力,氫鍵和疏水鍵相互作用,結果Lim方法較前兩個方法預測的精度要稍高一些。理論和實驗表明,不同的氨基酸殘基在不同的局域環(huán)境下具有形成特定二級結構的

9、傾向性,因此在一定程度上,二級結構的預測可以歸結為模式識別問題。二級結構預測的目標就是預測某一個片段中心的殘基是螺旋,還是折疊,或是其它。盡管人們己經(jīng)建立了許多二級結構的預測方法,但其準確率一般都不超過70。這很可能是由于這些方法大都只利用序列的局部信息,預測時考慮的局部序列長度一般小于20個氨基酸殘基。因為局部序列對二級結構的影響只占65左右,所以在預測蛋白質二級結構時,需要考慮全局信息和進化信息等。預測準確率超過70的第一個軟件是基于神經(jīng)網(wǎng)絡的PHD系統(tǒng),該系統(tǒng)除使用序列的局部信息外,張紅娟:基于非格點模型的蛋白質結構預測研究還使用了序列的進化信息。雖然二級結構預測的準確性有待提高,但其預

10、測結果仍然能提供許多結構信息,尤其是當結構尚未解出時更是如此。NnPredict用神經(jīng)網(wǎng)絡方法預二級結構,這個方法對全口蛋白能達到79的準確率。PrcdictProtein利用了多序列比對的剖面文件,其平均預測準確率達到72。SOPMA帶比對的自優(yōu)化預測方法,將幾種獨立二級結構預測方法匯集成“一致預測結果”,采用的二級結構預測方法包括GOR方法、Levin同源預測方法、雙重預測方法、PttD方法和SOPMA方法。實驗證明多種方法的綜合應用平均效果比單個方法更好。3 蛋白質三維結構預測三維結構預測是指從蛋白質的一級結構出發(fā)測定未知的蛋白質的空間結構,這是蛋白質結構預測的最終目標。目前還沒有一種預

11、測方法能得到比較滿意的結果,不過最近的發(fā)展十分令人鼓舞,產生了一些有一定作用的三維結構預測方法。并且隨著對蛋白質結構規(guī)律和折疊規(guī)律的進一步認識,蛋白質三維結構預測已經(jīng)轉變?yōu)槿绾斡行У乃阉鳂嬒罂臻g和如何區(qū)分出天然結構和錯誤結構的問題。x射線晶體衍射方法和多維核磁共振技術是目前測定蛋白質結構的主要方法,但實驗方法耗資耗時,且受實驗條件的限制,因此利用數(shù)學和計算機技術預測蛋白質結構具有十分重要的意義。蛋白質一級結構決定其空間結構是蛋白質結構預測的基礎。目前,從理論上預測蛋白質結構的方法通常有基于知識的預測(同源模建,折疊識別和從頭預測?;谥R的預測依賴于人們對于蛋白質結構規(guī)律的認識,其基礎是對于已

12、知的蛋白質結構進行分析,總結結構規(guī)律,因而,用這種方法無法產生全新結構。從頭預測不需要已知結構信息,直接從蛋白質序列預測其空間結構,在理論上是一種理想的方法。蛋白質分子結構預測除了它自身的理論意義外,同時又是設計全新蛋白質的基礎,在制藥、食品、農業(yè)、環(huán)境等諸多領域都有廣闊的應用前景,具有重要的現(xiàn)實意義。目前國際上許多著名制藥公司都投入了大量的人力、物力從事基于蛋白質分子結構預測的藥物分子設計研究。美國還出現(xiàn)了主要利用結構預測方法設計藥物的公司。3.1 蛋白質結構預測的整體框架依據(jù)待預測的蛋白質結構與數(shù)據(jù)庫中蛋白質序列同源度大小,蛋白質結構預測的流程如圖31: 3.2 同源模建方法(Homolo

13、gous Modeling同源模建方法也稱為比較模建法(Comparative Modeling,是一種基于知識的蛋白質結構預測方法13-15。目前主要是指同源結構預測,它是在未知蛋白質有同源結構可以參考的情況下應用的一種技術,是目前最為成熟的蛋白質結構預測方法,并且已有商業(yè)化軟件可以使用,如BIOSYM/MSI公司的Homology和Protein Design等。蛋白質根據(jù)序列同源性可以分為不同的家族,一般認為,序列相似性大于30的蛋白質可能由同一祖先進化而來,稱為同源蛋白質,同源模建的理論基礎是在進化過程中蛋白質的三維結構的保守性遠大于序列的保守性,因此,已知同源蛋白質家族中某些蛋白質的

14、結構,就可以預測其它一些序列己知而結構未知的同源蛋白質的結構,可以用同源模建的方法預測未知蛋白質的三級結構。一般而言對于同源性為60的蛋白質可以建張紅娟:基于非格點模型的蛋白質結構預測研究立高精度的模建模型,主鏈原子的預測誤差大約為1埃;同源性大于60的蛋白質其預測結果將接近于試驗得到的測試結果;同源性低于30的蛋白質難以得到理想的結構模型,并且隨著同源性的降低,模型誤差會迅速增加。3.3 折疊識別方法(Fold Recognition折疊識別(Fold RecognitionThreading是近年來發(fā)展起來的種比較新的方法。它可以應用到?jīng)]有同源結構的情況中,并且不需要預測二級結構,便可以直

15、接預測蛋白質的三級結構,是一種很有潛力的預測方法。折疊識別方法的主要原理是把未知蛋白的序列和己知的結構進行匹配,找出一種或幾種匹配最好的結構作為未知蛋白質的預測結構。它的實現(xiàn)過程是總結出己知的獨立的蛋白質結構模式作為未知結構進行匹配的模板,然后用經(jīng)過對現(xiàn)有的數(shù)據(jù)庫的學習總結出的可以區(qū)分正誤結構的平均勢函數(shù)(Mean Force Field,作為判別標準來選擇出最佳的匹配方式。這種方法的局限性在于它假設蛋白質的折疊類型是有限的,所以只有未知蛋白質和已知蛋白質結構相像的情況下,才有可能預測出未知的蛋白質結構。如未知蛋白質結構是現(xiàn)在還沒有出現(xiàn)的結構類型時,這種方法將不能被應用。折疊識別方法的準確率介

16、于同源模建和從頭預測方法之間,目前廣泛應用的軟件系統(tǒng)主要THREADER,3DProfile和Prospect等。折疊識別技術目前還不是特別可靠的技術,只有在序列相同比率在30一50時,才有可能獲得準確的估計。相關程序的結果也相當粗糙,大多數(shù)情況下難以作為同源性建模研究的依據(jù),但是它是大多數(shù)蛋白質結構預測信息唯一可利用的工具。3.4 從頭預測方法(Ab Initio Prediction在既沒有己知結構的同源蛋白質、也沒有已知結構的遠程同源蛋白質的情況下,上述兩種蛋白質結構預測的方法都不能用,這時只能采用從頭預測方法,即僅僅根據(jù)序列本身來預測其結構。Anfinsen提出的蛋白質的天然構象對應于

17、自由能最低時的結構這一熱力學假設,是從頭預測方法預測蛋白質結構的理論基礎,也由此揭開了用最優(yōu)化思想預測蛋白質結構的序幕。從頭預測主要包括兩方面的工作:建立預測模型及模型的求解。從頭預測可細分為:二級結構預測、超二級結構預測、蛋白質結構類型預測、蛋白質折疊模式預測、詳細的蚤白質三級結構的直接預測等。從理論上說,從頭預測法是最為理想的蛋白質結構預測方法。它要求方法本身可以只根據(jù)蛋白質的氨基酸序列來預測蛋白質的二級結構和高級結構,但現(xiàn)在還不能完全實現(xiàn)這個要求。從頭預測方法一般由下列3個部分組成:(1由于一種蛋白質幾何的表示方法表示和處理所有原子和溶劑環(huán)境的計算代價非常大,因此需要對蛋白質和溶劑的表示

18、形式作近似處理,例如,使用一個或少數(shù)幾個原子代表一個氨基酸殘基。(2一種勢函數(shù)及其參數(shù)通過對己知結構的蛋白質進行統(tǒng)計分析確定勢函數(shù)中的各個參數(shù)。(3一種構象空間搜索技術。其中,勢能函數(shù)的建立和構象空間搜索是從頭預測方法的關鍵,也是目前制約從頭預測方法進展的兩個主要方面。4 總結與展望同源蛋白質結構預測已經(jīng)有了相當長的歷史。目前主鏈結構預測已經(jīng)沒有太大的困難,無規(guī)卷曲和側鏈結構預測的方法上也己基本解決,但預測精度有待進一步提高。精度的提高依賴于模型優(yōu)化方法的發(fā)展。另一方面,同源結構預測的領域有待拓寬。結構預測中采用的許多種模式識別方法,都可以歸入同源結構的范疇。由于長程相互作用在蛋白質折疊中的重

19、要貢獻,若不能將長程作用納入預測框架,從一級結構預N-級結構、再從二級結構預測三級結構的逐級預測方法則不可能取得突破性進展。隨著蛋白質結構數(shù)據(jù)的積累,人們發(fā)現(xiàn)許多結構都可以歸并為數(shù)目有限的重復結構域。同源結構預測的第一步工作,就是不管是否有可辨認的序列同源性,都要正確的指認蛋白質的折疊方式。近年來,在利用序列模式和超二級結構模式提高二級結構預測精確度以及蛋白質折疊方式的自動指認等方面都出現(xiàn)了一些新方法。CASP作為蛋白質結構預測研究領域的一項著名的評估蛋白質結構預測技術的競賽,極大地推動著蛋白質結構預測技術的發(fā)展。在最初的CASP中,預測方法就被分為三類:比較建模方法、折疊識別方法和從頭預測方

20、法。然而由于預測的目標是預測精度而非預測方法的評比,從近兩次CASP的結果看,有以下一些趨勢15-20:1專家知識的參與可以提高預測精度。由于CASP的目的在于建立精確的模型,而不是單純對方法的評價,所以在預測的過程中利用專家知識能夠大大提高預測模型的精度,但是這樣預測方法本身的依賴性增強了。從CASP3開始增加了全自動蛋白質結構預測方法評比CAFASP,目的是對 完全自動化的蛋白質結構預測方法進行評價。2各類方法的融合。尤其是從頭預測方法,由于在預測中廣泛采用已知知識,包括己知結構信息 和能量函數(shù)的建立,在CASP4中這類方法被更名為新折疊方法,結合己知知識的從頭預測方法取得了可喜的進展。3

21、序列比較方法的發(fā)展使同源模建方法的應用范圍在拓寬,以前序列相似性關系不是很明確的蛋白質也能夠用同源模建方法進行預測。研究蛋白質的結構意義重大,分析蛋白質結構、功能及其關系是蛋白質組計劃中的一個重要組成部分。蛋白質結構的研究,有助于了解蛋白質的作用,了解蛋白質如何行使其生物功能,認識蛋白質與蛋白質(或其它分子之間的相互作用,這無論是對于生物學還是對于醫(yī)學和藥學,都是非常重要的??梢灶A見,隨著新方法的不斷涌現(xiàn)以及已有方法的有效結合,蛋白質結構預測研究將得到飛速的發(fā)展。參考文獻:1 Hardin C,East-wood MP,Prentiss MLuthey·Schulten ZWalyn

22、ess PG:Folding Funnels:the key to robust protein structure predictionJ Comput Chem2002,23:138_1462 Brooks,BR,Bruccoleri,RE,Olafson,BD,States,DJ,Swaminathan,S,Karplus,M一”CHARMM:A Program for Macromolecular Energy,Minimization,and Dynamics Calculations",JCompChem1983(43 Narumi,T,Susukita,R,Ebisuz

23、aki,T,Mc Niven,G,and Elmegreen,BMolecular dynamics machine: Special-purpose compmer for molecular dynamics simulationsMolecular Simulation1999,21:401·415,4 Eastwood MPIarclin cLutheySohulten ZWolynes PG:Evaluating protein structure prediction schemes using energy landscape theoryIBM J Res Dcv20

24、0145:475-4975 李林蛋白質組學的進展生物化學與生物物理進展2000,27(3:2272316 Liwo AKazmierkiewicz RCzaplewski CGroth MOldziej SWawak RJRackovsky SPincus MRScheraga HA:A unitedresidue force field for oflattice protein structure simulationsOfi百n of backbone hydrogen bonding cooperativity in united-residue potentialJComput Chem-1998,19:259-2767 閻隆飛,孫之榮蛋白質分子結構北京:清華大學出版社,19998 羅靜初基于Pckinux的分子生物信息數(shù)據(jù)庫查詢系統(tǒng)科學通報2000,45(9:100610089 王彥力,來魯華,韓玉真等新型平均勢函數(shù)在蛋白質反向折疊中的應用生物物理學報 1995,11:677410 來魯華等蛋白質的結構預測與分子設計北京:北京大學出版社,1993,496111 LaVallie,Edward R

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論