《生物信息學(xué)cha》課件_第1頁
《生物信息學(xué)cha》課件_第2頁
《生物信息學(xué)cha》課件_第3頁
《生物信息學(xué)cha》課件_第4頁
《生物信息學(xué)cha》課件_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章-2蛋白質(zhì)結(jié)構(gòu)預(yù)測主講人:孫嘯制作人:劉志華東南大學(xué)吳健雄實驗室1編輯ppt第七章-2蛋白質(zhì)結(jié)構(gòu)預(yù)測主講人:孫嘯1編輯ppt結(jié)構(gòu)預(yù)測流程ProteinsequenceDatabasesimilaritysearchDoessequencealignwithproteinofknown3Dstructure?Proteinfamily,domain,clusteranalysisRelation-shiptoknownstructure?Structuralanalysis3DcomparativemodelingPredictedthreedimensionalstructureIsthereapredictedstructure?3Danalysisinlaboratoryyesnonono2編輯ppt結(jié)構(gòu)預(yù)測流程ProteinDatabasesimilari第四節(jié)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測1、同源模型化方法主要思想: 對于一個未知結(jié)構(gòu)的蛋白質(zhì),找到一個已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。依據(jù):任何一對蛋白質(zhì),如果兩者的序列等同部分超過30%,則它們具有相似的三維結(jié)構(gòu),即兩個蛋白質(zhì)的基本折疊相同,只是在非螺旋和非折疊區(qū)域的一些細(xì)節(jié)部分有所不同。

3編輯ppt第四節(jié)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測1、同源模型化方法3編輯p假設(shè)待預(yù)測三維結(jié)構(gòu)的目標(biāo)蛋白質(zhì)為U(Unknown),利用同源模型化方法建立結(jié)構(gòu)模型的過程包括下述6個步驟:(1)搜索結(jié)構(gòu)模型的模板(T)(2)序列比對(3)建立骨架(4)構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈(5)構(gòu)建目標(biāo)蛋白質(zhì)的環(huán)區(qū)(6)優(yōu)化模型UT4編輯ppt假設(shè)待預(yù)測三維結(jié)構(gòu)的目標(biāo)蛋白質(zhì)為U(Unknown),利用同構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈5編輯ppt構(gòu)建目標(biāo)蛋白質(zhì)的側(cè)鏈5編輯ppt預(yù)測結(jié)果準(zhǔn)確率:對于具有60%等同的序列,用上述方法所建立的三維模型非常準(zhǔn)確。若序列的等同部分超過60%,則預(yù)測結(jié)果將接近于實驗得到的測試結(jié)果。一般如果序列的等同部分大于30%,則可以期望得到比較好的預(yù)測結(jié)果。6編輯ppt預(yù)測結(jié)果準(zhǔn)確率:6編輯ppt2、線索化方法(折疊識別方法)有很多蛋白質(zhì)具有相似的空間結(jié)構(gòu),但它們的序列等同部分小于25%,即遠(yuǎn)程同源。對于這類蛋白質(zhì),很難通過序列比對找出它們之間的關(guān)系,必須設(shè)計新的分析方法。7編輯ppt2、線索化方法(折疊識別方法)7編輯ppt對于一個未知結(jié)構(gòu)的蛋白質(zhì)(U),如果找到一個已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)(T),那么可以根據(jù)T的結(jié)構(gòu)模板通過遠(yuǎn)程同源模型化方法建立U的三維結(jié)構(gòu)模型。UT(遠(yuǎn)程同源)8編輯ppt對于一個未知結(jié)構(gòu)的蛋白質(zhì)(U),UT(遠(yuǎn)程同源一個遠(yuǎn)程同源模型化方法要解決三個問題:(1)檢測遠(yuǎn)程同源蛋白質(zhì)(T);(2)U和T的序列必須被正確地對比排列;(3)修改一般的同源模型化過程,以應(yīng)用于相似度非常低的情況,即處理更多的環(huán)區(qū),建立合理的三維結(jié)構(gòu)模型。

如何解決第一個和第二個問題?基本思想是建立一個從U到已知結(jié)構(gòu)T的線索,并通過一些基于環(huán)境或基于知識的勢,評價序列與結(jié)構(gòu)的適應(yīng)性。至于最后建立三維結(jié)構(gòu)模型則是非常困難的序列→結(jié)構(gòu)比對9編輯ppt一個遠(yuǎn)程同源模型化方法要解決三個問題:序列→結(jié)構(gòu)比對9線索化的主要思想:利用氨基酸的結(jié)構(gòu)傾向(如形成二級結(jié)構(gòu)的傾向、疏水性、極性等),評價一個序列所對應(yīng)的結(jié)構(gòu)是否能夠適配到一個給定的結(jié)構(gòu)環(huán)境中。10編輯ppt線索化的主要思想:10編輯ppt建立序列到結(jié)構(gòu)的線索的過程稱為線索化,線索技術(shù)又稱折疊識別技術(shù)。線索化或者折疊識別的目標(biāo)是為目標(biāo)蛋白質(zhì)U尋找合適的蛋白質(zhì)模板,這些模板蛋白質(zhì)與U沒有顯著的序列相似性,但卻是遠(yuǎn)程同源的。

11編輯ppt建立序列到結(jié)構(gòu)的線索的過程稱為線索化,線索技術(shù)又稱折疊識別技線索化方法一般有5個基本組成部分:(1)已知三維折疊結(jié)構(gòu)的數(shù)據(jù)庫;(2)一種適合于進(jìn)行序列-結(jié)構(gòu)比對的三維折疊信息的表示方法;(3)一個序列-結(jié)構(gòu)匹配函數(shù),該函數(shù)對匹配程度進(jìn)行打分;(4)建立最優(yōu)線索的策略,或者是進(jìn)行序列-結(jié)構(gòu)比對的策略;(5)一種評價序列-結(jié)構(gòu)比對顯著性的方法。12編輯ppt線索化方法一般有5個基本組成部分:12編輯ppt假設(shè)存在有限數(shù)目的核心折疊(corefolds)核心折疊實際上是構(gòu)成蛋白質(zhì)空間形狀的基本模式。建立核心折疊數(shù)據(jù)庫預(yù)測----建立線索U序列與數(shù)據(jù)庫核心折疊比對取最佳核心折疊U結(jié)構(gòu)模型13編輯ppt假設(shè)存在有限數(shù)目的核心折疊(corefolds)U序列與數(shù)一種基于序列與結(jié)構(gòu)比對的最優(yōu)線索化算法令:s1,s2,…,sn為蛋白質(zhì)序列S的n個元素C1,C2,…,Cm為數(shù)據(jù)庫中核心折疊C的m個核心區(qū)域 Cij為第i個核心區(qū)域第j個氨基酸位置

每一個核心區(qū)域由若干個氨基酸殘基構(gòu)成

14編輯ppt一種基于序列與結(jié)構(gòu)比對的最優(yōu)線索化算法14編輯ppt設(shè)t是一個從序列到核心折疊的線索,那么t說明了序列S的哪些元素si,sj,sk,…代表核心區(qū)域C1,C2,C3,…的起始位置。這實際上是一種從序列S到核心折疊C的比對令

代表核心折疊C中的環(huán)到序列S中空位的映射,顯然

是通過線索化而確定的。15編輯ppt設(shè)t是一個從序列到核心折疊的線索,那么t說明了序列S的哪些元令f(t)是進(jìn)行比對的得分函數(shù),其定義如下:f(t)=g1(v,t)+g2(u,v,t)+g3(

,t) g1(v,t)評價氨基酸殘基v所處的位置g2(u,v,t)評價殘基u和v的相對位置,如果u和v鍵合,則得分高;g3(

,t)評價環(huán)區(qū),根據(jù)環(huán)區(qū)的大小進(jìn)行打分。

線索化問題: 對于給定的序列S和核心折疊C,選擇一個線索t,使得f(t)的值最小,即尋找一個從S到C的最佳映射。16編輯ppt令f(t)是進(jìn)行比對的得分函數(shù),其定義如下:16編輯ppt3、從頭預(yù)測方法在既沒有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)的情況下,上述兩種蛋白質(zhì)結(jié)構(gòu)預(yù)測的方法都不能用,這時只能采用從頭預(yù)測方法,即(直接)僅僅根據(jù)序列本身來預(yù)測其結(jié)構(gòu)。17編輯ppt3、從頭預(yù)測方法17編輯ppt從頭預(yù)測方法一般由下列3個部分組成:(1)一種蛋白質(zhì)幾何的表示方法 由于表示和處理所有原子和溶劑環(huán)境的計算開銷非常大,因此需要對蛋白質(zhì)和溶劑的表示形式作近似處理。(2)一種勢函數(shù)及其參數(shù) 通過對已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計分析確定勢函數(shù)中的各個參數(shù)(3)一種構(gòu)象空間搜索技術(shù)構(gòu)象空間搜索和勢函數(shù)的建立是從頭預(yù)測方法的關(guān)鍵18編輯ppt從頭預(yù)測方法一般由下列3個部分組成:18編輯pptN端的氨基酸位于坐標(biāo)系統(tǒng)的原點第二個氨基酸位于坐標(biāo)的(1,0)或(1,0,0)處。H-P模型-[疏水(hydrophobic)-極性(polar)]

19編輯pptN端的氨基酸位于坐標(biāo)系統(tǒng)的原點H-P模型-[疏水(hydr基于疏水殘基之間的接觸進(jìn)行打分每一個H和H的接觸(非相鄰殘基)對能量的貢獻(xiàn)都為-1最優(yōu)的構(gòu)象就是所有可能的構(gòu)象中具有最多H和H接觸的那個構(gòu)象圖中的二維和三維構(gòu)象的得分都是-320編輯ppt基于疏水殘基之間的接觸進(jìn)行打分20編輯ppt絕對方向表示法:每一個位置上可選擇的方向:上、右、左和下(U、R、L、D);而對于三維模型:上、右、左、下、后和前(U、R、L、D、B、F)。構(gòu)象空間搜索(R,R,D,L,D,L,U,L,U,U,R) (R,B,U,F(xiàn),L,U,R,B,L,L,F(xiàn))21編輯ppt絕對方向表示法:構(gòu)象空間搜索(R,R,D,L,D,L,U,L相對方向表示法:利用每個氨基酸殘基主鏈的轉(zhuǎn)動方向來表示每個位置上的殘基的方向二維網(wǎng)格模型:每個殘基位置上可選擇的方向有三個左、右和前(L、R和F)三維網(wǎng)格模型:左、右、前、上和下(L、R、F、U、D)22編輯ppt相對方向表示法:22編輯ppt能量函數(shù)和優(yōu)化需要考慮的相互作用疏水作用氫鍵二硫橋靜電作用范德華力溶劑作用23編輯ppt能量函數(shù)和優(yōu)化23編輯ppt分子力學(xué)方法——假設(shè)正確的蛋白質(zhì)折疊對應(yīng)于最低能量的構(gòu)象分子力學(xué)勢能是原子坐標(biāo)的函數(shù)勢能函數(shù)由多項組成 成鍵作用: 化學(xué)鍵的伸縮能(鍵長) 彎曲能(鍵角) 扭轉(zhuǎn)能(二面角) 非成鍵作用: 范德華力 靜電力 氫鍵分子力學(xué)中的勢能參數(shù)的來源從頭算(abinitio)和半經(jīng)驗計算結(jié)果氨基酸和小分子的實驗觀察結(jié)果24編輯ppt分子力學(xué)方法24編輯ppt

能量優(yōu)化方法:梯度下降法 最陡下降法 共軛梯度法牛頓-拉普森方法

25編輯ppt能量優(yōu)化方法:25編輯ppt分子動力學(xué)蒙特卡羅方法模擬退火方法遺傳算法26編輯ppt分子動力學(xué)26編輯ppt基于勢函數(shù)或者力場的結(jié)構(gòu)預(yù)測方法在實際應(yīng)用中存在許多問題,主要原因:我們還沒有完全了解究竟是哪些力決定了蛋白質(zhì)的折疊過程,同時這些力之間又是如何相互作用的力場參數(shù)不精確,沒有對溶劑處理的好方法構(gòu)象搜索過程容易陷入局部能量極小點自然折疊的蛋白質(zhì)結(jié)構(gòu)與一般蛋白質(zhì)構(gòu)象之間的能量差比較小研究蛋白質(zhì)折疊的計算量非常大27編輯ppt基于勢函數(shù)或者力場的結(jié)構(gòu)預(yù)測方法在實際應(yīng)用中存在許多問題,主4、預(yù)測方法評價對各種方法所得到的蛋白質(zhì)結(jié)構(gòu)預(yù)測結(jié)果需要進(jìn)行驗證,以確定預(yù)測方法是否可行,確定其適應(yīng)面。驗證的一種方法是取已知結(jié)構(gòu)的蛋白質(zhì),對這些蛋白質(zhì)進(jìn)行模擬結(jié)構(gòu)預(yù)測,并將預(yù)測結(jié)構(gòu)與真實結(jié)構(gòu)進(jìn)行比較,分析兩者之間的差距。

權(quán)威的評判機(jī)構(gòu),建立公共認(rèn)可的蛋白質(zhì)結(jié)構(gòu)測試數(shù)據(jù)集。設(shè)立在馬里蘭生物技術(shù)研究中心的CASP就是這樣一個系統(tǒng)(/casp4/)28編輯ppt4、預(yù)測方法評價28編輯ppt第五節(jié)蛋白質(zhì)空間結(jié)構(gòu)比較結(jié)構(gòu)域?qū)Φ鞍踪|(zhì)進(jìn)行序列比較,可以發(fā)現(xiàn)同源序列的保守區(qū)域。 但是對于結(jié)構(gòu)域,通過序列比較,我們只能得到一部分信息。如果在結(jié)構(gòu)這個層次上進(jìn)行比較,可以發(fā)現(xiàn)更多的信息。蛋白質(zhì)的結(jié)構(gòu)比序列更加保守,通過比較蛋白質(zhì)的空間結(jié)構(gòu),可以發(fā)現(xiàn)屬于同一家族蛋白質(zhì)的保守結(jié)構(gòu),可以發(fā)現(xiàn)特定的空間結(jié)構(gòu)模式。這些模式由多個不相鄰的序列片段組成,經(jīng)過蛋白質(zhì)折疊以后,這些一維不相鄰的元素在三維空間中結(jié)合到一起,形成特定的功能位點,如酶的活性部位,蛋白質(zhì)結(jié)合部位等。

29編輯ppt第五節(jié)蛋白質(zhì)空間結(jié)構(gòu)比較結(jié)構(gòu)域29編輯ppt蛋白質(zhì)結(jié)構(gòu)比較有兩個主要的任務(wù):檢測蛋白質(zhì)的結(jié)構(gòu)特征在已知兩個蛋白質(zhì)對應(yīng)結(jié)構(gòu)特征的條件下,尋找將兩個蛋白質(zhì)空間結(jié)構(gòu)重疊的幾何變換,進(jìn)行三維結(jié)構(gòu)的比對(alignment)。

30編輯ppt蛋白質(zhì)結(jié)構(gòu)比較有兩個主要的任務(wù):30編輯ppt如果用數(shù)學(xué)語言來描述,就是給定兩個三維點集P={pi}和Q={qi}(i=1,2,…,n),尋找一個空間變換矩陣T,使得最小,即:這個問題可以用最小二乘法解決

31編輯ppt如果用數(shù)學(xué)語言來描述,就是給定兩個三維點集P={pi}和Q空間點三元組幾何變換

目標(biāo):尋找兩個蛋白質(zhì)空間點三元組重疊最多的幾何變換。32編輯ppt空間點三元組幾何變換

目標(biāo):32編輯ppt解決這個問題的直接算法是如下:(1)對于每一對空間點三元組(分別來自不同的蛋白質(zhì)),計算能使這兩個對象重疊的幾何變換;(2)統(tǒng)計在各種變換中,能夠同時重疊、或者基本重疊的空間點三元組個數(shù),并作為對應(yīng)變換的得分;(3)選擇得分比較高的變換,改進(jìn)這些變換,使其得分進(jìn)一步提高。33編輯ppt解決這個問題的直接算法是如下:33編輯ppt基于幾何哈希(geometrichashing)技術(shù)的三維結(jié)構(gòu)比對方法34編輯ppt基于幾何哈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論