藥物分子設(shè)計(jì)第九講_第1頁(yè)
藥物分子設(shè)計(jì)第九講_第2頁(yè)
藥物分子設(shè)計(jì)第九講_第3頁(yè)
藥物分子設(shè)計(jì)第九講_第4頁(yè)
藥物分子設(shè)計(jì)第九講_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(一)Protein Structure Prediction (I)1Protein Structure PredictionFrom Sequence to Native Structure2Protein Structure PredictionPSI-BLAST3Protein Structure Prediction4Multiple Sequence AlignmentToolsClustalWMultiple sequence alignments reveal:conservation of individual residuesconservation of r

2、egionsdifferences within protein families5ToolsHMMerProfileFor each position along the sequence, tabulate how often each type of amino acid occur (include . for gap)The pro always of size Nx21, no matter how many sequences are considered6Protein Structure Prediction7Secondary Structure PredictionGiv

3、en a protein sequence a1a2aN, secondary structure prediction aims at defining the state of each amino acid ai as being either H (helix), E (extended strand), or O (other) (Some methods have 4 states: H, E, T for turns, and O for other).The quality of secondary structure prediction is measured with a

4、 Qindex (Qhelix, Qstrand, Qcoil) or Q3. Q3 is the percent of residues that match “reality” (X-ray structure). 8Secondary Structure PredictionAmino acid sequenceActual Secondary StructureQ3=22/29=76%Q3=22/29=76%ALHEASGPSVILFGSDVTVPPASNAEQAKhhhhhooooeeeeoooeeeooooohhhhhohhhooooeeeeoooooeeeooohhhhhhhhh

5、hhoooohhhhooohhhooooohhhhh(useful prediction)(terrible prediction) Q3 for random prediction is 33% Secondary structure assignment in real proteins is uncertain to about 10%. Therefore, a “perfect” prediction would have Q3=90%.Limitations of Q3 (Q3 = Npredicted100%/ Nobserved) 9Secondary Structure Pr

6、edictionChou-Fasman MethodStart by computing amino acids propensities to belong to a given type of secondary structure:Propensities 1 mean that the residue type i is likely to be found in the corresponding secondary structure type.10Chou-Fasman Method參數(shù)值P、P和Pt是分別在原有相應(yīng)值的基礎(chǔ)上乘以100得到 Secondary Structure

7、 Prediction11Secondary Structure PredictionChou-Fasman MethodHelix prediction沿著蛋白質(zhì)序列尋找螺旋核,相鄰的6個(gè)殘基中如果有至少4個(gè)殘基傾向于形成螺旋,即有4個(gè)殘基對(duì)應(yīng)的P 100,則認(rèn)為是螺旋核。然后從螺旋核向兩端延伸,直至四肽片段P 的平均值小于100為止。按上述方式找到的片段長(zhǎng)度大于5,并且P 的平均值大于P 的平均值,那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測(cè)為螺旋。此外,不容許Pro在螺旋內(nèi)部出現(xiàn),但可出現(xiàn)在C末端以及N端的前三位,這也用于終止螺旋的延伸。12Secondary Structure Prediction

8、Chou-Fasman MethodStrand Prediction如果相鄰6個(gè)殘基中若有4個(gè)傾向于形成折疊,即有4個(gè)殘基對(duì)應(yīng)的P 100,則認(rèn)為是折疊核。折疊核向兩端延伸直至4個(gè)殘基P 的平均值小于100為止。若延伸后片段的P 的平均值大于105,并且P 的平均值大于P 的平均值,則該片段被預(yù)測(cè)為折疊。13Secondary Structure PredictionChou-Fasman MethodTurn Prediction轉(zhuǎn)角的模型為四肽組合模型,要考慮每個(gè)位置上殘基的組合概率,即特定殘基在四肽模型中各個(gè)位置的概率。在計(jì)算過(guò)程中,對(duì)于從第i個(gè)殘基開(kāi)始的連續(xù)4個(gè)殘基的片段,將上述概率

9、相乘,根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如果f(i)f(i+1)f(i+2)f(i+3)大于7.510-5,四肽片段Pt的平均值大于100,并且Pt 的均值同時(shí)大于P 的均值以及P 的均值,則可以預(yù)測(cè)這樣連續(xù)的4個(gè)殘基形成轉(zhuǎn)角。14Secondary Structure PredictionChou-Fasman MethodConflict 假如預(yù)測(cè)出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊區(qū)域P 均值和P 均值的相對(duì)大小進(jìn)行預(yù)測(cè),若P 的均值大于P 的均值,則預(yù)測(cè)為螺旋;反之,預(yù)測(cè)為折疊。 15Secondary Structure PredictionGOR Method是一種基于信息論和貝葉

10、斯統(tǒng)計(jì)學(xué)的方法GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來(lái)處理GOR方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響 16Secondary Structure PredictionGOR Method通過(guò)對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)1720的得分矩陣。然后利用矩陣中的值來(lái)計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺旋、折疊或者轉(zhuǎn)角的概率。 17Secondary Structure PredictionGOR Method首先考慮兩個(gè)事件S和R的條件概率P(S|R),

11、即在R發(fā)生的條件下,S發(fā)生的概率P(S,R)是同時(shí)觀察到S 和R 的聯(lián)合概率,而P(R)是R 的出現(xiàn)概率。在二級(jí)結(jié)構(gòu)預(yù)測(cè)過(guò)程中,S 表示特殊的二級(jí)結(jié)構(gòu)類型,R 代表氨基酸殘基,P(S|R)就是殘基R 處于二級(jí)結(jié)構(gòu)類型S 的概率。P(S)是在統(tǒng)計(jì)過(guò)程中觀察到二級(jí)結(jié)構(gòu)類型S 的概率。Statistics: helices 29.7%, strands 19.7%, turns 12.2%, coils 38.3%18Secondary Structure PredictionLim Method 氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水性、極性、側(cè)鏈基

12、團(tuán)的大小等,根據(jù)殘基各方面的性質(zhì)及殘基之間的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)?!笆杷浴笔前被岬囊环N重要性質(zhì),疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。19Secondary Structure PredictionLim MethodHelix prediction在一段序列中發(fā)現(xiàn)第i、i+3、i+4位(如1、4、5)是疏水殘基時(shí),這一片段就被預(yù)測(cè)為螺旋; 當(dāng)發(fā)現(xiàn)第i、i+1、i+4位(如7,8,11)為疏水殘基時(shí),這一片段也被預(yù)測(cè)為螺旋。20Secondary Structure PredictionLim MethodStrand prediction 對(duì)于折疊,也存在著

13、一些特征的親疏水殘基間隔模式,埋藏的折疊通常由連續(xù)的疏水殘基組成,一側(cè)暴露的折疊則通常具有親水-疏水的兩殘基重復(fù)模式。原則上,通過(guò)在序列中搜尋特殊的親疏水殘基間隔模式,就可以預(yù)測(cè)螺旋和折疊。 21Secondary Structure PredictionNeural Network用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò),包括輸入層、隱含層以及輸出層。22Neural Network預(yù)測(cè)結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)結(jié)構(gòu)。 例如: Pattern LSADQISTVQASFDK Target H沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的序列片段進(jìn)行

14、編碼,窗口包括中心氨基酸殘基及左右m個(gè)(共2m+1個(gè))殘基,每一個(gè)殘基用21個(gè)神經(jīng)元編碼,因此,輸入層共有21(2m+1)個(gè)神經(jīng)元。 例如:Alanine 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0輸出層有3個(gè)神經(jīng)元,分別對(duì)應(yīng)于窗口中心殘基的H、E、C三態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。 例如:輸出值為(0.2,0.1,0.1),則認(rèn)為是螺旋結(jié)構(gòu)。編碼為:1 0 0 Secondary Structure Prediction23Neural Network PHDsec (Pro neural network system from Heidelb

15、erg)Secondary Structure Prediction24Neural Network PHDsec (Pro neural network system from Heidelberg)Input25Neural Network PHDsec (Pro neural network system from Heidelberg)First Layer26Neural Network PHDsec (Pro neural network system from Heidelberg)Second Layer27Secondary Structure PredictionDSSP (Database of Secondary Structure in Proteins)H = alpha helixB = residue in isolated bata-bridgeE = extended strand, participates in beta ladderG = 3/10 helixI = pi helixT = hydrogen bonded turnS = bend28Secondary Structure PredictionAlpha helix, 3/10 helix and pi helix Alpha helixHydrogen bonds

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論