熱點(diǎn)殘基預(yù)測的總結(jié)_第1頁
熱點(diǎn)殘基預(yù)測的總結(jié)_第2頁
熱點(diǎn)殘基預(yù)測的總結(jié)_第3頁
熱點(diǎn)殘基預(yù)測的總結(jié)_第4頁
熱點(diǎn)殘基預(yù)測的總結(jié)_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

熱點(diǎn)殘基預(yù)測的總結(jié)13級(jí)艾美樂相關(guān)背景

近年來,研究人員對(duì)蛋白質(zhì)相互作用網(wǎng)絡(luò)的研究中發(fā)現(xiàn),在蛋白質(zhì)相互作用界面上存在一種很特殊的殘基,當(dāng)使用丙氨酸突變掃描技術(shù)將這類殘基誘發(fā)突變成丙氨酸后,會(huì)使結(jié)合自由能產(chǎn)生很大的變化,研究人員將這些殘基稱為熱點(diǎn)殘基。通過進(jìn)一步的研究發(fā)現(xiàn),熱點(diǎn)殘基主要是集中在蛋白質(zhì)相互作用界面的中心部位,它們對(duì)保持蛋白質(zhì)的功能和相互作用結(jié)合的穩(wěn)定性起著非常重要的作用。因此對(duì)蛋白質(zhì)相互作用界面中熱點(diǎn)殘基的研究不僅助于我們理解未知蛋白質(zhì)的功能以及特定生物功能的生物特性,還能為研究人員探明致病微生物的致病機(jī)理,有助于新型藥物的研發(fā),從而提高人類的生活質(zhì)量。1.研究意義2.研究技術(shù)目前研究蛋白質(zhì)相互作用界面中熱點(diǎn)殘基的技術(shù)方法主要是丙氨酸突變掃描實(shí)驗(yàn),該方法就是把蛋白質(zhì)結(jié)合界面的氨基酸殘基突變成丙氨酸,然后檢查這個(gè)過程中結(jié)合自由能的變化,如果超過某個(gè)值就被認(rèn)定為熱點(diǎn)殘基。該方法的優(yōu)點(diǎn)是識(shí)別精度非常高,但缺點(diǎn)是本錢高,周期長,需要消耗大量的人力和物力。因?yàn)榈鞍踪|(zhì)結(jié)合界面中的氨基酸殘基數(shù)量非常大,但熱點(diǎn)殘基的數(shù)量往往很小,所以生物實(shí)驗(yàn)中要找到熱點(diǎn)殘基是相當(dāng)困難的,因此通過數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的方法來預(yù)測蛋白質(zhì)相互作用界面的熱點(diǎn)殘基的方法應(yīng)運(yùn)而生,通過預(yù)測模型可以找出大局部的熱點(diǎn)殘基,然后結(jié)合生物實(shí)驗(yàn)進(jìn)行驗(yàn)證,不僅能大大降低發(fā)現(xiàn)熱點(diǎn)殘基的本錢,而且能縮短周期,提高效率。3.研究現(xiàn)狀

正因?yàn)闊狳c(diǎn)殘基在蛋白質(zhì)相互作用中有著非常重要地位,研究人員對(duì)它的生物屬性進(jìn)行了大量的研究。Bogan和Thorn的研究說明,熱點(diǎn)殘基和非熱點(diǎn)殘基在氨基酸組成上存在著明顯區(qū)別,色氨酸、酪氨酸和精氨酸在熱點(diǎn)殘基中出現(xiàn)的頻率較高,蘇氨酸、亮氨酸、纈氨酸和絲氨酸這些氨基酸在蛋白質(zhì)結(jié)構(gòu)中有著重要地位,但是它們在熱點(diǎn)殘基中出現(xiàn)卻很少,而天冬酰胺和天冬氨酸相比谷酰胺和谷氨酸,在熱點(diǎn)殘基中出現(xiàn)更加頻繁,原因可能是側(cè)鏈構(gòu)象熵的不同。Li和Liu在研究中發(fā)現(xiàn),熱點(diǎn)殘基通常是被一些在結(jié)合自由能上奉獻(xiàn)不大的殘基環(huán)繞著,這些殘基在熱點(diǎn)殘基周圍形成了一個(gè)環(huán)形結(jié)構(gòu),這個(gè)結(jié)構(gòu)被稱為“O〞環(huán),它的作用是使熱點(diǎn)殘基與周圍的水分子隔離開來而不能與之發(fā)生相互作用。另外一些研究說明,熱點(diǎn)殘基比非熱點(diǎn)殘基在進(jìn)化過程中更加的保守。熱點(diǎn)殘基的相關(guān)介紹一般熱點(diǎn)殘基通常被定義為丙氨酸突變后引起結(jié)合自由能的變化值大于等于2.0kcal/mol的那些結(jié)合面上的殘基。其它:

??G>=2.0kcal/mol為熱點(diǎn)殘基,??G<2.0kcal/mol為非熱點(diǎn)殘基。

??G>=2.0kcal/mol為熱點(diǎn)殘基,??G<0.4kcal/mol為非熱點(diǎn)殘基。

??G>=1.0kcal/mol為熱點(diǎn)殘基,??G<1kcal/mol為非熱點(diǎn)殘基。界面殘基的定義:?ASA≥1?2的殘基。或者,界面殘基是和其它鏈有原子連接的殘基。這里的原子連接可以用CSUprogram計(jì)算。熱點(diǎn)殘基數(shù)據(jù)庫ASEdb:丙氨酸掃描熱力學(xué)數(shù)據(jù)庫,就是實(shí)驗(yàn)獲得的熱點(diǎn)殘基的數(shù)據(jù)庫。BID:結(jié)合界面數(shù)據(jù)庫,通過從文獻(xiàn)中挖掘經(jīng)過實(shí)驗(yàn)驗(yàn)證的熱點(diǎn)殘基數(shù)據(jù)庫。通常從ASEdb數(shù)據(jù)庫中獲得的數(shù)據(jù)作為訓(xùn)練集,從BID數(shù)據(jù)庫中獲得的數(shù)據(jù)作為測試集熱點(diǎn)殘基的預(yù)測方法從策略和技術(shù)上面來說:

策略:1.基于能量的2.基于特征的3.基于綜合信息的1.經(jīng)驗(yàn)公式a.能量函數(shù)b.經(jīng)驗(yàn)函數(shù)2.機(jī)器學(xué)習(xí)a.遺傳算法b.人工神經(jīng)網(wǎng)絡(luò)c.決策樹d.支持向量機(jī)e.貝葉斯網(wǎng)絡(luò)技術(shù):基于能量的策略需要計(jì)算?G,例如,計(jì)算丙氨酸掃描技術(shù),就是利用結(jié)合自由能函數(shù)來計(jì)算丙氨酸突變效應(yīng)引起的?G的變化,根據(jù)計(jì)算出的??G來標(biāo)識(shí)熱點(diǎn)殘基。LetAandBdenotetheunboundmonomers

andABthecomplex

weassumethatthe

alaninemutationoccursonproteinA.Wefurtherdenote

with(wt)thewild-typemoleculesandwith(mut)the

mutatedmolecules

基于特征的策略,利用各種特征把特點(diǎn)殘基于界面上的其余殘基區(qū)分開來,主要包括:從序列提取的特征,從結(jié)構(gòu)提取的特征,從分子相互作用信息提取特征?,F(xiàn)在大多數(shù)都是基于特征的。特征:序列:PSSM,sequenceentropy等結(jié)構(gòu):?ASA,Ca等分子相互作用:氫鍵,庫侖力等基于序列特征。從AAindex中提取154個(gè)特征,經(jīng)過提取去〔去冗余〕最終得到132個(gè)特征。提出了一個(gè)新的編碼方案;PSSM*AA1點(diǎn)乘。對(duì)這132個(gè)特征分別建立分類器,最終選出10個(gè)最好的特征。然后集成。基于序列和結(jié)構(gòu)的特征,ASA,BC,Phy,ESE,SE,PSSM。本論文,首先分成兩組ASA,BC,Phy和Phy,ESE,SE,PSSM。sequence-basedsvm,structure-basedsvm和allfeaturessvm,分別進(jìn)行預(yù)測。本論文也是多種特征,包含序列和結(jié)構(gòu)信息,包含62個(gè)特征,然后利用特征選擇F-SCORE。然后獲得9個(gè)特征,構(gòu)建9個(gè)基于ASA或PI的單特征SVM模型,然后通過投票來預(yù)測熱點(diǎn)殘基?;谀芰康奶卣?,vanderWaalspotentials,solvationenergy,hydrogenbonds,Coulombelectrostatics。3種類別,共12個(gè)特征。SVMx特征根據(jù)correlationofenergytermswithobserved??Gvalues.本論文利用108個(gè)序列,結(jié)構(gòu),能量特征。然后又分別計(jì)算兩結(jié)構(gòu)相鄰的特征,Euclideandistance和Voronoidiagram一共324個(gè)特征。進(jìn)行兩步特征選擇,隨機(jī)森林和序列向后消除。獲得38個(gè)優(yōu)秀特征,之后利用SVM進(jìn)行分類,最后進(jìn)行集成。thenearestcontactresidueintheotherface

andthenearestcontactresiduein

thesameface本論文也是利用序列,結(jié)構(gòu)和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論