


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、同源模建的方法與結果分析序言:作為一個以實驗為主的生化工作者來說,很多時候可以通過分子生物學手段獲取自己需要的目的基因,并在各種表達載體和宿主中進行對應蛋白的表達,隨后對于這些蛋白的特性進行研究,這也是一般酶學研究的特定套路。而近十幾年來,人們開始思考是否能夠將特性與蛋白質的三級結構進行關聯(lián),從分子水平理解蛋白質與底物之間的相互作用呢?于是類 似于蛋白結構模建、分子對接、分子動力學模擬、量化計算等多種手段相繼被創(chuàng)造以及應用。 在這些方法中,同源模建無疑是最基礎也是最重要的一個步驟,因為其質量的好壞直接決定了后續(xù)工作是否可信。因此,本文打算就同源模建的基本原理、常用軟件及服務器以及結果分析與改進
2、提供一些個人的經驗,并希望各位朋友能夠給予批評指正。1. 同源模建的原理及應用限制兩點基本原理:1. 一個蛋白質的結構由其氨基酸序列唯一的決定。知道其一級序列,至少在理論上足以 獲取其結構2. 結構在進化中更穩(wěn)定,變化比序列層面的變化要緩慢許多。應用限制:模板蛋白和目標蛋白的序列一致性需要大于30%,且越大建模準確性越有保障。了解了基本的原理,我們需要知道在實際操作中,同源模建都需要怎么樣進行。同源模建的過程從實踐中可分為以下7個步驟:1. 模板識別和初始比對在序列一致性比較高的時候,可以通過簡單的序列比對程序如BLAST獲取目標蛋白的結構(將比對的數據庫選擇為PDB數據庫)。2. 比對結果的
3、校正用以上的方法確定一個或多個建模模板后,應該采用更為精確的方法已取得更優(yōu)的比對結果。有時在序列一致性較低的區(qū)域比對兩條序列可能會具有困難,這個時候,我們可以采取其他同源蛋白序列一起參與比對來找到解決的辦法。3. 主鏈生成比對完成后,就可以開始實際的建模過程了,相對與后面幾步來說,主鏈建模時最 沒有難度的一步了,因為大部分軟件都是通過簡單的拷貝模板蛋白的主鏈坐標來實 現(xiàn)這一目的的。4. 環(huán)區(qū)建模這一部分主要是目標蛋白和模板蛋白的比對結果中存在缺口的部分如何處理的問 題。第一種解決的方式是略去模板蛋白存在的殘基,留下一個必須補上的缺口。另 一種情況是將主鏈截斷,插入缺少的殘基。5. 側鏈建模當我
4、們比較結構相似的蛋白質中保守殘基的側鏈構象時,我們會發(fā)現(xiàn)他們的側鏈構象通常會比較相似。這就告訴我們如果加保守殘基的側鏈構象完整的拷貝到模建蛋 白上時,在某些時候比先拷貝主鏈構象之后,再預測側鏈構象來的可靠。但是這一 經驗規(guī)則在實際運用中僅在兩者序列一致性較高,并且保守殘基之間形成接觸的情況下才能實現(xiàn)。因此,在現(xiàn)有的測序中,都是構造各種可能的構象體,并利用基于 能量的函數打分來實現(xiàn)側鏈構象的選擇的。6. 模型優(yōu)化模型優(yōu)化其實是一個比較復雜的問題,其質量依賴于高精確性的預測側鏈構象體, 而為了達到這種目的,我們需要正確的主鏈,這一步驟實際又依賴于側鏈構象體正 確的堆積。因此,這一優(yōu)化過程是迭代直至
5、收斂的過程。需要注意的是,對于結構 進行能量優(yōu)化需要十分謹慎。因此偏離正確結構的途徑比指向正確結構的途徑多很 多。在優(yōu)化中的每一步可以排除一些大的誤差,但是也會引入很多小的誤差,這些 小的誤差經過多步積累,就有可能使你的結果更加偏離正確的結構。7. 模型驗證所有的模型都包含誤差,誤差的多少主要依賴于兩方面的內容:1序列一致性的高低,越低的話弓I入誤差的可能性就越大。2. 模板蛋白中的誤差:如果這種誤差是局域性的,尤其是遠離活性位點的,對于你 最后進行分子對接等研究室?guī)缀鯖]有影響的。如果是蛋白整體的,則需要小心處理。2.常用軟件、服務器2.1常用服務器: SWISS-MODEL:網址 SWISS
6、-MODEL可能是目前非專業(yè)人士應用最為廣泛的一個在線建模服務器了。其常見的模式可分為:1. Automated mode :自動模式,可以稱為是最傻瓜的方式了pd c # $bwl存I AiiffimrtEiC Mctctnlling MrKl* 世F嚇曲戸TQjzt TI1I1IPrrntB-dH vn srHCfu vrw.a Uirw FsatOad:-aIiiL A|AHl Ari 凸orAla 401rnfS-IDChafnFIP.'進去之后只需要填上你的email以及在底下的框框內輸入你所想模建的蛋白序列, 再點擊submit modeling request即可,底下還
7、有高級選項,支持自定義模板蛋白 的pdb以及chain,或者自己上傳模板文件,簡而言之,真是非常易于操作。這 種方法適用于PDB數據庫中存在高度同源的蛋白結構時的建模(蛋白序列一致性最好大于80%,個人經驗)2. Alignment mode:比對模式基本的操作和自動模式類似,但是其序列提交的時候可以提交目標蛋白與模板蛋白的序列比對結果(FASTA,MSF,ClustalW 等格式),如下所示:Supported Alignment formatsfhe foil awing forrriats are current ly supported: FAS TACLUGTALW, PFAM an
8、d EEL 匚工:Examples-fasta:>THN_DENCLK5 GvPTJAABtTQYM Z CEL E3ZERE 冒匚曲二 5 3CKIH 2 GJGC FF GYRH ->IHBX_TEST>1cieATT亡二WETVAE呂州亡程tFEHFEAT二盒TTTE亡工工工衛(wèi)呑矗工亡衛(wèi)在DY胡一clustal:C?U3TA1 W TMN_DENCL TMNXTE5T IcinA(1*52) rrultiple sequerce 已丄jgiun年ttc英于匚CPTTAARtTQYNI匚只二FGTFRFVCJiJLiFG匚歪TT5GTGCF FEYRH-呼五殖5匚CEDT
9、TGRDIYNTCRrGGGRQVC.RISGCKII 5ASTCPS-YPNK 專 6TTCGPSIVAR5NFNvTCRIFGTFEALCATYTGCI 11PGAT CPGDYAN - 46這種模式比較適合目標蛋白與模板蛋白具有較高的相似性,但是利用自動模式未必能找到最合適模板的情況,或者使用者有目的的使用特定的模板蛋白(比如具有更為相似的活性位點結果,而不是更為相似的整體結構 )3. Project mode:項目模式項目模式主要是針對于目標蛋白和模板蛋白序列的相似性不高,兩者的三級結構相似程度難以直接通過序列比對獲得,需要人工插入調節(jié)(借助蛋白結構編輯軟件deepview),這個模式
10、能夠交互式的提高前面兩種模式的模型質量(通過將前兩種模式模建出的蛋白進行人為調整)。屬于針對比較困難(序列一致性較低)的建模的一種有效途徑。 (貌似被墻了?)*也可以下載本地安裝包個人使用評價:根據結果質量檢驗,貌似在用過的自動建模的軟件里是結果最好的了不過缺點是給結果時間比較長。個人使用評價:這個軟件需要序列蛋白與模板蛋白的結構比對文件上傳(FASTA格式),可對模建的蛋白進行l(wèi)oop區(qū)優(yōu)化以及側鏈優(yōu)化。尚未深入的研究 CPHmodels 3.2 Server: 個人使用評價:貌似沒有任何特色,只需要一條蛋白序列既可以完成自動建模。2.2常用軟件: Modeller:說到同源模建,不得不提其
11、中大名鼎鼎的modeller,要是做同源模建的娃們沒有聽過modeller,實在是不好意思說自己玩轉了同源模建的。哈哈該軟件由Sali lab開發(fā),目前最新的版本是9.11,可在win下和linux運行,需要對應版本的pytho n (3.0 )。該軟件好在什么地方呢?主要是可以自己控制的地方特別多,但這個也給新手帶來了不少困擾,比如究竟在特定的場合用什么參數等等。(本人將在自己以后的學習過程中繼續(xù)分享對這個軟件的學習心得,真的是挺有意思的)可實現(xiàn)的功能包括:多聚體建模,二硫鍵建模,雜原子建模(配體、輔酶等)。具體的運算流程稍后補充:其最成熟的GUI為easymodeller,最新版本為4.0
12、。使用方法稍后補充。3. 同源模建結果評價與改進策略在我們通過各種軟件構建出一個蛋白的同源模型后,我們如何評價這一模型是否準確?如果不準確如何進行進一步的修飾能使其更好的應用于我們的后續(xù)模擬中呢?這些問題將在本 節(jié)得以討論3.1同源模建結果的評價本人最常使用的結構檢測方法來源于UCLA-DOE 的SAVES服務器,其網址為: VES/提供的檢測工具包括 5種方法:PROCHECK:該程序可以給出特定蛋白質模型的一系列立體化學參數,并且能以直觀的彩圖輸出部分結果。 該方法的原理主要是通過對蛋白質數據庫中高分辨的蛋白晶體結構 的參數進行整理,作為標準參數。將輸入蛋白結構所具有的參數與標準參數進行對
13、比, 如果兩者差異顯著,則說明輸入的蛋白結構存在明顯問題。其輸出的結果包括:拉氏圖,主鏈的鍵長與鍵角,二級結構圖,平面?zhèn)孺溑c水平面之間的背離程度等。WHATCHECK:包含大量的檢測項,可以針對給定的蛋白結構與正常結構之間的差異, 產生一個非常長而且詳細的報告。ERRAT:計算0.35 nm范圍之內,不同原子類型對之間形成的非鍵相互作用的數目。原 子按照C、N、O/S進行分類,所以有六種不同的相互作用類型:CC、CN、CO、NN、NO、 OO。如果這些相互作用類型出現(xiàn)的頻率與正常值相比有較大的區(qū)別,蛋白質模 型的質量就值得懷疑了 通常使用9個氨基酸長度的滑行窗口用于獲得每一個窗口的相 互作用頻
14、率。類似的分析方法可以用于定位局部有問題的區(qū)域。Verify_3D:PROVE:該程序可以比較給定結構的原子體積與預先計算好的一系列標準體積之間的 差別。體積的計算方法采用Voronoi polyhedra幾何模型,通過在原子及其鄰近原子間放置一個個分散的平面來定義每一個原子占據的空間。以下以我研究的一個酶C-C鍵水解酶BphD的模型進行實例講解:背景:首先利用BLAST進行蛋白一致性搜索,找出最合適的蛋白模板,經確定為2OG1, 以此蛋白結構為模板,利用 modeller進行模建,得到我們的 BphD的初始結構,提交到 SAVES服務器進行處理:Suiniiidry1ProchKk * Hn
15、mnrhflnrtlrnin plot:號鼻啟* cm 3 J*fe fillowOtfliif 0-44b diallPostScript POF JM4 All filnmiicliiiiidradir 1 labellMl rfjidlues (curt of 2B4) '.airbC jPos&cnptj + PDF1 1 3 - cliil ch i J: & 佃鈍 I儲!11U2 )呼噸押 POPImages; 1 2 Main-chain params: b better U inside 0 worseA皿創(chuàng)訂Mfl SMe?dwili paiBMiii
16、s:、better U ini&ide U worse Mrtfcgj* MaF JPC|O¥E:r<ilk 0.03HRMflii# prop*irfte5: MLnx.d*vlnllflin: 4.0 Md ctunfinm.:0 * Bond len/anqle: 6-0 Morris et al lass: 1 1 j + 1 ctsrpeptides G-fadnr% Dihednis: OAD Ccmleatz -fluMPfiiCrtpC PDF1 ?":What checkVerify 3D98.61% of theresidues hadan
17、averaged3D-1D score >0,2UlAULf PintErratqy日別I quav factorPostScript PDF JPC Otifpilf I(WJ沁dieRamachandiHri PlotM14SM訂応喬 5 T45 S)1?5"711Pin1PLa: £ciiisx.L2s_a蘭乂】起社立世± isfl-jm 具日l"R翼Wd 331才 4出冒.3 “431 J|LEi 二 gZf二'-fV iM#父 6*psiARi1去.托11H二"MhUTturIU峠 燼怔 附昭峠稔出壬M PV1jS二才白
18、嚇二_r±. raldL_L/dfanhii u tr-u'ii sii二口沖 減> Mdjel11Td& ib/r«£r X rti-JiKi這個服務器最好的一點就是可以提供處于各個區(qū)域的氨基酸殘基占總數的百分比。拉氏圖的結果主要分成 4個區(qū)域:核心區(qū)域,允許區(qū),大致允許區(qū)以及禁阻區(qū)。從圖中可以 看到大部分的氨基酸殘基均位于核心區(qū)域(95.9%),落在允許區(qū)和大致允許區(qū)的各有1個殘基,而處于禁阻區(qū)的只有殘基Ser112。通過我們對這個蛋白本身的了解可知,Ser112為該水解酶的催化三聯(lián)體,其模板蛋白的Ser112同樣處于禁阻區(qū)。戶pg-日
19、f: ERRA-2亡 naintfjOverall qualitvfastor'*: E9.9202一1>_K'd1C012914D1 旳耳 iwirdofti Genl-er)©th* 祈r Hr 4 20 I鼻就!TIMC博 氓JI肚悄PB«lf他 Wtfi a iosa z bEc m: pqih p t-EEc« :esJ rst eri rrluei41 £沖ai沾自益SE*主自M tx; 31泄 n Z 補1*電站 s宣tv is u6-til>»Q* a< 孕咱I -IB. 3»c Fi
20、QA N6d5itjmlJFfl 2*rwa j srd-JjEiB- /b!n£i b-t- CKM ef ug-if sv 電 iLtQ!- i j Ip 11ft |Q -5<11 曲富即 尊知 3 1W-C B1*%接下來我們看看 ERRAT的結果,該結果中 Overall quality factor值越高越好,一般高解析度的晶體結構該值可以達到95,而對于解析度一般的來說該值只能到91%左右。本例中的ERRAT值為89.928,已經比較接近低解析度的晶體結構了,但是應該還有繼續(xù)改進 的空間。在圖中存在的兩條誤差限表示的是位于其線以上的區(qū)域有多大的可能性是有問 題的區(qū)
21、域。根據這一結果,可以看出從殘基120-150之間是一個需要高度注意的區(qū)域,另一個需要注意的區(qū)域是 250-255。從BphD的PDB結構來看這兩段主要是 loop區(qū),本 身具有較大的彈性,因此再接下來的過程中可能需要重點關注這一段結構的優(yōu)化。其他的參數如verify_3D等數值較好,在本例中未詳細給出,將在下一個修改版中放出 首先,我們考慮采用計算量較少的chiron服務器對模建結構的clash進行處理。其結果給出原始蛋白結構中存在的結構間的沖突以及其修正后的結果與原始結構的疊合結果。In 1 i -rJ f-1 ka c-.-Irl m i3 L- Enp ut- Di t.mcii |A
22、AuJusi 1;眄1電円(AVOW Ry t>Uk-'£.1 a (ktal rwoOo6C02號3.6002.929137*oEOG193 2002S900 37&GS9C0彌4 4£SH 653M19Q0783破D3 157a 524CA10OO12S 955 Z32OG10NE23.2D02.G510.56011CD2263.血3.041(LS52cs14OO1223 6603.092(j 34/U001爼3貂05. ?&S2 017CD14cs244 1193 394(J *34CD14OO1223 6602 8261 B5ZCE14CG24d 11B3 06&1 ?50NZ14CG243 &602.05S1.SB200116CA212轉百弓皿QWCE1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度智慧城市建設勞務合同實施策略及優(yōu)缺點
- 2025年度科技創(chuàng)新項目借款合同的概念與應用
- 二零二五年度連鎖健身房加盟經營合同規(guī)范
- 2025年度生態(tài)家居裝修主材保真及綠色認證服務協(xié)議
- 二零二五年度企業(yè)員工離職競業(yè)限制協(xié)議
- 二零二五年度大數據分析團隊勞動合同終止補償合同
- 二零二五年度變壓器行業(yè)產業(yè)投資基金合作合同
- 二零二五年度文化教育機構勞動合同解除協(xié)議
- 二零二五年度教育信息化項目教師聘用合同范文
- 2025年度水上樂園聘用船只駕駛員安全協(xié)議及游客安全合同
- 人教版小學一年級美術上冊全冊課件
- 統(tǒng)編人教部編版道德與法治四年級下冊教材解讀教師教材培訓課件
- 履約專項檢查表
- 人教版數學四年級下冊第一單元測試卷
- 模具保養(yǎng)記錄表
- 2023國家自然科學基金申請書
- 原始狩獵圖 (2)
- 《色彩構成——色彩基礎知識》PPT課件
- 綠色建筑及材料分析及案列
- 鍍層的結合力
- 霍尼韋爾DDC編程軟件(CARE)簡介
評論
0/150
提交評論