第11講 蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)_第1頁(yè)
第11講 蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)_第2頁(yè)
第11講 蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)_第3頁(yè)
第11講 蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)_第4頁(yè)
第11講 蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一講蛋白質(zhì)高級(jí)結(jié)構(gòu)預(yù)測(cè)Left:themodelwasgeneratedbyROSETTARight:themodelwasgeneratedbyI-TASSER蛋白質(zhì)高級(jí)結(jié)構(gòu)三維結(jié)構(gòu)功能作用機(jī)制分子間互作功能注釋指導(dǎo)實(shí)驗(yàn)驗(yàn)證功能確認(rèn)功能位點(diǎn)設(shè)計(jì)和改造蛋白藥物靶標(biāo)設(shè)計(jì)同源建模法(Homologymodeling)線索化法/折疊識(shí)別法/串線法(Threading/Foldrecognition)從頭預(yù)測(cè)法(Abinitio/Denovomethods)蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)方法依據(jù):a、一個(gè)蛋白質(zhì)的結(jié)構(gòu)由其氨基酸序列唯一的決定。由一級(jí)結(jié)構(gòu),在理論上,足以獲取其二級(jí)、三級(jí)結(jié)構(gòu)。b、三級(jí)結(jié)構(gòu)的保守型遠(yuǎn)遠(yuǎn)大于一級(jí)結(jié)構(gòu)的保守型。主要思想:

對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì),找到一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。1.蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)之同源建模同源建模的過(guò)程2.將模板結(jié)構(gòu)的坐標(biāo)拷貝到目標(biāo)U,僅拷貝匹配殘基的坐標(biāo)PDB數(shù)據(jù)庫(kù)1.PDB數(shù)據(jù)庫(kù)、BLAST(或PSI-BLAST)3、模型優(yōu)化,主鏈生成、環(huán)區(qū)建模、加氫4.

合理性檢測(cè)同源建模方法特點(diǎn)繞過(guò)了二級(jí)結(jié)構(gòu)預(yù)測(cè)目前蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法中最成功、最準(zhǔn)確、使用最多局限是:僅僅是一種技術(shù)手段,而非理論應(yīng)用范圍收已有同源結(jié)構(gòu)的限制Loop區(qū)域準(zhǔn)確率差同源建模在線服務(wù)器和軟件Swiss-modelHOMCOS1.0ESyPred3DNameMethodDescription3D-JIGSAWFragmentassemblyAutomatedwebserverRaptorXremotehomologydetection,protein3Dmodeling,bindingsitepredictionAutomatedwebserverandDownloadableprogramBiskitwrapsexternalprogramsintoautomatedworkflowBLASTsearch,T-Coffeealignment,andMODELLERconstructionCABSReducedmodelingtoolDownloadableprogramCPHModelFragmentassemblyAutomatedwebserverEasyModellerGUItoMODELLERStandalonewindowsexecutableESyPred3DTemplatedetection,alignment,3DmodelingAutomatedwebserverGeneSilicoConsensustemplatesearch/fragmentassemblyWebserverGeno3DSatisfactionofspatialrestraintsAutomatedwebserverHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityLIBRAILIghtBalanceforRemoteAnalogousproteins,ver.IWebserverLOMETSLocalMetathreadingserverMeta-servercombining9differentprogramsMODELLERSatisfactionofspatialrestraintsStandaloneprogrammainlyinFortranandPythonProtinfoCMComparativemodellingofproteinstructureusingminimumperturbationandloopbuildingWebserverBHAGEERATH-HCombinationofabinitiofoldingandhomologymethodsProteintertiarystructurepredictionsSTRUCTUROPEDIAWebInterfacetoMODELLERHomologymodelingofproteinsinmonomericormultimericformsaloneandincomplexwithpeptidesandDNAaswellasintroductionofmutationsandpost-translationalmodifications(PTMs)intoproteinstructuresSWISS-MODELLocalsimilarity/fragmentassemblyAutomatedwebserver(basedonProModII)TIP-STRUCTFASTAutomatedComparativeModelingWebserverandknowledgebaseWHATIFPositionspecificrotamersStandaloneprogramandwebinterfaceYasaraDetectionoftemplates,alignment,modelingincl.ligandsandoligomers,hybridizationofmodelfragmentsGraphicalinterfaceortextmode(clusters)SWISS-MODELSWISS-MODEL:網(wǎng)址/非專業(yè)人士應(yīng)用最為廣泛的一個(gè)在線建模服務(wù)器。特點(diǎn):簡(jiǎn)單、自動(dòng)化、對(duì)學(xué)術(shù)團(tuán)隊(duì)免費(fèi)。SWISS-MODEL:

//SWISS-MODEL.htmlAutomatedmodeAutomatedmode:自動(dòng)模式,可以稱為是最傻瓜的方式提交自己的氨基酸序列+郵箱即可適用:一致性較高時(shí)郵箱模型命名氨基酸序列PDB登錄號(hào)PDB模板AlignmentmodeAlignmentmode:比對(duì)模式提交目標(biāo)蛋白與模板蛋白的序列比對(duì)結(jié)果(FASTA,MSF,ClustalW等格式)適用:a、較高的相似性b、利用Auto模式未必能找到最合適模板的情況

c、使用者有目的的使用特定的模板蛋白(比如具有更為相似的活性位點(diǎn)結(jié)果,而不是更為相似的整體結(jié)構(gòu))郵箱模型命名比對(duì)后的序列比對(duì)文件ProjectmodeProjectmode:項(xiàng)目模式:

難以直接通過(guò)序列比對(duì)獲得模板,需要人工插入調(diào)節(jié)(借助蛋白結(jié)構(gòu)編輯軟件deepview),可以將前兩種模式模建出的蛋白進(jìn)行人為調(diào)整適用:相似性不高HOMCOS1.0HOMCOS1.0:tein.osaka-u.ac.jp/homcos/同源二聚體建模異源二聚體建模識(shí)別可能的互作蛋白ESyPred3DESyPred3D:http://www.unamur.be/sciences/biologie/urbm/bioinfo/esypred/評(píng)價(jià):自動(dòng)建模預(yù)測(cè)服務(wù)程序,ESyPred3D在目標(biāo)-模板比對(duì)這一步做出的結(jié)果較好,且在預(yù)測(cè)序列與模板序列相似度差時(shí)有較好的模型預(yù)測(cè)效果。Modeller該軟件由Salilab開發(fā),目前最新的版本是9.11,可在win下和linux運(yùn)行,需要對(duì)應(yīng)版本的python(<3.0)。完全免費(fèi)。主要功能包括:多聚體建模,二硫鍵建模,雜原子建模等(配體、輔酶等)。自帶一套模建結(jié)構(gòu)后的優(yōu)化、分析。But!該軟件完全是命令行模式,操作相對(duì)復(fù)雜,可控制的地方多。Easymodeller對(duì)于習(xí)慣于GUI的我們來(lái)說(shuō),modeller操作不太方便。于是。。。印度Hyderabad大學(xué)的KuntalKumarBhusan為其編寫了一個(gè)GUI界面,即為EasyModeller。EasyModeller,目前最新版本為4.0。之后,又有SWIFTMODELLER,UCSFChimerainterface2.蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)之線索化方法

Threading/foldrecognition線索化方法又稱蛋白質(zhì)折疊類型識(shí)別依據(jù):蛋白質(zhì)折疊模式的有限性:一些序列(小于25%,遠(yuǎn)程同源)/功能不同的蛋白質(zhì)采用類似的結(jié)構(gòu),蛋白質(zhì)折疊模式的種類是有限的。序列中的殘基的結(jié)構(gòu)信息比殘基本身更加保守。Physicalforcesfavorcertainstructures.Structureisbetterconservedthansequence蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(kù)SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)Numberoffoldsislimited.Currently~700,Total:1,000~10,000CATH的結(jié)構(gòu)層次有限的蛋白質(zhì)折疊類型258種類型165種類型141種類型334種類型50種類型90%ofnewstructuressubmittedtoPDBinthepastthreeyearshavesimilarstructuralfoldsinPDB目標(biāo)序列與數(shù)據(jù)庫(kù)核心折疊比對(duì)取最佳核心折疊結(jié)構(gòu)模型主要思想:利用氨基酸的結(jié)構(gòu)傾向(如形成二級(jí)結(jié)構(gòu)的傾向、疏水性、極性等),評(píng)價(jià)一個(gè)序列所對(duì)應(yīng)的結(jié)構(gòu)是否能夠適配到一個(gè)給定的結(jié)構(gòu)環(huán)境中。建立序列到結(jié)構(gòu)的線索的過(guò)程稱為線索化,線索技術(shù)又稱折疊識(shí)別技術(shù)。具體做法是將結(jié)構(gòu)轉(zhuǎn)換為含有這三個(gè)結(jié)構(gòu)的字符串,然后對(duì)這些字符串進(jìn)行比較(sequence-structure

alignment)。線索技術(shù)的首要任務(wù)是建立核心折疊數(shù)據(jù)庫(kù)在預(yù)測(cè)蛋白質(zhì)空間結(jié)構(gòu)時(shí)將一個(gè)待預(yù)測(cè)結(jié)構(gòu)的蛋白質(zhì)序列與數(shù)據(jù)庫(kù)中核心折疊進(jìn)行比對(duì),找出比對(duì)結(jié)果最好的核心折疊,作為構(gòu)造待預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)模型的根據(jù)。evaluationwithcompatibilityfunctionsthestructuremostcompatiblewiththesequence

ConceptofThreadingThread(alignorplace)aqueryproteinsequenceontoatemplatestructurein“optimal”wayGoodalignmentgivesapproximatebackboneQuerysequence:MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTETemplatesetThreadingproblem

Threading:Givenasequence,andafold(template),computetheoptimalalignmentscorebetweenthesequenceandthefold.Ifwecansolvetheaboveproblem,thenGivenasequence,wecantryeachknownfold,andfindthebestfoldthatfitsthissequence.Becausethereareonlyafewthousandsfolds,wecanfindthecorrectfoldforthegivensequence.ThreadingisNP-hard.ProteinThreading–structuredatabaseBuildatemplatedatabaseProteinThreading–energyfunctionhowwellaresiduefitsastructuralenvironment:E_showpreferabletoputtwoparticularresiduesnearby:E_palignmentgappenalty:E_gtotalenergy:E_p+E_s+E_gfindasequence-structurealignmenttominimizetheenergyfunction序列-結(jié)構(gòu)最佳對(duì)齊方式,能量最小化MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTEAssessingPredictionReliabilityPredictionofProteinStructuresExamples–afewgoodexamplesPredictionofProteinStructuresNotsogoodexampleExistingPredictionProgramsPROSPECT:/protein_pipelineFUGU:http://www-cryst.bioc.cam.ac.uk/~fugue/prfsearch.htmlTHREADER:http://bioinf.cs.ucl.ac.uk/threader/NameMethodDescriptionRaptorXRemotetemplatedetection,single-templateandmulti-templatethreading,totallydifferentfromandmuchbetterthantheoldprogramRAPTORdesignedbythesamegroupWebserverwithjobmanager,automaticallyupdatedfoldlibrary3D-PSSM3D-1Dsequenceprofiling(replacedbyPhyre)WebserverBioingbuEvolutionaryinformationrecognitionWebserverFALCON@homeSingle-templateandmulti-templatethreading,ahigh-throughputserverbasedonvolunteercomputingWebserverwithjobmanagerHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityNovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERCombinationofabinitiofoldingandthreadingmethodsStructuralandfunctionpredictionsLOOPPMultiplemethodsWebservermGenTHREADER/GenTHREADERSequenceprofileandpredictedsecondarystructureWebserverMUSTERprofile-profilealignmentWebserverPhyreandPhyre2Remotetemplatedetection,alignment,3Dmodeling,multi-templates,abinitioWebserverwithjobmanager,automaticallyupdatedfoldlibrary,genomesearchingandotherfacilitiesRAPTORIntegerprogrammingbasedfoldrecognitionFreedemoSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingFreedemo,interactivewebserverandstandaloneprogramincluding:3Dthreadingandflexible3dthreadingSUPERFAMILYHiddenMarkovmodelingWebserver/standaloneSPARKS-X3DstructuremodelingbyFoldrecognitionaccordingtoSequenceprofilesandstructuralprofilesWebserverBBSP-BuildingBlocksStructurePredictorHybridtemplate-basedFreeapplicationplusdatabase

I-TASSAR

I-TASSAR:/I-TASSER/也可以下載本地安裝包評(píng)價(jià):根據(jù)結(jié)果質(zhì)量檢驗(yàn),該服務(wù)器應(yīng)該是自動(dòng)建模的軟件里是結(jié)果最詳細(xì)的,二級(jí)結(jié)構(gòu)、top10模型、配體結(jié)合位點(diǎn)等等。缺點(diǎn):計(jì)算結(jié)果時(shí)間比較長(zhǎng)

結(jié)果需要進(jìn)一步優(yōu)化FlowchartofI-TASSERproteinstructuremodelling3.蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)之從頭預(yù)測(cè)在既沒(méi)有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒(méi)有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)的情況下使用根據(jù)序列本身來(lái)預(yù)測(cè)其結(jié)構(gòu)可以用來(lái)預(yù)測(cè)任何一種蛋白質(zhì)是三種方法中難度最大的基于一種假設(shè)-蛋白質(zhì)折疊為能量最低的形式準(zhǔn)確率較同源模建法要低(序列相似性>30%)能量函數(shù)和優(yōu)化需要考慮的相互作用:疏水作用氫鍵二硫橋靜電作用范德華力溶劑作用NameMethodDescriptionEVfoldEvolutionarycouplingscalculatedfromcorrelatedmutationsinaproteinfamily,usedtopredict3Dstructurefromsequencesaloneandtopredictfunctionalresiduesfromcouplingstrengths.Predictsbothglobularandtransmembraneproteins.WebserverFALCONAposition-specifichiddenMarkovmodeltopredictproteinstructurebyiterativelyrefiningthedistributionsofdihedralanglesWebserverQUARKMonteCarlofragmentassemblyOn-lineserverforproteinmodeling(bestforabinitiofoldinginCASP9)NovaFoldCombinationofthreadingandabinitiofoldingCommercialproteinstructurepredictionapplicationI-TASSERThreadingfragmentstructurereassemblyOn-lineserverforproteinmodelingROSETTARosettahomologymodelingandabinitiofragmentassemblywithGinzudomainpredictionWebserverRosetta@homeDistributed-computingimplementationofRosettaalgorithmDownloadableprogramCABSReducedmodelingtoolDownloadableprogramCABS-FOLDServerfordenovomodeling,canalsousealternativetemplates(consensusmodeling).WebserverBhageerathAcomputationalprotocolformodelingandpredictingproteinstructuresattheatomiclevel.WebserverAbaloneMolecularDynamicsfoldingProgramPEP-FOLDDenovoapproach,basedonaHMMstructuralalphabetOn-lineserverforpeptidestructurepredictionSelvitaProteinModelingPlatformPackageoftoolsforproteinmodelingInteractivewebserverandstandaloneprogramincluding:CABSabinitiomodelingFlowchartoftheROSETTAprotocol

方法特點(diǎn)工具同源建模法(Homology/Comparativemodelling)基于模板的蛋白結(jié)構(gòu)預(yù)測(cè);對(duì)于序列相似度的序列模擬比較有效最常用的方法SWISS-MODEL線索化法/折疊識(shí)別法

(Threading/Foldrecognition)基于模板的蛋白結(jié)構(gòu)預(yù)測(cè);“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi)適于對(duì)蛋白質(zhì)核心結(jié)構(gòu)進(jìn)行預(yù)測(cè)計(jì)算量大PHYRETHREADER,從頭預(yù)測(cè)法(Abinitio/Denovomethods)不依賴模板的蛋白結(jié)構(gòu)預(yù)測(cè),直接預(yù)測(cè);基于分子動(dòng)力學(xué),尋找能量最低的構(gòu)象;計(jì)算量大,目前只能做小分子預(yù)測(cè);理論意義極大HMMSTR/ROSSETA4.蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法比較蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法比較二5.模型評(píng)估在模型使用前要對(duì)其進(jìn)行評(píng)估!同源模建結(jié)果評(píng)價(jià)與改進(jìn)策略PROCHECK、WHATCHECK、ERRAT、Verify_3D、PROVEUCLA-DOE的SAVES服務(wù)器包括了這五種常用的檢測(cè),其網(wǎng)址為:/SAVES/除SAVES外,Molprobity也是一個(gè)常用的在線模型分析工具,其網(wǎng)址為:/index.php

PROCHECK:以PDB中高分辨的晶體結(jié)構(gòu)參數(shù)為參考,給出提交模型的一系列立體化學(xué)參數(shù)(主鏈)。其輸出的結(jié)果包括:拉氏圖,主鏈的鍵長(zhǎng)與鍵角,二級(jí)結(jié)構(gòu)圖,平面?zhèn)孺溑c水平面之間的背離程度等。WHATCHECK:包含大量的檢測(cè)項(xiàng),可以針對(duì)提交的蛋白結(jié)構(gòu)與正常結(jié)構(gòu)之間的差異,產(chǎn)生一個(gè)非常長(zhǎng)而且詳細(xì)的報(bào)告。ERRAT:計(jì)算0.35nm范圍之內(nèi),不同原子類型對(duì)之間形成的非鍵相互作用的數(shù)目(側(cè)鏈)。原子按照C、N、O/S進(jìn)行分類,所以有六種不同的相互作用類型:CC、CN、CO、NN、NO、OO。得分>85比較好。Verify_3D:比較模型和氨基酸一級(jí)結(jié)構(gòu)的關(guān)系,獲得PASS評(píng)價(jià)即可。PROVE:與預(yù)先計(jì)算好的一系列標(biāo)準(zhǔn)體積之間的差別。用Z-score

來(lái)表示。Z-score作為一個(gè)統(tǒng)計(jì)學(xué)值,可以顯示模板蛋白質(zhì)和待測(cè)蛋白之間的匹配程度,當(dāng)Z-score較低時(shí),就意味著沒(méi)有匹配搜索的結(jié)構(gòu)模型提交SAVES服務(wù)器(StructuralAnalysisandVerificationServer)進(jìn)行檢驗(yàn)/SAVES/PROCHECKPROCHECK:本部分主要需要的是拉氏圖(RamachandranPlot),可下載ps格式、PDF格式以及JPG格式。落在核心區(qū)+允許區(qū)+最大允許區(qū)的堿基百分比大于95%的模型質(zhì)量很好。RamachandranplotVerify_3D78.74%oftheresidueshadanaveraged3D-1Dscore>0.2ERRATOverallqualityfactor值越高越好,一般高解析度的晶體結(jié)構(gòu)該值可以達(dá)到95,而對(duì)于解析度一般的來(lái)說(shuō)該值只能到91左右。本例中的ERRAT值為68.280,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論