蛋白質(zhì)功能-結(jié)構(gòu)-相互作用預(yù)測(cè)網(wǎng)站工具合集_第1頁
蛋白質(zhì)功能-結(jié)構(gòu)-相互作用預(yù)測(cè)網(wǎng)站工具合集_第2頁
蛋白質(zhì)功能-結(jié)構(gòu)-相互作用預(yù)測(cè)網(wǎng)站工具合集_第3頁
蛋白質(zhì)功能-結(jié)構(gòu)-相互作用預(yù)測(cè)網(wǎng)站工具合集_第4頁
蛋白質(zhì)功能-結(jié)構(gòu)-相互作用預(yù)測(cè)網(wǎng)站工具合集_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、蛋白質(zhì)組學(xué)蛋白質(zhì)是生物體的重要組成部分,參與幾乎所有生理和細(xì)胞代謝過程。此外,與基因組學(xué)和轉(zhuǎn)錄組學(xué)比較,對(duì)一個(gè)細(xì)胞或組織中表達(dá)的所有蛋白質(zhì),及其修飾和相互作用的大規(guī)模研究稱為蛋白質(zhì)組學(xué)。蛋白質(zhì)組學(xué)通常被認(rèn)為是在基因組學(xué)和轉(zhuǎn)錄組學(xué)之后,生物系統(tǒng)研究的下一步。然而,蛋白質(zhì)組的研究遠(yuǎn)比基因組 學(xué)復(fù)雜,這是由于蛋白質(zhì)內(nèi)在的復(fù)雜特點(diǎn),如蛋白質(zhì)各種各樣的翻譯后修飾所決定的。并且,研究基因組學(xué)的技術(shù) 要比研究蛋白質(zhì)組學(xué)的技術(shù)強(qiáng)得多,雖然在蛋白質(zhì)組學(xué)研究中,質(zhì)譜技術(shù)的研究已取得了一些進(jìn)展。盡管存在方法上的挑戰(zhàn),蛋白質(zhì)組學(xué)正在迅速發(fā)展,并且對(duì)癌癥的臨床診斷和疾病治療做出了重要貢獻(xiàn)。幾項(xiàng)研究鑒定出了一些蛋白質(zhì)在乳

2、腺癌、卵巢癌、前列腺癌和食道癌中表達(dá)變化。例如,通過蛋白質(zhì)組學(xué)技術(shù),人們可以在患者血液中明確鑒定出腫瘤標(biāo)志物。表1列出了更多的蛋白質(zhì)組學(xué)技術(shù)用于研究癌癥的例子。另外,高爾基體功能復(fù)雜。最新研究表明,它除了參與蛋白加工外,還能參與細(xì)胞分化及細(xì)胞間信號(hào)傳導(dǎo)的過程,并在凋亡中扮演重要角色,其功能障礙也許和腫瘤的發(fā)生、發(fā)展有某種聯(lián)系。根據(jù)人類基因組研究,約1000多種人類高爾基體蛋白質(zhì)中僅有500600種得到了鑒定,建立一條關(guān)于高爾基體蛋白質(zhì)組成的技術(shù)路線將有助于其功能的深入研究。蛋白質(zhì)組學(xué)是一種有效的研究方法,特別是隨著亞細(xì)胞器蛋白質(zhì)組學(xué)技術(shù)的迅猛發(fā)展,使高爾基體的全面研究變?yōu)?可能。因此研究人員希

3、望能以胃癌細(xì)胞中的高爾基體為研究對(duì)象,通過亞細(xì)胞器蛋白質(zhì)組學(xué)方法,建立胃癌細(xì)胞中 高爾基體的蛋白質(zhì)組方法學(xué)。研究人員采用蔗糖密度梯度的超速離心方法分離純化高爾基體,雙向凝膠電泳(2-DE)分離高爾基體蛋白質(zhì),用ImageMaster 2D軟件分析所得圖譜,基質(zhì)輔助激光解吸離子化飛行時(shí)間質(zhì)譜( MALDI-TOF MS )鑒定蛋白質(zhì)點(diǎn)等一 系列亞細(xì)胞器蛋白質(zhì)組學(xué)方法建立了胃癌細(xì)胞內(nèi)高爾基體的蛋白圖譜。最后,人們根據(jù)分離出的純度較高的高爾基體建立了分辨率和重復(fù)性均較好的雙向電泳圖譜,運(yùn)用質(zhì)譜技術(shù)鑒定出12個(gè)蛋白質(zhì),包括蛋白合成相關(guān)蛋白、膜融合蛋白、調(diào)節(jié)蛋白、凋亡相關(guān)蛋白、運(yùn)輸?shù)鞍缀图?xì)胞增殖分化相關(guān)

4、蛋白。通過亞細(xì)胞器分離純化、雙向電泳的蛋白分離及MALDI-TOF MS蛋白鑒定分析,研究人員首次成功建立了胃癌細(xì)胞SGC7901中高爾基體的蛋白質(zhì)組學(xué)技術(shù)路線。3.1 蛋白質(zhì)功能預(yù)測(cè)工具也許生物信息學(xué)方法在癌癥研究中最常用的就是基因功能預(yù)測(cè)方法,但是這些數(shù)據(jù)庫只存儲(chǔ)了基因組的大約一半基因的功能。為了在微陣列資料基礎(chǔ)上完成功能性的富集分析,基因簇的功能注解是非常重要的。近幾年生物學(xué)家研發(fā)了一些基因功能預(yù)測(cè)的方法,這些方法旨在超越傳統(tǒng)的BLAST搜索來預(yù)測(cè)基因的功能?;蚬δ茴A(yù)測(cè)可以以氨基酸序列、三級(jí)結(jié)構(gòu)、與之相互作用的配體、相互作用過程或基因的表達(dá)方式為基礎(chǔ)。其中最重要的是基于氨基酸序列的分析

5、,因?yàn)檫@種方法適合于微陣列分析的全部基因。在表3中,前三項(xiàng)列舉了三種同源搜索方法。FASTA方法雖然應(yīng)用還不太廣泛,但它要優(yōu)于 BLAST ,或者至少相當(dāng)。FASTA程序是第一個(gè)使用的數(shù)據(jù)庫相似性搜索程序。為了達(dá)到較高的敏感程度,程序引用取代矩陣實(shí)行局部比對(duì)以獲得最佳搜索。美國(guó)弗吉尼亞大學(xué)可以提供這項(xiàng)程序的地方版本,當(dāng)然數(shù)據(jù)庫搜索結(jié)果依賴于要搜索的數(shù)據(jù)庫序列。如果最近的序列數(shù)據(jù)庫版本在弗吉尼亞大學(xué)不能獲得,那么就最好試一下京都大學(xué) (Kyoto University )的KEGG站點(diǎn)。PSI-BLAST (位點(diǎn)特異性反復(fù) BLAST)是BLAST的轉(zhuǎn)化版本,PSI-BLAST的特色是每次用 p

6、rofile搜索數(shù)據(jù)庫 后再利用搜索的結(jié)果重新構(gòu)建 profile ,然后用新的profile再次搜索數(shù)據(jù)庫,如此反復(fù)直至沒有新的結(jié)果產(chǎn)生為止。PSI-BLAST先用帶空位的BLAST搜索數(shù)據(jù)庫,將獲得的序列通過多序列比對(duì)來構(gòu)建第一個(gè)profile。PSI-BLAST自然地拓展了 BLAST方法,能尋找蛋白質(zhì)序列中的隱含模式,有研究表明這種方法可以有效地找到很多序列差異較大編輯版word而結(jié)構(gòu)功能相似的相關(guān)蛋白,所以它比BLAST和FASTA有更好的敏感性。PSI-BLAST服務(wù)可以在NCBI的BLAST主頁上找到,還可以從NCBI的FTP服務(wù)器上下載 PSI-BLAST的獨(dú)立程序。在檢查 P

7、SI-BLAST的搜索輸出時(shí),也有一些注意事項(xiàng),因?yàn)榧俚钠ヅ溆涗浐苋菀孜廴痉治鼋Y(jié)果。表3蛋白質(zhì)功能預(yù)測(cè)工具預(yù)測(cè)工具類型所在地網(wǎng)站BLAST同源搜索NCBI :美國(guó)國(guó)立生物技術(shù)信息中心;NIH :美國(guó)國(guó)家醫(yī)學(xué)研究院/BLASTselect protein-proteinBLASTFASTA同源搜索美國(guó)弗吉尼亞大學(xué)、日本京都大學(xué)http:/fasta.genome.jp/PSI-BLAST同源搜索NCBI :美國(guó)國(guó)立生物技術(shù)信息中心;NIH :美國(guó)國(guó)家醫(yī)學(xué)研究院http:/www.ncb

8、/BLASTselect- arPISIPHI- BLAST1Pfam蛋白質(zhì)家族鑒定華盛頓大學(xué)SMART保守結(jié)構(gòu)域搜索EMBL :歐洲分子生物學(xué)實(shí)驗(yàn)室http:/smart.embl-heidelberg.dePROSITE功能模體搜索瑞士生物信息研究所http:/prositehttp:/motif.genome.ad.jpjELM真核生物功能結(jié)構(gòu)域搜索ELM聯(lián)合體STRING通過比較基因組學(xué)進(jìn)行功能預(yù)測(cè)EMBL (歐洲分子生物學(xué)實(shí)驗(yàn)室)http:/string.emb

9、l.dePSORT亞細(xì)胞定位預(yù)測(cè)人類基因組中心東京大學(xué)1PFP通過發(fā)掘PSI-BLAST結(jié)果進(jìn)行功能預(yù)測(cè)美國(guó)普渡大學(xué)/pfpPfam數(shù)據(jù)庫(Protein families database of alignments and HMM,蛋白質(zhì)家族比對(duì)和 HMM 數(shù)據(jù)庫)是基于 HMM 模型 (隱馬爾可夫模型)構(gòu)建并拓展起來的。它實(shí)際上是一個(gè)涵蓋了生物蛋白質(zhì)序列中常見結(jié)構(gòu)域的序列及其相對(duì)應(yīng)的隱馬爾科夫模型的數(shù)據(jù)庫,由英國(guó)的Sange門nstitute維護(hù)。Hmmpfam的工作原理簡(jiǎn)單來說,就是將用戶所提交

10、的查詢序列在Pfam庫中做比對(duì)計(jì)算,然后預(yù)測(cè)出查詢序列中所隱含的結(jié)構(gòu)域信息。表4中描述的三個(gè)數(shù)據(jù)庫資源簡(jiǎn)單模塊構(gòu)架搜索工具( simple modular architecture research tool, SMART)、Motif數(shù)據(jù)庫(PROSITE)以及ELM是具有不同特點(diǎn)的數(shù)據(jù)模體數(shù)據(jù)庫。SMART儲(chǔ)存有蛋白質(zhì)家族的保守區(qū)域,可以作為每一個(gè)基因家族的特征標(biāo)記。SMART可以說是蛋白結(jié)構(gòu)預(yù)測(cè)和功能分析的工具集合。簡(jiǎn)單點(diǎn)說,SMART就是集合了一些工具,可以預(yù)測(cè)蛋白的一些二級(jí)結(jié)構(gòu),如跨膜區(qū)(Transmembrane segment、復(fù)合螺旋區(qū)(coiled coil region)、

11、信號(hào)月太(Signal peptidR和蛋白Z構(gòu)域(PFAM domain )等。另一方面,PROSITE中的序列模體是一些重要的生物 學(xué)位點(diǎn),包括功能位點(diǎn)和容易被修飾的位點(diǎn)。ELM是真核生物功能位點(diǎn)數(shù)據(jù)庫。編輯版wordPROSITE數(shù)據(jù)庫是基于多序列比較而得到的單一彳守序列片段,或稱序列模體。PROSITE數(shù)據(jù)庫是基于對(duì)蛋白質(zhì)家族中同源序列多重序列比對(duì)得到的保守性區(qū)域,這些區(qū)域通常與生物學(xué)功能有關(guān),例如酶的活性位點(diǎn)、配體或金 屬結(jié)合位點(diǎn)等。因此, PROSITE數(shù)據(jù)庫實(shí)際上是蛋白質(zhì)序列功能位點(diǎn)數(shù)據(jù)庫。通過對(duì)PROSITE數(shù)據(jù)庫的搜索,可判斷該序列包含什么樣的功能位點(diǎn),從而推測(cè)其可能屬于哪一

12、個(gè)蛋白質(zhì)家族。Prosite數(shù)據(jù)庫實(shí)際上包括兩個(gè)數(shù)據(jù)庫文件:一個(gè)為數(shù)據(jù)文件,即Prosite,該文件給出了能進(jìn)行匹配的序列及序列的詳細(xì)信息;另一個(gè)為說明文件,即PrositeDoCo PrositeDoc說明文件中給出該序列模式的生物學(xué)功能及其文獻(xiàn)資料來源。PROSITE數(shù)據(jù)庫使用正則表達(dá)式來表示序列模式。 STRING是一個(gè)已知和預(yù)測(cè)基因間功能聯(lián)系的數(shù)據(jù)庫。STRING 一個(gè)有趣的特點(diǎn)是,一個(gè)查詢序列的功能是利用比較基因組學(xué)方法預(yù)測(cè)的。例如,假設(shè)一個(gè)要查詢的基因是幾個(gè)基因組中功能已知的基因,這幾個(gè)基因組進(jìn)化上相關(guān),那么預(yù)示著要查詢的基因與相鄰基因可能涉及相同的途徑或功能。具有相同的系統(tǒng)發(fā)生的

13、那些基因,或同時(shí)存在和同時(shí)消失的那些基因也預(yù)示著他們的功能是相互聯(lián)系的。SMART也利用微陣列中的共表達(dá)來分析,用戶可以利用SMART站點(diǎn)進(jìn)行功能預(yù)測(cè),基因功能之間的聯(lián)系資料也可以免費(fèi)獲得。 PSORT工具可以預(yù)測(cè)基因的亞細(xì)胞定位。從根本上說,PSORT工具基于其氨基酸序列預(yù)測(cè)蛋白質(zhì)亞細(xì)胞定位。它利用機(jī)器將要查詢蛋白質(zhì)的特殊序列(如信號(hào)肽序列) 檢測(cè)和分類并定位到已知位置。PSORT II是廣泛使用的蛋白質(zhì)亞細(xì)胞定位分析軟件,通過輸入的氨基酸序列,能夠預(yù)測(cè)出其在亞細(xì)胞結(jié)構(gòu)中可能的位置。 PFP (蛋白質(zhì)功能預(yù)測(cè))服務(wù)器是最近研發(fā)的。不同于傳統(tǒng)的PSI-BLAST , PFP利用序列采樣數(shù)可以發(fā)

14、掘更多的功能信息。 在列出的蛋白質(zhì)功能預(yù)測(cè)工具中,BLAST、FASTA和Pfam最可靠,但它們無法提供關(guān)于已經(jīng)儲(chǔ)存在公共數(shù)據(jù)庫中的已注解基因的更多的信息。其它方法都優(yōu)于上述三種方法,且有更廣的覆蓋率,但是使用時(shí)要小心,因?yàn)橛邢鄬?duì) 較高的假采樣。為了避免這種情況發(fā)生,應(yīng)該多采樣幾種方法,檢查獲得結(jié)果的一致性。表4蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具預(yù)測(cè)工具類型所在地網(wǎng)址PSIPRED二級(jí)結(jié)構(gòu)倫敦大學(xué)http:/bioinf.cs.ucl.ac.uk/psipred/PORTER二級(jí)結(jié)構(gòu)都柏林學(xué)院http:/distill.ucd.ie/porter/SAM-T02二級(jí)結(jié)構(gòu)加州大學(xué)圣塔克魯茲分校http:/www

15、./research/compbio/HMM-apps/T02-query.htmlSABLE二級(jí)結(jié)構(gòu)和溶劑可接近性美國(guó)辛辛那提兒童研究基金會(huì)兒童醫(yī)院醫(yī)療中心/PredictProtein二級(jí)結(jié)構(gòu)和其他美國(guó)哥倫比亞大學(xué)/predictprotein/COILS2個(gè)或以上的a螺旋組成的超螺旋結(jié)構(gòu)區(qū)域(卷曲螺旋區(qū)域)瑞士,EMBnet/software/COILSform.html編輯版wordGlobPlot無規(guī)則區(qū)域歐洲分子生

16、物學(xué)實(shí)驗(yàn)室1jhttp:/globplot.embl.de/PONDR無規(guī)則區(qū)域印地安納大學(xué)TMHMM跨膜結(jié)構(gòu)域丹麥科技大學(xué)http:/www.cbs.dtu.dK/services/TMHMM-2.0/1HMMTOP跨膜結(jié)構(gòu)域匈牙利科學(xué)院http:/www.enzim.hu/hmmtop/SWISS-MODEL3D結(jié)構(gòu)同源建模法瑞士生物信息研究所HHPred3D結(jié)構(gòu)同源建模法馬克斯?普朗克科學(xué)促進(jìn)協(xié)會(huì)http:protevo.eb.tuebingenmpg.de/toolkit/index.php?view=hhpredrMODELLER

17、3D結(jié)構(gòu)同源建模法加州大學(xué)舊金山分校/modeller/1FUGUE3D結(jié)構(gòu),指認(rèn)方法(線引法或穿線法)劍橋大學(xué)http:/www-cryst.bioc.camac.uk/fugue/Phyre3D結(jié)構(gòu),指認(rèn)方法(線引法或穿線法)帝國(guó)理工學(xué)院(倫敦大學(xué)(University ofLondon )的獨(dú)立學(xué)院)http:/www.sbg.bio.ic.ac.uk/phyre/SPARKS3D結(jié)構(gòu),指認(rèn)方法(線引法或穿線法)紐約州立大學(xué)水牛城分校/hzhou/anonymous-fold-sparks2.htm

18、lRobetta3D結(jié)構(gòu)從頭計(jì)算法(ab initio )華盛頓大學(xué)/3.2 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具當(dāng)候選基因被選擇出來通過微陣列進(jìn)行實(shí)驗(yàn)檢測(cè)時(shí),生物信息學(xué)蛋白質(zhì)預(yù)測(cè)工具就對(duì)設(shè)計(jì)生物化學(xué)實(shí)驗(yàn)非常重要。 例如,一個(gè)基因預(yù)測(cè)的二級(jí)結(jié)構(gòu)就對(duì)預(yù)測(cè)結(jié)構(gòu)域很有益處,因?yàn)檫@對(duì)設(shè)計(jì)有限的蛋白質(zhì)水解以鑒定基因的功能區(qū)域 非常重要。當(dāng)今二級(jí)結(jié)構(gòu)預(yù)測(cè)算法的準(zhǔn)確率大約75%,足以達(dá)到平常預(yù)測(cè)的要求。表 4中列舉了 5種二級(jí)結(jié)構(gòu)預(yù)測(cè)工具,它們都利用機(jī)器學(xué)習(xí)的技術(shù)來識(shí)別大家熟悉的二級(jí)結(jié)構(gòu),如 優(yōu)螺旋和3折疊。機(jī)器學(xué)習(xí)就是要使計(jì)算機(jī)能模 擬人的學(xué)習(xí)行為自動(dòng)通過學(xué)習(xí)獲取知識(shí)和技

19、能,不斷改善性能,實(shí)現(xiàn)自我完善。機(jī)器學(xué)習(xí)研究的就是如何通過識(shí)別和利用現(xiàn)有知識(shí)來獲取新知識(shí)和新技能。PSI-PRED、PORTER、SABLE和PredictProtein seartificial利用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks ,簡(jiǎn)寫為 ANNs ),而 SAM-T02 則利用 HMM。 SABLE 和 PORTER 被認(rèn)為是這個(gè)領(lǐng) 域中最準(zhǔn)確的預(yù)測(cè)工具,它們的準(zhǔn)確率分別可以達(dá)到78.4%和79%。盡管列表中的工具在蛋白質(zhì)預(yù)測(cè)方面準(zhǔn)確率還相對(duì)較低,但這些工具不僅能夠預(yù)測(cè)二級(jí)結(jié)構(gòu),也能夠預(yù)測(cè)其它結(jié)構(gòu)信息,包括混亂區(qū)域、兩個(gè)或兩個(gè)以上的“螺旋組成的超螺旋結(jié)構(gòu)

20、區(qū)域、每個(gè)殘基的可溶解程度以及要搜索序列的模體結(jié)構(gòu),所以他們可以用來“一步完成”蛋編輯版word白質(zhì)序列分析。COILS通過序列中周期出現(xiàn)的疏水殘基來預(yù)測(cè)蛋白質(zhì)的卷曲螺旋。卷曲螺旋是存在于多種天然蛋白 質(zhì)中的結(jié)構(gòu)模式。近年來,人們通過對(duì)天然蛋白質(zhì)中的卷曲螺旋結(jié)構(gòu)以及根據(jù)已有知識(shí)設(shè)計(jì)合成的卷曲螺旋結(jié)構(gòu)的 研究,已基本掌握了這類結(jié)構(gòu)模式的特點(diǎn),并將特異的卷曲螺旋結(jié)構(gòu)應(yīng)用于生化分析、工業(yè)和醫(yī)藥衛(wèi)生等領(lǐng)域。 GlobPlot和PONDR是預(yù)測(cè)蛋白質(zhì)固有無規(guī)則區(qū)域的工具,這些區(qū)域的天然構(gòu)象中,沒有穩(wěn)定的蛋白質(zhì)二級(jí)結(jié)構(gòu)。 這些無規(guī)則區(qū)域的重要性最近才剛剛被人們發(fā)現(xiàn),因?yàn)樗鼈兪呛芏嘀匾墓δ苄晕稽c(diǎn),例如其它

21、蛋白質(zhì)和配體的結(jié) 合區(qū)域位于球狀蛋白質(zhì)的結(jié)構(gòu)域的外部,所以本質(zhì)上是沒有規(guī)則的3。HMMTOP是預(yù)測(cè)蛋白序列的跨膜螺旋與拓?fù)浣Y(jié)構(gòu)工具,TMHMM是預(yù)測(cè)蛋白的跨膜螺旋工具。它們都利用了 HMM??缒そY(jié)構(gòu)域預(yù)測(cè)是生物信息學(xué)在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中應(yīng)用得最成功,HMMTOP預(yù)測(cè)的跨膜蛋白質(zhì) 98%的結(jié)構(gòu)域和85%的拓?fù)浣Y(jié)構(gòu)是正確的。且上述這兩種工具是基于網(wǎng)絡(luò)的,HMMTOP也提供本地拷貝3。表5的后面列舉了 5種預(yù)測(cè)三級(jí)結(jié)構(gòu)的工具。預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)的方法在最近幾十年中有了較大的改進(jìn),并且有 些方法的準(zhǔn)確率已經(jīng)足以應(yīng)用于實(shí)踐3。結(jié)構(gòu)預(yù)測(cè)方法大致分為三類: (1)同源性建模(homology modeling

22、)方法:這類方法的理論依據(jù)是,如果兩個(gè)蛋白質(zhì)的序列比較相似,則其結(jié)構(gòu)也 有很大可能比較相似。有實(shí)驗(yàn)表明,如果序列相似性高于75%,則可以使用這種方法進(jìn)行粗略的預(yù)測(cè)。這類方法的優(yōu)點(diǎn)是準(zhǔn)確度高,缺點(diǎn)是只能處理和模板庫中蛋白質(zhì)序列相似性較高的情況;(2)從頭計(jì)算(Ab initio或de novo)方法:這類方法的依據(jù)是熱力學(xué)理論,即求蛋白質(zhì)能量最小的狀態(tài)。生物學(xué)家 和物理學(xué)家等認(rèn)為從原理上講這是影響蛋白質(zhì)結(jié)構(gòu)的本質(zhì)因素。然而由于巨大的計(jì)算量,這種方法并不實(shí)用,目前 只能計(jì)算幾個(gè)氨基酸形成的結(jié)構(gòu)。舊M開發(fā)的Blue Gene超級(jí)計(jì)算機(jī)就是要解決這個(gè)問題; 穿線法(Threading或fold rec

23、ognition ):由于 Ab Initio方法目前只有理論上的意義,Homology方法受限于待求蛋白質(zhì)必需和已知模板庫中某個(gè)蛋白質(zhì)有較高的序列相似性,因此對(duì)于其它大部分蛋白質(zhì)來說,有必要尋求新的方 法,于是Threading應(yīng)運(yùn)而生。以上三種方法中,Ab Initio方法不依賴于已知結(jié)構(gòu),其余兩種則需要已知結(jié)構(gòu)的協(xié)助。通常將蛋白質(zhì)序列和其真實(shí) 三級(jí)結(jié)構(gòu)組織成模板庫,待預(yù)測(cè)三級(jí)結(jié)構(gòu)的蛋白質(zhì)序列,則稱之為查詢序列( query sequence 。SWISS-MODEL和HHPred是基于網(wǎng)絡(luò)的同源建模工具,HHPred軟件也可以下載。MODELLER 是這一類型軟件中應(yīng)用最早和最廣泛的軟件

24、。MODELLER 和SWISS-MODEL有同源建模數(shù)據(jù)庫。接下來三個(gè)工具 FUGUE、Phyre和SPARKS屬于穿線法。穿線法可在數(shù)據(jù)庫中搜尋和待測(cè)蛋白結(jié)構(gòu)非常匹配的模板蛋白質(zhì)。與同源建模法不同,穿 線法中模板蛋白質(zhì)和待測(cè)蛋白質(zhì)明顯的序列相似性并不是必要條件。穿線法可以檢測(cè)一個(gè)數(shù)據(jù)庫中親緣關(guān)系很遠(yuǎn)的蛋白質(zhì),Z-score作為一個(gè)統(tǒng)計(jì)學(xué)值,可以顯示模板蛋白質(zhì)和待測(cè)蛋白之間的匹配程度,當(dāng)Z-score較低時(shí),就意味著沒有匹配搜索的結(jié)構(gòu)3。 最后,Robetta工具屬于從頭計(jì)算法。它利用從數(shù)據(jù)庫收集的序列片段來組裝模型,是一個(gè)自動(dòng)化的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)服務(wù)工具。它由貝克實(shí)驗(yàn)室提供,用于非商業(yè)性質(zhì)的

25、從頭計(jì)算和比較建模3。3.3 蛋白質(zhì)-蛋白質(zhì)相互作用數(shù)據(jù)庫表5列出了蛋白質(zhì)之間相互作用(protein-protein interactions, PPI)的數(shù)據(jù)庫。在過去的幾年中,有大規(guī)模實(shí)驗(yàn)開始 研究蛋白質(zhì)之間的相互作用,并且很多相關(guān)資源可以在互聯(lián)網(wǎng)上得到。了解一個(gè)基因編碼蛋白質(zhì)與其它蛋白質(zhì)之間 的關(guān)系,對(duì)于推測(cè)這個(gè)基因發(fā)揮功能所需白背景關(guān)系具有重要意義。BIND (biomolecular interaction network database)數(shù)據(jù)庫是 BOND ( biomolecular object network databank)數(shù)據(jù)庫的一個(gè)子數(shù)據(jù)庫,它是現(xiàn)在最大的 PPI

26、數(shù)據(jù)庫。BIND數(shù)據(jù)庫U錄了 1500種生物分子之間的200,000種相互作用的數(shù)據(jù)。這種相互作用不僅包括蛋白質(zhì)之間的相互作用,編輯版word還包括蛋白質(zhì)與 DNA、RNA、小分子、脂質(zhì)以及糖類物質(zhì)之間的相互作用。BIND數(shù)據(jù)庫每日更新、覆蓋面廣,包含人、果蠅、酵母、線蟲等物種的 PPI3。在BIND 數(shù)據(jù)庫中,PPI被分成3大類:二元分子相互作用(binary interaction)、分子復(fù)合物(molecularcomplexe)以及生物途徑(biological pathway),它們分別從不同層面呈現(xiàn)了分子間的相互作用關(guān)系3。DIP (database of interacting protein)數(shù)據(jù)庫專門存儲(chǔ)經(jīng)實(shí)驗(yàn)證實(shí)的來自文獻(xiàn)報(bào)道的二元PPI,以及來自 PDB (proteindata bank)數(shù)據(jù)庫的蛋白質(zhì)復(fù)合物。目前 DIP收錄了 18,000種相互作用的數(shù)據(jù),DIP的目的在于建立一個(gè)簡(jiǎn)單、易 用、高度可信的PPI公共數(shù)據(jù)庫3。MIPS (mammalian protein-protein interactiondatabase)數(shù)據(jù)庫同樣利用文獻(xiàn)挖掘技術(shù),專門存儲(chǔ)哺乳動(dòng)物的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論