蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測(cè)_第1頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測(cè)_第2頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測(cè)_第3頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測(cè)_第4頁
蛋白質(zhì)的序列分析及結(jié)構(gòu)預(yù)測(cè)_第5頁
已閱讀5頁,還剩130頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

DNAsequenceProteinsequenceProteinstructureProteinfunction當(dāng)前1頁,總共135頁。一、蛋白質(zhì)數(shù)據(jù)庫介紹二、蛋白質(zhì)序列分析三、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)四、應(yīng)用分子設(shè)計(jì)當(dāng)前2頁,總共135頁。一、蛋白質(zhì)數(shù)據(jù)庫介紹蛋白質(zhì)的結(jié)構(gòu)主要分為四級(jí),一級(jí)結(jié)構(gòu)、二級(jí)結(jié)構(gòu)、三級(jí)結(jié)構(gòu)以及四級(jí)結(jié)構(gòu)。依據(jù)這種結(jié)構(gòu)層次,將蛋白質(zhì)數(shù)據(jù)庫分為:1.蛋白質(zhì)序列數(shù)據(jù)庫:如PIR、SWISS-PROT、NCBI,這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質(zhì)的序列為主,并賦予相應(yīng)的注釋;2.蛋白質(zhì)模體及結(jié)構(gòu)域數(shù)據(jù)庫:如PROSITE、Pfam,這些數(shù)據(jù)庫主要收集了蛋白質(zhì)的保守結(jié)構(gòu)域和功能域的特征序列;3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫:如PDB等,這些數(shù)據(jù)庫主要以蛋白質(zhì)的結(jié)構(gòu)測(cè)量數(shù)據(jù)為主;4.蛋白質(zhì)分類數(shù)據(jù)庫:如SCOP、CATH、FSSP等,這其中有以序列比較為基礎(chǔ)的序列分類數(shù)據(jù)庫以及以結(jié)構(gòu)比較為基礎(chǔ)的結(jié)構(gòu)分類數(shù)據(jù)庫之分。當(dāng)前3頁,總共135頁。蛋白質(zhì)數(shù)據(jù)庫特征:

這些數(shù)據(jù)庫種類有差別,但內(nèi)部是相互聯(lián)系的.

每個(gè)數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫,而且數(shù)據(jù)庫之間的序列以及相應(yīng)的結(jié)構(gòu)是共享的,同一種蛋白質(zhì)依次會(huì)出現(xiàn)在不同的數(shù)據(jù)庫.這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質(zhì)的內(nèi)在生物信息,這些數(shù)據(jù)庫是融序列信息的索取、處理、存儲(chǔ)、輸出于一身的。當(dāng)前4頁,總共135頁。1.蛋白質(zhì)序列數(shù)據(jù)庫(1)PIR(proteininformationresource,PIR)和PSD(proteinsequencedatabase,PSD)

PIR-PSD是一個(gè)綜合全面的、非冗余的、專業(yè)注釋的、分類完整的蛋白質(zhì)序列數(shù)據(jù)庫。PIR-PSD的序列來自于將GenBank/EMBL/DDBJ三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質(zhì)序列、發(fā)表的文獻(xiàn)中的序列和用戶直接提交的序列。(2)SWISS-PROT/TrEMBL數(shù)據(jù)庫

數(shù)據(jù)庫由蛋白質(zhì)序列條目構(gòu)成,每個(gè)條目包含蛋白質(zhì)序列、引用文獻(xiàn)信息、分類學(xué)信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾位點(diǎn)、特殊位點(diǎn)和區(qū)域、二級(jí)結(jié)構(gòu)、四級(jí)結(jié)構(gòu)、與其他序列的相似性、序列殘缺與疾病的關(guān)系、序列變異體等信息。當(dāng)前5頁,總共135頁。2.模體以及結(jié)構(gòu)域數(shù)據(jù)庫模體數(shù)據(jù)庫(1)PROSITE蛋白質(zhì)家族及結(jié)構(gòu)域數(shù)據(jù)庫(/)PROSITE數(shù)據(jù)庫收集了有顯著生物學(xué)意義的蛋白質(zhì)位點(diǎn)序列、蛋白質(zhì)特征序列譜庫以及序列模型,并能依據(jù)這些特征屬性快速可靠地鑒定出一個(gè)未知功能蛋白質(zhì)序列屬于哪個(gè)蛋白質(zhì)家族,即使在蛋白質(zhì)序列相似性很低的情況下,也可以通過搜索隱含的功能結(jié)構(gòu)模體(motif)來鑒定,因此是有效的序列分析數(shù)據(jù)庫。PROSITE中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)、金屬離子結(jié)合位點(diǎn)、二硫鍵、小分子或者蛋白質(zhì)結(jié)合區(qū)域等,此外PROSITE還包括由多序列比對(duì)構(gòu)建的序列表譜(profile),能更敏感地發(fā)現(xiàn)序列中的信息。當(dāng)前6頁,總共135頁。PROSITE同時(shí)數(shù)據(jù)庫提供了序列分析工具:①ScanProsite

是用于搜索所提交的序列數(shù)據(jù)是否包含PROSITE數(shù)據(jù)庫中的序列模式或者SWISS-PROT數(shù)據(jù)庫中已提交的序列模式;②MotifScan

用于查找未知序列中所有可能的已知結(jié)構(gòu)組件,數(shù)據(jù)庫包括PROSITE序列表譜、PROSITE模式、Pfam收集的隱馬爾可夫模式(HMM)。當(dāng)前7頁,總共135頁。(2)PRINTSFingerprintDatabase

這個(gè)數(shù)據(jù)庫包含1500個(gè)蛋白質(zhì)指紋圖譜,編碼9136個(gè)單一模體。(3)BLOCKS(

)BLOCKS是通過一些高度保守的蛋白質(zhì)區(qū)域比對(duì)出來的無空位的片段。模體數(shù)據(jù)庫當(dāng)前8頁,總共135頁。蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫

(1)蛋白質(zhì)家族序列比對(duì)以及隱馬爾可夫模式數(shù)據(jù)庫Pfam(proteinfamiliesdatabaseofalignmentsandHMMs)Pfam是蛋白質(zhì)家族序列比對(duì)以及隱馬爾可夫模式數(shù)據(jù)庫,其網(wǎng)址是:。(2)蛋白質(zhì)結(jié)構(gòu)域數(shù)據(jù)庫ProDom

http://(3)SMARTSMART是一個(gè)簡單的結(jié)構(gòu)研究工具,可對(duì)可轉(zhuǎn)移的遺傳因子進(jìn)行鑒定和注解,以及分析結(jié)構(gòu)域結(jié)構(gòu),可以檢測(cè)出500多個(gè)參與信號(hào)傳導(dǎo)、胞外和染色體相關(guān)蛋白質(zhì)的結(jié)構(gòu)域家族,對(duì)這些結(jié)構(gòu)域又在系統(tǒng)進(jìn)化樹分布、功能分類、三級(jí)結(jié)構(gòu)和重要的功能殘基方面做了注解。

/當(dāng)前9頁,總共135頁。3.蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB(proteindatabank,PDB)

PDB包括了蛋白質(zhì)、核酸、蛋白質(zhì)-核酸復(fù)合體以及病毒等生物大分子結(jié)構(gòu)數(shù)據(jù),主要是蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù),這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結(jié)構(gòu)研究的研究機(jī)構(gòu),并由RCSB維護(hù)和注釋。當(dāng)前10頁,總共135頁。4.蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(1)CATH數(shù)據(jù)庫

(2)SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(structuralclassificationofproteindatabase,SCOP)

當(dāng)前11頁,總共135頁。二、蛋白質(zhì)的序列分析1.蛋白質(zhì)序列信息的獲取

2.蛋白質(zhì)序列分析

當(dāng)前12頁,總共135頁。1.蛋白質(zhì)序列信息的獲?。?)直接測(cè)序(2)翻譯編碼的DNA序列ORFFinder(3)在數(shù)據(jù)庫中搜索運(yùn)用ID號(hào)、入口號(hào)、條目號(hào)等搜索。運(yùn)用關(guān)鍵詞搜索其他方式搜索。如可以通過引用序列的文獻(xiàn)、序列的作者、序列提交的日期等進(jìn)行搜索。當(dāng)前13頁,總共135頁。(1)直接測(cè)序e.g.ProteinSequencingandIdentificationbyTandem

MassSpectrometry,即用串聯(lián)質(zhì)譜儀測(cè)序1.蛋白質(zhì)序列信息的獲取當(dāng)前14頁,總共135頁。串聯(lián)質(zhì)譜及其作用兩個(gè)或更多的質(zhì)譜連接在一起,稱為串聯(lián)質(zhì)譜。最簡單的串聯(lián)質(zhì)譜(MS|MS)由兩個(gè)質(zhì)譜串聯(lián)而成,其中第一個(gè)質(zhì)量分析器(MS1)將離子預(yù)分離或加能量修飾,由第二級(jí)質(zhì)量分析器(MS2)分析結(jié)果。

當(dāng)前15頁,總共135頁。

串聯(lián)質(zhì)譜儀的組合方式:(1)磁分析器-靜電分析器-磁分析器

(2)靜電分析器-磁分析器-靜電分析器

(3)三重四極濾質(zhì)器質(zhì)譜儀

(4)混合式串聯(lián)質(zhì)譜儀,如MA-ESA-Q-Q。實(shí)現(xiàn)串聯(lián)質(zhì)譜有空間串聯(lián)和時(shí)間串聯(lián)兩種方式。

當(dāng)前16頁,總共135頁。

優(yōu)點(diǎn):可以避免底物分子產(chǎn)生的干擾,大大降低背景噪音。其次,可使分子離子通過與反應(yīng)氣的碰撞來產(chǎn)生斷裂。因此能提供更多的結(jié)構(gòu)信息,所以串聯(lián)質(zhì)譜特別適合于復(fù)雜組分體系且干擾嚴(yán)重的樣品中低含量組分分析測(cè)定,具有比GC-MS和LC-MS等一級(jí)質(zhì)譜更高的選擇性和靈敏度。當(dāng)前17頁,總共135頁。MassesofAminoAcidResidues當(dāng)前18頁,總共135頁。ProteinbackboneH...-HN-CH-CO-NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1AAresiduei-1AAresidueiAAresiduei+1N-terminusC-terminus當(dāng)前19頁,總共135頁。BreakingProteinintoPeptidesandPeptidesintoFragmentIonsProteases,e.g.trypsin(胰蛋白酶),breakproteinintopeptides.ATandemMassSpectrometer(串聯(lián)式質(zhì)譜儀)furtherbreaksthepeptidesdownintofragmentionsandmeasuresthemassofeachpiece.Generalforsequencing當(dāng)前20頁,總共135頁。BreakingProteinintoPeptidesandPeptidesintoFragmentIonsMassSpectrometeracceleratesthefragmentedions;heavierionsaccelerateslowerthanlighterones.MassSpectrometermeasuremass/chargeratioofanion.Generalforsequencing當(dāng)前21頁,總共135頁。PeptideFragmentationPeptidestendtofragmentalongthebackbone.FragmentscanalsolooseneutralchemicalgroupslikeNH3andH2O.H...-HN-CH-CO

...

NH-CH-CO-NH-CH-CO-…OHRi-1RiRi+1H+PrefixFragmentSuffixFragmentCollisionInducedDissociation當(dāng)前22頁,總共135頁。N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides當(dāng)前23頁,總共135頁。TerminalpeptidesandiontypesPeptideMass(D)57+97+147+114=415H2OPeptideMass(D)57+97+147+114–18=397H2Owithout當(dāng)前24頁,總共135頁。N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429當(dāng)前25頁,總共135頁。N-andC-terminalPeptidesN-terminalpeptidesC-terminalpeptides415

486

30115457

71185332429當(dāng)前26頁,總共135頁。PeptideFragmentationy3b2y2y1b3a2a3

HONH3+||

R1OR2OR3

OR4||||||||||H--NCCNCCNCCNC--COOH|||||||HHHHHHHb2-H2Oy3-H2Ob3-NH3y2-NH3當(dāng)前27頁,總共135頁。MassSpectraGVDLKmass057Da=‘G’

99Da=‘V’LK

DVGThepeaksinthemassspectrum:Prefix

Fragmentswithneutrallosses(-H2O,-NH3)Noiseandmissingpeaks.andSuffixFragments.DH2O當(dāng)前28頁,總共135頁。ProteinIdentificationwithMS/MSGVDLKmass0Intensitymass0MS/MSPeptideIdentification:當(dāng)前29頁,總共135頁。TandemMass-Spectrometry當(dāng)前30頁,總共135頁。BreakingProteinsintoPeptidespeptidesMPSER……GTDIMRPAKID……HPLCToMS/MSMPSERGTDIMRPAKIDprotein當(dāng)前31頁,總共135頁。MassSpectrometryMatrix-AssistedLaserDesorption/Ionization(MALDI)基質(zhì)輔助激光解吸質(zhì)譜

當(dāng)前32頁,總共135頁?;|(zhì)輔助激光解吸飛行時(shí)間質(zhì)譜儀

MALDI-TOF-MSMALDI-TOF-MS是近年來發(fā)展起來的一種軟電離新型有機(jī)質(zhì)譜。近年來已成為檢測(cè)和鑒定多肽、蛋白質(zhì)、多糖、核苷酸、糖蛋白、高聚物以及多種合成聚合物的強(qiáng)有力工具。原理:當(dāng)用一定強(qiáng)度的激光照射樣品與基質(zhì)形成的共結(jié)晶薄膜,基質(zhì)從激光中吸收能量,基質(zhì)-樣品之間發(fā)生電荷轉(zhuǎn)移使得樣品分子電離,電離的樣品在電場作用下加速飛過飛行管道,根據(jù)到達(dá)檢測(cè)器的飛行時(shí)間不同而被檢測(cè),即測(cè)定離子的質(zhì)量電荷之比與離子的飛行時(shí)間成正比來檢測(cè)離子。MALDI-TOF-MS的中心技術(shù)就是依據(jù)樣品的質(zhì)荷比(m/z)的不同來進(jìn)行檢測(cè),并測(cè)得樣品分子的分子量。當(dāng)前33頁,總共135頁。TandemMassSpectrometryScan1708LCScan1707MSMS/MSIonSourceMS-1collisioncellMS-2當(dāng)前34頁,總共135頁。多肽片段指紋圖譜(PFF)

步驟:用酶專一性酶解蛋白質(zhì),經(jīng)過分離,得到的肽段在質(zhì)譜中被選擇和破碎后得到MS/MS譜圖,與數(shù)據(jù)庫中的譜圖比較進(jìn)行鑒定

代表方法:

LC-ESI-MS/MS2D-LC-MS/MS(shotgun)當(dāng)前35頁,總共135頁。1.蛋白質(zhì)序列信息的獲?。?)翻譯編碼的DNA序列

e.g.用“ORFFinder”程序找到DNA的開放閱讀框。網(wǎng)址:當(dāng)前36頁,總共135頁。當(dāng)前37頁,總共135頁。當(dāng)前38頁,總共135頁。1.蛋白質(zhì)序列信息的獲?。?)在數(shù)據(jù)庫中搜索e.g.PIR-PSDdatabase:

SWISS-PROT/TrEMBLdatabase

當(dāng)前39頁,總共135頁。目前大部分蛋白質(zhì)序列是通過DNA人工翻譯過來的,實(shí)際上很少有人能獲得真正的蛋白質(zhì),因而實(shí)驗(yàn)證據(jù)就很難直接獲得,因此對(duì)蛋白質(zhì)序列初始分析是很有價(jià)值的。比如,通過一些序列分析工具進(jìn)行蛋白質(zhì)理化特性的預(yù)測(cè)、修飾位點(diǎn)的預(yù)測(cè)等。2.蛋白質(zhì)序列分析當(dāng)前40頁,總共135頁。1.蛋白質(zhì)序列的基本性質(zhì)分析理化性質(zhì)分析,疏水性分析,跨膜區(qū)分析,信號(hào)肽預(yù)測(cè),Coil區(qū)分析,亞細(xì)胞定位2.序列數(shù)據(jù)庫搜索

相似性搜索,模體的搜索3.結(jié)構(gòu)域定位4.空間結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu)及三級(jí)結(jié)構(gòu)預(yù)測(cè),結(jié)構(gòu)預(yù)測(cè)方法評(píng)價(jià)

蛋白質(zhì)序列分析主要內(nèi)容:當(dāng)前41頁,總共135頁。1.蛋白質(zhì)序列的基本性質(zhì)分析(1)理化性質(zhì)分析分子質(zhì)量、分子式、理論等電點(diǎn)、氨基酸組成、消光系數(shù)、穩(wěn)定性等理化特性。例,利用ProtParam工具

當(dāng)前42頁,總共135頁。理化指標(biāo)CLCLAP分子式C1615H2420N428O535S16C1211H1951N319O364S3分子量36904.426899.9理論等電點(diǎn)pI4.476.20總原子數(shù)50143848消光系數(shù)(280nm)754555960半衰期(小時(shí))哺乳動(dòng)物,體外3030酵母,體內(nèi)>20>20大腸桿菌,體內(nèi)>10>10不穩(wěn)定性指數(shù)31.7229.59脂肪族指數(shù)63.73105.18總體親水性-0.5420.109CL和CLAP的理化性質(zhì)預(yù)測(cè)結(jié)果

CL:組織蛋白酶L

CLAP:組織蛋白酶L相關(guān)蛋白

當(dāng)前43頁,總共135頁。(2)疏水性分析

氨基酸側(cè)鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示,蛋白質(zhì)的疏水性在保持蛋白質(zhì)三級(jí)結(jié)構(gòu)的形成和穩(wěn)定中起著重要作用。e.g.利用ProtScale工具利用BioEdit軟件分析當(dāng)前44頁,總共135頁。海參溶菌酶親水性/疏水性分析Score>0,表示疏水性;Score<0,表示親水性當(dāng)前45頁,總共135頁。(3)跨膜區(qū)分析

蛋白質(zhì)含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白。例,使用在線分析當(dāng)前46頁,總共135頁。鋁激活蘋果酸的轉(zhuǎn)運(yùn)蛋白(TaALMT1)跨膜結(jié)構(gòu)分析當(dāng)前47頁,總共135頁。(4)信號(hào)肽預(yù)測(cè)信號(hào)肽:指分泌蛋白表達(dá)時(shí)氨基端的20余個(gè)氨基酸,將引導(dǎo)該蛋白質(zhì)最終分泌至細(xì)胞外,但這段信號(hào)肽會(huì)被信號(hào)肽酶切掉,所以成熟的分泌蛋白是不含這段信號(hào)肽的。用于指導(dǎo)蛋白質(zhì)的跨膜轉(zhuǎn)移(定位)的N末端的氨基酸序列,一般由15-30個(gè)氨基酸組成。使用SignalP在線分析http:///當(dāng)前48頁,總共135頁。海參溶菌酶信號(hào)肽預(yù)測(cè)Conclusion:cleavagesitebetweenpos.20and21:ASG-QV當(dāng)前49頁,總共135頁。(5)Coil區(qū)分析蛋白質(zhì)中由2-7條α螺旋鏈相互纏繞形成類似麻花狀結(jié)構(gòu)的總稱;主要存在形式是2-5條相互纏繞形成的平行或反平行同寡聚體或異寡聚體;是控制蛋白質(zhì)寡聚化的元件,轉(zhuǎn)錄因子、骨架蛋白、動(dòng)力蛋白、膜蛋白、酶等;七肽重復(fù)區(qū)。e.g.使用COILS服務(wù)器分析http://當(dāng)前50頁,總共135頁。(6)亞細(xì)胞定位根據(jù)氨基酸組成可以進(jìn)行亞細(xì)胞定位不同細(xì)胞器多具不同的理化環(huán)境,它會(huì)根據(jù)蛋白質(zhì)的結(jié)構(gòu)及表面理化特征選擇性容納蛋白質(zhì);蛋白質(zhì)表面直接暴露于細(xì)胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。亞細(xì)胞定位的步驟在線分析工具e.g.使用TargetPhttp:///當(dāng)前51頁,總共135頁。組織蛋白酶CL和相關(guān)蛋白CLAP的亞細(xì)胞定位蛋白質(zhì)各亞細(xì)胞位點(diǎn)出現(xiàn)可能性(%)細(xì)胞質(zhì)內(nèi)質(zhì)網(wǎng)線粒體細(xì)胞核空泡分泌性小囊泡高爾基體質(zhì)膜細(xì)胞支架CL34.8--CLAP26.14.313.013.04.317.44.313.04.3結(jié)果證明,CL和CLAP出現(xiàn)幾率最高的位點(diǎn)都為胞質(zhì),說明它們都為胞漿內(nèi)蛋白,這也為今年來在溶酶體內(nèi)外都發(fā)現(xiàn)組織蛋白酶活性提供了證據(jù)。當(dāng)前52頁,總共135頁。(1)相似性搜索(或同源搜索)①一個(gè)新序列與序列數(shù)據(jù)庫中的序列比對(duì),從而找到同源或者相似序列。②常用程序是BLASTp。2.序列數(shù)據(jù)庫搜索當(dāng)前53頁,總共135頁。當(dāng)前54頁,總共135頁。(2)模體(motif)的搜索這是另一種序列搜索方法,其目的是尋找蛋白質(zhì)中結(jié)構(gòu)域或者功能域。這個(gè)方法不是給每個(gè)位置的氨基酸打分,然后得到一個(gè)相似程度,而是直接描述關(guān)鍵的幾個(gè)保守殘基,同時(shí)忽略其他位置的氨基酸多態(tài)性,這些保守的序列有時(shí)會(huì)稱為“標(biāo)志”(signature),就是所謂的模式序列(pattern)。當(dāng)前55頁,總共135頁。Motif搜索即模體搜索,是序列中局部的保守區(qū)域,或是一組序列中共有的一小段序列模式。使用PROSITE數(shù)據(jù)庫進(jìn)行motif搜索

模式序列常表示為:

[AG]-x-V-x(2)-x-{YW}

[

]showseitheraminoacid

x

isanyaminoacid

x(2)anyaminoacidinthenext2positions

{

}showsanyaminoacidexceptthese當(dāng)前56頁,總共135頁。模體的搜索舉例:有序列表示為:H-[FW]-x-[LIVM]-x-G-x(5)-[LV]-H-x(3)-[DE]這是描述一個(gè)DNA結(jié)合蛋白質(zhì)家族的,可以理解為組氨酸,接著是苯丙氨酸或者色氨酸,緊接一個(gè)氨基酸x,然后可以是亮氨酸、異亮氨酸、纈氨酸、或者甲硫氨酸??,這樣一段序列由于處于活性區(qū)域或者蛋白質(zhì)的重要結(jié)構(gòu)區(qū),所以特別保守,因此也是序列搜索的目標(biāo)之一。當(dāng)前57頁,總共135頁。3.結(jié)構(gòu)域定位通過將序列在數(shù)據(jù)庫中搜索,可以了解到序列的一些信息,接下來就可以進(jìn)行結(jié)構(gòu)域的定位,這樣就對(duì)以后的結(jié)構(gòu)預(yù)測(cè)有了一個(gè)比較清醒的認(rèn)識(shí)。如果蛋白質(zhì)序列的長度大于500個(gè)氨基酸,就可以根據(jù)搜索的情況(比如按相似性高低或者結(jié)構(gòu)域多少等)將蛋白質(zhì)分割成多個(gè)不連續(xù)的區(qū)域,最好將這一段一段的序列分別鑒別。

當(dāng)前58頁,總共135頁。什么是結(jié)構(gòu)域?結(jié)構(gòu)域是在二級(jí)結(jié)構(gòu)或超二級(jí)結(jié)構(gòu)的基礎(chǔ)上形成三級(jí)結(jié)構(gòu)的局部折疊區(qū),一條多肽鏈在這個(gè)域范圍內(nèi)來回折疊,但相鄰的域常被一個(gè)或兩個(gè)多肽片段連結(jié)。通常由50-300個(gè)氨基酸殘基組成,其特點(diǎn)是在三維空間可以明顯區(qū)分和相對(duì)獨(dú)立,并且具有一定的生物功能如結(jié)合小分子。模體(motif)是結(jié)構(gòu)域的亞單位,通常由2~3二級(jí)結(jié)構(gòu)單位組成,一般為α螺旋、β折疊和環(huán)(loop)。結(jié)構(gòu)域定位當(dāng)前59頁,總共135頁。二聚體蛋白結(jié)構(gòu)域當(dāng)前60頁,總共135頁。結(jié)構(gòu)域和功能域?qū)δ切┹^小的球狀蛋白質(zhì)分子或亞基來說,結(jié)構(gòu)域和三級(jí)結(jié)構(gòu)是一個(gè)意思,也就是說這些蛋白質(zhì)或亞基是單結(jié)構(gòu)域的,如紅氧還蛋白等;較大的蛋白質(zhì)分子或亞基其三級(jí)結(jié)構(gòu)一般含有兩個(gè)以上的結(jié)構(gòu)域,即多結(jié)構(gòu)域的,其間以柔性的鉸鏈(hinge)相連,以便相對(duì)運(yùn)動(dòng)。結(jié)構(gòu)域有時(shí)也指功能域。功能域是蛋白質(zhì)分子中能獨(dú)立存在的功能單位,它可以是一個(gè)結(jié)構(gòu)域,也可以是由兩個(gè)或兩個(gè)以上結(jié)構(gòu)域組成。結(jié)構(gòu)域定位當(dāng)前61頁,總共135頁。結(jié)構(gòu)域定位結(jié)構(gòu)域是蛋白序列的功能、結(jié)構(gòu)和進(jìn)化單元分析方法:序列比對(duì)單條蛋白質(zhì)序列可以包含一個(gè)或多個(gè)結(jié)構(gòu)域當(dāng)前62頁,總共135頁?;绢愋停?/p>

63α-螺旋型

全β-折疊型

α/β型α+β型當(dāng)前63頁,總共135頁。結(jié)構(gòu)域定位分析一般流程:(1)探測(cè)序列與其他全序列之間有無同源性.如果有,那么這是該段序列為結(jié)構(gòu)域的很好證據(jù),然后進(jìn)行結(jié)構(gòu)數(shù)據(jù)庫的搜索,也可以搜索注釋好的數(shù)據(jù)庫,從而得到一些有關(guān)結(jié)構(gòu)域的說明。

(2)分析低復(fù)雜度的區(qū)域。在多結(jié)構(gòu)域的蛋白質(zhì)中,這些低復(fù)雜度序列常常間隔結(jié)構(gòu)域,長的重復(fù)序列特別是pro、glu、ser、thr等常常是連接序列,也是很好的結(jié)構(gòu)域剪接位置。

結(jié)構(gòu)域定位當(dāng)前64頁,總共135頁。結(jié)構(gòu)域定位分析一般流程:(3)跨膜區(qū)域。由于跨膜結(jié)構(gòu)是一個(gè)非常典型的結(jié)構(gòu),這種結(jié)構(gòu)連續(xù)性較強(qiáng),而且預(yù)測(cè)容易,準(zhǔn)確性也比較高,因此也是一個(gè)分割的區(qū)域,這樣就很容易區(qū)分胞外和胞內(nèi)區(qū)域。(4)卷曲螺旋結(jié)構(gòu)(coiled-coil)。這個(gè)結(jié)構(gòu)有時(shí)也可能是蛋白質(zhì)結(jié)構(gòu)域之間的間隔區(qū),可以在COIL網(wǎng)站上預(yù)測(cè)coiled-coil結(jié)構(gòu)。

結(jié)構(gòu)域定位當(dāng)前65頁,總共135頁。結(jié)構(gòu)域定位分析一般流程:(5)二級(jí)結(jié)構(gòu)預(yù)測(cè)。這個(gè)方法常常用來預(yù)測(cè)一個(gè)結(jié)構(gòu)中包含的不同折疊子。例如,一個(gè)序列中的一部分可能會(huì)被預(yù)測(cè)成只有α-螺旋,而另一個(gè)部分可能會(huì)被預(yù)測(cè)成只含有β-折疊,這些都可能預(yù)示有域的結(jié)構(gòu)存在。(6)如果序列已被成功地分解成成形的結(jié)構(gòu)域,那么重復(fù)進(jìn)行數(shù)據(jù)庫搜索并且進(jìn)行獨(dú)立比對(duì)是很重要的.結(jié)構(gòu)域定位當(dāng)前66頁,總共135頁。結(jié)構(gòu)域定位當(dāng)前67頁,總共135頁。結(jié)構(gòu)域分析工具介于二級(jí)和三級(jí)結(jié)構(gòu)之間可以明顯區(qū)分但又相對(duì)獨(dú)立的折疊單元,每個(gè)結(jié)構(gòu)域自身形成緊實(shí)的三維結(jié)構(gòu),可以獨(dú)立存在或折疊,但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。通常由25-300個(gè)氨基酸殘基組成;全平行結(jié)構(gòu)域、反平行結(jié)構(gòu)域、α+β結(jié)構(gòu)域、α/β結(jié)構(gòu)域及其他折疊類型。利用SMART服務(wù)器進(jìn)行結(jié)構(gòu)與分析當(dāng)前68頁,總共135頁。結(jié)構(gòu)域定位分析舉例實(shí)例分析:海參溶菌酶序列和其它i型溶菌酶保守區(qū)域的比對(duì)結(jié)果:高度保守的2個(gè)活性位點(diǎn)(E34和S50)和特有的氨基酸保守序列MDVGSLSCG(P\Y)(Y\F)QIK當(dāng)前69頁,總共135頁。i-型溶菌酶含有兩個(gè)結(jié)構(gòu)域當(dāng)前70頁,總共135頁。模體搜索和結(jié)構(gòu)域定位舉例實(shí)例分析:海參i-型溶菌酶3D結(jié)構(gòu)模式圖當(dāng)前71頁,總共135頁。4.蛋白質(zhì)空間結(jié)構(gòu)預(yù)測(cè)(1)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)

蛋白質(zhì)二級(jí)結(jié)構(gòu)是蛋白質(zhì)分子中重要的組成“部件”,是研究蛋白質(zhì)氨基酸序列和三級(jí)結(jié)構(gòu)之間的橋梁。

基本的二級(jí)結(jié)構(gòu):α螺旋,β折疊,β轉(zhuǎn)角,無規(guī)則卷曲(coils)以及模體(motif)等蛋白質(zhì)局部結(jié)構(gòu)組件當(dāng)前72頁,總共135頁。

蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本依據(jù)是每一段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向。二級(jí)結(jié)構(gòu)預(yù)測(cè)問題是模式分類問題。二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo):判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級(jí)結(jié)構(gòu)態(tài),即三態(tài)。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)當(dāng)前73頁,總共135頁。二級(jí)結(jié)構(gòu)的預(yù)測(cè)方法:基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法進(jìn)行預(yù)測(cè)Chou-Fasman算法GOR算法多序列列線預(yù)測(cè)基于神經(jīng)網(wǎng)絡(luò)的序列預(yù)測(cè)基于已有知識(shí)的預(yù)測(cè)方法(knowledgebasedmethod)混合方法(hybridsystemmethod)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)當(dāng)前74頁,總共135頁。二級(jí)結(jié)構(gòu)中氨基酸出現(xiàn)頻率的影響:

氨基酸殘基在二級(jí)結(jié)構(gòu)元件中出現(xiàn)頻率的研究揭示,某些殘基如Glu、Met、Ala和Leu在α螺旋中出現(xiàn)的頻率比在其他二級(jí)結(jié)構(gòu)元件中高。相反,Gly和Pro在α螺旋中頻率很低。但它們?cè)讦罗D(zhuǎn)角中很高。另一些殘基包括Val、Ile和芳香族氨基酸在β折疊片中頻率很高,而Asp、Glu和Pro在β折疊片中則很低。這表明各種殘基形成各種二級(jí)結(jié)構(gòu)的傾向性是不同的。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)當(dāng)前75頁,總共135頁。工具網(wǎng)站備注BCMSearchLauncher/包括了常見的蛋白質(zhì)結(jié)構(gòu)分析程序入口,一般分析可以以此服務(wù)器作為起點(diǎn)HNNhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html基于神經(jīng)網(wǎng)絡(luò)的分析工具,含序列到結(jié)構(gòu)過程和結(jié)構(gòu)到結(jié)構(gòu)處理Jpredpbio.dundee.ac.uk/~www-jpred/submit.html基于Jnet神經(jīng)網(wǎng)絡(luò)的分析程序,并采用PSI-BLAST來構(gòu)建序列Profile進(jìn)行預(yù)測(cè),對(duì)于序列較短、結(jié)構(gòu)單一的蛋白預(yù)測(cè)較好nnPredict/~nomi/nnpredict.html預(yù)測(cè)蛋白質(zhì)序列中潛在的亮氨酸拉鏈結(jié)構(gòu)和卷曲螺旋NNSSPhttp://bioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于雙層前反饋神經(jīng)網(wǎng)絡(luò)為算法,還考慮到蛋白質(zhì)結(jié)構(gòu)分類信息PREDATORhttp://bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html預(yù)測(cè)時(shí)考慮了氨基酸殘基間的氫鍵蛋白質(zhì)二級(jí)結(jié)構(gòu)分析工具當(dāng)前76頁,總共135頁。工具網(wǎng)站備注PredictProtein/提供多項(xiàng)蛋白質(zhì)性質(zhì)分析,并有較好準(zhǔn)確性Profhttp://www.aber.ac.uk/~phiwww/prof/基于多重序列比對(duì)預(yù)測(cè)工具PSIpredhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓?fù)浣Y(jié)構(gòu)預(yù)測(cè)和蛋白profile折疊結(jié)構(gòu)識(shí)別工具SOPMAhttp://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html可以比較各種分析方法得到的結(jié)果,也可輸出“一致性結(jié)果”SSPREDhttp://coot.embl.de/~fmilpetz/SSPRED/sspred.html基于數(shù)據(jù)庫搜索相似蛋白并構(gòu)建多重序列比對(duì)蛋白質(zhì)二級(jí)結(jié)構(gòu)分析工具(續(xù))當(dāng)前77頁,總共135頁。PredictProtein可以獲得功能預(yù)測(cè)、二級(jí)結(jié)構(gòu)、基序、二硫鍵結(jié)構(gòu)、結(jié)構(gòu)域等許多蛋白質(zhì)序列的結(jié)構(gòu)信息該方法的平均準(zhǔn)確率超過72%,最佳殘基預(yù)測(cè)準(zhǔn)確率達(dá)90%以上。因此,被視為蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的標(biāo)準(zhǔn)需要注冊(cè)帳號(hào)用于學(xué)術(shù)研究蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)當(dāng)前78頁,總共135頁。PredictProtein提交界面詳解提交郵件地址(必填)蛋白名稱(可選)分析方法當(dāng)前79頁,總共135頁。1D序列預(yù)測(cè)PROFsec(默認(rèn))基于輪廓(profile)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)PROFacc(默認(rèn))基于輪廓(profile)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)殘基溶劑可及性PHDhtm(默認(rèn))基于多序列比對(duì)中預(yù)測(cè)跨膜區(qū)位置和拓?fù)浣Y(jié)構(gòu)ASP(默認(rèn))識(shí)別二級(jí)結(jié)構(gòu)中構(gòu)型變化的氨基酸COILS(默認(rèn))識(shí)別卷曲螺旋PROFtmb識(shí)別細(xì)菌中Beta桶結(jié)構(gòu)序列基序識(shí)別ProSite(默認(rèn))搜索序列中保守基序SEG(默認(rèn))過濾序列中低復(fù)雜區(qū)域PredictNLS(默認(rèn))基于實(shí)驗(yàn)數(shù)據(jù)預(yù)測(cè)序列核定位區(qū)域二硫鍵識(shí)別DISULFIND(默認(rèn))識(shí)別序列中二硫鍵位置無序結(jié)構(gòu)識(shí)別PROFbval識(shí)別序列標(biāo)準(zhǔn)骨架的B-value值UCON預(yù)測(cè)蛋白質(zhì)中非3D結(jié)構(gòu)區(qū)域折疊子識(shí)別AGAPE基于折疊結(jié)構(gòu)識(shí)別遠(yuǎn)源蛋白序列殘基接觸預(yù)測(cè)PROFcon預(yù)測(cè)單鏈中原子殘基接觸性結(jié)構(gòu)域預(yù)測(cè)ProDom(默認(rèn))基于序列同源性來預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)域CHOP(comingsoon)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)域結(jié)構(gòu)表面識(shí)別ConSeq(comingsoon)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)表面結(jié)構(gòu)功能關(guān)鍵殘基分析方法程序詳解當(dāng)前80頁,總共135頁??缒ぢ菪A(yù)測(cè)(PHDhtm)專家選項(xiàng)Ambivalent序列識(shí)別(ASP)專家選項(xiàng)CHOP結(jié)構(gòu)域分析工具專家選項(xiàng)當(dāng)前81頁,總共135頁。比對(duì)內(nèi)容從SWISS-PROT數(shù)據(jù)庫返回BLAST搜索結(jié)果MaxHom參數(shù)選項(xiàng)最低序列比對(duì)一致性空位間隔罰分空位延伸罰分比對(duì)矩陣最大擊中值當(dāng)前82頁,總共135頁。選擇保存分析結(jié)果是否返回多序列比對(duì)結(jié)果HTML結(jié)果形式AGAPE結(jié)果PROF/PHD結(jié)果形式以下拉框中所指定的輸入格式將待測(cè)序列粘貼此提交欄當(dāng)前83頁,總共135頁。服務(wù)器運(yùn)行程序信息ProSite模體搜索結(jié)果低復(fù)雜區(qū)域過濾程序ProDom結(jié)構(gòu)域搜索結(jié)果二硫鍵識(shí)別結(jié)果PHD程序信息PHD預(yù)測(cè)結(jié)果PROF預(yù)測(cè)結(jié)果球狀蛋白預(yù)測(cè)結(jié)果Ambivalent序列識(shí)別結(jié)果PredictProtein分析結(jié)果當(dāng)前84頁,總共135頁。PredictProtein分析結(jié)果跨膜區(qū)非跨膜區(qū)LoopHelixSheet當(dāng)前85頁,總共135頁。(2)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)方法特點(diǎn)工具同源建模法(Homology/Comparativemodelling)基于序列同源比對(duì),對(duì)于序列相似度>30%的序列模擬比較有效,最常用的方法SWISS-MODEL,CPHmodels

串線法/折疊識(shí)別法

(Threading/Foldrecognition)“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi),適于對(duì)蛋白質(zhì)核心結(jié)構(gòu)進(jìn)行預(yù)測(cè),計(jì)算量大THREADER,3D-PSSM從頭預(yù)測(cè)法(Abinitio/Denovomethods)基于分子動(dòng)力學(xué),尋找能量最低的構(gòu)象,計(jì)算量大,只能做小分子預(yù)測(cè)HMMSTR/ROSSETA當(dāng)前86頁,總共135頁。方法一:同源模建comparativemodeling

1.同源模建的基礎(chǔ)蛋白質(zhì)的三級(jí)結(jié)構(gòu)比一級(jí)結(jié)構(gòu)更保守。研究表明如果兩個(gè)蛋白質(zhì)的同源性達(dá)到50%,二者90%的Ca的RMS

小于1埃。

2.原理:序列高度相似的蛋白質(zhì)具有相似的三維結(jié)構(gòu)。同源蛋白質(zhì)之間具有保守的結(jié)構(gòu)內(nèi)核,差異僅存在分子表面的回折區(qū)。當(dāng)一個(gè)蛋白質(zhì)的序列與一個(gè)已知結(jié)構(gòu)的蛋白質(zhì)序列相似的時(shí)候,該蛋白質(zhì)的結(jié)構(gòu)可以被模建。當(dāng)前87頁,總共135頁。

3.同源模建的前提和條件:要模建的目標(biāo)蛋白必須有一個(gè)或多個(gè)已知結(jié)構(gòu)的與之同源(同源性不低于25%)的蛋白。數(shù)據(jù)庫:蛋白質(zhì)結(jié)構(gòu)、序列數(shù)據(jù)計(jì)算機(jī):工作站分子模擬系統(tǒng):軟件系統(tǒng)4.同源模建的發(fā)展歷史

1969年,Browne利用溶菌酶的結(jié)構(gòu)手工模建了牛乳白蛋白的結(jié)構(gòu)。八十年代,Blundel發(fā)展了利用多種同源蛋白質(zhì)進(jìn)行結(jié)構(gòu)預(yù)測(cè)的方法。隨著計(jì)算機(jī)技術(shù)的發(fā)展、結(jié)構(gòu)測(cè)定數(shù)據(jù)的增加,同源模建技術(shù)也在快速發(fā)展。當(dāng)前88頁,總共135頁。5.同源模建的主要算法剛體裝配模建(modelingbyrigidbodyassembly)片段匹配模建(modelingbysegmentmatching)空間制約模建(modelingbysatisfactionofspatialrestraints)當(dāng)前89頁,總共135頁。(1)剛體裝配模建從一些剛體包括核心區(qū)、環(huán)區(qū)和側(cè)鏈來構(gòu)造模型,這些剛體都來自分解的相關(guān)結(jié)構(gòu)(參考蛋白)。模型的裝配涉及計(jì)算一個(gè)框架,這個(gè)框架定義為折疊模式的保守區(qū)域的模板原子的平均,并把剛體裝進(jìn)框架。(2)片段匹配模建依賴于從模板蛋白的保守原子的相近位置來計(jì)算其它原子的坐標(biāo)。它可以通過使用蛋白質(zhì)結(jié)構(gòu)的短片數(shù)據(jù)庫、能量或幾何規(guī)則、以及這些標(biāo)準(zhǔn)的某些聯(lián)合來完成。(3)空間制約滿足:首先從參考蛋白結(jié)構(gòu)中抽取出一些空間制約條件,將這些制約條件用幾率密度函數(shù)來表示,然后根據(jù)氨基酸類型、等位殘基的主鏈構(gòu)象和序列之間局部的相似程度而對(duì)空間制約條件施加以不同的權(quán)重因子。模建時(shí)將幾率密度函數(shù)應(yīng)用到未知結(jié)構(gòu)蛋白質(zhì)序列上,通過優(yōu)化分子的幾率密度函數(shù)使制約條件有最小的沖突而得到目標(biāo)蛋白的三維結(jié)構(gòu),整個(gè)優(yōu)化過程通過分子力學(xué)和分子動(dòng)力學(xué)模擬來實(shí)現(xiàn)。

當(dāng)前90頁,總共135頁。6.同源建模法分析步驟:多序列比對(duì)與已有晶體結(jié)構(gòu)的蛋白質(zhì)序列比對(duì)確定是否有可以使用的模板序列相似度>30%序列相似度<30%,結(jié)合功能,蛋白質(zhì)一級(jí)序列、二級(jí)結(jié)構(gòu)或結(jié)構(gòu)域信息構(gòu)建三維模型三維模型準(zhǔn)確性檢驗(yàn)Whatcheck程序Ramachandranplot計(jì)算檢驗(yàn)手工調(diào)整多序列比對(duì),重新擬和,構(gòu)建新的模型當(dāng)前91頁,總共135頁。當(dāng)前92頁,總共135頁。常用數(shù)據(jù)庫數(shù)據(jù)庫網(wǎng)站備注PDB/pdb/home/home.do主要的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫MMDB/Structure/MMDB/mmdb.shtmlNCBI維護(hù)的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Psdb/~deerfiel/PSdb/從PDB和NRL-3D數(shù)據(jù)庫中衍生出的數(shù)據(jù)庫,含二級(jí)結(jié)構(gòu)和三維結(jié)構(gòu)信息3DinSighthttp://gibk26.bse.kyutech.ac.jp/jouhou/3dinsight/3DinSight.html整合了結(jié)構(gòu)、性質(zhì)(氨基酸組成、熱力學(xué)參數(shù)等)、生物學(xué)功能(突變點(diǎn),相互作用等)的綜合數(shù)據(jù)庫,F(xiàn)SSPhttp://www.ebi.ac.uk/dali//fssp/根據(jù)結(jié)構(gòu)比對(duì)的蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOPhttp://scop.mrc-lmb.cam.ac.uk/scop/蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫,將已知結(jié)構(gòu)蛋白進(jìn)行有層次地分類CATH/latest/index.html另一個(gè)有名的蛋白質(zhì)結(jié)構(gòu)和結(jié)構(gòu)域主要結(jié)構(gòu)分類庫MODBASE/modbase-cgi/index.cgi用同源比對(duì)法生成的模型結(jié)構(gòu)數(shù)據(jù)庫EnzymeStructurehttp://www.ebi.ac.uk/thornton-srv/databases/enzymes/從PDB數(shù)據(jù)庫中整理已知結(jié)構(gòu)的酶蛋白數(shù)據(jù)庫HSSPhttp://www.sander.ebi.ac.uk/hssp/根據(jù)同源性到處的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫當(dāng)前93頁,總共135頁。模板搜索與比對(duì)工具網(wǎng)站備注PSI-BLAST/BLAST/位置特異性疊代BLAST,可用來搜索遠(yuǎn)源家族序列FASTA3http://www.ebi.ac.uk/fasta33/位于EBI的序列比對(duì)工具SSEARCHrs.fr/bin/ssearch-guess.cgi采用Smith/Waterman法來進(jìn)行序列比對(duì)ClustalWhttp://www.ebi.ac.uk/Tools/clustalw/index.html多序列比對(duì)工具,位于EBIT-Coffeehttp://www.ebi.ac.uk/t-coffee/用多種方法(如ClustalW、DIalign等)來構(gòu)建多序列比對(duì)Multalinhttp://bioinfo.genopole-toulouse.prd.fr/multalin/multalin.html一個(gè)老牌的多序列比對(duì)工具Dalihttp://www.ebi.ac.uk/dali/三維結(jié)構(gòu)比對(duì)網(wǎng)絡(luò)服務(wù)器VAST/Structure/VAST/vast.shtml基于向量并列分析算法的三維結(jié)構(gòu)比對(duì)工具SAM-T99/research/compbio/sam.html用HMM法搜索蛋白質(zhì)遠(yuǎn)源同源序列當(dāng)前94頁,總共135頁。同源建模法工具網(wǎng)站備注SWISS-MODEL/完整建模程序,采用同源性鑒定來確定模板蛋白,用戶也可以自定義模板進(jìn)行分析CPHmodelshttp://www.cbs.dtu.dk/services/CPHmodels/基于神經(jīng)網(wǎng)絡(luò)的同源建模工具,用戶只需提交序列,無高級(jí)選項(xiàng)EsyPred3Dhttp://www.fundp.ac.be/urbm/bioinfo/esypred/采用神經(jīng)網(wǎng)絡(luò)來提高同源建模準(zhǔn)確性的預(yù)測(cè)工具3Djigsawhttp://www.bmm.icnet.uk/servers/3djigsaw/根據(jù)同源已知結(jié)構(gòu)蛋白來建模的預(yù)測(cè)工具M(jìn)ODELLER/modeller/一個(gè)廣泛使用的同源建模軟件,需要用戶對(duì)腳本有一定的了解當(dāng)前95頁,總共135頁。串線法工具網(wǎng)站備注3D-PSSMhttp://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html第一個(gè)運(yùn)用1D-3D序列profile來預(yù)測(cè)蛋白質(zhì)折疊結(jié)構(gòu)的網(wǎng)絡(luò)服務(wù)器Fuguehttp://www-cryst.bioc.cam.ac.uk/~fugue/以序列—結(jié)構(gòu)比對(duì)搜索數(shù)據(jù)庫來預(yù)測(cè)蛋白質(zhì)折疊HHpredhttp://toolkit.tuebingen.mpg.de/hhpred基于HMM-HMM比對(duì)搜索多個(gè)數(shù)據(jù)庫來預(yù)測(cè)給定序列的的折疊結(jié)構(gòu)LOOPP/loopp.aspx學(xué)習(xí)、觀察和輸出蛋白質(zhì)模式和結(jié)構(gòu)工具THREADERhttp://bioinf.cs.ucl.ac.uk/threader/一個(gè)老牌的線索分析軟件,對(duì)搜索遠(yuǎn)源蛋白序列較敏感PROSPECT/structure/prospect/index.html蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和評(píng)價(jià)工具包,能以一種非常簡單的方式運(yùn)行,對(duì)于高級(jí)用戶,也提供了很多的可選項(xiàng)123D+http://123/123D+.html結(jié)合了序列概形,二級(jí)結(jié)構(gòu)信息和接觸勢(shì)能來將待測(cè)蛋白“穿入”一系列結(jié)構(gòu)來預(yù)測(cè)結(jié)構(gòu)SAM-T02/research/compbio/HMM-apps/T02-query.html基于HMM方法的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)GenThreaderhttp://bioinf.cs.ucl.ac.uk/psipred/psiform.html使用結(jié)構(gòu)評(píng)分和基于神經(jīng)網(wǎng)絡(luò)序列比對(duì)來也測(cè)蛋白折疊結(jié)構(gòu)當(dāng)前96頁,總共135頁。蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)SWISS-MODEL工具同源建模方法與PDB數(shù)據(jù)庫已知結(jié)構(gòu)的蛋白質(zhì)序列比對(duì)進(jìn)行預(yù)測(cè)當(dāng)前97頁,總共135頁。主要參數(shù)/選項(xiàng)粘貼protein.txt中一條蛋白質(zhì)序列輸入用戶Email(選填)比對(duì)e值參照模板序列數(shù)目當(dāng)前98頁,總共135頁。輸出結(jié)果下載pdb格式文件當(dāng)前99頁,總共135頁。與模板序列比對(duì)結(jié)果,并顯示二級(jí)結(jié)構(gòu)區(qū)域當(dāng)前100頁,總共135頁。方法二:折疊識(shí)別/穿線方法對(duì)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)背景:序列比對(duì)后所擊中的相似序列不是完整的而是一段一段的結(jié)構(gòu)域,也可以通過二級(jí)結(jié)構(gòu)預(yù)測(cè)和折疊識(shí)別(foldrecognition)找到合適的折疊子,再以這些已知結(jié)構(gòu)的折疊子為模板來構(gòu)建模型。當(dāng)前101頁,總共135頁。折疊識(shí)別/穿線方法

觀察:有限的蛋白質(zhì)折疊種類(~1,000?)與“從頭開始”來預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)不同,我們可以從有限的蛋白質(zhì)折疊條目中得到正確的結(jié)果。基于序列技巧可以做到這一點(diǎn),或者通過穿線法將序列按順序投到模板上,并評(píng)價(jià)每一個(gè)匹配好壞程度當(dāng)前102頁,總共135頁。折疊識(shí)別/穿線方法原理:將序列“穿”入已知的各種蛋白質(zhì)折疊子骨架內(nèi),通過目的蛋白序列與已知折疊子的逐一比對(duì),計(jì)算出未知結(jié)構(gòu)序列折疊成各種已知折疊子的可能性;折疊子一般包括一個(gè)或多個(gè)蛋白質(zhì)超家族;每個(gè)折疊子的結(jié)構(gòu)內(nèi)核有確定的結(jié)構(gòu)特征;基于序列同源性很低的蛋白質(zhì)都可能存在結(jié)構(gòu)相同的折疊子進(jìn)行預(yù)測(cè)。例如,通過PHYRE系統(tǒng)進(jìn)行折疊識(shí)別預(yù)測(cè)http://www.sbg.bio.ic.ac.uk/~phyre/index.cgi當(dāng)前103頁,總共135頁。折疊識(shí)別或穿線法目標(biāo)序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…可能折疊的庫(哪些具有已知序列和結(jié)構(gòu)):當(dāng)前104頁,總共135頁。序列-結(jié)構(gòu)比對(duì)目標(biāo)序列=SHPALTQLRALRYCKEIPALDPQLLDWLLLEDSMTKRFEQQ…=t1t2t3t4t5…tn已知折疊結(jié)構(gòu)的序列=s1s2s3s4s5…sn已知折疊結(jié)構(gòu)的位置=p1p2p3p4p5…pn怎樣將目標(biāo)序列與結(jié)構(gòu)進(jìn)行比對(duì)?當(dāng)前105頁,總共135頁。同源模建與結(jié)構(gòu)類型識(shí)別方法的比較蛋白質(zhì)家族與蛋白質(zhì)結(jié)構(gòu)類型

Family蛋白質(zhì)家族依據(jù)序列同源性將蛋白質(zhì)分為不同的家族:一般將序列同源性大于30%的蛋白質(zhì)歸屬為一個(gè)家族。一個(gè)蛋白質(zhì)家族的成員可能由一個(gè)共同的祖先進(jìn)化而來。自然界存在的可能蛋白質(zhì)家族數(shù)目大約為23100種。同一個(gè)家族的蛋白質(zhì)一般具有相近的功能和相同的結(jié)構(gòu)類型(折疊模式)。當(dāng)前106頁,總共135頁。3D-PSSM工具h(yuǎn)ttp://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html由英國倫敦帝國理工學(xué)院維護(hù),其數(shù)據(jù)庫中含有9864個(gè)蛋白折疊結(jié)構(gòu)3D-PSSM先用PSI-BLAST標(biāo)準(zhǔn)方法通過多序列比對(duì)得到輪廓(profile),然后對(duì)家族中的一系列成員進(jìn)行結(jié)構(gòu)比對(duì)得出該家族的結(jié)構(gòu)輪廓,接著用線串法將模板結(jié)構(gòu)輪廓和待測(cè)蛋白的序列輪廓進(jìn)行1D-3D輪廓之間的比對(duì),此外也考慮了溶劑可及性和二級(jí)結(jié)構(gòu)信息當(dāng)前107頁,總共135頁。輸入用戶Email(學(xué)術(shù)郵箱,必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)當(dāng)前108頁,總共135頁。輸入用戶Email(必需)蛋白質(zhì)描述(選填)序列提交框(氨基酸單字母)Phyre

-http://www.sbg.bio.ic.ac.uk/~phyre/3d-PSSM的升級(jí)版,增加了fold數(shù)據(jù),并且性能上提高10%-15%,采用了新的分析界面當(dāng)前109頁,總共135頁。二級(jí)結(jié)構(gòu)預(yù)測(cè)當(dāng)前110頁,總共135頁。序列比對(duì)結(jié)果序列比對(duì)一致性模板長度靶標(biāo)蛋白模型模板蛋白結(jié)構(gòu)分類信息折疊子描述當(dāng)前111頁,總共135頁。當(dāng)前112頁,總共135頁。當(dāng)前113頁,總共135頁。工具網(wǎng)站備注Swiss-PdbViewer/spdbv/一個(gè)界面非常友好的工具,可以分析蛋白質(zhì)的結(jié)構(gòu)性質(zhì),比較活性位點(diǎn)或突變點(diǎn)Jmol/一個(gè)基于Java語言開發(fā)的三維觀察工具,大多是作為一個(gè)內(nèi)嵌式網(wǎng)頁工具快速游覽結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)MolMolhttp://www.mol.biol.ethz.ch/wuthrich/software/molmol/免費(fèi)的PDB三維分子觀察軟件,可以通過處理生成很漂亮的圖形文件PyMol/一個(gè)基于開源的三維觀察工具,有很多額外的插件來提升功能Rasmol/software/rasmol/很有名的三維觀察軟件,操作界面簡介,用命令行實(shí)現(xiàn)多種功能VMD/Research/vmd/用內(nèi)建的腳本來瀏覽、分析三維結(jié)構(gòu),還可以以動(dòng)畫的形式模擬蛋白質(zhì)結(jié)構(gòu)Chime/products/framework/chime/index.jsp網(wǎng)絡(luò)游覽器插件,可以在網(wǎng)頁中直接觀察PDB格式的文件Chimera/chimera/index.html免費(fèi)分子模擬顯示程序,還包括結(jié)構(gòu)比對(duì)、藥物篩選等功能ICM-Browser/icm_browser.html三維分子游覽工具,有序列比對(duì)顯示功能,由MolSodt公司免費(fèi)推出常用蛋白質(zhì)三維結(jié)構(gòu)觀察和修改工具當(dāng)前114頁,總共135頁。Chime網(wǎng)絡(luò)游覽器插件基于游覽器的三維結(jié)構(gòu)觀察工具安裝后在InternetExplorer下的PLUGINS文件夾中會(huì)有:npchime.dll(pluginsfolder)npchime.zip(pluginsfolder,usedforLiveConnect)NOTE:Donotunzipthisfilechimepro.html(pluginsfolder,thereleasenotesforChime)chime26.isu(pluginsfolder,usedtouninstallChime)sculptapi.dll(WindowsSystemfolder,usedforSculpt)ChimeShim.dll(pluginsfolder,InternetExploreronly)當(dāng)前115頁,總共135頁。當(dāng)前116頁,總共135頁。SWISS-PdbView觀察三維模型SWISS-PdbView工具觀察和修改分子的三維結(jié)構(gòu)當(dāng)前117頁,總共135頁。菜單欄/工具欄圖層窗口主窗口序列聯(lián)配窗口控制面板當(dāng)前118頁,總共135頁。Ramachandran圖結(jié)構(gòu)疊加當(dāng)前119頁,總共135頁。蛋白質(zhì)序列分析蛋白質(zhì)一級(jí)序列蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)親疏水性分析跨膜區(qū)結(jié)構(gòu)預(yù)測(cè)卷曲螺旋預(yù)測(cè)翻譯后修飾位點(diǎn)預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)序列信號(hào)位點(diǎn)分析蛋白質(zhì)超二級(jí)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)三級(jí)結(jié)構(gòu)蛋白質(zhì)三維結(jié)構(gòu)模擬蛋白質(zhì)分類蛋白質(zhì)家族分析蛋白質(zhì)序列分析匯總表課程總結(jié)當(dāng)前120頁,總共135頁。課程總結(jié)當(dāng)前121頁,總共135頁。四、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的應(yīng)用蛋白質(zhì)的分子設(shè)計(jì)當(dāng)前122頁,總共135頁。

蛋白質(zhì)分子設(shè)計(jì)與基因工程技術(shù)、多肽合成技術(shù)和化學(xué)合成技術(shù)一起開創(chuàng)了新藥設(shè)計(jì)和開發(fā)研究的新局面。這個(gè)領(lǐng)域的研究方向主要包括蛋白三維結(jié)構(gòu)預(yù)測(cè)、蛋白質(zhì)結(jié)構(gòu)功能關(guān)系研究、蛋白相互作用、蛋白與DNA相互作用、蛋白質(zhì)突變體的分子設(shè)計(jì)、全新蛋白質(zhì)設(shè)計(jì)等。當(dāng)前123頁,總共135頁。1.分子設(shè)計(jì)的意義

分子生物學(xué)最激動(dòng)人心的進(jìn)展之一是能夠設(shè)計(jì)和生產(chǎn)新的蛋白質(zhì)分子。重組DNA技術(shù)使人們能夠定向改變蛋白質(zhì)中的氨基酸序列,包括氨基酸的取代、插入或缺失,甚至包括蛋白質(zhì)的融合等。

蛋白質(zhì)工程則是在深入了解蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系的基礎(chǔ)上,利用分子生物學(xué)方法和手段有目的地改造蛋白質(zhì),使之性能得到改善。作為蛋白質(zhì)工程的組成部分,蛋白質(zhì)分子設(shè)計(jì)在其中起著十分重要的作用。

當(dāng)前124頁,總共135頁。當(dāng)前125頁,總共135頁。從預(yù)期的蛋白質(zhì)功能出發(fā)→設(shè)計(jì)預(yù)期的蛋白質(zhì)結(jié)構(gòu)→推測(cè)應(yīng)有的氨基酸序列→找到相對(duì)應(yīng)的脫氧核苷酸(基因)當(dāng)前126頁,總共135頁。

2.分子設(shè)計(jì)的種類小改:少數(shù)殘基的替換,突變或修飾中改:分子拼接,肽段或結(jié)構(gòu)域的替換大改:從頭設(shè)計(jì),全新蛋白質(zhì)的設(shè)計(jì)3.分子設(shè)計(jì)與蛋白質(zhì)結(jié)構(gòu)

蛋白質(zhì)分子內(nèi)部的電荷分布、相互作用有其特定的結(jié)構(gòu)特征,隨意選擇突變位點(diǎn)在蛋白質(zhì)分子中改變氨基酸,不僅達(dá)不到預(yù)期目的,反而可能影響蛋白質(zhì)分子的活性中心,使蛋白質(zhì)的活性降低或喪失。當(dāng)前127頁,總共135頁。

4.蛋白質(zhì)分子設(shè)計(jì)的應(yīng)用

應(yīng)用1:酶穩(wěn)定性的改善酶的穩(wěn)定性

在蛋白質(zhì)工程的實(shí)踐中,一般可以通過在酶分子內(nèi)增加二硫鍵或靜電作用來提高酶分子的穩(wěn)定性。例1:核糖核酸酶的穩(wěn)定性的提高(1)已知條件:核糖核酸酶三維結(jié)構(gòu)已由晶體衍射方法測(cè)定。

分子內(nèi)有兩對(duì)二硫鍵:Tyr24與Asn84正對(duì),二者的Ca之間的距離為6.0A,滿足二硫鍵的特征(二硫鍵的Ca的平均距離:4.5-6.8?),可

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論