![蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第1頁](http://file4.renrendoc.com/view/633e80c991987fd0cd1fa5ac38461298/633e80c991987fd0cd1fa5ac384612981.gif)
![蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第2頁](http://file4.renrendoc.com/view/633e80c991987fd0cd1fa5ac38461298/633e80c991987fd0cd1fa5ac384612982.gif)
![蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第3頁](http://file4.renrendoc.com/view/633e80c991987fd0cd1fa5ac38461298/633e80c991987fd0cd1fa5ac384612983.gif)
![蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第4頁](http://file4.renrendoc.com/view/633e80c991987fd0cd1fa5ac38461298/633e80c991987fd0cd1fa5ac384612984.gif)
![蛋白質(zhì)組與蛋白質(zhì)結(jié)構(gòu)分析_第5頁](http://file4.renrendoc.com/view/633e80c991987fd0cd1fa5ac38461298/633e80c991987fd0cd1fa5ac384612985.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
學(xué)習(xí)提綱
重點
蛋白質(zhì)的分離與鑒定方法、蛋白質(zhì)芯片分析技術(shù)以及酵母雙雜交技術(shù)。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法及其軟件、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法及其軟件?,F(xiàn)在是1頁\一共有147頁\編輯于星期五
難點
蛋白質(zhì)二級結(jié)構(gòu)和三維結(jié)構(gòu)算法以及軟件的使用。蛋白質(zhì)功能預(yù)測方法及其軟件的使用。蛋白質(zhì)與疾病發(fā)生。常用的蛋白質(zhì)組學(xué)數(shù)據(jù)庫。
熟悉現(xiàn)在是2頁\一共有147頁\編輯于星期五第一節(jié)引言Section1Introduction現(xiàn)在是3頁\一共有147頁\編輯于星期五隨著人類基因組及諸多物種基因組計劃的完成,生命科學(xué)研究已經(jīng)進入以基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等“組學(xué)”為研究標(biāo)志的后基因組時代(post-genomicera)。在后基因組時代,蛋白質(zhì)組學(xué)研究越來越受到關(guān)注和重視?,F(xiàn)在是4頁\一共有147頁\編輯于星期五蛋白質(zhì)組(proteome):指由一個基因組(genome),或一個細胞、組織表達的所有蛋白質(zhì)(protein)。蛋白質(zhì)組學(xué)(proteomics):蛋白質(zhì)組學(xué)是采用大規(guī)模、高通量、系統(tǒng)化的方法,研究某一類型細胞、組織或體液中的所有蛋白質(zhì)組成、功能及其蛋白之間相互作用的學(xué)科。根據(jù)不同研究目的和手段,蛋白質(zhì)組學(xué)分為表達蛋白質(zhì)組學(xué)、結(jié)構(gòu)蛋白質(zhì)組學(xué)和功能蛋白質(zhì)組學(xué)?,F(xiàn)在是5頁\一共有147頁\編輯于星期五①表達蛋白質(zhì)組學(xué):主要采用經(jīng)典蛋白質(zhì)組學(xué)技術(shù)如雙向凝膠電泳和圖像分析技術(shù),開展細胞內(nèi)蛋白樣品表達的定量研究;②結(jié)構(gòu)蛋白質(zhì)組學(xué):以繪制出蛋白復(fù)合物結(jié)構(gòu)或存在于一個特殊的細胞器中的蛋白為研究目標(biāo)的蛋白質(zhì)組學(xué),主要用于建立細胞內(nèi)信號轉(zhuǎn)導(dǎo)網(wǎng)絡(luò)圖譜并解釋某些特定蛋白表達對細胞產(chǎn)生的特定作用;現(xiàn)在是6頁\一共有147頁\編輯于星期五③功能蛋白質(zhì)組學(xué):以細胞在某一特定時間所表達或與某個功能相關(guān)的蛋白質(zhì)集合為研究對象進行研究和描述,能夠提供有關(guān)蛋白糖基化、磷酸化,蛋白信號轉(zhuǎn)導(dǎo)通路,疾病機制或蛋白-藥物之間相互作用的重要信息?,F(xiàn)在是7頁\一共有147頁\編輯于星期五第二節(jié)蛋白質(zhì)組數(shù)據(jù)的獲取與分析Section2ProteomicsDataAcquisitionandAnalysis現(xiàn)在是8頁\一共有147頁\編輯于星期五一、二維凝膠電泳分析技術(shù)2-DE:是將樣品進行電泳后在它的直角方向再進行一次電泳,又稱雙向電泳。第一向:等電聚焦(isoelectricfocusing,IEF),蛋白質(zhì)沿pH梯度分離至各自的等電點。第二向:是十二磺酸鈉-聚丙烯酰胺凝膠電泳(SDS),蛋白質(zhì)進行分子量的分離。(一)定義及特點現(xiàn)在是9頁\一共有147頁\編輯于星期五樣品經(jīng)過電荷和質(zhì)量兩次分離后,可獲得樣品分子等電點(isoelectricpoint,pI)和分子量(molecularweight,MW)等信息。分離的結(jié)果不是獲得蛋白條帶,而是蛋白斑點。這是迄今分辨率最高、信息最多的蛋白電泳技術(shù)。目前使用廣泛的2-DE蛋白分離的方法為固相pH梯度-SDS雙向凝膠電泳。現(xiàn)在是10頁\一共有147頁\編輯于星期五1.樣品制備目的是從成分復(fù)雜的細胞、組織等材料中取得純度高的完整蛋白質(zhì)組分。(二)固相pH梯度-SDS雙向凝膠電泳
(IPG-DALT電泳)操作原理及技術(shù)流程現(xiàn)在是11頁\一共有147頁\編輯于星期五2.蛋白質(zhì)定量BCA法、Bradford法及UV280法等,但由于這些定量方法都基于吸光度測定,而樣品溶液中往往含有高濃度尿素等溶劑可能影響吸光度的準(zhǔn)確測定,故推薦使用雙向電泳蛋白質(zhì)定量專用試劑盒進行檢測。現(xiàn)在是12頁\一共有147頁\編輯于星期五3.一向電泳一向電泳等電聚焦(isoelectricfocusing,IEF),是根據(jù)蛋白質(zhì)pI值不同,在電場力的作用下將其分離。現(xiàn)在是13頁\一共有147頁\編輯于星期五4.一向膠條的平衡進行第二向電泳前,需要對IPG膠條進行平衡(equilibration),平衡過程是將IPG膠條浸沒在第二向電泳所必需的SDS緩沖體系中,以便被分離蛋白質(zhì)與SDS完全結(jié)合并順利轉(zhuǎn)移入二向電泳的凝膠中。平衡后應(yīng)立即進行第二向電泳。現(xiàn)在是14頁\一共有147頁\編輯于星期五5.二向電泳即十二烷基磺酸鈉-聚丙烯酰胺凝膠電泳,是根據(jù)分子量大小各異的蛋白質(zhì)在電場中的泳動速率不同的原理而分離蛋白質(zhì)的方法?,F(xiàn)在是15頁\一共有147頁\編輯于星期五6.凝膠檢測適用于SDS凝膠中蛋白質(zhì)檢測的方法都可用于雙向電泳凝膠檢測。銀染和考馬斯亮藍(R250、G250)染色,是蛋白質(zhì)組研究中最為廣泛使用的兩種染色方法?,F(xiàn)在是16頁\一共有147頁\編輯于星期五質(zhì)譜(massspectrometry,MS)是按照物質(zhì)的質(zhì)量與電荷的比值(質(zhì)荷比,mass-to-chargeratio,m/z)順序排列成的圖譜。質(zhì)譜分析法是按照離子的質(zhì)荷比大小對離子進行分離和測定,從而對樣品進行定性和定量分析的一種方法。二、蛋白質(zhì)組質(zhì)譜分析技術(shù)現(xiàn)在是17頁\一共有147頁\編輯于星期五質(zhì)譜儀(massspectrometer)是利用電磁學(xué)原理使離子按照質(zhì)荷比進行分離,從而測定物質(zhì)的質(zhì)量與含量的科學(xué)實驗儀器。(一)質(zhì)譜儀現(xiàn)在是18頁\一共有147頁\編輯于星期五1.基質(zhì)輔助激光解吸/電離(matrixassistedlaserdesorption/ionization,MALDI)利用激光脈沖將與基質(zhì)結(jié)晶混合的蛋白質(zhì)樣品升華并電離出來。2.電噴霧(electrpsprayionization,ESI)將分析物從溶液中電離出來,可以方便地與液相色譜(liquid-chromatography,LC)聯(lián)用?,F(xiàn)在是19頁\一共有147頁\編輯于星期五1.分子量測定2.肽譜測定生物質(zhì)譜通過與特異性蛋白酶解相結(jié)合,可測定肽質(zhì)量指紋圖(peptidemassfingerprint,PMF),并獲得全部肽段的準(zhǔn)確分子量,結(jié)合蛋白質(zhì)數(shù)據(jù)庫檢索就可實現(xiàn)蛋白質(zhì)的快速鑒別和高通量篩選。(二)質(zhì)譜的應(yīng)用現(xiàn)在是20頁\一共有147頁\編輯于星期五3.肽序列測定串聯(lián)質(zhì)譜技術(shù)可直接用于肽段的測序,從一級質(zhì)譜產(chǎn)生的肽段中選擇母離子進入二級質(zhì)譜,經(jīng)惰性氣體碰撞后,肽段沿肽鏈斷裂,由所得各肽段質(zhì)量數(shù)差值推定肽段序列,并用于數(shù)據(jù)庫查尋,稱為肽序列標(biāo)簽技術(shù)(peptidesequencetag,PST),目前廣泛應(yīng)用于蛋白質(zhì)組大規(guī)模篩選?,F(xiàn)在是21頁\一共有147頁\編輯于星期五4.巰基和二硫鍵定位利用生物質(zhì)譜的準(zhǔn)確分子量測定特性,同時結(jié)合碘乙酰胺、4-乙烯吡啶等化學(xué)試劑對蛋白質(zhì)進行烷基化和還原烷基化以及蛋白質(zhì)酶切、肽譜技術(shù)等,可實現(xiàn)對二硫鍵和自由巰基的快速定位?,F(xiàn)在是22頁\一共有147頁\編輯于星期五5.蛋白質(zhì)翻譯后修飾如用MALDI-TOF-MS對雙向電泳分離蛋白質(zhì)磷酸化位點進行定位、MALDI-TOF-MS結(jié)合不同酶解方式確定糖基化位點等。現(xiàn)在是23頁\一共有147頁\編輯于星期五1.MALDI-TOF質(zhì)譜測定肽質(zhì)量指紋圖將質(zhì)譜分析獲得的肽段分子質(zhì)量與蛋白質(zhì)數(shù)據(jù)庫中理論肽段的分子質(zhì)量進行比較,通過軟件分析可獲得蛋白質(zhì)信息,根據(jù)匹配情況判斷出所鑒定分析的蛋白質(zhì)是已知的還是未知的。(三)基質(zhì)輔助激光解吸電離飛行時間質(zhì)譜(MALDI-TOF-MS)分析技術(shù)現(xiàn)在是24頁\一共有147頁\編輯于星期五2.MALDI-TOF質(zhì)譜技術(shù)用于蛋白質(zhì)C-端序列分析在質(zhì)譜儀內(nèi),應(yīng)用源后衰變(post-sourcedecay,PSD)和碰撞誘導(dǎo)解離(collision-induceddissociation,CID)可產(chǎn)生包含有僅異于一個氨基酸殘基質(zhì)量的一系列肽峰質(zhì)譜。此外,用酶或化學(xué)方法從N-或C-末端按順序除去不同數(shù)目氨基酸,亦可形成大小不同的一系列梯形肽片段,所得的一定數(shù)目肽質(zhì)量由MALDI-TOF-MS測量。現(xiàn)在是25頁\一共有147頁\編輯于星期五1.電噴霧電離質(zhì)譜測定蛋白質(zhì)和多肽分子質(zhì)量蛋白質(zhì)和多肽分子經(jīng)電噴霧電離時,會吸附一個或多個質(zhì)子,形成一系列帶電荷狀態(tài)不同的分子離子,在質(zhì)譜中形成荷質(zhì)比不同的譜峰。一般可根據(jù)譜峰的同位素離子峰分布情況以及利用相鄰兩峰的荷質(zhì)比和電荷數(shù)關(guān)系計算求得離子分子質(zhì)量。(四)電噴霧質(zhì)譜分析現(xiàn)在是26頁\一共有147頁\編輯于星期五2.液相色譜-電噴霧質(zhì)譜法鑒定雙向凝膠電泳蛋白質(zhì)對雙向凝膠電泳分離的蛋白質(zhì)點經(jīng)酶解后的多肽混合物進行液相色譜-電噴霧質(zhì)譜聯(lián)用(LC-ESIMS)鑒定分析,同樣可以得到PMF。現(xiàn)在是27頁\一共有147頁\編輯于星期五串聯(lián)質(zhì)譜的使用能夠?qū)赑MF的結(jié)果進行再分析或?qū)ξ促x值的質(zhì)譜峰信號進行研究。對于初始用PMF法鑒定的蛋白,可選擇其中部分肽段峰進行MS/MS分析,得到肽段的序列。(五)串聯(lián)質(zhì)譜(MS/MS)現(xiàn)在是28頁\一共有147頁\編輯于星期五三、蛋白質(zhì)芯片分析技術(shù)蛋白質(zhì)芯片(proteinchips)技術(shù)又稱蛋白質(zhì)微陣列(proteinmicroarrays),是一種高通量的、小型化的、平行性的生物檢測技術(shù)。現(xiàn)在是29頁\一共有147頁\編輯于星期五原理蛋白質(zhì)芯片是將已知蛋白點印在固定于不同種類支持介質(zhì)上,制成由高密度蛋白質(zhì)或多肽分子微陣列組成的蛋白微陣列,陣列中固定分子的位置及組成已知,未經(jīng)標(biāo)記或標(biāo)記(熒光物質(zhì)、酶或化學(xué)發(fā)光物質(zhì))的生物分子與芯片上探針反應(yīng),通過掃描裝置如激光掃描系統(tǒng)(laserscannerbasessystem)或電荷偶聯(lián)照像系統(tǒng)(chargecoupleddevice-camera,CCD-camera)檢測信號強度,量化分析雜交結(jié)果,檢測蛋白質(zhì)。現(xiàn)在是30頁\一共有147頁\編輯于星期五蛋白質(zhì)芯片具有以下特點①特異性強;②敏感性高;③高通量;④重復(fù)性好;⑤應(yīng)用性強;⑥適用范圍廣。現(xiàn)在是31頁\一共有147頁\編輯于星期五分類根據(jù)功能:功能研究型芯片(functionalproteinmicroarrays)和分析檢測型芯片(analyticalproteinmicroarrays)?,F(xiàn)在是32頁\一共有147頁\編輯于星期五根據(jù)蛋白質(zhì)種類:抗體芯片和抗原芯片。根據(jù)芯片表面化學(xué)成分:化學(xué)表面芯片和生物表面芯片。根據(jù)點樣蛋白質(zhì)活性功能:無活性芯片和有活性芯片?,F(xiàn)在是33頁\一共有147頁\編輯于星期五根據(jù)載體:普通玻璃載體芯片(plain-glassslide)、多孔凝膠覆蓋芯片(porousgelpadchip)及微孔芯片(microwellchip)等。現(xiàn)在是34頁\一共有147頁\編輯于星期五待測樣品準(zhǔn)備反應(yīng)過程:待蛋白質(zhì)芯片與被測樣品溶液在適宜溫度下孵育一定時間后用PBST洗去未反應(yīng)分子,再根據(jù)不同標(biāo)記物直接檢測(如熒光標(biāo)記)或顯色后檢測(如酶標(biāo)記)。蛋白質(zhì)芯片檢測及分析現(xiàn)在是35頁\一共有147頁\編輯于星期五芯片檢測:對于熒光標(biāo)記芯片,用熒光掃描儀或激光共聚焦顯微鏡掃描,利用計算機分析各點平均熒光密度;對于酶標(biāo)記芯片,顯色后可用CCD照相機拍攝,利用計算機處理信號得到各點灰度?,F(xiàn)在是36頁\一共有147頁\編輯于星期五結(jié)果分析:設(shè)計對照反應(yīng),或設(shè)定陰陽性結(jié)果閾值。排除各點熒光密度或灰度背景干擾后與閾值比較并定量分析。現(xiàn)在是37頁\一共有147頁\編輯于星期五應(yīng)用領(lǐng)域基因表達篩選特異性抗原抗體檢測蛋白質(zhì)組學(xué)研究蛋白質(zhì)相互作用研究現(xiàn)在是38頁\一共有147頁\編輯于星期五四、酵母雙雜交系統(tǒng)酵母雙雜交系統(tǒng)(yeasttwo-hybridsystem)是一種直接于酵母細胞內(nèi)檢測蛋白質(zhì)-蛋白質(zhì)相互作用且靈敏度很高的分子生物學(xué)方法?,F(xiàn)在是39頁\一共有147頁\編輯于星期五酵母中轉(zhuǎn)錄活化因子GAL4蛋白能激活轉(zhuǎn)錄主要因為其二個結(jié)構(gòu)可分功能相互獨立的結(jié)構(gòu)域,即位于氨基(N)端的DNA-BD及位于羧基(C)端的AD。根據(jù)GAL4特性,可構(gòu)建兩種重組質(zhì)粒載體,分別表達GAL4蛋白的DNA-BD(N端1~147個氨基酸)和AD(羧基端768~881個氨基酸)。若在DNA-BD上連接“誘餌”蛋白X基因,在AD上連接“獵物”蛋白Y基因,再將這兩個質(zhì)粒共同轉(zhuǎn)入酵母體內(nèi)表達?,F(xiàn)在是40頁\一共有147頁\編輯于星期五如果酵母體內(nèi)表達的蛋白X和Y在酵母核內(nèi)發(fā)生交互作用,可使得DNA-BD和AD在空間上接近,從而激活UAS下游啟動子調(diào)節(jié)的酵母特定報告基因的表達,使轉(zhuǎn)化子由于報告基因的表達而可以在特定的營養(yǎng)缺陷培養(yǎng)基上生長,同時因激活轉(zhuǎn)錄下游GAL1-LacZ和/或MEL1基因的表達,從而在X-β-Gal和/或X-α-Gal存在下顯藍色,可用于排除篩選假陽性克隆。這樣可根據(jù)報告基因是否轉(zhuǎn)錄表達判斷“誘餌”蛋白X與“獵物”蛋白Y之間相互作用?,F(xiàn)在是41頁\一共有147頁\編輯于星期五(二)酵母雙雜交系統(tǒng)特點與應(yīng)用1.特點不僅可以精確測定蛋白質(zhì)間微弱相互作用,且在DNA水平操作,不需要在體外進行大量表達和純化蛋白質(zhì)?,F(xiàn)在是42頁\一共有147頁\編輯于星期五2.應(yīng)用分析已知蛋白質(zhì)間相互作用;可篩選cDNA文庫,分離與已知蛋白作用的新配體及其基因序列。發(fā)現(xiàn)新基因的主要途徑,是研究蛋白間交互作用最有力的工具之一?,F(xiàn)在是43頁\一共有147頁\編輯于星期五3.局限性轉(zhuǎn)化效率低;適用范圍有限;存在假陽性及假陰性;外源蛋白毒性及翻譯后修飾?,F(xiàn)在是44頁\一共有147頁\編輯于星期五五、RosettaStone方法某物種中基因C的兩個片段分別與同一物種或另一物種中基因A及基因B同源,既可認為基因A與基因B存在功能相關(guān)性,借助于基因C能找到無同源性的基因A及基因B之間關(guān)聯(lián)?;駽稱為羅塞塔石碑基因(RosettaStonegene),其表達蛋白稱為羅塞塔石碑蛋白。(一)RosettaStone方法來源現(xiàn)在是45頁\一共有147頁\編輯于星期五根據(jù)羅塞塔石碑蛋白C可預(yù)測蛋白質(zhì)A與蛋白質(zhì)B之間存在相互作用。該方法理論基礎(chǔ)是基于功能相關(guān)蛋白常常共進化的性質(zhì)?,F(xiàn)在是46頁\一共有147頁\編輯于星期五利用RosettaStone方法,檢索大腸桿菌基因組中4290種編碼蛋白基因在其他生物細胞基因組的融合情況,共發(fā)現(xiàn)6809對蛋白能構(gòu)成RosettaStone序列,其中3950對蛋白能在SWISS-PROT數(shù)據(jù)庫檢索到注釋功能,有2682對蛋白共享至少同一個關(guān)鍵詞,說明蛋白對功能相關(guān)。應(yīng)用此法檢索酵母菌基因組,發(fā)現(xiàn)45502對相關(guān)蛋白的基因序列。(二)RosettaStone方法的應(yīng)用現(xiàn)在是47頁\一共有147頁\編輯于星期五RosettaStone方法預(yù)測得到的蛋白互作網(wǎng)絡(luò),必須進一步通過實驗分析以提高其準(zhǔn)確性。可利用噬菌體展示技術(shù)、酵母雙雜交系統(tǒng)、免疫共沉淀法、X射線結(jié)晶學(xué)以及表面等離子共振技術(shù)等有效檢測蛋白質(zhì)相互作用高通量實驗技術(shù),為蛋白質(zhì)組學(xué)發(fā)展奠定堅實的基礎(chǔ)?,F(xiàn)在是48頁\一共有147頁\編輯于星期五六、蛋白質(zhì)組學(xué)分析軟件與數(shù)據(jù)庫1.蛋白質(zhì)表達分布圖數(shù)據(jù)庫日內(nèi)瓦大學(xué)的xPASy系統(tǒng)。2.蛋白質(zhì)組圖譜自動識別軟件包肽圖(peptidemapping)包含一個蛋白質(zhì)全部質(zhì)譜(MS)信息,肽段(peptidefragment)包含蛋白質(zhì)多個片段質(zhì)譜信息(類似于EST)。(一)常用蛋白質(zhì)組分析工具現(xiàn)在是49頁\一共有147頁\編輯于星期五(二)蛋白質(zhì)組分析軟件1.圖像分析2.微量測序(microsequencing)N-末端Edman降解技術(shù)現(xiàn)在是50頁\一共有147頁\編輯于星期五3.質(zhì)譜數(shù)據(jù)質(zhì)譜鑒定主要包括數(shù)據(jù)的計算機處理和蛋白質(zhì)的數(shù)據(jù)庫搜尋鑒定。質(zhì)譜數(shù)據(jù)經(jīng)計算機處理后,可使用三種數(shù)據(jù)庫搜尋方式“鑒定”蛋白質(zhì):①利用MS數(shù)據(jù)搜尋,即PMF法;②利用“原始”MS/MS數(shù)據(jù)搜尋法;③先對串聯(lián)質(zhì)譜數(shù)據(jù)進行解析,獲得部分多肽片段氨基酸序列后對蛋白質(zhì)進行序列查詢法鑒定?,F(xiàn)在是51頁\一共有147頁\編輯于星期五4.肽質(zhì)譜指紋圖(PMF)與肽序列測定由于氨基酸序列不同,蛋白質(zhì)酶(如胰酶)酶解后產(chǎn)生的酶切肽片段序列也不同,其肽混合物質(zhì)量數(shù)具一定特征,稱為肽質(zhì)譜指紋圖(PMF)?,F(xiàn)在是52頁\一共有147頁\編輯于星期五5.氨基酸組分利用氨基酸組分異質(zhì)性,基于雙向凝膠電泳圖譜鑒定蛋白質(zhì)。多種工具可用于氨基酸組分分析,如AACompIdent、ASA、FINDER、AAC-PI及PROP-SEARCH等。現(xiàn)在是53頁\一共有147頁\編輯于星期五(三)蛋白質(zhì)組數(shù)據(jù)庫1.綜合性蛋白質(zhì)2DE數(shù)據(jù)庫具有數(shù)據(jù)直觀性,以蛋白質(zhì)雙向電泳圖片為基礎(chǔ),并整合其他數(shù)據(jù)庫中信息,如蛋白質(zhì)序列、結(jié)構(gòu)及功能等。數(shù)據(jù)庫包括:SWISS2D數(shù)據(jù)庫、Argonne2D數(shù)據(jù)庫、MaxPlanck感染生物學(xué)研究所(MPIB)創(chuàng)建的蛋白質(zhì)2D數(shù)據(jù)庫等?,F(xiàn)在是54頁\一共有147頁\編輯于星期五2.哺乳類2DE數(shù)據(jù)庫丹麥Aarhus大學(xué)人類基因組研究中心的2D數(shù)據(jù)庫、英國心臟科學(xué)中心Harefield醫(yī)院維護的心臟內(nèi)皮細胞HSC2D數(shù)據(jù)庫、德國柏林心臟研究所的人類心肌2D數(shù)據(jù)庫等?,F(xiàn)在是55頁\一共有147頁\編輯于星期五3.微生物類和植物類2DE數(shù)據(jù)庫微生物類2DE數(shù)據(jù)庫主要包括細菌、真菌和寄生蟲三類。植物類2DE數(shù)據(jù)庫包括:澳大利亞國立大學(xué)ANU2D、法國INRACestas的樹木2D等?,F(xiàn)在是56頁\一共有147頁\編輯于星期五(四)質(zhì)譜數(shù)據(jù)庫查詢和蛋白質(zhì)鑒定常用軟件1.PepSea檢索前必須先獲得肽序列標(biāo)簽(PST)。在檢索較大蛋白時積分較高,隨機匹配的可能性也較大。2.SEQUEST可使用多個肽片段序列信息進行查詢,無需人工干預(yù),但查詢相當(dāng)費時。3.PeptIdent/MultiIdent基于遺傳算法?,F(xiàn)在是57頁\一共有147頁\編輯于星期五4.ProbID基于概率模型。5.MOWSE(molecularweightsearch)基于概率算法的數(shù)據(jù)庫查詢軟件。6.ProFound基于Bayesian算法,綜合考慮每個蛋白質(zhì)序列詳細信息,同時考慮了酶解產(chǎn)生肽片段的蛋白質(zhì)序列信息,大大提高算法的靈敏度和選擇性。現(xiàn)在是58頁\一共有147頁\編輯于星期五(五)PMF質(zhì)譜分析基本步驟1.核對譜圖,扣除本底等因素引起的失真,進行峰值校正,選擇分析范圍。(1)相對豐度:以質(zhì)譜中最強峰為100%(稱基峰),其他碎片峰與之相比的百分數(shù)。(2)總離子流(TIC):即一次掃描得到的所有離子強度之和?,F(xiàn)在是59頁\一共有147頁\編輯于星期五(3)動態(tài)范圍:即最強峰與最弱峰高之比。(4)本底:未進樣時,掃描得到的質(zhì)譜圖,空氣成分、儀器泵油、底物、緩沖液及吸附在離子源中其他樣品等所導(dǎo)致的背景峰。現(xiàn)在是60頁\一共有147頁\編輯于星期五以牛血清白蛋白(bovineserumalbumin,BSA)PMF圖譜為例(圖6-1)。右上角顯示質(zhì)譜分析數(shù)據(jù)。第一列表示實驗肽段質(zhì)量數(shù),第二列表示理論酶切后肽段質(zhì)量數(shù),第三列表示BSA酶切后各肽段序列。質(zhì)譜圖中各肽段峰上數(shù)字表示各峰相對應(yīng)的質(zhì)荷比(m/z)值,(+)表示該實驗峰質(zhì)荷比值與理論酶切后肽段峰質(zhì)荷比值相比配。現(xiàn)在是61頁\一共有147頁\編輯于星期五圖6-1BSA的MALDI-TOF質(zhì)譜圖譜現(xiàn)在是62頁\一共有147頁\編輯于星期五各標(biāo)記肽段峰上,(+)表示BSA酶切后肽段峰,(M)表示基質(zhì)峰。圖6-2BSA的MALDI-TOF質(zhì)譜圖譜500~900區(qū)域放大圖現(xiàn)在是63頁\一共有147頁\編輯于星期五2.確定肽指紋譜峰值數(shù)據(jù)集,剔除與所鑒定蛋白無關(guān)的質(zhì)量峰經(jīng)剔除基質(zhì)峰、酶自解峰等信號,圖6-1中BSA的肽指紋質(zhì)量數(shù)數(shù)據(jù)集為,721.355、927.490、1163.654、1249.633、1305.694、1439.850、1479.815、1567.733、1639.953、1871.888、2044.991?,F(xiàn)在是64頁\一共有147頁\編輯于星期五3.數(shù)據(jù)庫搜索及參數(shù)設(shè)置(1)選擇允許的化學(xué)修飾(2)確定可耐受的質(zhì)量數(shù)精確度(masstolerance)(3)確定酶切所用蛋白酶(4)確定允許漏切的酶切位點個數(shù)(5)確定肽段質(zhì)量數(shù)值(massvalues)及計算模式(6)根據(jù)搜索蛋白的匹配對象選擇合適的數(shù)據(jù)庫及物種(taxonomy)限定(7)確定估計等電點(pI)及分子量數(shù)值現(xiàn)在是65頁\一共有147頁\編輯于星期五現(xiàn)以牛血清白蛋白(bovineserumalbumin,BSA)為例,采用MASCOT搜索工具進行PMF分析鑒定(圖6-3、圖6-4、圖6-5、圖6-6)?,F(xiàn)在是66頁\一共有147頁\編輯于星期五圖6-3MASCOT搜索主界面現(xiàn)在是67頁\一共有147頁\編輯于星期五圖6-4選擇MASCOTPeptideMassFingerprint程序現(xiàn)在是68頁\一共有147頁\編輯于星期五圖6-5MASCOTPMF搜索結(jié)果界面現(xiàn)在是69頁\一共有147頁\編輯于星期五圖6-6搜索結(jié)果蛋白詳細信息現(xiàn)在是70頁\一共有147頁\編輯于星期五第三節(jié)蛋白質(zhì)結(jié)構(gòu)的預(yù)測Section3PredictionofProteinStructure現(xiàn)在是71頁\一共有147頁\編輯于星期五一、蛋白質(zhì)結(jié)構(gòu)預(yù)測概述1961年提出的Anfinsen原理為從氨基酸序列預(yù)測蛋白質(zhì)空間結(jié)構(gòu)奠定了理論基礎(chǔ),即蛋白質(zhì)分子的一級序列決定其空間結(jié)構(gòu),而蛋白質(zhì)天然構(gòu)象是能量最低的構(gòu)象。Li和Scheraga等曾用隨機搜索方法確定多肽構(gòu)象,但單純構(gòu)象搜索對于結(jié)構(gòu)和自由度復(fù)雜得多的蛋白質(zhì)無能為力。現(xiàn)在是72頁\一共有147頁\編輯于星期五目前蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法主要發(fā)展自兩個方向:1.物化理論分析:從頭預(yù)測2.統(tǒng)計學(xué)方法:同源建模,折疊識別現(xiàn)在是73頁\一共有147頁\編輯于星期五二、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法及軟件蛋白質(zhì)中約85%的殘基處于三種穩(wěn)定二級結(jié)構(gòu),α螺旋、β折疊和β轉(zhuǎn)角。二級結(jié)構(gòu)預(yù)測的目標(biāo)是根據(jù)一級結(jié)構(gòu)判斷殘基是否處于特定二級結(jié)構(gòu)。其基本依據(jù)是:每段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向,通過統(tǒng)計和分析發(fā)現(xiàn)這些傾向或者規(guī)律,二級結(jié)構(gòu)預(yù)測問題可轉(zhuǎn)化為模式分類和識別問題。現(xiàn)在是74頁\一共有147頁\編輯于星期五(一)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法1.DPM(雙重預(yù)測方法)先預(yù)測蛋白質(zhì)的結(jié)構(gòu)分類再預(yù)測序列的二級結(jié)構(gòu)。2.DSC算法首先預(yù)測基本概念,然后利用簡單線性統(tǒng)計方法結(jié)合概念預(yù)測二級結(jié)構(gòu),其準(zhǔn)確率較高?,F(xiàn)在是75頁\一共有147頁\編輯于星期五3.PHDsec基于神經(jīng)網(wǎng)絡(luò)系統(tǒng),被認為是二級結(jié)構(gòu)預(yù)測的標(biāo)準(zhǔn)。4.SOPMA它用五種相互獨立方法預(yù)測,并匯集整理“一致預(yù)測結(jié)果”,準(zhǔn)確率達69.5%?,F(xiàn)在是76頁\一共有147頁\編輯于星期五5.MLRC算法集GOR4、SIMPA96和SOPMA為一體,處理蛋白質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)果,并估計分類的后驗概率。6.Jpred1998年由BartonGroup創(chuàng)建,運用Jnet神經(jīng)網(wǎng)絡(luò)算法,準(zhǔn)確率可達到76.4%?,F(xiàn)在是77頁\一共有147頁\編輯于星期五(二)蛋白質(zhì)結(jié)構(gòu)域識別方法目前結(jié)構(gòu)域識別方法主要包括根據(jù)蛋白質(zhì)空間結(jié)構(gòu)信息利用機器學(xué)習(xí)方法獲取結(jié)構(gòu)域信息的方法、通過對具有代表性三級結(jié)構(gòu)的蛋白質(zhì)建立隱馬爾可夫模型方法、分析蛋白質(zhì)序列構(gòu)象熵值判定結(jié)構(gòu)域邊界的方法、運用神經(jīng)網(wǎng)絡(luò)從蛋白質(zhì)序列獲取結(jié)構(gòu)域邊界方法和基于經(jīng)驗的人工劃分方法等?,F(xiàn)在是78頁\一共有147頁\編輯于星期五(三)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件以人基質(zhì)金屬蛋白酶(matrixmetalloproteinase14,MMP14,NCBI蛋白質(zhì)數(shù)據(jù)庫編號NP_004986)為例,介紹Jpred、SOPMA及PredictProtein等預(yù)測軟件?,F(xiàn)在是79頁\一共有147頁\編輯于星期五1.Jpred(pbio.dundee.ac.uk/~www-jpred/)Jpred首頁及部分分析結(jié)果見圖6-7,預(yù)測得到MMP14有8個α-螺旋區(qū)(H)和21個β-折疊區(qū)(E),其他區(qū)域均為無規(guī)則卷曲區(qū)(-)。現(xiàn)在是80頁\一共有147頁\編輯于星期五Jpred預(yù)測二級結(jié)構(gòu)現(xiàn)在是81頁\一共有147頁\編輯于星期五2.SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)SOPMA主頁及預(yù)測結(jié)果如圖6-8所示,MMP14含有螺旋(h)27.66%、延伸鏈(e)19.24%、轉(zhuǎn)角(t)11.34%和無軌卷曲(c)41.75%?,F(xiàn)在是82頁\一共有147頁\編輯于星期五SOPMA預(yù)測二級結(jié)構(gòu)現(xiàn)在是83頁\一共有147頁\編輯于星期五3.PredictProtein(/)二級結(jié)構(gòu)預(yù)測和溶劑可及性分析如圖6-9,目標(biāo)蛋白序列中的Helix(紅)和Strand(藍)被RePROF(上)和PROFsec(下)兩種方法預(yù)測出來,同時溶劑可及(Exposed,藍)與不可及(Buried,黃)的殘基也被PROFacc方法計算出來。各特征殘基的比例以餅狀圖顯示?,F(xiàn)在是84頁\一共有147頁\編輯于星期五PredictProtein預(yù)測現(xiàn)在是85頁\一共有147頁\編輯于星期五三、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法及軟件目前,蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法有三類:①比較建模(comparativemodeling,CM)需要與目標(biāo)序列的相似度較高(>30%)的已知結(jié)構(gòu)模板;②當(dāng)缺乏同源性較高的模板時,就需用復(fù)雜方法獲得合適的模板并產(chǎn)生更確切的比對,這種過程被稱為遠程同源建模(distanthomologymodeling)、折疊識別(foldrecognition)或穿線法(threading);③不直接用已知模板的方法稱為自由建模(freemodeling)或從頭預(yù)測(abinitio)法?,F(xiàn)在是86頁\一共有147頁\編輯于星期五(一)比較建模法原理比較建模又稱同源建模(homologymodeling),原理較簡單,基于進化相關(guān)的序列具有相似的三維結(jié)構(gòu)且進化過程中三維結(jié)構(gòu)比序列保守的原理,利用進化相關(guān)模板結(jié)構(gòu)信息建?!,F(xiàn)在是87頁\一共有147頁\編輯于星期五基本步驟①將目標(biāo)序列作為查詢序列來搜索PDB和SWISS-PROT等已知蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,確定和識別一個同源模板,或選擇已知結(jié)構(gòu)的同源序列作為建模的模板;②將目標(biāo)序列和模板序列進行比對,利用多種比對方法或手工校正以改進和優(yōu)化靶序列和模板結(jié)構(gòu)的比對,比對中可以加入空格;現(xiàn)在是88頁\一共有147頁\編輯于星期五③以模板結(jié)構(gòu)骨架作為模型,建立目標(biāo)蛋白質(zhì)骨架模型;④構(gòu)建環(huán)區(qū)(loops)和側(cè)鏈,優(yōu)化側(cè)鏈位置;⑤優(yōu)化和評估產(chǎn)生的模型,使用能量最小化或其他方法優(yōu)化結(jié)構(gòu),如利用分子動力學(xué)、模擬退火等優(yōu)化結(jié)構(gòu)。現(xiàn)在是89頁\一共有147頁\編輯于星期五比較建模法的局限性最大的挑戰(zhàn)是對模板鏈進行空隙和插入的建模。目標(biāo)蛋白與模板結(jié)構(gòu)保守性的程度及序列比對的正確性嚴重影響預(yù)測模型的準(zhǔn)確性。因此,比較建模主要在序列一致性大于30%的序列間進行。現(xiàn)在是90頁\一共有147頁\編輯于星期五(1)SWISS-MODEL服務(wù)器是目前最廣泛使用的基于網(wǎng)絡(luò)的免費蛋白質(zhì)3D自動建模服務(wù)器。它與ExPASy網(wǎng)站和DeepView程序緊密相聯(lián)。常用比較建模服務(wù)器和軟件現(xiàn)在是91頁\一共有147頁\編輯于星期五(2)MODELLER軟件需要用戶提供目標(biāo)序列與其模板的比對結(jié)果,能夠自動計算由非氫原子組成的模型,并通過搜索序列數(shù)據(jù)庫、多序列比對、聚類、對高柔性環(huán)區(qū)進行從頭建模和多模型優(yōu)化等方法,進一步修正模型?,F(xiàn)在是92頁\一共有147頁\編輯于星期五(3)HHpred服務(wù)器和軟件既可使用交互式服務(wù)器也可使用下載的軟件進行模板的搜索、序列比對、二級結(jié)構(gòu)預(yù)測等同源建模準(zhǔn)備,并利用MODELLER構(gòu)建三維模型?,F(xiàn)在是93頁\一共有147頁\編輯于星期五(4)AccelrysDiscoveryStudio軟件是一個綜合生物大分子結(jié)構(gòu)分析和計算機輔助藥物設(shè)計等多種功能的軟件。整合MODELLER用于同源建模,和后續(xù)模型評價。并可進行相關(guān)結(jié)構(gòu)域和活性位點分析。現(xiàn)在是94頁\一共有147頁\編輯于星期五(5)MOE(molecularoperatingenvironment)軟件綜合生物大分子結(jié)構(gòu)分析和計算機輔助藥物設(shè)計等多種功能的商業(yè)軟件。其優(yōu)勢在于可視化工具非常方便,便于對分子局部操作,對所建模型進一步局部優(yōu)化和修正。現(xiàn)在是95頁\一共有147頁\編輯于星期五(二)折疊識別法結(jié)構(gòu)在進化上的保守性要高于序列。尤其在只能找到同源性小于30%的模板時比較適用。此方法包括兩步:①將目標(biāo)蛋白序列和已知的折疊進行匹配,根據(jù)比對的進化信息在已知的結(jié)構(gòu)中找到一個或幾個匹配最好的折疊結(jié)構(gòu),作為建模的模板。②將目標(biāo)序列的:線“穿”到模板的折疊結(jié)構(gòu)上,拼裝出最好的匹配模型?,F(xiàn)在是96頁\一共有147頁\編輯于星期五這種方法局限性在于已有的蛋白質(zhì)折疊類型還是有限的,序列相似的蛋白也可能具有明顯不同的折疊模式等等。現(xiàn)在是97頁\一共有147頁\編輯于星期五(三)蛋白質(zhì)三維結(jié)構(gòu)的從頭預(yù)測方法如果目標(biāo)蛋白序列缺乏已知結(jié)構(gòu)的同源蛋白質(zhì),則可采用從頭預(yù)測方法(abinitio)或稱自由建模法。從頭預(yù)測法的理論依據(jù)是Anfinsen假說,即在給定條件下蛋白質(zhì)的天然結(jié)構(gòu)對應(yīng)其自由能最低的狀態(tài)。現(xiàn)在是98頁\一共有147頁\編輯于星期五成功的從頭預(yù)測依賴于以下因素的有效性:①通過能量優(yōu)化找到的蛋白質(zhì)結(jié)構(gòu)具有充分的結(jié)構(gòu)可靠性和計算可控性;②符合實際的力場或其他作用力描述方法;③高效而準(zhǔn)確的搜索構(gòu)象空間重要區(qū)域的算法;④對獲得結(jié)構(gòu)進行準(zhǔn)確評估的方法?,F(xiàn)在是99頁\一共有147頁\編輯于星期五四、對結(jié)構(gòu)預(yù)測結(jié)果的評價1.LiveBench(LB)實驗方法LB不斷地對各自動服務(wù)器進行能力評估,約半年評估這些預(yù)測方法一次。2.CASP和CAFASP實驗方法用于檢測現(xiàn)行建模方法的能力和局限、確定研發(fā)的進展并闡明問題的瓶頸,是蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的一個重要里程碑?,F(xiàn)在是100頁\一共有147頁\編輯于星期五3.EVA實驗方法主要用于二級結(jié)構(gòu)預(yù)測、接觸預(yù)測、比較蛋白質(zhì)結(jié)構(gòu)建模和穿線法/折疊識別。現(xiàn)在是101頁\一共有147頁\編輯于星期五第四節(jié)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Section4ProteinStructureDatabases現(xiàn)在是102頁\一共有147頁\編輯于星期五PDB:包含了通過X射線單晶衍射、磁共振和電子衍射等實驗手段確定的蛋白質(zhì)、多糖和核酸等生物大分子的三維結(jié)構(gòu)數(shù)據(jù)。截止到2014年9月16日,PDB總共收錄了103354條結(jié)構(gòu)數(shù)據(jù),其中,收錄包括95633個蛋白質(zhì)結(jié)構(gòu)、2726個核酸結(jié)構(gòu)、4969個蛋白/核酸復(fù)合物和26個其他結(jié)構(gòu)。一、蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫(PDB)現(xiàn)在是103頁\一共有147頁\編輯于星期五PDB數(shù)據(jù)庫網(wǎng)站主頁如圖6-10,在新一代的交互式界面的支持下,其大多數(shù)頁面可由用戶自行定義不同的顯示面板。現(xiàn)在是104頁\一共有147頁\編輯于星期五圖6-10PDB數(shù)據(jù)庫及其快速增長的數(shù)據(jù)量現(xiàn)在是105頁\一共有147頁\編輯于星期五PDB數(shù)據(jù)庫以文本文件的方式存放數(shù)據(jù),每個分子各用一個獨立的文件,都有唯一的PDB-ID。它包含4個字符,由大寫字母和數(shù)字組成(如血紅蛋白的PDB-ID為4HHB)。文件中除了原子坐標(biāo)外,還包括物種來源、化合物名稱、結(jié)構(gòu)以及有關(guān)文獻等基本注釋信息。此外,還給出分辨率、結(jié)構(gòu)因子、溫度系數(shù)、蛋白質(zhì)主鏈數(shù)目、配體分子式、金屬離子、二級結(jié)構(gòu)信息、二硫鍵位置等和結(jié)構(gòu)有關(guān)的數(shù)據(jù)?,F(xiàn)在是106頁\一共有147頁\編輯于星期五PDB格式的文件可以用于一些圖形軟件直觀觀察蛋白質(zhì)的三維結(jié)構(gòu),例如VMD、Jmol、Swiss-PDBviewer及RasMol等?,F(xiàn)在是107頁\一共有147頁\編輯于星期五PDB數(shù)據(jù)庫允許用戶用各種關(guān)鍵字進行檢索,如功能類別、PDB代碼、名稱、作者、空間群、分辨率、來源、入庫時間、分子式、參考文獻和生物來源等項。用戶不僅可以得到生物大分子的各種注釋、原子空間坐標(biāo)和三維圖形,并能鏈接到一系列與PDB相關(guān)的數(shù)據(jù)庫,包括SCOP、CATH、Medline、ENZYME和SWISS-3DIMAGE等。除了使用關(guān)鍵字搜索,用戶也可以按照分類查看PDB數(shù)據(jù)庫?,F(xiàn)在是108頁\一共有147頁\編輯于星期五二、蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫(一)SCOP(http://scop.mrc-lmb.cam.ac.uk/scop/)蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOP,是對已知蛋白質(zhì)結(jié)構(gòu)進行分類的數(shù)據(jù)庫,根據(jù)不同蛋白質(zhì)的氨基酸組成及三級結(jié)構(gòu)的相似性,描述已知結(jié)構(gòu)蛋白的功能及進化關(guān)系。SCOP數(shù)據(jù)庫的構(gòu)建除了使用計算機程序外,主要依賴于人工驗證。現(xiàn)在是109頁\一共有147頁\編輯于星期五SCOP提供一個非冗余的ASTRAIL序列庫,通常被用來評估各種序列比對算法;一個PDB-ISL中介序列庫,用于比對搜索與未知結(jié)構(gòu)序列遠源的已知結(jié)構(gòu)序列;還可以鏈接到PDB等外部數(shù)據(jù)庫來檢索更多信息?,F(xiàn)在是110頁\一共有147頁\編輯于星期五在SCOP數(shù)據(jù)庫中對蛋白質(zhì)的分類基于樹狀層級,從根到葉依次為類(class)、折疊類型(fold)、超家族(superfamily)、家族(family)、蛋白質(zhì)結(jié)構(gòu)域(proteindomain)、來源物種(species)、單個PDB蛋白質(zhì)結(jié)構(gòu)記錄。家族用來描述相近的蛋白質(zhì)進化關(guān)系。超家族用來描述遠源的進化關(guān)系,如果序列相似性較低,但其結(jié)構(gòu)和功能特性表明有共同的進化起源,則將其視作超家族?,F(xiàn)在是111頁\一共有147頁\編輯于星期五折疊類型用來描述空間的幾何關(guān)系,無論有無共同的進化起源,只要二級結(jié)構(gòu)單元具有相同的排列和拓撲結(jié)構(gòu),即歸入相同的折疊方式。頂級的種類class則依據(jù)二級結(jié)構(gòu)組成分為:全螺旋,全折疊,螺旋和折疊,螺旋+折疊以及其他特殊種類。這樣的樹狀層次,便于對目標(biāo)蛋白的結(jié)構(gòu)功能特征進行定位?,F(xiàn)在是112頁\一共有147頁\編輯于星期五(二)CATH(/)四種分類層次:蛋白質(zhì)的種類(class,C)、二級結(jié)構(gòu)的構(gòu)架(architecture,A)、拓撲結(jié)構(gòu)(topology,T)和蛋白質(zhì)同源超家族(homologoussuperfamily,H)?,F(xiàn)在是113頁\一共有147頁\編輯于星期五CATH的蛋白質(zhì)種類為全α、全β、α-β(α/β型和α+β型)和低二級結(jié)構(gòu)四類,其中低二級結(jié)構(gòu)類是指二級結(jié)構(gòu)成分含量很低的蛋白質(zhì)分子。第二個層次是蛋白質(zhì)分子的構(gòu)架,主要考慮α螺旋和β折疊形成超二級結(jié)構(gòu)的排列方式,而不考慮其連接關(guān)系。這一層次的分類主要依靠人工方法?,F(xiàn)在是114頁\一共有147頁\編輯于星期五第三個層次為拓撲結(jié)構(gòu),即二級結(jié)構(gòu)的形狀和二級結(jié)構(gòu)間的聯(lián)系,與SCOP中的折疊模式fold相當(dāng)。第四個層次為結(jié)構(gòu)的同源性,是先通過序列比對再用結(jié)構(gòu)比較來確定的?,F(xiàn)在是115頁\一共有147頁\編輯于星期五CATH的主頁、分類層級和代表性類別現(xiàn)在是116頁\一共有147頁\編輯于星期五三、其他常用蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫1.SWISS-MODEL數(shù)據(jù)庫(/)收錄的蛋白質(zhì)結(jié)構(gòu)都是使用SWISS-MODEL對蛋白質(zhì)序列進行自動同源建模所得到的結(jié)構(gòu)數(shù)據(jù)。直接從PDB中獲得最新的實測三維結(jié)構(gòu),存于其模板數(shù)據(jù)庫(SMTL)。可提供蛋白質(zhì)四級結(jié)構(gòu)和必要的配體和輔助因子的注釋,以方便構(gòu)建完整的結(jié)構(gòu)模型,包括寡聚體結(jié)構(gòu)。現(xiàn)在是117頁\一共有147頁\編輯于星期五新版的SWISS-MODEL允許用戶以交互方式搜索模板,根據(jù)序列相似性對其聚類,從結(jié)構(gòu)上比較不同模板,最后選擇適當(dāng)?shù)哪0逵糜诮⒛P?并且還允許用戶對數(shù)據(jù)庫中的模型質(zhì)量進行評價?,F(xiàn)在是118頁\一共有147頁\編輯于星期五2.生物磁共振數(shù)據(jù)庫(BMRB,/)由美國威斯康星大學(xué)麥迪遜分校組織構(gòu)建的專門用于存放蛋白質(zhì)、多肽、核酸等物質(zhì)磁共振NMR波譜數(shù)據(jù),以及對應(yīng)的分子研究的源數(shù)據(jù)、研究所使用的實驗條件和設(shè)備、與研究相關(guān)的重要出版物等信息?,F(xiàn)在是119頁\一共有147頁\編輯于星期五第五節(jié)蛋白質(zhì)功能分析Section5AnalysisofProteinFunction現(xiàn)在是120頁\一共有147頁\編輯于星期五一、蛋白質(zhì)功能分析概述蛋白質(zhì)在進化中保守的結(jié)構(gòu)通常對應(yīng)某些保守的生物化學(xué)功能。對蛋白質(zhì)功能進行分類和預(yù)測的方法主要還是依賴于結(jié)構(gòu)比對,如DaliLite、SSM、STRUCTAL、MultiProt和3DCoffee等。還有一些方法試圖將結(jié)構(gòu)相似性方法與其他方法相結(jié)合進行功能預(yù)測。例如,考慮一個系統(tǒng)發(fā)育上下文中的結(jié)構(gòu)相似性,會增加功能注釋精確性。(一)基于結(jié)構(gòu)分類的蛋白質(zhì)功能預(yù)測現(xiàn)在是121頁\一共有147頁\編輯于星期五(二)基于結(jié)構(gòu)預(yù)測蛋白質(zhì)間相互作用1.基于結(jié)構(gòu)的物理對接主要用于預(yù)測兩個蛋白質(zhì)間的相互作用位點,但對體積很大的蛋白質(zhì)分子,相互作用的可能界面太多而計算工作量很大?,F(xiàn)在是122頁\一共有147頁\編輯于星期五2.基于相互作用界面序列特征模式的預(yù)測利用統(tǒng)計分析發(fā)掘蛋白質(zhì)相互作用界面的序列特征信息。主要分為幾類:(1)關(guān)聯(lián)性突變法不需要目標(biāo)蛋白的高級結(jié)構(gòu)而只需要序列信息,且計算量比基于結(jié)構(gòu)的物理對接小得多。(2)聯(lián)用方法聯(lián)用高級結(jié)構(gòu)和序列信息?,F(xiàn)在是123頁\一共有147頁\編輯于星期五(3)人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法利用高級結(jié)構(gòu)信息和序列特征進行訓(xùn)練,可建立蛋白質(zhì)間相互作用界面的預(yù)測方法。預(yù)測準(zhǔn)確度可達到70%。現(xiàn)在是124頁\一共有147頁\編輯于星期五二、蛋白質(zhì)功能預(yù)測方法(一)基于基序的方法基于基序的方法(motif-basedapproaches)通過識別功能相關(guān)的蛋白質(zhì)中保守的三維基序,并建立這些保守的基序和保守的蛋白質(zhì)功能間的映射關(guān)系用于預(yù)測目標(biāo)蛋白質(zhì)的某些生物化學(xué)功能?,F(xiàn)在是125頁\一共有147頁\編輯于星期五1.SITE程序和數(shù)據(jù)庫儲存了酶活性位點保守基序信息用位點匹配程序?qū)ふ谊P(guān)鍵的功能位點殘基作為保守殘基。2.TESS程序采用了幾何散列算法,通過模板研究和重疊,從蛋白質(zhì)的高級結(jié)構(gòu)中尋找保守的必須殘基。現(xiàn)在是126頁\一共有147頁\編輯于星期五3.模糊功能形態(tài)(FFF)從三維信息角度認證與生物學(xué)功能相關(guān)位點的保守性。4.SPASM同時用主鏈α碳原子和側(cè)鏈基團作為分析對象,并列尋找保守殘基,并用于搜尋結(jié)構(gòu)數(shù)據(jù)庫中能匹配的已知功能蛋白?,F(xiàn)在是127頁\一共有147頁\編輯于星期五5.分子識別策略分析是基于已知功能域四周原子的疊合認證保守性預(yù)測蛋白質(zhì)功能。6.蛋白質(zhì)側(cè)鏈的保守模式分析分析重復(fù)出現(xiàn)的氨基酸側(cè)鏈的保守性?,F(xiàn)在是128頁\一共有147頁\編輯于星期五(二)基于表面的方法基于表面的方法(surface-basedapproaches)對給定蛋白質(zhì)進行表面模型化,利用與結(jié)構(gòu)相關(guān)聯(lián)的蛋白質(zhì)表面模型,識別蛋白質(zhì)表面上的結(jié)構(gòu)特征(如空間特征、裂隙等),進而利用這些特征來推斷蛋白質(zhì)功能。SURFACE數(shù)據(jù)庫提供對輸入蛋白質(zhì)局部表面特征模式的識別,以據(jù)此對蛋白質(zhì)功能進行預(yù)測。這種匹配算法精確性一般能達到90%左右,但計算量很大?,F(xiàn)在是129頁\一共有147頁\編輯于星期五(三)基于學(xué)習(xí)的方法基于學(xué)習(xí)的方法(learning-basedapproaches)是利用有效的分類方法,從最相關(guān)的結(jié)構(gòu)特征中識別最合適的功能類別,如SVM和KNN等分類方法?;趯W(xué)習(xí)的方法以蛋白質(zhì)結(jié)構(gòu)特征作為分類依據(jù),功能分類作為樣本標(biāo)簽,通過數(shù)據(jù)對象之間的相似性矩陣對訓(xùn)練集中的蛋白質(zhì)進行結(jié)構(gòu)與功能關(guān)系的評估?,F(xiàn)在是130頁\一共有147頁\編輯于星期五三、蛋白質(zhì)結(jié)構(gòu)與功能關(guān)系數(shù)據(jù)庫(一)Pfam蛋白質(zhì)結(jié)構(gòu)域家族數(shù)據(jù)庫Pfam收集了大量使用多重序列比對和隱馬爾科夫模型對UniProtKB的蛋白質(zhì)序列數(shù)據(jù)進行結(jié)構(gòu)域歸類形成的蛋白質(zhì)家族,廣泛用于通過序列比對推測蛋白質(zhì)的結(jié)構(gòu)域排布形式及功能?,F(xiàn)在是131頁\一共有147頁\編輯于星期五Pfam包括高質(zhì)量、手工確定的Pfam-A,和用ADDA算法自動分類的低質(zhì)量、未注釋的Pfam-B數(shù)據(jù)庫。Pfam數(shù)據(jù)庫可使用蛋白質(zhì)或DNA序列搜索蛋白所屬家族,查看該家族的功能注釋和多序列比對,擴展至屬于同一群落的多個家族,查看一個目標(biāo)序列的結(jié)構(gòu)域組成,鏈接到該序列在PDB數(shù)據(jù)庫中的結(jié)構(gòu),或直接使用關(guān)鍵字搜索。現(xiàn)在是132頁\一共有147頁\
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年直流風(fēng)扇項目規(guī)劃申請報告
- 2025年度電力供需雙方策劃協(xié)議書
- 2025年公司辦公地點租賃協(xié)議范本
- 2025年度個人借款與擔(dān)保協(xié)議
- 2025年建筑行業(yè)工人雇傭策劃合同樣本
- 2025年耗盡關(guān)機傳感器項目規(guī)劃申請報告模范
- 2025年城市交通安全策劃與事故應(yīng)急處理協(xié)議
- 2025年直流斬波調(diào)壓牽引裝置項目規(guī)劃申請報告
- 2025年郵政專用機械及器材項目申請報告模范
- 2025年個人抵押貸款償還協(xié)議
- 預(yù)防保健科護理管理質(zhì)量控制考核標(biāo)準(zhǔn)
- 皮下抗凝劑的注射規(guī)范
- 食管癌護理小講課課件
- 護理組長競聘講稿-護理組長競聘主題教學(xué)課件
- 2023北京市高級中等學(xué)校招生考試英語答題卡A4版word版可以編輯
- 水泥考試試題(含答案)
- 北師大版七年級(下)數(shù)學(xué)全冊教案
- 江蘇地理專題復(fù)習(xí)
- 小學(xué)六年級語文聽課記錄22篇
- GB/T 25995-2010精細陶瓷密度和顯氣孔率試驗方法
- GB/T 22085.1-2008電子束及激光焊接接頭缺欠質(zhì)量分級指南第1部分:鋼
評論
0/150
提交評論