蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述_第1頁
蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述_第2頁
蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述_第3頁
蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述_第4頁
蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述一、本文概述蛋白質(zhì),作為生物體內(nèi)最基本的分子單位之一,承載著生命活動的眾多重要功能。從酶的催化作用,到細(xì)胞間的信號傳遞,再到生物體的結(jié)構(gòu)支撐,蛋白質(zhì)無處不在,無時(shí)不刻不在發(fā)揮著其獨(dú)特的作用。盡管蛋白質(zhì)的重要性不言而喻,但其結(jié)構(gòu)與功能之間的復(fù)雜關(guān)系一直是科學(xué)家們研究的難題。蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了生物學(xué)、化學(xué)、物理學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科交叉的研究熱點(diǎn)。本文旨在對蛋白質(zhì)結(jié)構(gòu)預(yù)測的研究進(jìn)行全面的綜述,以期對該領(lǐng)域的發(fā)展有一個(gè)清晰的認(rèn)識。我們將回顧蛋白質(zhì)結(jié)構(gòu)預(yù)測的發(fā)展歷程,從早期的基于經(jīng)驗(yàn)的預(yù)測方法,到現(xiàn)代的基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的預(yù)測方法。我們將介紹當(dāng)前蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要技術(shù)和方法,包括同源建模、從頭預(yù)測、基于深度學(xué)習(xí)的預(yù)測等,并詳細(xì)分析它們的優(yōu)缺點(diǎn)。我們還將探討蛋白質(zhì)結(jié)構(gòu)預(yù)測在藥物設(shè)計(jì)、疾病治療等領(lǐng)域的應(yīng)用前景。二、蛋白質(zhì)結(jié)構(gòu)預(yù)測的基本原理和方法蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學(xué)領(lǐng)域的重要分支,其目標(biāo)是根據(jù)蛋白質(zhì)的氨基酸序列,預(yù)測其三維空間結(jié)構(gòu)。這一預(yù)測過程基于的基本原理和方法,主要涵蓋同源建模、從頭預(yù)測和混合方法三類。同源建模(HomologyModeling)是最常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法之一。它基于一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì)(模板)來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。同源建模的準(zhǔn)確性高度依賴于模板蛋白質(zhì)與目標(biāo)蛋白質(zhì)之間的序列相似性和結(jié)構(gòu)保守性。通過比對目標(biāo)序列與模板序列,確定它們之間的序列相似性和結(jié)構(gòu)對應(yīng)關(guān)系,然后利用這些信息來構(gòu)建目標(biāo)蛋白質(zhì)的結(jié)構(gòu)模型。從頭預(yù)測(AbinitioModeling)則不依賴于已知的蛋白質(zhì)結(jié)構(gòu),而是基于物理和化學(xué)原理,如分子力學(xué)、量子力學(xué)和統(tǒng)計(jì)力學(xué)等,來預(yù)測蛋白質(zhì)的結(jié)構(gòu)。從頭預(yù)測的方法通常涉及到大量的計(jì)算,因此其預(yù)測過程相對較慢。盡管如此,從頭預(yù)測方法對于那些沒有同源模板的蛋白質(zhì)或者序列相似性較低的蛋白質(zhì)仍然具有重要意義?;旌戏椒ǎ℉ybridMethods)則是將同源建模和從頭預(yù)測兩種方法結(jié)合起來,以提高預(yù)測的準(zhǔn)確性?;旌戏椒ㄍǔJ紫仁褂猛唇7椒?gòu)建一個(gè)初步的結(jié)構(gòu)模型,然后使用從頭預(yù)測方法對這個(gè)模型進(jìn)行優(yōu)化和修正?;旌戏椒ńY(jié)合了兩種方法的優(yōu)點(diǎn),可以在一定程度上提高蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性。蛋白質(zhì)結(jié)構(gòu)預(yù)測的基本原理和方法涵蓋了同源建模、從頭預(yù)測和混合方法等多個(gè)方面。這些方法在實(shí)際應(yīng)用中各有優(yōu)缺點(diǎn),需要根據(jù)具體的蛋白質(zhì)序列和結(jié)構(gòu)特點(diǎn)選擇合適的方法進(jìn)行預(yù)測。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和算法的不斷優(yōu)化,蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性將不斷提高,為生物醫(yī)學(xué)研究和藥物設(shè)計(jì)等領(lǐng)域的發(fā)展提供有力支持。三、蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要技術(shù)和工具隨著生物信息學(xué)和計(jì)算生物學(xué)的發(fā)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測已經(jīng)成為一個(gè)熱門且富有挑戰(zhàn)性的領(lǐng)域。預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)對于理解其功能、揭示生命活動的機(jī)制以及指導(dǎo)藥物設(shè)計(jì)等方面都具有重要意義。目前,蛋白質(zhì)結(jié)構(gòu)預(yù)測主要依賴于計(jì)算方法和實(shí)驗(yàn)手段,其中計(jì)算預(yù)測技術(shù)日益成為研究熱點(diǎn)?;谀0宓慕7椒ㄊ亲钤缜易畛S玫牡鞍踪|(zhì)結(jié)構(gòu)預(yù)測技術(shù)之一。這種方法通過比對目標(biāo)序列與已知結(jié)構(gòu)的蛋白質(zhì)序列,找到相似的模板,然后基于模板的結(jié)構(gòu)信息來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。常見的基于模板的建模軟件有MODELLER、SWISSMODEL等。同源建模是基于序列比對和結(jié)構(gòu)比對的技術(shù),它利用與目標(biāo)蛋白質(zhì)序列相似的已知結(jié)構(gòu)蛋白質(zhì)作為模板,來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。同源建模的成功與否很大程度上取決于序列相似性和模板選擇的準(zhǔn)確性。從頭預(yù)測方法不依賴于已知結(jié)構(gòu)的模板,而是根據(jù)蛋白質(zhì)序列的物理化學(xué)性質(zhì)和統(tǒng)計(jì)規(guī)律,通過計(jì)算機(jī)算法來預(yù)測其結(jié)構(gòu)。這類方法通常涉及復(fù)雜的能量優(yōu)化和搜索算法,如蒙特卡洛模擬、分子動力學(xué)模擬等。近年來,隨著深度學(xué)習(xí)和人工智能技術(shù)的興起,基于深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法也取得了顯著進(jìn)展,如AlphaFold等。除了計(jì)算預(yù)測外,實(shí)驗(yàn)方法也是蛋白質(zhì)結(jié)構(gòu)研究的重要手段。如射線晶體學(xué)、核磁共振(NMR)等技術(shù)可以直接測定蛋白質(zhì)的三維結(jié)構(gòu)。這些方法雖然精度高,但成本較高且操作復(fù)雜,通常用于驗(yàn)證計(jì)算預(yù)測結(jié)果或研究特定問題。為了整合各種預(yù)測方法和技術(shù),提高預(yù)測準(zhǔn)確性,近年來出現(xiàn)了多個(gè)綜合預(yù)測平臺和數(shù)據(jù)庫,如CAMEO、CriticalAssessmentofTechniquesforProteinStructurePrediction(CASP)等。這些平臺和數(shù)據(jù)庫不僅提供了多種預(yù)測工具和方法,還定期舉辦評估活動,以推動蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展。蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個(gè)綜合性的研究領(lǐng)域,涉及多種技術(shù)和工具。隨著計(jì)算生物學(xué)和人工智能技術(shù)的不斷發(fā)展,我們有理由相信,未來蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性和效率將得到進(jìn)一步提升。四、蛋白質(zhì)結(jié)構(gòu)預(yù)測的應(yīng)用領(lǐng)域和前景蛋白質(zhì)結(jié)構(gòu)預(yù)測在多個(gè)領(lǐng)域具有廣泛的應(yīng)用,并持續(xù)展現(xiàn)其巨大的潛力和前景。在醫(yī)學(xué)領(lǐng)域,蛋白質(zhì)結(jié)構(gòu)預(yù)測對藥物設(shè)計(jì)和開發(fā)起到了關(guān)鍵的作用。通過理解蛋白質(zhì)的三維結(jié)構(gòu),科研人員可以更加準(zhǔn)確地識別出藥物與蛋白質(zhì)之間的相互作用點(diǎn),從而設(shè)計(jì)出更有效的藥物。蛋白質(zhì)結(jié)構(gòu)預(yù)測也在疾病診斷和治療中發(fā)揮了重要作用,例如通過預(yù)測病原體蛋白質(zhì)的結(jié)構(gòu),可以幫助我們設(shè)計(jì)出更有效的疫苗和抗體。在生物工程領(lǐng)域,蛋白質(zhì)結(jié)構(gòu)預(yù)測為蛋白質(zhì)工程提供了重要的理論基礎(chǔ)。通過預(yù)測和修改蛋白質(zhì)的結(jié)構(gòu),科研人員可以優(yōu)化蛋白質(zhì)的功能,從而開發(fā)出更高效的酶、催化劑等生物工具。蛋白質(zhì)結(jié)構(gòu)預(yù)測還在生物傳感器、生物能源等領(lǐng)域中發(fā)揮著重要作用。隨著計(jì)算機(jī)科學(xué)和人工智能技術(shù)的不斷發(fā)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測的前景更加廣闊。一方面,隨著算法的不斷優(yōu)化和計(jì)算能力的提升,我們可以預(yù)測更大、更復(fù)雜的蛋白質(zhì)結(jié)構(gòu)。另一方面,人工智能技術(shù)的引入也為蛋白質(zhì)結(jié)構(gòu)預(yù)測帶來了新的機(jī)遇。例如,深度學(xué)習(xí)等人工智能技術(shù)可以自動學(xué)習(xí)和優(yōu)化預(yù)測模型,從而提高預(yù)測的準(zhǔn)確性和效率。蛋白質(zhì)結(jié)構(gòu)預(yù)測在多個(gè)領(lǐng)域都具有廣泛的應(yīng)用,并持續(xù)展現(xiàn)出巨大的潛力和前景。隨著科學(xué)技術(shù)的不斷進(jìn)步,我們有理由相信,蛋白質(zhì)結(jié)構(gòu)預(yù)測將在未來的科學(xué)研究和應(yīng)用中發(fā)揮更加重要的作用。五、蛋白質(zhì)結(jié)構(gòu)預(yù)測的未來發(fā)展方向算法和模型的持續(xù)優(yōu)化:當(dāng)前,深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在蛋白質(zhì)結(jié)構(gòu)預(yù)測中已經(jīng)取得了顯著的成功。隨著數(shù)據(jù)量的增加和計(jì)算能力的提升,我們有理由期待更精確、更高效的算法和模型的出現(xiàn)。這些新的算法和模型可能包括更復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)、更精細(xì)的特征表示以及更先進(jìn)的優(yōu)化技術(shù)。多尺度模擬和整合:蛋白質(zhì)的結(jié)構(gòu)和功能通常受到多個(gè)尺度(如原子、殘基、域和整體)的影響。將多個(gè)尺度的信息有效地整合到預(yù)測模型中,以提高預(yù)測的準(zhǔn)確性,將是未來的一個(gè)重要方向。通過多尺度模擬,我們還可以更好地理解蛋白質(zhì)在各種生理和病理?xiàng)l件下的行為??鐚W(xué)科合作:蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個(gè)跨學(xué)科的領(lǐng)域,涉及到生物學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。未來,隨著這個(gè)領(lǐng)域的進(jìn)一步發(fā)展,我們期待看到更多的跨學(xué)科合作,尤其是在數(shù)據(jù)科學(xué)、人工智能和生物信息學(xué)等領(lǐng)域。實(shí)際應(yīng)用的推廣:目前,蛋白質(zhì)結(jié)構(gòu)預(yù)測已經(jīng)在藥物設(shè)計(jì)、疾病診斷和治療等方面展現(xiàn)出了一定的應(yīng)用潛力。這些應(yīng)用仍然處于初級階段。未來,隨著預(yù)測精度的提高和計(jì)算成本的降低,我們有理由相信,蛋白質(zhì)結(jié)構(gòu)預(yù)測將在更多領(lǐng)域得到實(shí)際應(yīng)用,為人類的健康和福祉做出更大的貢獻(xiàn)。數(shù)據(jù)共享和標(biāo)準(zhǔn)化:隨著蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的發(fā)展,數(shù)據(jù)共享和標(biāo)準(zhǔn)化將成為越來越重要的問題。通過共享數(shù)據(jù),我們可以提高預(yù)測模型的泛化能力,避免重復(fù)勞動,加速科學(xué)進(jìn)步。而標(biāo)準(zhǔn)化則有助于確保不同研究團(tuán)隊(duì)之間的可比性,推動領(lǐng)域內(nèi)的合作和交流。蛋白質(zhì)結(jié)構(gòu)預(yù)測的未來充滿了無限的可能性和挑戰(zhàn)。我們期待在這個(gè)領(lǐng)域中看到更多的創(chuàng)新和突破,為人類對生命科學(xué)的理解提供新的視角和工具。六、結(jié)論隨著生物信息學(xué)和計(jì)算生物學(xué)的快速發(fā)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測已成為當(dāng)前生物學(xué)和醫(yī)學(xué)領(lǐng)域的重要研究方向。通過對蛋白質(zhì)序列的深入分析,結(jié)合多種預(yù)測方法和算法,我們能夠初步理解蛋白質(zhì)的結(jié)構(gòu)和功能,從而進(jìn)一步揭示生命的奧秘。本文綜述了當(dāng)前蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要方法和技術(shù),包括基于模板的方法、從頭預(yù)測方法、混合方法等,并對這些方法進(jìn)行了詳細(xì)的分析和評價(jià)。雖然這些方法在預(yù)測精度和效率上取得了一定的進(jìn)展,但仍存在許多挑戰(zhàn)和問題需要解決。在未來,隨著大數(shù)據(jù)和人工智能技術(shù)的不斷發(fā)展,蛋白質(zhì)結(jié)構(gòu)預(yù)測將迎來更多的機(jī)遇和挑戰(zhàn)。一方面,更多的數(shù)據(jù)資源和計(jì)算資源將為我們提供更準(zhǔn)確、更全面的預(yù)測結(jié)果另一方面,新的算法和模型也將為我們提供更高效、更精確的預(yù)測方法。蛋白質(zhì)結(jié)構(gòu)預(yù)測是一項(xiàng)充滿挑戰(zhàn)和機(jī)遇的研究領(lǐng)域。我們需要不斷地探索和創(chuàng)新,提高預(yù)測精度和效率,為生物醫(yī)學(xué)研究和藥物開發(fā)提供更多的有力支持。同時(shí),我們也需要更加關(guān)注數(shù)據(jù)質(zhì)量和算法的可解釋性,以確保預(yù)測結(jié)果的準(zhǔn)確性和可靠性。相信在不久的將來,我們一定能夠?qū)崿F(xiàn)對蛋白質(zhì)結(jié)構(gòu)更深入的理解和應(yīng)用。參考資料:隨著互聯(lián)網(wǎng)的快速發(fā)展,人們對于信息的個(gè)性化需求越來越高。個(gè)性化算法作為一種能夠根據(jù)用戶特征和行為習(xí)慣,提供定制化服務(wù)的技術(shù),已經(jīng)在推薦系統(tǒng)、廣告系統(tǒng)、搜索引擎等領(lǐng)域得到了廣泛應(yīng)用。本文將探究基于統(tǒng)計(jì)學(xué)的個(gè)性化算法,包括其基本概念、應(yīng)用場景、優(yōu)缺點(diǎn)以及未來發(fā)展趨勢等方面。個(gè)性化算法通過對用戶數(shù)據(jù)的分析,挖掘用戶的興趣愛好、行為習(xí)慣等信息,從而為用戶提供更加精準(zhǔn)、個(gè)性化的服務(wù)。這種技術(shù)在電商、音樂、視頻、新聞等行業(yè)都有廣泛的應(yīng)用,已經(jīng)成為提高用戶體驗(yàn)和提升平臺收益的重要手段。統(tǒng)計(jì)學(xué)習(xí)理論是機(jī)器學(xué)習(xí)的基礎(chǔ),它包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等多種方法。監(jiān)督學(xué)習(xí)是指根據(jù)已知輸入和輸出數(shù)據(jù)進(jìn)行訓(xùn)練,從而對未知數(shù)據(jù)進(jìn)行預(yù)測;無監(jiān)督學(xué)習(xí)是指在沒有已知輸出數(shù)據(jù)的情況下,通過分析輸入數(shù)據(jù)之間的相似性來挖掘潛在的數(shù)據(jù)結(jié)構(gòu);半監(jiān)督學(xué)習(xí)則結(jié)合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的特點(diǎn),利用部分有標(biāo)簽數(shù)據(jù)和大量無標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練,以提高預(yù)測精度。個(gè)性化算法可以應(yīng)用于各種場景,如推薦系統(tǒng)、廣告投放、搜索引擎等。推薦系統(tǒng)是最為常見的一種應(yīng)用場景。以下是一個(gè)基于統(tǒng)計(jì)學(xué)習(xí)的個(gè)性化推薦算法案例:通過對用戶歷史行為數(shù)據(jù)的分析,挖掘用戶的興趣愛好和行為習(xí)慣,并利用監(jiān)督學(xué)習(xí)算法訓(xùn)練模型。在推薦過程中,模型可以根據(jù)用戶當(dāng)前的行為數(shù)據(jù),預(yù)測其可能感興趣的內(nèi)容,并實(shí)時(shí)更新推薦列表。個(gè)性化算法也存在一些問題和挑戰(zhàn)。例如,數(shù)據(jù)稀疏性、用戶興趣的動態(tài)變化、冷啟動問題等。為了解決這些問題,研究者們不斷探索新的技術(shù)和方法。例如,利用矩陣分解等技術(shù)來處理數(shù)據(jù)稀疏性問題;利用深度學(xué)習(xí)等方法來捕捉用戶興趣的動態(tài)變化等。對抗生成網(wǎng)絡(luò)(GAN)是一種深度學(xué)習(xí)模型,由生成器和判別器兩個(gè)神經(jīng)網(wǎng)絡(luò)組成,通過相互對抗訓(xùn)練來提高生成數(shù)據(jù)的真實(shí)性和判別器的判斷能力。GAN在個(gè)性化算法中有著廣泛的應(yīng)用,可以用于生成高質(zhì)量的圖像、音頻等數(shù)據(jù),從而為推薦系統(tǒng)、廣告系統(tǒng)等提供更加真實(shí)、豐富的素材。GAN也存在一些問題,如訓(xùn)練不穩(wěn)定、難以收斂等。GAN對于數(shù)據(jù)量的需求也比較大,對于一些數(shù)據(jù)稀疏的場景可能不太適用。遷移學(xué)習(xí)是一種將已經(jīng)在一個(gè)領(lǐng)域或任務(wù)上訓(xùn)練好的模型應(yīng)用于另一個(gè)領(lǐng)域或任務(wù)上的方法。通過遷移學(xué)習(xí),我們可以利用已經(jīng)訓(xùn)練好的模型來對新的數(shù)據(jù)進(jìn)行預(yù)測和分析,從而提高模型的效率和準(zhǔn)確性。在個(gè)性化算法中,遷移學(xué)習(xí)可以用于處理用戶興趣的動態(tài)變化等問題。例如,我們可以利用已經(jīng)訓(xùn)練好的模型來對用戶的行為數(shù)據(jù)進(jìn)行預(yù)測和分析,從而實(shí)時(shí)更新用戶的興趣列表。遷移學(xué)習(xí)也存在一些問題。例如,不同領(lǐng)域或任務(wù)之間的差異可能會導(dǎo)致模型的準(zhǔn)確性和效率下降。如何選擇合適的遷移學(xué)習(xí)算法也是一項(xiàng)重要的挑戰(zhàn)。個(gè)性化算法是機(jī)器學(xué)習(xí)的一個(gè)重要應(yīng)用領(lǐng)域,已經(jīng)在推薦系統(tǒng)、廣告系統(tǒng)、搜索引擎等領(lǐng)域得到了廣泛應(yīng)用。本文介紹了基于統(tǒng)計(jì)學(xué)的個(gè)性化算法探究,包括統(tǒng)計(jì)學(xué)習(xí)理論、個(gè)性化算法的應(yīng)用場景和優(yōu)缺點(diǎn)、對抗生成網(wǎng)絡(luò)和遷移學(xué)習(xí)等方法和概念。個(gè)性化算法仍然存在一些問題和挑戰(zhàn),例如數(shù)據(jù)稀疏性、用戶興趣的動態(tài)變化、冷啟動問題等。未來,我們需要進(jìn)一步探索新的技術(shù)和方法來解決這些問題,提高個(gè)性化算法的準(zhǔn)確性和效率。蛋白質(zhì)二級結(jié)構(gòu)是指蛋白質(zhì)中局部主鏈的構(gòu)象,不涉及蛋白質(zhì)鏈的局部空間構(gòu)象。預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的方法大致可以分為兩類:一類是基于序列的方法,另一類是基于結(jié)構(gòu)的方法?;谛蛄械姆椒ㄖ饕抢靡阎牡鞍踪|(zhì)序列信息,通過統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)方法預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。這類方法通常依賴于大量的已知蛋白質(zhì)序列數(shù)據(jù),從中提取出序列特征,然后利用這些特征進(jìn)行二級結(jié)構(gòu)的預(yù)測。例如,使用隱馬爾科夫模型(HMM)和神經(jīng)網(wǎng)絡(luò)方法等?;谛蛄械姆椒m然精度相對較低,但由于其簡單易行、計(jì)算效率高,因此在實(shí)踐中得到了廣泛應(yīng)用。基于結(jié)構(gòu)的方法則是通過已知的蛋白質(zhì)三維結(jié)構(gòu)信息,預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。這類方法通常依賴于大量的已知蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù),通過統(tǒng)計(jì)分析或者模擬計(jì)算等方法,預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)?;诮Y(jié)構(gòu)的方法精度較高,但由于其計(jì)算復(fù)雜度高、需要大量的已知結(jié)構(gòu)數(shù)據(jù),因此在實(shí)踐中應(yīng)用較少。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,越來越多的研究者嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。深度學(xué)習(xí)方法能夠自動提取特征,并且能夠處理大規(guī)模的數(shù)據(jù),因此在預(yù)測精度和泛化能力上具有優(yōu)勢。例如,卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等方法已經(jīng)被廣泛應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測是一個(gè)具有挑戰(zhàn)性的問題,需要不斷探索新的方法和技術(shù)。隨著數(shù)據(jù)和計(jì)算資源的不斷增加,相信未來會有更多的研究者投入到這一領(lǐng)域中,推動蛋白質(zhì)二級結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展。本文旨在探討基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法。通過采用高效的聚類算法對蛋白質(zhì)進(jìn)行分組,并利用同源建模技術(shù)預(yù)測未知結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效地提高結(jié)構(gòu)預(yù)測的準(zhǔn)確性。本文為蛋白質(zhì)結(jié)構(gòu)預(yù)測研究提供新的思路和方向。蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學(xué)研究的重要領(lǐng)域之一。同源建模是一種常用的結(jié)構(gòu)預(yù)測方法,通過找到具有相似功能的已知蛋白質(zhì)結(jié)構(gòu),推斷未知蛋白質(zhì)的結(jié)構(gòu)。同源建模的準(zhǔn)確性受到數(shù)據(jù)噪聲和模型局限性的限制。為了提高預(yù)測準(zhǔn)確性,研究者們嘗試將聚類算法應(yīng)用于同源建模。本文旨在探討基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法,并對其準(zhǔn)確性和優(yōu)越性進(jìn)行評估。同源建模是一種常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法。該方法通過找到具有相似功能的已知蛋白質(zhì)結(jié)構(gòu),利用這些已知結(jié)構(gòu)的信息推斷未知蛋白質(zhì)的結(jié)構(gòu)。同源建模主要分為兩個(gè)步驟:序列比對和結(jié)構(gòu)建模。在序列比對階段,算法尋找已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的相似性;在結(jié)構(gòu)建模階段,利用已知蛋白質(zhì)結(jié)構(gòu)的信息構(gòu)建未知蛋白質(zhì)的結(jié)構(gòu)模型。聚類算法在同源建模中的應(yīng)用已經(jīng)得到廣泛研究。這些方法主要分為兩類:基于距離的方法和基于密度的方法?;诰嚯x的方法通過計(jì)算蛋白質(zhì)之間的相似性矩陣,將相似的蛋白質(zhì)聚集在一起;基于密度的方法則通過計(jì)算每個(gè)蛋白質(zhì)周圍的鄰居密度來進(jìn)行聚類。聚類算法的應(yīng)用能夠有效地過濾噪聲,提高同源建模的準(zhǔn)確性。本文采用基于密度的聚類算法——DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)對蛋白質(zhì)進(jìn)行分組。利用BLAST算法進(jìn)行序列比對,尋找已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的相似性;利用同源建模技術(shù)預(yù)測未知蛋白質(zhì)的結(jié)構(gòu)。同時(shí),本文采用ROSAC(RobustScalableAlgorithmsforCo-clustering)算法對蛋白質(zhì)進(jìn)行層次聚類,并利用MODASS(Model-basedAnalysisofProteomicsData)算法對聚類結(jié)果進(jìn)行評估。實(shí)驗(yàn)結(jié)果表明,基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法能夠有效地提高預(yù)測準(zhǔn)確性。通過將聚類算法應(yīng)用于同源建模,本文方法在已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的比對階段更加準(zhǔn)確;同時(shí),利用ROSAC算法進(jìn)行層次聚類,實(shí)現(xiàn)了對蛋白質(zhì)的合理分組;利用MODASS算法對聚類結(jié)果進(jìn)行評估,驗(yàn)證了聚類效果的可靠性。與傳統(tǒng)的同源建模方法相比,本文方法具有更高的預(yù)測準(zhǔn)確性和更好的穩(wěn)健性。本文研究了基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法,并對其準(zhǔn)確性和優(yōu)越性進(jìn)行了評估。實(shí)驗(yàn)結(jié)果表明,該方法能夠有效地提高結(jié)構(gòu)預(yù)測的準(zhǔn)確性。該方法仍存在一定的局限性,例如在聚類過程中可能存在主觀因素和噪聲的影響。未來的研究方向可以包括改進(jìn)聚類算法、優(yōu)化已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的比對方法,以及開發(fā)更為精確的結(jié)構(gòu)建模算法。蛋白質(zhì)結(jié)構(gòu)是指蛋白質(zhì)分子的空間結(jié)構(gòu)。蛋白質(zhì)主要由碳、氫、氧、氮等化學(xué)元素組成,是一類重要的生物大分子,所有蛋白質(zhì)都是由20種不同氨基酸連接形成的多聚體,在形成蛋白質(zhì)后,這些氨基酸又被稱為殘基。蛋白質(zhì)和多肽之間的界限并不是很清晰,有人基于發(fā)揮功能性作用的結(jié)構(gòu)域所需的殘基數(shù)認(rèn)為,若殘基數(shù)少于40,就稱之為多肽或肽。要發(fā)揮生物學(xué)功能,蛋白質(zhì)需要正確折疊為一個(gè)特定構(gòu)型,主要是通過大量的非共價(jià)相互作用(如氫鍵,離子鍵,范德華力和疏水作用)來實(shí)現(xiàn);在一些蛋白質(zhì)(特別是分泌性蛋白質(zhì))折疊中,二硫鍵也起到關(guān)鍵作用。為了從分子水平上了解蛋白質(zhì)的作用機(jī)制,常常需要測定蛋白質(zhì)的三維結(jié)構(gòu)。由研究蛋白質(zhì)結(jié)構(gòu)而發(fā)展起來了結(jié)構(gòu)生物學(xué),采用了包括射線晶體學(xué)、核磁共振等技術(shù)來解析蛋白質(zhì)結(jié)構(gòu)。一定數(shù)量的殘基對于發(fā)揮某一生物化學(xué)功能是必要的;40-50個(gè)殘基通常是一個(gè)功能性結(jié)構(gòu)域大小的下限。蛋白質(zhì)大小的范圍可以從這樣一個(gè)下限一直到數(shù)千個(gè)殘基。估計(jì)的蛋白質(zhì)的平均長度在不同的物種中有所區(qū)別,一般約為200-380個(gè)殘基,而真核生物的蛋白質(zhì)平均長度比原核生物長約55%。更大的蛋白質(zhì)聚合體可以通過許多蛋白質(zhì)亞基形成;如由數(shù)千個(gè)肌動蛋白分子聚合形成蛋白纖維。1959年佩魯茨和肯德魯對血紅蛋白和肌血蛋白進(jìn)行結(jié)構(gòu)分析,解決了三維空間結(jié)構(gòu),獲1962年諾貝爾化學(xué)獎(jiǎng)。鮑林發(fā)現(xiàn)了蛋白質(zhì)的基本結(jié)構(gòu)??死锟恕⑽稚谏渚€衍射資料的基礎(chǔ)上,提出了DNA三維結(jié)構(gòu)的模型。獲1962年諾貝爾生理或醫(yī)學(xué)獎(jiǎng)。50年代后豪普特曼和卡爾勒建立了應(yīng)用射線分析的以直接法測定晶體結(jié)構(gòu)的純數(shù)學(xué)理論,在晶體研究中具有劃時(shí)代的意義,特別在研究大分子生物物質(zhì)如激素、抗生素、蛋白質(zhì)及新型藥物分子結(jié)構(gòu)方面起了重要作用。他們因此獲1985年諾貝爾化學(xué)獎(jiǎng)。蛋白質(zhì)分子是由氨基酸首尾相連縮合而成的共價(jià)多肽鏈,但是天然蛋白質(zhì)分子并不是走向隨機(jī)的松散多肽鏈。每一種天然蛋白質(zhì)都有自己特有的空間結(jié)構(gòu)或稱三維結(jié)構(gòu),這種三維結(jié)構(gòu)通常被稱為蛋白質(zhì)的構(gòu)象,即蛋白質(zhì)的結(jié)構(gòu)。除了這些結(jié)構(gòu)層次,蛋白質(zhì)可以在多個(gè)類似結(jié)構(gòu)中轉(zhuǎn)換,以行使其生物學(xué)功能。對于功能性的結(jié)構(gòu)變化,這些三級或四級結(jié)構(gòu)通常用化學(xué)構(gòu)象進(jìn)行描述,而相應(yīng)的結(jié)構(gòu)轉(zhuǎn)換就被稱為構(gòu)象變化。蛋白質(zhì)的一級結(jié)構(gòu)(primarystructure)就是蛋白質(zhì)多肽鏈中氨基酸殘基的排列順序(sequence),也是蛋白質(zhì)最基本的結(jié)構(gòu)。它是由基因上遺傳密碼的排列順序所決定的。各種氨基酸按遺傳密碼的順序,通過肽鍵連接起來,成為多肽鏈,故肽鍵是蛋白質(zhì)結(jié)構(gòu)中的主鍵。迄今已有約一千種左右蛋白質(zhì)的一級結(jié)構(gòu)被研究確定,如胰島素,胰核糖核酸酶、胰蛋白酶等。蛋白質(zhì)的一級結(jié)構(gòu)決定了蛋白質(zhì)的二級、三級等高級結(jié)構(gòu),成百億的天然蛋白質(zhì)各有其特殊的生物學(xué)活性,決定每一種蛋白質(zhì)的生物學(xué)活性的結(jié)構(gòu)特點(diǎn),首先在于其肽鏈的氨基酸序列,由于組成蛋白質(zhì)的20種氨基酸各具特殊的側(cè)鏈,側(cè)鏈基團(tuán)的理化性質(zhì)和空間排布各不相同,當(dāng)它們按照不同的序列關(guān)系組合時(shí),就可形成多種多樣的空間結(jié)構(gòu)和不同生物學(xué)活性的蛋白質(zhì)分子。蛋白質(zhì)分子的多肽鏈并非呈線形伸展,而是折疊和盤曲構(gòu)成特有的比較穩(wěn)定的空間結(jié)構(gòu)。蛋白質(zhì)的生物學(xué)活性和理化性質(zhì)主要決定于空間結(jié)構(gòu)的完整,因此僅僅測定蛋白質(zhì)分子的氨基酸組成和它們的排列順序并不能完全了解蛋白質(zhì)分子的生物學(xué)活性和理化性質(zhì)。例如球狀蛋白質(zhì)(多見于血漿中的白蛋白、球蛋白、血紅蛋白和酶等)和纖維狀蛋白質(zhì)(角蛋白、膠原蛋白、肌凝蛋白、纖維蛋白等),前者溶于水,后者不溶于水,顯而易見,此種性質(zhì)不能僅用蛋白質(zhì)的一級結(jié)構(gòu)的氨基酸排列順序來解釋。蛋白質(zhì)的二級結(jié)構(gòu)(secondarystructure)是指多肽鏈中主鏈原子的局部空間排布即構(gòu)象,不涉及側(cè)鏈部分的構(gòu)象。Pauling等人對一些簡單的肽及氨基酸的酰胺等進(jìn)行了線衍射分析,從一個(gè)肽鍵的周圍來看,得知:(1)肽鍵中的C-N鍵長132nm,比相鄰的N-C單鍵(147nm)短,而較一般C=N雙鍵(128nm)長,可見,肽鍵中-C-N-鍵的性質(zhì)介于單、雙鍵之間,具有部分雙鍵的性質(zhì),因而不能旋轉(zhuǎn),這就將固定在一個(gè)平面之內(nèi)。(2)肽鍵的C及N周圍三個(gè)鍵角之和均為360°,說明都處于一個(gè)平面上,也就是說六個(gè)原子基本上同處于一個(gè)平面,這就是肽鍵平面。肽鏈中能夠旋轉(zhuǎn)的只有α碳原子所形成的單鍵,此單鍵的旋轉(zhuǎn)決定兩個(gè)肽鍵平面的位置關(guān)系,于是肽鍵平面成為肽鏈盤曲折疊的基本單位。(3)肽鍵中的C-N既具有雙鍵性質(zhì),就會有順反不同的立體異構(gòu),已證實(shí)處于反位。1)α-螺旋Pauling等人對α-角蛋白(α-keratin)進(jìn)行了線衍射分析,從衍射圖中看到有5~55nm的重復(fù)單位,故推測蛋白質(zhì)分子中有重復(fù)性結(jié)構(gòu),并認(rèn)為這種重復(fù)性結(jié)構(gòu)為α-螺旋(α-h(huán)elix).①多個(gè)肽鍵平面通過α-碳原子旋轉(zhuǎn),相互之間緊密盤曲成穩(wěn)固的右手螺旋。②主鏈呈螺旋上升,每6個(gè)氨基酸殘基上升一圈,相當(dāng)于54nm,這與線衍射圖符合。③相鄰兩圈螺旋之間借肽鍵中C=O和H桸形成許多鏈內(nèi)氫健,即每一個(gè)氨基酸殘基中的NH和前面相隔三個(gè)殘基的C=O之間形成氫鍵,這是穩(wěn)定α-螺旋的主要鍵。④肽鏈中氨基酸側(cè)鏈R,分布在螺旋外側(cè),其形狀、大小及電荷影響α-螺旋的形成。酸性或堿性氨基酸集中的區(qū)域,由于同電荷相斥,不利于α-螺旋形成;較大的R(如苯丙氨酸、色氨酸、異亮氨酸)集中的區(qū)域,也妨礙α-螺旋形成;脯氨酸因其α-碳原子位于五元環(huán)上,不易扭轉(zhuǎn),加之它是亞氨基酸,不易形成氫鍵,故不易形成上述α-螺旋;甘氨酸的R基為H,空間占位很小,也會影響該處螺旋的穩(wěn)定。2)β-片層結(jié)構(gòu)Astbury等人曾對β-角蛋白進(jìn)行線衍射分析,發(fā)現(xiàn)具有7nm的重復(fù)單位。如將毛發(fā)α-角蛋白在濕熱條件下拉伸,可拉長到原長二倍,這種α-螺旋的線衍射圖可改變?yōu)榕cβ-角蛋白類似的衍射圖。說明β-角蛋白中的結(jié)構(gòu)和α-螺旋拉長伸展后結(jié)構(gòu)相同。兩段以上的這種折疊成鋸齒狀的肽鏈,通過氫鍵相連而平行成片層狀的結(jié)構(gòu)稱為β-片層(β-pleatedsheet)結(jié)構(gòu)或稱β-折迭。①是肽鏈相當(dāng)伸展的結(jié)構(gòu),肽鏈平面之間折疊成鋸齒狀,相鄰肽鍵平面間呈110°角。氨基酸殘基的R側(cè)鏈伸出在鋸齒的上方或下方。②依靠兩條肽鏈或一條肽鏈內(nèi)的兩段肽鏈間的C=O與N-H形成氫鍵,使構(gòu)象穩(wěn)定。③兩段肽鏈可以是平行的,也可以是反平行的。即前者兩條鏈從“N端”到“C端”是同方向的,后者是反方向的。β-片層結(jié)構(gòu)的形式十分多樣,正、反平行能相互交替。④平行的β-片層結(jié)構(gòu)中,兩個(gè)殘基的間距為65nm;反平行的β-片層結(jié)構(gòu),則間距為7nm.蛋白質(zhì)分子中,肽鏈經(jīng)常會出現(xiàn)180°的回折,在這種回折角處的構(gòu)象就是β-轉(zhuǎn)角(β-turn或β-bend)。β-轉(zhuǎn)角中,第一個(gè)氨基酸殘基的C=O與第四個(gè)殘基的N-H之間形成氫鍵,從而使結(jié)構(gòu)穩(wěn)定。沒有確定規(guī)律性的部分肽鏈構(gòu)象,肽鏈中肽鍵平面不規(guī)則排列,屬于松散的無規(guī)卷曲(randomcoil)。超二級結(jié)構(gòu)(supersecondarystructure)是指在多肽鏈內(nèi)順序上相互鄰近的二級結(jié)構(gòu)常常在空間折疊中靠近,彼此相互作用,形成規(guī)則的二級結(jié)構(gòu)聚集體。發(fā)現(xiàn)的超二級結(jié)構(gòu)有三種基本形式:α螺旋組合(αα);β折疊組合(βββ)和α螺旋β折疊組合(βαβ),其中以βαβ組合最為常見。它們可直接作為三級結(jié)構(gòu)的“建筑塊”或結(jié)構(gòu)域的組成單位,是蛋白質(zhì)構(gòu)象中二級結(jié)構(gòu)與三級結(jié)構(gòu)之間的一個(gè)層次,故稱超二級結(jié)構(gòu)。結(jié)構(gòu)域(domain)也是蛋白質(zhì)構(gòu)象中二級結(jié)構(gòu)與三級結(jié)構(gòu)之間的一個(gè)層次。在較大的蛋白質(zhì)分子中,由于多肽鏈上相鄰的超二級結(jié)構(gòu)緊密聯(lián)系,形成二個(gè)或多個(gè)在空間上可以明顯區(qū)別它與蛋白質(zhì)亞基結(jié)構(gòu)的區(qū)別。一般每個(gè)結(jié)構(gòu)域約由100-200個(gè)氨基酸殘基組成,各有獨(dú)特的空間構(gòu)象,并承擔(dān)不同的生物學(xué)功能。如免疫球蛋白(IgG)由12個(gè)結(jié)構(gòu)域組成,其中兩個(gè)輕鏈上各有2個(gè),兩個(gè)重鏈上各有4個(gè);補(bǔ)體結(jié)合部位與抗原結(jié)合部位處于不同的結(jié)構(gòu)域。一個(gè)蛋白質(zhì)分子中的幾個(gè)結(jié)構(gòu)域有的相同,有的不同;而不同蛋白質(zhì)分子之間肽鏈中的各結(jié)構(gòu)域也可以相同。如乳酸脫氫酶、3-磷酸甘油醛脫氫酶、蘋果酸脫氫酶等均屬以NAD+為輔酶的脫氫酶類,它們各自由2個(gè)不同的結(jié)構(gòu)域組成,但它們與NAD+結(jié)合的結(jié)構(gòu)域構(gòu)象則基本相同。蛋白質(zhì)的多肽鏈在各種二級結(jié)構(gòu)的基礎(chǔ)上再進(jìn)一步盤曲或折迭形成具有一定規(guī)律的三維空間結(jié)構(gòu),稱為蛋白質(zhì)的三級結(jié)構(gòu)(tertiarystructure)。蛋白質(zhì)三級結(jié)構(gòu)的穩(wěn)定主要靠次級鍵,包括氫鍵、疏水鍵、鹽鍵以及范德華力(VanderWaalsforce)等。這些次級鍵可存在于一級結(jié)構(gòu)序號相隔很遠(yuǎn)的氨基酸殘基的R基團(tuán)之間,因此蛋白質(zhì)的三級結(jié)構(gòu)主要指氨基酸殘基的側(cè)鏈間的結(jié)合。次級鍵都是非共價(jià)鍵,易受環(huán)境中pH、溫度、離子強(qiáng)度等的影響,有變動的可能性。二硫鍵不屬于次級鍵,但在某些肽鏈中能使遠(yuǎn)隔的二個(gè)肽段聯(lián)系在一起,這對于蛋白質(zhì)三級結(jié)構(gòu)的穩(wěn)定上起著重要作用。現(xiàn)也有認(rèn)為蛋白質(zhì)的三級結(jié)構(gòu)是指蛋白質(zhì)分子主鏈折疊盤曲形成構(gòu)象的基礎(chǔ)上,分子中的各個(gè)側(cè)鏈所形成一定的構(gòu)象。側(cè)鏈構(gòu)象主要是形成微區(qū)(或稱結(jié)構(gòu)域domain)。對球狀蛋白質(zhì)來說,形成疏水區(qū)和親水區(qū)。親水區(qū)多在蛋白質(zhì)分子表面,由很多親水側(cè)鏈組成。疏水區(qū)多在分子內(nèi)部,由疏水側(cè)鏈集中構(gòu)成,疏水區(qū)常形成一些“洞穴”或“口袋”,某些輔基就鑲嵌成為活性部位。具備三級結(jié)構(gòu)的蛋白質(zhì)從其外形上看,有的細(xì)長(長軸比短軸大10倍以上),屬于纖維狀蛋白質(zhì)(fibrousprotein),如絲心蛋白;有的長短軸相差不多基本上呈球形,屬于球狀蛋白質(zhì)(globularprotein),如血漿清蛋白、球蛋白、肌紅蛋白,球狀蛋白的疏水基多聚集在分子的內(nèi)部,而親水基則多分布在分子表面,因而球狀蛋白質(zhì)是親水的,更重要的是,多肽鏈經(jīng)過如此盤曲后,可形成某些發(fā)揮生物學(xué)功能的特定區(qū)域,例如酶的活性中心等。具有二條或二條以上獨(dú)立三級結(jié)構(gòu)的多肽鏈組成的蛋白質(zhì),其多肽鏈間通過次級鍵相互組合而形成的空間結(jié)構(gòu)稱為蛋白質(zhì)的四級結(jié)構(gòu)(quarternarystructure)。每個(gè)具有獨(dú)立三級結(jié)構(gòu)的多肽鏈單位稱為亞基(subunit)。四級結(jié)構(gòu)實(shí)際上是指亞基的立體排布、相互作用及接觸部位的布局。亞基之間不含共價(jià)鍵,亞基間次級鍵的結(jié)合比三級結(jié)構(gòu)疏松,因此在一定的條件下,四級結(jié)構(gòu)的蛋白質(zhì)可分離為其組成的亞基,而亞基本身構(gòu)象仍可不變。一種蛋白質(zhì)中,亞基結(jié)構(gòu)可以相同,也可不同。如煙草斑紋病毒的外殼蛋白是由2200個(gè)相同的亞基形成的多聚體;正常人血紅蛋白A是兩個(gè)α亞基與兩個(gè)β亞基形成的四聚體;天冬氨酸氨甲?;D(zhuǎn)移酶由六個(gè)調(diào)節(jié)亞基與六個(gè)催化亞基組成。有人將具有全套不同亞基的最小單位稱為原聚體(protomer),如一個(gè)催化亞基與一個(gè)調(diào)節(jié)亞基結(jié)合成天冬氨酸氨甲?;D(zhuǎn)移酶的原聚體。某些蛋白質(zhì)分子可進(jìn)一步聚合成聚合體(polymer)。聚合體中的重復(fù)單位稱為單體(monomer),聚合體可按其中所含單體的數(shù)量不同而分為二聚體、三聚體……寡聚體(oligomer)和多聚體(polymer)而存在,如胰島素(insulin)在體內(nèi)可形成二聚體及六聚體。已經(jīng)測定了釀酒酵母(Saccharomycescereuisiae)、線蟲(Caenorhabditiselegans)、果蠅(Drosophilamelanogaster)、擬南芥(Arabidopsisthaliana)等模式生物的基因組序列.。特別值得一提的是,隨著人類基因310福建農(nóng)林大學(xué)學(xué)報(bào)(自然科學(xué)版)第35卷組計(jì)劃(HumanGenomeProgram)的完成,接下來的重點(diǎn)就轉(zhuǎn)移到研究這些基因組里的所有基因的結(jié)構(gòu)和功能。結(jié)構(gòu)基因組學(xué)受到了世界各國的高度重視,美國、日本、歐洲紛紛建立了結(jié)構(gòu)基因組學(xué)的研究機(jī)構(gòu)。結(jié)構(gòu)基因組學(xué)就是以大規(guī)模、高通量測定這些基因的表達(dá)產(chǎn)物蛋白質(zhì)分子的結(jié)構(gòu)為研究目標(biāo),以高通量基因克隆技術(shù)、蛋白質(zhì)表達(dá)及其純化、蛋白質(zhì)結(jié)晶、蛋白質(zhì)結(jié)構(gòu)測定為主要研究內(nèi)容的基因組學(xué)分支。蛋白質(zhì)結(jié)構(gòu)測定比基因組測定難度大得多,按照常規(guī)的實(shí)驗(yàn)步驟,從基因序列到相應(yīng)的蛋白質(zhì)結(jié)構(gòu)測定之間還要經(jīng)過基因表達(dá)、蛋白質(zhì)的提取和純化、結(jié)晶、射線衍射分析等步驟。由于蛋白質(zhì)結(jié)構(gòu)和性質(zhì)的多樣性,這些步驟大多沒有固定的規(guī)律可循,因而,這種作坊式的需要高超技巧和豐富經(jīng)驗(yàn)的研究方法難以適應(yīng)測定生物蛋白質(zhì)組中所有蛋白質(zhì)的要求,需要建立理論分析方法來解決這些問題。以預(yù)測技術(shù)水平,預(yù)測結(jié)果的精確度不如射線衍射分析和NMR等實(shí)驗(yàn)手段,但蛋白質(zhì)結(jié)構(gòu)預(yù)測是大規(guī)模、低成本和快速獲得三維結(jié)構(gòu)的有效途徑,例如當(dāng)目標(biāo)蛋白質(zhì)和模板蛋白質(zhì)的序列相似性超過30%時(shí),以結(jié)構(gòu)預(yù)測方法建立的蛋白質(zhì)三維結(jié)構(gòu)模型就可以用于一般性的功能分析。因而,蛋白質(zhì)預(yù)測技術(shù)在結(jié)構(gòu)基因組學(xué)中得到了廣泛的應(yīng)用。從基因組數(shù)據(jù)到新藥物的過程分為2個(gè)部分:一是選擇目標(biāo)蛋白,二是選擇合適的藥物,藥物分子必需與目標(biāo)蛋白質(zhì)分子緊密結(jié)合、容易合成且沒有毒副作用。傳統(tǒng)的藥物設(shè)計(jì)通過篩選大量的天然化合物、已知的底物或配基的類似物(anaIogs)以及生物化學(xué)研究來確定前導(dǎo)物(Ieadcompounds),較少依賴目標(biāo)蛋白質(zhì)的三維結(jié)構(gòu),因而研發(fā)周期長、費(fèi)用巨大,并且?guī)в谢蚨嗷蛏俚拿つ啃?。隨著蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的增長和結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展,目標(biāo)蛋白質(zhì)分子三維結(jié)構(gòu)的信息對于上述2個(gè)過程發(fā)揮著越來越大的作用,計(jì)算機(jī)輔助的藥物設(shè)計(jì)(computer-aideddrugdesign)可以縮短研發(fā)周期和降低成本。蛋白質(zhì)設(shè)計(jì)的目標(biāo)是通過計(jì)算機(jī)輔助的算法以生成符合目標(biāo)蛋白質(zhì)三維結(jié)構(gòu)的氨基酸序列,經(jīng)過漫長的進(jìn)化,自然界已經(jīng)篩選出了數(shù)量眾多的蛋白質(zhì),但天然蛋白質(zhì)只有在自然條件下才發(fā)揮最佳功能,這使得人們利用這些蛋白質(zhì)受到了限制,因此需要對蛋白質(zhì)進(jìn)行改造使其能適應(yīng)特定條件發(fā)揮特定的功能。蛋白質(zhì)分子的設(shè)計(jì)分為3類:小改、中改和大改。(3)食品蛋白質(zhì):凡可供食用,易消化,無毒和可供人類利用的蛋白質(zhì)兩個(gè)氨基酸可以通過縮合反應(yīng)結(jié)合在一起,并在兩個(gè)氨基酸之間形成肽鍵。而不斷地重復(fù)這一反應(yīng)就可以形成一條很長的殘基鏈(即多肽鏈)。這一反應(yīng)是由核糖體在翻譯進(jìn)程中所催化的。肽鍵雖然是單鍵,但具有部分的雙鍵性質(zhì)(由C=O雙鍵中的π電子云與N原子上的未共用電子對發(fā)生共振導(dǎo)致),因此C-N鍵(即肽鍵)不能旋轉(zhuǎn),從而連接在肽鍵兩端的基團(tuán)處于一個(gè)平面上,這一平面就被稱為肽平面。而對應(yīng)的肽二面角φ(肽平面繞N-Cα鍵的旋轉(zhuǎn)角)和ψ(肽平面繞Cα-C1鍵的旋轉(zhuǎn)角)有一定的取值范圍;一旦所有殘基的二面角確定下來,蛋白質(zhì)的主鏈構(gòu)象也就隨之確定。根據(jù)每個(gè)殘基的φ和ψ來做圖,就可以得到拉氏圖,由于形成同一類二級結(jié)構(gòu)的殘基的二面角的值都限定在一定范圍內(nèi),因此在拉氏圖上就可以大致分辨殘基參與形成哪一類二級結(jié)構(gòu)。下表列出了肽鍵與對應(yīng)類型單鍵以及氫鍵鍵長的比較。殘基側(cè)鏈上的原子根據(jù)希臘字母表的順序(α、β、γ、δ、ε等)來命名,如Cα指的是對應(yīng)殘基上最接近羰基的碳原子,而Cβ則是次接近的。Cα通常被認(rèn)為是主鏈骨架的組成原子。這些原子之間的鍵對應(yīng)的二面角則

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論