蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述

上傳人：1*** IP屬地：廣東上傳時(shí)間：2024-04-10 格式：DOCX 頁數(shù)：29 大?。?7.38KB 積分：11.88 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩24頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述一、本文概述蛋白質(zhì)，作為生物體內(nèi)最基本的分子單位之一，承載著生命活動的眾多重要功能。從酶的催化作用，到細(xì)胞間的信號傳遞，再到生物體的結(jié)構(gòu)支撐，蛋白質(zhì)無處不在，無時(shí)不刻不在發(fā)揮著其獨(dú)特的作用。盡管蛋白質(zhì)的重要性不言而喻，但其結(jié)構(gòu)與功能之間的復(fù)雜關(guān)系一直是科學(xué)家們研究的難題。蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了生物學(xué)、化學(xué)、物理學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科交叉的研究熱點(diǎn)。本文旨在對蛋白質(zhì)結(jié)構(gòu)預(yù)測的研究進(jìn)行全面的綜述，以期對該領(lǐng)域的發(fā)展有一個(gè)清晰的認(rèn)識。我們將回顧蛋白質(zhì)結(jié)構(gòu)預(yù)測的發(fā)展歷程，從早期的基于經(jīng)驗(yàn)的預(yù)測方法，到現(xiàn)代的基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的預(yù)測方法。我們將介紹當(dāng)前蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要技術(shù)和方法，包括同源建模、從頭預(yù)測、基于深度學(xué)習(xí)的預(yù)測等，并詳細(xì)分析它們的優(yōu)缺點(diǎn)。我們還將探討蛋白質(zhì)結(jié)構(gòu)預(yù)測在藥物設(shè)計(jì)、疾病治療等領(lǐng)域的應(yīng)用前景。二、蛋白質(zhì)結(jié)構(gòu)預(yù)測的基本原理和方法蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學(xué)領(lǐng)域的重要分支，其目標(biāo)是根據(jù)蛋白質(zhì)的氨基酸序列，預(yù)測其三維空間結(jié)構(gòu)。這一預(yù)測過程基于的基本原理和方法，主要涵蓋同源建模、從頭預(yù)測和混合方法三類。同源建模（HomologyModeling）是最常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法之一。它基于一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì)（模板）來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。同源建模的準(zhǔn)確性高度依賴于模板蛋白質(zhì)與目標(biāo)蛋白質(zhì)之間的序列相似性和結(jié)構(gòu)保守性。通過比對目標(biāo)序列與模板序列，確定它們之間的序列相似性和結(jié)構(gòu)對應(yīng)關(guān)系，然后利用這些信息來構(gòu)建目標(biāo)蛋白質(zhì)的結(jié)構(gòu)模型。從頭預(yù)測（AbinitioModeling）則不依賴于已知的蛋白質(zhì)結(jié)構(gòu)，而是基于物理和化學(xué)原理，如分子力學(xué)、量子力學(xué)和統(tǒng)計(jì)力學(xué)等，來預(yù)測蛋白質(zhì)的結(jié)構(gòu)。從頭預(yù)測的方法通常涉及到大量的計(jì)算，因此其預(yù)測過程相對較慢。盡管如此，從頭預(yù)測方法對于那些沒有同源模板的蛋白質(zhì)或者序列相似性較低的蛋白質(zhì)仍然具有重要意義?；旌戏椒ǎ℉ybridMethods）則是將同源建模和從頭預(yù)測兩種方法結(jié)合起來，以提高預(yù)測的準(zhǔn)確性?；旌戏椒ㄍǔＪ紫仁褂猛唇７椒?gòu)建一個(gè)初步的結(jié)構(gòu)模型，然后使用從頭預(yù)測方法對這個(gè)模型進(jìn)行優(yōu)化和修正?；旌戏椒ńY(jié)合了兩種方法的優(yōu)點(diǎn)，可以在一定程度上提高蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性。蛋白質(zhì)結(jié)構(gòu)預(yù)測的基本原理和方法涵蓋了同源建模、從頭預(yù)測和混合方法等多個(gè)方面。這些方法在實(shí)際應(yīng)用中各有優(yōu)缺點(diǎn)，需要根據(jù)具體的蛋白質(zhì)序列和結(jié)構(gòu)特點(diǎn)選擇合適的方法進(jìn)行預(yù)測。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和算法的不斷優(yōu)化，蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性將不斷提高，為生物醫(yī)學(xué)研究和藥物設(shè)計(jì)等領(lǐng)域的發(fā)展提供有力支持。三、蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要技術(shù)和工具隨著生物信息學(xué)和計(jì)算生物學(xué)的發(fā)展，蛋白質(zhì)結(jié)構(gòu)預(yù)測已經(jīng)成為一個(gè)熱門且富有挑戰(zhàn)性的領(lǐng)域。預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)對于理解其功能、揭示生命活動的機(jī)制以及指導(dǎo)藥物設(shè)計(jì)等方面都具有重要意義。目前，蛋白質(zhì)結(jié)構(gòu)預(yù)測主要依賴于計(jì)算方法和實(shí)驗(yàn)手段，其中計(jì)算預(yù)測技術(shù)日益成為研究熱點(diǎn)?；谀０宓慕７椒ㄊ亲钤缜易畛Ｓ玫牡鞍踪|(zhì)結(jié)構(gòu)預(yù)測技術(shù)之一。這種方法通過比對目標(biāo)序列與已知結(jié)構(gòu)的蛋白質(zhì)序列，找到相似的模板，然后基于模板的結(jié)構(gòu)信息來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。常見的基于模板的建模軟件有MODELLER、SWISSMODEL等。同源建模是基于序列比對和結(jié)構(gòu)比對的技術(shù)，它利用與目標(biāo)蛋白質(zhì)序列相似的已知結(jié)構(gòu)蛋白質(zhì)作為模板，來預(yù)測目標(biāo)蛋白質(zhì)的結(jié)構(gòu)。同源建模的成功與否很大程度上取決于序列相似性和模板選擇的準(zhǔn)確性。從頭預(yù)測方法不依賴于已知結(jié)構(gòu)的模板，而是根據(jù)蛋白質(zhì)序列的物理化學(xué)性質(zhì)和統(tǒng)計(jì)規(guī)律，通過計(jì)算機(jī)算法來預(yù)測其結(jié)構(gòu)。這類方法通常涉及復(fù)雜的能量優(yōu)化和搜索算法，如蒙特卡洛模擬、分子動力學(xué)模擬等。近年來，隨著深度學(xué)習(xí)和人工智能技術(shù)的興起，基于深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法也取得了顯著進(jìn)展，如AlphaFold等。除了計(jì)算預(yù)測外，實(shí)驗(yàn)方法也是蛋白質(zhì)結(jié)構(gòu)研究的重要手段。如射線晶體學(xué)、核磁共振（NMR）等技術(shù)可以直接測定蛋白質(zhì)的三維結(jié)構(gòu)。這些方法雖然精度高，但成本較高且操作復(fù)雜，通常用于驗(yàn)證計(jì)算預(yù)測結(jié)果或研究特定問題。為了整合各種預(yù)測方法和技術(shù)，提高預(yù)測準(zhǔn)確性，近年來出現(xiàn)了多個(gè)綜合預(yù)測平臺和數(shù)據(jù)庫，如CAMEO、CriticalAssessmentofTechniquesforProteinStructurePrediction(CASP)等。這些平臺和數(shù)據(jù)庫不僅提供了多種預(yù)測工具和方法，還定期舉辦評估活動，以推動蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展。蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個(gè)綜合性的研究領(lǐng)域，涉及多種技術(shù)和工具。隨著計(jì)算生物學(xué)和人工智能技術(shù)的不斷發(fā)展，我們有理由相信，未來蛋白質(zhì)結(jié)構(gòu)預(yù)測的準(zhǔn)確性和效率將得到進(jìn)一步提升。四、蛋白質(zhì)結(jié)構(gòu)預(yù)測的應(yīng)用領(lǐng)域和前景蛋白質(zhì)結(jié)構(gòu)預(yù)測在多個(gè)領(lǐng)域具有廣泛的應(yīng)用，并持續(xù)展現(xiàn)其巨大的潛力和前景。在醫(yī)學(xué)領(lǐng)域，蛋白質(zhì)結(jié)構(gòu)預(yù)測對藥物設(shè)計(jì)和開發(fā)起到了關(guān)鍵的作用。通過理解蛋白質(zhì)的三維結(jié)構(gòu)，科研人員可以更加準(zhǔn)確地識別出藥物與蛋白質(zhì)之間的相互作用點(diǎn)，從而設(shè)計(jì)出更有效的藥物。蛋白質(zhì)結(jié)構(gòu)預(yù)測也在疾病診斷和治療中發(fā)揮了重要作用，例如通過預(yù)測病原體蛋白質(zhì)的結(jié)構(gòu)，可以幫助我們設(shè)計(jì)出更有效的疫苗和抗體。在生物工程領(lǐng)域，蛋白質(zhì)結(jié)構(gòu)預(yù)測為蛋白質(zhì)工程提供了重要的理論基礎(chǔ)。通過預(yù)測和修改蛋白質(zhì)的結(jié)構(gòu)，科研人員可以優(yōu)化蛋白質(zhì)的功能，從而開發(fā)出更高效的酶、催化劑等生物工具。蛋白質(zhì)結(jié)構(gòu)預(yù)測還在生物傳感器、生物能源等領(lǐng)域中發(fā)揮著重要作用。隨著計(jì)算機(jī)科學(xué)和人工智能技術(shù)的不斷發(fā)展，蛋白質(zhì)結(jié)構(gòu)預(yù)測的前景更加廣闊。一方面，隨著算法的不斷優(yōu)化和計(jì)算能力的提升，我們可以預(yù)測更大、更復(fù)雜的蛋白質(zhì)結(jié)構(gòu)。另一方面，人工智能技術(shù)的引入也為蛋白質(zhì)結(jié)構(gòu)預(yù)測帶來了新的機(jī)遇。例如，深度學(xué)習(xí)等人工智能技術(shù)可以自動學(xué)習(xí)和優(yōu)化預(yù)測模型，從而提高預(yù)測的準(zhǔn)確性和效率。蛋白質(zhì)結(jié)構(gòu)預(yù)測在多個(gè)領(lǐng)域都具有廣泛的應(yīng)用，并持續(xù)展現(xiàn)出巨大的潛力和前景。隨著科學(xué)技術(shù)的不斷進(jìn)步，我們有理由相信，蛋白質(zhì)結(jié)構(gòu)預(yù)測將在未來的科學(xué)研究和應(yīng)用中發(fā)揮更加重要的作用。五、蛋白質(zhì)結(jié)構(gòu)預(yù)測的未來發(fā)展方向算法和模型的持續(xù)優(yōu)化：當(dāng)前，深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在蛋白質(zhì)結(jié)構(gòu)預(yù)測中已經(jīng)取得了顯著的成功。隨著數(shù)據(jù)量的增加和計(jì)算能力的提升，我們有理由期待更精確、更高效的算法和模型的出現(xiàn)。這些新的算法和模型可能包括更復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)、更精細(xì)的特征表示以及更先進(jìn)的優(yōu)化技術(shù)。多尺度模擬和整合：蛋白質(zhì)的結(jié)構(gòu)和功能通常受到多個(gè)尺度（如原子、殘基、域和整體）的影響。將多個(gè)尺度的信息有效地整合到預(yù)測模型中，以提高預(yù)測的準(zhǔn)確性，將是未來的一個(gè)重要方向。通過多尺度模擬，我們還可以更好地理解蛋白質(zhì)在各種生理和病理?xiàng)l件下的行為?？鐚W(xué)科合作：蛋白質(zhì)結(jié)構(gòu)預(yù)測是一個(gè)跨學(xué)科的領(lǐng)域，涉及到生物學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。未來，隨著這個(gè)領(lǐng)域的進(jìn)一步發(fā)展，我們期待看到更多的跨學(xué)科合作，尤其是在數(shù)據(jù)科學(xué)、人工智能和生物信息學(xué)等領(lǐng)域。實(shí)際應(yīng)用的推廣：目前，蛋白質(zhì)結(jié)構(gòu)預(yù)測已經(jīng)在藥物設(shè)計(jì)、疾病診斷和治療等方面展現(xiàn)出了一定的應(yīng)用潛力。這些應(yīng)用仍然處于初級階段。未來，隨著預(yù)測精度的提高和計(jì)算成本的降低，我們有理由相信，蛋白質(zhì)結(jié)構(gòu)預(yù)測將在更多領(lǐng)域得到實(shí)際應(yīng)用，為人類的健康和福祉做出更大的貢獻(xiàn)。數(shù)據(jù)共享和標(biāo)準(zhǔn)化：隨著蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的發(fā)展，數(shù)據(jù)共享和標(biāo)準(zhǔn)化將成為越來越重要的問題。通過共享數(shù)據(jù)，我們可以提高預(yù)測模型的泛化能力，避免重復(fù)勞動，加速科學(xué)進(jìn)步。而標(biāo)準(zhǔn)化則有助于確保不同研究團(tuán)隊(duì)之間的可比性，推動領(lǐng)域內(nèi)的合作和交流。蛋白質(zhì)結(jié)構(gòu)預(yù)測的未來充滿了無限的可能性和挑戰(zhàn)。我們期待在這個(gè)領(lǐng)域中看到更多的創(chuàng)新和突破，為人類對生命科學(xué)的理解提供新的視角和工具。六、結(jié)論隨著生物信息學(xué)和計(jì)算生物學(xué)的快速發(fā)展，蛋白質(zhì)結(jié)構(gòu)預(yù)測已成為當(dāng)前生物學(xué)和醫(yī)學(xué)領(lǐng)域的重要研究方向。通過對蛋白質(zhì)序列的深入分析，結(jié)合多種預(yù)測方法和算法，我們能夠初步理解蛋白質(zhì)的結(jié)構(gòu)和功能，從而進(jìn)一步揭示生命的奧秘。本文綜述了當(dāng)前蛋白質(zhì)結(jié)構(gòu)預(yù)測的主要方法和技術(shù)，包括基于模板的方法、從頭預(yù)測方法、混合方法等，并對這些方法進(jìn)行了詳細(xì)的分析和評價(jià)。雖然這些方法在預(yù)測精度和效率上取得了一定的進(jìn)展，但仍存在許多挑戰(zhàn)和問題需要解決。在未來，隨著大數(shù)據(jù)和人工智能技術(shù)的不斷發(fā)展，蛋白質(zhì)結(jié)構(gòu)預(yù)測將迎來更多的機(jī)遇和挑戰(zhàn)。一方面，更多的數(shù)據(jù)資源和計(jì)算資源將為我們提供更準(zhǔn)確、更全面的預(yù)測結(jié)果另一方面，新的算法和模型也將為我們提供更高效、更精確的預(yù)測方法。蛋白質(zhì)結(jié)構(gòu)預(yù)測是一項(xiàng)充滿挑戰(zhàn)和機(jī)遇的研究領(lǐng)域。我們需要不斷地探索和創(chuàng)新，提高預(yù)測精度和效率，為生物醫(yī)學(xué)研究和藥物開發(fā)提供更多的有力支持。同時(shí)，我們也需要更加關(guān)注數(shù)據(jù)質(zhì)量和算法的可解釋性，以確保預(yù)測結(jié)果的準(zhǔn)確性和可靠性。相信在不久的將來，我們一定能夠?qū)崿F(xiàn)對蛋白質(zhì)結(jié)構(gòu)更深入的理解和應(yīng)用。參考資料：隨著互聯(lián)網(wǎng)的快速發(fā)展，人們對于信息的個(gè)性化需求越來越高。個(gè)性化算法作為一種能夠根據(jù)用戶特征和行為習(xí)慣，提供定制化服務(wù)的技術(shù)，已經(jīng)在推薦系統(tǒng)、廣告系統(tǒng)、搜索引擎等領(lǐng)域得到了廣泛應(yīng)用。本文將探究基于統(tǒng)計(jì)學(xué)的個(gè)性化算法，包括其基本概念、應(yīng)用場景、優(yōu)缺點(diǎn)以及未來發(fā)展趨勢等方面。個(gè)性化算法通過對用戶數(shù)據(jù)的分析，挖掘用戶的興趣愛好、行為習(xí)慣等信息，從而為用戶提供更加精準(zhǔn)、個(gè)性化的服務(wù)。這種技術(shù)在電商、音樂、視頻、新聞等行業(yè)都有廣泛的應(yīng)用，已經(jīng)成為提高用戶體驗(yàn)和提升平臺收益的重要手段。統(tǒng)計(jì)學(xué)習(xí)理論是機(jī)器學(xué)習(xí)的基礎(chǔ)，它包括監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等多種方法。監(jiān)督學(xué)習(xí)是指根據(jù)已知輸入和輸出數(shù)據(jù)進(jìn)行訓(xùn)練，從而對未知數(shù)據(jù)進(jìn)行預(yù)測；無監(jiān)督學(xué)習(xí)是指在沒有已知輸出數(shù)據(jù)的情況下，通過分析輸入數(shù)據(jù)之間的相似性來挖掘潛在的數(shù)據(jù)結(jié)構(gòu)；半監(jiān)督學(xué)習(xí)則結(jié)合了監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的特點(diǎn)，利用部分有標(biāo)簽數(shù)據(jù)和大量無標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練，以提高預(yù)測精度。個(gè)性化算法可以應(yīng)用于各種場景，如推薦系統(tǒng)、廣告投放、搜索引擎等。推薦系統(tǒng)是最為常見的一種應(yīng)用場景。以下是一個(gè)基于統(tǒng)計(jì)學(xué)習(xí)的個(gè)性化推薦算法案例：通過對用戶歷史行為數(shù)據(jù)的分析，挖掘用戶的興趣愛好和行為習(xí)慣，并利用監(jiān)督學(xué)習(xí)算法訓(xùn)練模型。在推薦過程中，模型可以根據(jù)用戶當(dāng)前的行為數(shù)據(jù)，預(yù)測其可能感興趣的內(nèi)容，并實(shí)時(shí)更新推薦列表。個(gè)性化算法也存在一些問題和挑戰(zhàn)。例如，數(shù)據(jù)稀疏性、用戶興趣的動態(tài)變化、冷啟動問題等。為了解決這些問題，研究者們不斷探索新的技術(shù)和方法。例如，利用矩陣分解等技術(shù)來處理數(shù)據(jù)稀疏性問題；利用深度學(xué)習(xí)等方法來捕捉用戶興趣的動態(tài)變化等。對抗生成網(wǎng)絡(luò)（GAN）是一種深度學(xué)習(xí)模型，由生成器和判別器兩個(gè)神經(jīng)網(wǎng)絡(luò)組成，通過相互對抗訓(xùn)練來提高生成數(shù)據(jù)的真實(shí)性和判別器的判斷能力。GAN在個(gè)性化算法中有著廣泛的應(yīng)用，可以用于生成高質(zhì)量的圖像、音頻等數(shù)據(jù)，從而為推薦系統(tǒng)、廣告系統(tǒng)等提供更加真實(shí)、豐富的素材。GAN也存在一些問題，如訓(xùn)練不穩(wěn)定、難以收斂等。GAN對于數(shù)據(jù)量的需求也比較大，對于一些數(shù)據(jù)稀疏的場景可能不太適用。遷移學(xué)習(xí)是一種將已經(jīng)在一個(gè)領(lǐng)域或任務(wù)上訓(xùn)練好的模型應(yīng)用于另一個(gè)領(lǐng)域或任務(wù)上的方法。通過遷移學(xué)習(xí)，我們可以利用已經(jīng)訓(xùn)練好的模型來對新的數(shù)據(jù)進(jìn)行預(yù)測和分析，從而提高模型的效率和準(zhǔn)確性。在個(gè)性化算法中，遷移學(xué)習(xí)可以用于處理用戶興趣的動態(tài)變化等問題。例如，我們可以利用已經(jīng)訓(xùn)練好的模型來對用戶的行為數(shù)據(jù)進(jìn)行預(yù)測和分析，從而實(shí)時(shí)更新用戶的興趣列表。遷移學(xué)習(xí)也存在一些問題。例如，不同領(lǐng)域或任務(wù)之間的差異可能會導(dǎo)致模型的準(zhǔn)確性和效率下降。如何選擇合適的遷移學(xué)習(xí)算法也是一項(xiàng)重要的挑戰(zhàn)。個(gè)性化算法是機(jī)器學(xué)習(xí)的一個(gè)重要應(yīng)用領(lǐng)域，已經(jīng)在推薦系統(tǒng)、廣告系統(tǒng)、搜索引擎等領(lǐng)域得到了廣泛應(yīng)用。本文介紹了基于統(tǒng)計(jì)學(xué)的個(gè)性化算法探究，包括統(tǒng)計(jì)學(xué)習(xí)理論、個(gè)性化算法的應(yīng)用場景和優(yōu)缺點(diǎn)、對抗生成網(wǎng)絡(luò)和遷移學(xué)習(xí)等方法和概念。個(gè)性化算法仍然存在一些問題和挑戰(zhàn)，例如數(shù)據(jù)稀疏性、用戶興趣的動態(tài)變化、冷啟動問題等。未來，我們需要進(jìn)一步探索新的技術(shù)和方法來解決這些問題，提高個(gè)性化算法的準(zhǔn)確性和效率。蛋白質(zhì)二級結(jié)構(gòu)是指蛋白質(zhì)中局部主鏈的構(gòu)象，不涉及蛋白質(zhì)鏈的局部空間構(gòu)象。預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的方法大致可以分為兩類：一類是基于序列的方法，另一類是基于結(jié)構(gòu)的方法?；谛蛄械姆椒ㄖ饕抢靡阎牡鞍踪|(zhì)序列信息，通過統(tǒng)計(jì)模型或者機(jī)器學(xué)習(xí)方法預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。這類方法通常依賴于大量的已知蛋白質(zhì)序列數(shù)據(jù)，從中提取出序列特征，然后利用這些特征進(jìn)行二級結(jié)構(gòu)的預(yù)測。例如，使用隱馬爾科夫模型（HMM）和神經(jīng)網(wǎng)絡(luò)方法等?；谛蛄械姆椒m然精度相對較低，但由于其簡單易行、計(jì)算效率高，因此在實(shí)踐中得到了廣泛應(yīng)用。基于結(jié)構(gòu)的方法則是通過已知的蛋白質(zhì)三維結(jié)構(gòu)信息，預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。這類方法通常依賴于大量的已知蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)，通過統(tǒng)計(jì)分析或者模擬計(jì)算等方法，預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)?；诮Y(jié)構(gòu)的方法精度較高，但由于其計(jì)算復(fù)雜度高、需要大量的已知結(jié)構(gòu)數(shù)據(jù)，因此在實(shí)踐中應(yīng)用較少。近年來，隨著深度學(xué)習(xí)技術(shù)的發(fā)展，越來越多的研究者嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。深度學(xué)習(xí)方法能夠自動提取特征，并且能夠處理大規(guī)模的數(shù)據(jù)，因此在預(yù)測精度和泛化能力上具有優(yōu)勢。例如，卷積神經(jīng)網(wǎng)絡(luò)（CNN）和循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）等方法已經(jīng)被廣泛應(yīng)用于蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測是一個(gè)具有挑戰(zhàn)性的問題，需要不斷探索新的方法和技術(shù)。隨著數(shù)據(jù)和計(jì)算資源的不斷增加，相信未來會有更多的研究者投入到這一領(lǐng)域中，推動蛋白質(zhì)二級結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展。本文旨在探討基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法。通過采用高效的聚類算法對蛋白質(zhì)進(jìn)行分組，并利用同源建模技術(shù)預(yù)測未知結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明，該方法能夠有效地提高結(jié)構(gòu)預(yù)測的準(zhǔn)確性。本文為蛋白質(zhì)結(jié)構(gòu)預(yù)測研究提供新的思路和方向。蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學(xué)研究的重要領(lǐng)域之一。同源建模是一種常用的結(jié)構(gòu)預(yù)測方法，通過找到具有相似功能的已知蛋白質(zhì)結(jié)構(gòu)，推斷未知蛋白質(zhì)的結(jié)構(gòu)。同源建模的準(zhǔn)確性受到數(shù)據(jù)噪聲和模型局限性的限制。為了提高預(yù)測準(zhǔn)確性，研究者們嘗試將聚類算法應(yīng)用于同源建模。本文旨在探討基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法，并對其準(zhǔn)確性和優(yōu)越性進(jìn)行評估。同源建模是一種常用的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法。該方法通過找到具有相似功能的已知蛋白質(zhì)結(jié)構(gòu)，利用這些已知結(jié)構(gòu)的信息推斷未知蛋白質(zhì)的結(jié)構(gòu)。同源建模主要分為兩個(gè)步驟：序列比對和結(jié)構(gòu)建模。在序列比對階段，算法尋找已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的相似性；在結(jié)構(gòu)建模階段，利用已知蛋白質(zhì)結(jié)構(gòu)的信息構(gòu)建未知蛋白質(zhì)的結(jié)構(gòu)模型。聚類算法在同源建模中的應(yīng)用已經(jīng)得到廣泛研究。這些方法主要分為兩類：基于距離的方法和基于密度的方法?；诰嚯x的方法通過計(jì)算蛋白質(zhì)之間的相似性矩陣，將相似的蛋白質(zhì)聚集在一起；基于密度的方法則通過計(jì)算每個(gè)蛋白質(zhì)周圍的鄰居密度來進(jìn)行聚類。聚類算法的應(yīng)用能夠有效地過濾噪聲，提高同源建模的準(zhǔn)確性。本文采用基于密度的聚類算法——DBSCAN（Density-BasedSpatialClusteringofApplicationswithNoise）對蛋白質(zhì)進(jìn)行分組。利用BLAST算法進(jìn)行序列比對，尋找已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的相似性；利用同源建模技術(shù)預(yù)測未知蛋白質(zhì)的結(jié)構(gòu)。同時(shí)，本文采用ROSAC（RobustScalableAlgorithmsforCo-clustering）算法對蛋白質(zhì)進(jìn)行層次聚類，并利用MODASS（Model-basedAnalysisofProteomicsData）算法對聚類結(jié)果進(jìn)行評估。實(shí)驗(yàn)結(jié)果表明，基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法能夠有效地提高預(yù)測準(zhǔn)確性。通過將聚類算法應(yīng)用于同源建模，本文方法在已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的比對階段更加準(zhǔn)確；同時(shí)，利用ROSAC算法進(jìn)行層次聚類，實(shí)現(xiàn)了對蛋白質(zhì)的合理分組；利用MODASS算法對聚類結(jié)果進(jìn)行評估，驗(yàn)證了聚類效果的可靠性。與傳統(tǒng)的同源建模方法相比，本文方法具有更高的預(yù)測準(zhǔn)確性和更好的穩(wěn)健性。本文研究了基于蛋白質(zhì)聚類的同源建模結(jié)構(gòu)預(yù)測方法，并對其準(zhǔn)確性和優(yōu)越性進(jìn)行了評估。實(shí)驗(yàn)結(jié)果表明，該方法能夠有效地提高結(jié)構(gòu)預(yù)測的準(zhǔn)確性。該方法仍存在一定的局限性，例如在聚類過程中可能存在主觀因素和噪聲的影響。未來的研究方向可以包括改進(jìn)聚類算法、優(yōu)化已知蛋白質(zhì)序列與未知蛋白質(zhì)序列的比對方法，以及開發(fā)更為精確的結(jié)構(gòu)建模算法。蛋白質(zhì)結(jié)構(gòu)是指蛋白質(zhì)分子的空間結(jié)構(gòu)。蛋白質(zhì)主要由碳、氫、氧、氮等化學(xué)元素組成，是一類重要的生物大分子，所有蛋白質(zhì)都是由20種不同氨基酸連接形成的多聚體，在形成蛋白質(zhì)后，這些氨基酸又被稱為殘基。蛋白質(zhì)和多肽之間的界限并不是很清晰，有人基于發(fā)揮功能性作用的結(jié)構(gòu)域所需的殘基數(shù)認(rèn)為，若殘基數(shù)少于40，就稱之為多肽或肽。要發(fā)揮生物學(xué)功能，蛋白質(zhì)需要正確折疊為一個(gè)特定構(gòu)型，主要是通過大量的非共價(jià)相互作用（如氫鍵，離子鍵，范德華力和疏水作用）來實(shí)現(xiàn)；在一些蛋白質(zhì)（特別是分泌性蛋白質(zhì)）折疊中，二硫鍵也起到關(guān)鍵作用。為了從分子水平上了解蛋白質(zhì)的作用機(jī)制，常常需要測定蛋白質(zhì)的三維結(jié)構(gòu)。由研究蛋白質(zhì)結(jié)構(gòu)而發(fā)展起來了結(jié)構(gòu)生物學(xué)，采用了包括射線晶體學(xué)、核磁共振等技術(shù)來解析蛋白質(zhì)結(jié)構(gòu)。一定數(shù)量的殘基對于發(fā)揮某一生物化學(xué)功能是必要的；40-50個(gè)殘基通常是一個(gè)功能性結(jié)構(gòu)域大小的下限。蛋白質(zhì)大小的范圍可以從這樣一個(gè)下限一直到數(shù)千個(gè)殘基。估計(jì)的蛋白質(zhì)的平均長度在不同的物種中有所區(qū)別，一般約為200-380個(gè)殘基，而真核生物的蛋白質(zhì)平均長度比原核生物長約55%。更大的蛋白質(zhì)聚合體可以通過許多蛋白質(zhì)亞基形成；如由數(shù)千個(gè)肌動蛋白分子聚合形成蛋白纖維。1959年佩魯茨和肯德魯對血紅蛋白和肌血蛋白進(jìn)行結(jié)構(gòu)分析，解決了三維空間結(jié)構(gòu)，獲1962年諾貝爾化學(xué)獎(jiǎng)。鮑林發(fā)現(xiàn)了蛋白質(zhì)的基本結(jié)構(gòu)?？死锟恕⑽稚谏渚€衍射資料的基礎(chǔ)上，提出了DNA三維結(jié)構(gòu)的模型。獲1962年諾貝爾生理或醫(yī)學(xué)獎(jiǎng)。50年代后豪普特曼和卡爾勒建立了應(yīng)用射線分析的以直接法測定晶體結(jié)構(gòu)的純數(shù)學(xué)理論，在晶體研究中具有劃時(shí)代的意義，特別在研究大分子生物物質(zhì)如激素、抗生素、蛋白質(zhì)及新型藥物分子結(jié)構(gòu)方面起了重要作用。他們因此獲1985年諾貝爾化學(xué)獎(jiǎng)。蛋白質(zhì)分子是由氨基酸首尾相連縮合而成的共價(jià)多肽鏈，但是天然蛋白質(zhì)分子并不是走向隨機(jī)的松散多肽鏈。每一種天然蛋白質(zhì)都有自己特有的空間結(jié)構(gòu)或稱三維結(jié)構(gòu)，這種三維結(jié)構(gòu)通常被稱為蛋白質(zhì)的構(gòu)象，即蛋白質(zhì)的結(jié)構(gòu)。除了這些結(jié)構(gòu)層次，蛋白質(zhì)可以在多個(gè)類似結(jié)構(gòu)中轉(zhuǎn)換，以行使其生物學(xué)功能。對于功能性的結(jié)構(gòu)變化，這些三級或四級結(jié)構(gòu)通常用化學(xué)構(gòu)象進(jìn)行描述，而相應(yīng)的結(jié)構(gòu)轉(zhuǎn)換就被稱為構(gòu)象變化。蛋白質(zhì)的一級結(jié)構(gòu)（primarystructure）就是蛋白質(zhì)多肽鏈中氨基酸殘基的排列順序（sequence），也是蛋白質(zhì)最基本的結(jié)構(gòu)。它是由基因上遺傳密碼的排列順序所決定的。各種氨基酸按遺傳密碼的順序，通過肽鍵連接起來，成為多肽鏈，故肽鍵是蛋白質(zhì)結(jié)構(gòu)中的主鍵。迄今已有約一千種左右蛋白質(zhì)的一級結(jié)構(gòu)被研究確定，如胰島素，胰核糖核酸酶、胰蛋白酶等。蛋白質(zhì)的一級結(jié)構(gòu)決定了蛋白質(zhì)的二級、三級等高級結(jié)構(gòu)，成百億的天然蛋白質(zhì)各有其特殊的生物學(xué)活性，決定每一種蛋白質(zhì)的生物學(xué)活性的結(jié)構(gòu)特點(diǎn)，首先在于其肽鏈的氨基酸序列，由于組成蛋白質(zhì)的20種氨基酸各具特殊的側(cè)鏈，側(cè)鏈基團(tuán)的理化性質(zhì)和空間排布各不相同，當(dāng)它們按照不同的序列關(guān)系組合時(shí)，就可形成多種多樣的空間結(jié)構(gòu)和不同生物學(xué)活性的蛋白質(zhì)分子。蛋白質(zhì)分子的多肽鏈并非呈線形伸展，而是折疊和盤曲構(gòu)成特有的比較穩(wěn)定的空間結(jié)構(gòu)。蛋白質(zhì)的生物學(xué)活性和理化性質(zhì)主要決定于空間結(jié)構(gòu)的完整，因此僅僅測定蛋白質(zhì)分子的氨基酸組成和它們的排列順序并不能完全了解蛋白質(zhì)分子的生物學(xué)活性和理化性質(zhì)。例如球狀蛋白質(zhì)（多見于血漿中的白蛋白、球蛋白、血紅蛋白和酶等）和纖維狀蛋白質(zhì)（角蛋白、膠原蛋白、肌凝蛋白、纖維蛋白等），前者溶于水，后者不溶于水，顯而易見，此種性質(zhì)不能僅用蛋白質(zhì)的一級結(jié)構(gòu)的氨基酸排列順序來解釋。蛋白質(zhì)的二級結(jié)構(gòu)（secondarystructure）是指多肽鏈中主鏈原子的局部空間排布即構(gòu)象，不涉及側(cè)鏈部分的構(gòu)象。Pauling等人對一些簡單的肽及氨基酸的酰胺等進(jìn)行了線衍射分析，從一個(gè)肽鍵的周圍來看，得知：（1）肽鍵中的C-N鍵長132nm，比相鄰的N-C單鍵（147nm）短，而較一般C=N雙鍵（128nm）長，可見，肽鍵中-C-N-鍵的性質(zhì)介于單、雙鍵之間，具有部分雙鍵的性質(zhì)，因而不能旋轉(zhuǎn)，這就將固定在一個(gè)平面之內(nèi)。（2）肽鍵的C及N周圍三個(gè)鍵角之和均為360°，說明都處于一個(gè)平面上，也就是說六個(gè)原子基本上同處于一個(gè)平面，這就是肽鍵平面。肽鏈中能夠旋轉(zhuǎn)的只有α碳原子所形成的單鍵，此單鍵的旋轉(zhuǎn)決定兩個(gè)肽鍵平面的位置關(guān)系，于是肽鍵平面成為肽鏈盤曲折疊的基本單位。（3）肽鍵中的C-N既具有雙鍵性質(zhì)，就會有順反不同的立體異構(gòu)，已證實(shí)處于反位。1）α－螺旋Pauling等人對α－角蛋白（α－keratin）進(jìn)行了線衍射分析，從衍射圖中看到有5～55nm的重復(fù)單位，故推測蛋白質(zhì)分子中有重復(fù)性結(jié)構(gòu)，并認(rèn)為這種重復(fù)性結(jié)構(gòu)為α－螺旋（α－h(huán)elix）.①多個(gè)肽鍵平面通過α－碳原子旋轉(zhuǎn)，相互之間緊密盤曲成穩(wěn)固的右手螺旋。②主鏈呈螺旋上升，每6個(gè)氨基酸殘基上升一圈，相當(dāng)于54nm，這與線衍射圖符合。③相鄰兩圈螺旋之間借肽鍵中C=O和H桸形成許多鏈內(nèi)氫健，即每一個(gè)氨基酸殘基中的NH和前面相隔三個(gè)殘基的C=O之間形成氫鍵，這是穩(wěn)定α－螺旋的主要鍵。④肽鏈中氨基酸側(cè)鏈R，分布在螺旋外側(cè)，其形狀、大小及電荷影響α－螺旋的形成。酸性或堿性氨基酸集中的區(qū)域，由于同電荷相斥，不利于α－螺旋形成；較大的R（如苯丙氨酸、色氨酸、異亮氨酸）集中的區(qū)域，也妨礙α－螺旋形成；脯氨酸因其α－碳原子位于五元環(huán)上，不易扭轉(zhuǎn)，加之它是亞氨基酸，不易形成氫鍵，故不易形成上述α－螺旋；甘氨酸的R基為H，空間占位很小，也會影響該處螺旋的穩(wěn)定。2）β－片層結(jié)構(gòu)Astbury等人曾對β－角蛋白進(jìn)行線衍射分析，發(fā)現(xiàn)具有7nm的重復(fù)單位。如將毛發(fā)α－角蛋白在濕熱條件下拉伸，可拉長到原長二倍，這種α－螺旋的線衍射圖可改變?yōu)榕cβ－角蛋白類似的衍射圖。說明β－角蛋白中的結(jié)構(gòu)和α－螺旋拉長伸展后結(jié)構(gòu)相同。兩段以上的這種折疊成鋸齒狀的肽鏈，通過氫鍵相連而平行成片層狀的結(jié)構(gòu)稱為β－片層（β－pleatedsheet）結(jié)構(gòu)或稱β－折迭。①是肽鏈相當(dāng)伸展的結(jié)構(gòu)，肽鏈平面之間折疊成鋸齒狀，相鄰肽鍵平面間呈110°角。氨基酸殘基的R側(cè)鏈伸出在鋸齒的上方或下方。②依靠兩條肽鏈或一條肽鏈內(nèi)的兩段肽鏈間的C=O與N-H形成氫鍵，使構(gòu)象穩(wěn)定。③兩段肽鏈可以是平行的，也可以是反平行的。即前者兩條鏈從“N端”到“C端”是同方向的，后者是反方向的。β－片層結(jié)構(gòu)的形式十分多樣，正、反平行能相互交替。④平行的β－片層結(jié)構(gòu)中，兩個(gè)殘基的間距為65nm；反平行的β－片層結(jié)構(gòu)，則間距為7nm.蛋白質(zhì)分子中，肽鏈經(jīng)常會出現(xiàn)180°的回折，在這種回折角處的構(gòu)象就是β－轉(zhuǎn)角（β－turn或β－bend）。β－轉(zhuǎn)角中，第一個(gè)氨基酸殘基的C=O與第四個(gè)殘基的N-H之間形成氫鍵，從而使結(jié)構(gòu)穩(wěn)定。沒有確定規(guī)律性的部分肽鏈構(gòu)象，肽鏈中肽鍵平面不規(guī)則排列，屬于松散的無規(guī)卷曲（randomcoil）。超二級結(jié)構(gòu)（supersecondarystructure）是指在多肽鏈內(nèi)順序上相互鄰近的二級結(jié)構(gòu)常常在空間折疊中靠近，彼此相互作用，形成規(guī)則的二級結(jié)構(gòu)聚集體。發(fā)現(xiàn)的超二級結(jié)構(gòu)有三種基本形式：α螺旋組合（αα）；β折疊組合（βββ）和α螺旋β折疊組合（βαβ），其中以βαβ組合最為常見。它們可直接作為三級結(jié)構(gòu)的“建筑塊”或結(jié)構(gòu)域的組成單位，是蛋白質(zhì)構(gòu)象中二級結(jié)構(gòu)與三級結(jié)構(gòu)之間的一個(gè)層次，故稱超二級結(jié)構(gòu)。結(jié)構(gòu)域（domain）也是蛋白質(zhì)構(gòu)象中二級結(jié)構(gòu)與三級結(jié)構(gòu)之間的一個(gè)層次。在較大的蛋白質(zhì)分子中，由于多肽鏈上相鄰的超二級結(jié)構(gòu)緊密聯(lián)系，形成二個(gè)或多個(gè)在空間上可以明顯區(qū)別它與蛋白質(zhì)亞基結(jié)構(gòu)的區(qū)別。一般每個(gè)結(jié)構(gòu)域約由100-200個(gè)氨基酸殘基組成，各有獨(dú)特的空間構(gòu)象，并承擔(dān)不同的生物學(xué)功能。如免疫球蛋白（IgG）由12個(gè)結(jié)構(gòu)域組成，其中兩個(gè)輕鏈上各有2個(gè)，兩個(gè)重鏈上各有4個(gè)；補(bǔ)體結(jié)合部位與抗原結(jié)合部位處于不同的結(jié)構(gòu)域。一個(gè)蛋白質(zhì)分子中的幾個(gè)結(jié)構(gòu)域有的相同，有的不同；而不同蛋白質(zhì)分子之間肽鏈中的各結(jié)構(gòu)域也可以相同。如乳酸脫氫酶、3－磷酸甘油醛脫氫酶、蘋果酸脫氫酶等均屬以NAD+為輔酶的脫氫酶類，它們各自由2個(gè)不同的結(jié)構(gòu)域組成，但它們與NAD+結(jié)合的結(jié)構(gòu)域構(gòu)象則基本相同。蛋白質(zhì)的多肽鏈在各種二級結(jié)構(gòu)的基礎(chǔ)上再進(jìn)一步盤曲或折迭形成具有一定規(guī)律的三維空間結(jié)構(gòu)，稱為蛋白質(zhì)的三級結(jié)構(gòu)（tertiarystructure）。蛋白質(zhì)三級結(jié)構(gòu)的穩(wěn)定主要靠次級鍵，包括氫鍵、疏水鍵、鹽鍵以及范德華力（VanderWaalsforce）等。這些次級鍵可存在于一級結(jié)構(gòu)序號相隔很遠(yuǎn)的氨基酸殘基的R基團(tuán)之間，因此蛋白質(zhì)的三級結(jié)構(gòu)主要指氨基酸殘基的側(cè)鏈間的結(jié)合。次級鍵都是非共價(jià)鍵，易受環(huán)境中pH、溫度、離子強(qiáng)度等的影響，有變動的可能性。二硫鍵不屬于次級鍵，但在某些肽鏈中能使遠(yuǎn)隔的二個(gè)肽段聯(lián)系在一起，這對于蛋白質(zhì)三級結(jié)構(gòu)的穩(wěn)定上起著重要作用。現(xiàn)也有認(rèn)為蛋白質(zhì)的三級結(jié)構(gòu)是指蛋白質(zhì)分子主鏈折疊盤曲形成構(gòu)象的基礎(chǔ)上，分子中的各個(gè)側(cè)鏈所形成一定的構(gòu)象。側(cè)鏈構(gòu)象主要是形成微區(qū)（或稱結(jié)構(gòu)域domain）。對球狀蛋白質(zhì)來說，形成疏水區(qū)和親水區(qū)。親水區(qū)多在蛋白質(zhì)分子表面，由很多親水側(cè)鏈組成。疏水區(qū)多在分子內(nèi)部，由疏水側(cè)鏈集中構(gòu)成，疏水區(qū)常形成一些“洞穴”或“口袋”，某些輔基就鑲嵌成為活性部位。具備三級結(jié)構(gòu)的蛋白質(zhì)從其外形上看，有的細(xì)長（長軸比短軸大10倍以上），屬于纖維狀蛋白質(zhì)（fibrousprotein），如絲心蛋白；有的長短軸相差不多基本上呈球形，屬于球狀蛋白質(zhì)（globularprotein），如血漿清蛋白、球蛋白、肌紅蛋白，球狀蛋白的疏水基多聚集在分子的內(nèi)部，而親水基則多分布在分子表面，因而球狀蛋白質(zhì)是親水的，更重要的是，多肽鏈經(jīng)過如此盤曲后，可形成某些發(fā)揮生物學(xué)功能的特定區(qū)域，例如酶的活性中心等。具有二條或二條以上獨(dú)立三級結(jié)構(gòu)的多肽鏈組成的蛋白質(zhì)，其多肽鏈間通過次級鍵相互組合而形成的空間結(jié)構(gòu)稱為蛋白質(zhì)的四級結(jié)構(gòu)（quarternarystructure）。每個(gè)具有獨(dú)立三級結(jié)構(gòu)的多肽鏈單位稱為亞基（subunit）。四級結(jié)構(gòu)實(shí)際上是指亞基的立體排布、相互作用及接觸部位的布局。亞基之間不含共價(jià)鍵，亞基間次級鍵的結(jié)合比三級結(jié)構(gòu)疏松，因此在一定的條件下，四級結(jié)構(gòu)的蛋白質(zhì)可分離為其組成的亞基，而亞基本身構(gòu)象仍可不變。一種蛋白質(zhì)中，亞基結(jié)構(gòu)可以相同，也可不同。如煙草斑紋病毒的外殼蛋白是由2200個(gè)相同的亞基形成的多聚體；正常人血紅蛋白A是兩個(gè)α亞基與兩個(gè)β亞基形成的四聚體；天冬氨酸氨甲?；D(zhuǎn)移酶由六個(gè)調(diào)節(jié)亞基與六個(gè)催化亞基組成。有人將具有全套不同亞基的最小單位稱為原聚體（protomer），如一個(gè)催化亞基與一個(gè)調(diào)節(jié)亞基結(jié)合成天冬氨酸氨甲?；D(zhuǎn)移酶的原聚體。某些蛋白質(zhì)分子可進(jìn)一步聚合成聚合體（polymer）。聚合體中的重復(fù)單位稱為單體（monomer），聚合體可按其中所含單體的數(shù)量不同而分為二聚體、三聚體……寡聚體（oligomer）和多聚體（polymer）而存在，如胰島素（insulin）在體內(nèi)可形成二聚體及六聚體。已經(jīng)測定了釀酒酵母（Saccharomycescereuisiae）、線蟲（Caenorhabditiselegans）、果蠅（Drosophilamelanogaster）、擬南芥（Arabidopsisthaliana）等模式生物的基因組序列.。特別值得一提的是，隨著人類基因310福建農(nóng)林大學(xué)學(xué)報(bào)（自然科學(xué)版）第35卷組計(jì)劃（HumanGenomeProgram）的完成，接下來的重點(diǎn)就轉(zhuǎn)移到研究這些基因組里的所有基因的結(jié)構(gòu)和功能。結(jié)構(gòu)基因組學(xué)受到了世界各國的高度重視，美國、日本、歐洲紛紛建立了結(jié)構(gòu)基因組學(xué)的研究機(jī)構(gòu)。結(jié)構(gòu)基因組學(xué)就是以大規(guī)模、高通量測定這些基因的表達(dá)產(chǎn)物蛋白質(zhì)分子的結(jié)構(gòu)為研究目標(biāo)，以高通量基因克隆技術(shù)、蛋白質(zhì)表達(dá)及其純化、蛋白質(zhì)結(jié)晶、蛋白質(zhì)結(jié)構(gòu)測定為主要研究內(nèi)容的基因組學(xué)分支。蛋白質(zhì)結(jié)構(gòu)測定比基因組測定難度大得多，按照常規(guī)的實(shí)驗(yàn)步驟，從基因序列到相應(yīng)的蛋白質(zhì)結(jié)構(gòu)測定之間還要經(jīng)過基因表達(dá)、蛋白質(zhì)的提取和純化、結(jié)晶、射線衍射分析等步驟。由于蛋白質(zhì)結(jié)構(gòu)和性質(zhì)的多樣性，這些步驟大多沒有固定的規(guī)律可循，因而，這種作坊式的需要高超技巧和豐富經(jīng)驗(yàn)的研究方法難以適應(yīng)測定生物蛋白質(zhì)組中所有蛋白質(zhì)的要求，需要建立理論分析方法來解決這些問題。以預(yù)測技術(shù)水平，預(yù)測結(jié)果的精確度不如射線衍射分析和NMR等實(shí)驗(yàn)手段，但蛋白質(zhì)結(jié)構(gòu)預(yù)測是大規(guī)模、低成本和快速獲得三維結(jié)構(gòu)的有效途徑，例如當(dāng)目標(biāo)蛋白質(zhì)和模板蛋白質(zhì)的序列相似性超過30%時(shí)，以結(jié)構(gòu)預(yù)測方法建立的蛋白質(zhì)三維結(jié)構(gòu)模型就可以用于一般性的功能分析。因而，蛋白質(zhì)預(yù)測技術(shù)在結(jié)構(gòu)基因組學(xué)中得到了廣泛的應(yīng)用。從基因組數(shù)據(jù)到新藥物的過程分為2個(gè)部分：一是選擇目標(biāo)蛋白，二是選擇合適的藥物，藥物分子必需與目標(biāo)蛋白質(zhì)分子緊密結(jié)合、容易合成且沒有毒副作用。傳統(tǒng)的藥物設(shè)計(jì)通過篩選大量的天然化合物、已知的底物或配基的類似物（anaIogs）以及生物化學(xué)研究來確定前導(dǎo)物（Ieadcompounds），較少依賴目標(biāo)蛋白質(zhì)的三維結(jié)構(gòu)，因而研發(fā)周期長、費(fèi)用巨大，并且?guī)в谢蚨嗷蛏俚拿つ啃?。隨著蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的增長和結(jié)構(gòu)預(yù)測技術(shù)的發(fā)展，目標(biāo)蛋白質(zhì)分子三維結(jié)構(gòu)的信息對于上述2個(gè)過程發(fā)揮著越來越大的作用，計(jì)算機(jī)輔助的藥物設(shè)計(jì)（computer-aideddrugdesign）可以縮短研發(fā)周期和降低成本。蛋白質(zhì)設(shè)計(jì)的目標(biāo)是通過計(jì)算機(jī)輔助的算法以生成符合目標(biāo)蛋白質(zhì)三維結(jié)構(gòu)的氨基酸序列，經(jīng)過漫長的進(jìn)化，自然界已經(jīng)篩選出了數(shù)量眾多的蛋白質(zhì)，但天然蛋白質(zhì)只有在自然條件下才發(fā)揮最佳功能，這使得人們利用這些蛋白質(zhì)受到了限制，因此需要對蛋白質(zhì)進(jìn)行改造使其能適應(yīng)特定條件發(fā)揮特定的功能。蛋白質(zhì)分子的設(shè)計(jì)分為3類：小改、中改和大改。（3）食品蛋白質(zhì)：凡可供食用，易消化，無毒和可供人類利用的蛋白質(zhì)兩個(gè)氨基酸可以通過縮合反應(yīng)結(jié)合在一起，并在兩個(gè)氨基酸之間形成肽鍵。而不斷地重復(fù)這一反應(yīng)就可以形成一條很長的殘基鏈（即多肽鏈）。這一反應(yīng)是由核糖體在翻譯進(jìn)程中所催化的。肽鍵雖然是單鍵，但具有部分的雙鍵性質(zhì)（由C=O雙鍵中的π電子云與N原子上的未共用電子對發(fā)生共振導(dǎo)致），因此C-N鍵（即肽鍵）不能旋轉(zhuǎn)，從而連接在肽鍵兩端的基團(tuán)處于一個(gè)平面上，這一平面就被稱為肽平面。而對應(yīng)的肽二面角φ（肽平面繞N-Cα鍵的旋轉(zhuǎn)角）和ψ（肽平面繞Cα-C1鍵的旋轉(zhuǎn)角）有一定的取值范圍；一旦所有殘基的二面角確定下來，蛋白質(zhì)的主鏈構(gòu)象也就隨之確定。根據(jù)每個(gè)殘基的φ和ψ來做圖，就可以得到拉氏圖，由于形成同一類二級結(jié)構(gòu)的殘基的二面角的值都限定在一定范圍內(nèi)，因此在拉氏圖上就可以大致分辨殘基參與形成哪一類二級結(jié)構(gòu)。下表列出了肽鍵與對應(yīng)類型單鍵以及氫鍵鍵長的比較。殘基側(cè)鏈上的原子根據(jù)希臘字母表的順序（α、β、γ、δ、ε等）來命名，如Cα指的是對應(yīng)殘基上最接近羰基的碳原子，而Cβ則是次接近的。Cα通常被認(rèn)為是主鏈骨架的組成原子。這些原子之間的鍵對應(yīng)的二面角則

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述

文檔簡介

溫馨提示

最新文檔

評論

蛋白質(zhì)結(jié)構(gòu)預(yù)測綜述

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔