蛋白質(zhì)組相關(guān)生物信息學(xué)_第1頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)_第2頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)_第3頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)_第4頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 過(guò)去十年中,全世界的分子生物學(xué)家們所收集的原始信息不斷激增。在不太久之前,這些信息的分析整理工作只有不情愿的研究生去做,因?yàn)樗麄儗?duì)擺弄試管比敲擊鍵盤(pán)更有興趣,而現(xiàn)在有很多人已全身心地投入了這個(gè)領(lǐng)域。生物信息學(xué)正處于新興萌芽中,它可以不嚴(yán)格地定義為分子生物學(xué)和計(jì)算生物學(xué)的交叉,這個(gè)領(lǐng)域中已經(jīng)產(chǎn)生了大量重要的發(fā)現(xiàn),并有希望揭示更多大自然的奧秘。對(duì)大多數(shù)人而言,生物信息學(xué)的吸引力在于它是生物學(xué)中嶄新和有待開(kāi)墾的領(lǐng)域;而對(duì)其他人,其吸引力蘊(yùn)藏在簡(jiǎn)化論者對(duì)化學(xué)層次上的細(xì)節(jié)的熱愛(ài)和系統(tǒng)遺傳學(xué)家對(duì)了解各物種體系之間內(nèi)在關(guān)系的興趣之中。生物信息學(xué)的好處早已作為談資得以廣泛宣揚(yáng),它被宣稱是能解決一切痼疾的仙丹

2、,或是肢解序列數(shù)據(jù)的強(qiáng)大工具,或簡(jiǎn)稱之為搞科學(xué)一條迷人途徑。而實(shí)際上,生物信息學(xué)是在艱難而有意義工作中的一種新的方法。這一領(lǐng)域中,研究方法大多在不斷變化并有待發(fā)展和完善,與當(dāng)年生物化學(xué)的黃金年代并無(wú)不同,那時(shí)人們選擇各種能溶解和分析目標(biāo)分子的手段,不象如今生化實(shí)驗(yàn)室中所用技術(shù)要成熟和精巧得多。然而,在生物信息學(xué)被推向前進(jìn)的競(jìng)賽中,一些人曾企圖將其從科學(xué)分支降級(jí)為購(gòu)買(mǎi)了合適工具包就完成的功能。而維護(hù)了生物信息學(xué)在科學(xué)領(lǐng)域中地位的正是學(xué)術(shù)用戶群體本身,無(wú)論他們是在私立大學(xué)里還是在政府贊助的研究中心里。生物信息學(xué)中已取得的卓越進(jìn)展就蘊(yùn)藏在從收集整理原始數(shù)據(jù),到開(kāi)發(fā)更新更強(qiáng)的數(shù)據(jù)處理方法的工作之中,而

3、且一切均處于信息和技術(shù)自由共享的環(huán)境里。生物信息學(xué)群體的獨(dú)特之處在于,在商業(yè)部門(mén)之外,其“團(tuán)體精神”比生物學(xué)中許多競(jìng)爭(zhēng)性領(lǐng)域要開(kāi)放得多。由此想法,本書(shū)試圖能讓那些想了解更多序列分析方法的科學(xué)家跳進(jìn)書(shū)中,來(lái)體驗(yàn)令人著迷的科學(xué)旅途。蛋白質(zhì)組研究中的生物信息學(xué)蛋白質(zhì)組研究中的生物信息學(xué) 第一節(jié)第一節(jié) 生物信息學(xué)簡(jiǎn)介生物信息學(xué)簡(jiǎn)介一、什么是生物信息學(xué)一、什么是生物信息學(xué) 生物信息學(xué)是隨著人類(lèi)基因組計(jì)劃而發(fā)生物信息學(xué)是隨著人類(lèi)基因組計(jì)劃而發(fā)展起來(lái)的。生物信息學(xué)是一門(mén)新興的交叉學(xué)展起來(lái)的。生物信息學(xué)是一門(mén)新興的交叉學(xué)科???。它包含了生物信息的獲取、處理、存儲(chǔ)、它包含了生物信息的獲取、處理、存儲(chǔ)、發(fā)布、分析

4、和解釋等在內(nèi)的所有方面發(fā)布、分析和解釋等在內(nèi)的所有方面它綜它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來(lái)闡明和理解大量數(shù)據(jù)所包含的生物學(xué)具,來(lái)闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。意義。二、生物信息學(xué)的研究?jī)?nèi)容二、生物信息學(xué)的研究?jī)?nèi)容 生物信息學(xué)從有以下研究?jī)?nèi)容。生物信息學(xué)從有以下研究?jī)?nèi)容。 1 1序列比對(duì)序列比對(duì) 基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)基本問(wèn)題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。序列比對(duì)是生序列的相似性或不相似性。序列比對(duì)是生物信息學(xué)的基礎(chǔ),非常重要。物信息學(xué)的基礎(chǔ),非常重要。2. 2. 結(jié)構(gòu)比對(duì)結(jié)構(gòu)比對(duì) 比較兩個(gè)或兩個(gè)以上蛋白質(zhì)

5、分子空間結(jié)比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。構(gòu)的相似性或不相似性。3. 3. 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) 包括二級(jí)和三級(jí)結(jié)構(gòu)預(yù)測(cè),是最重要的包括二級(jí)和三級(jí)結(jié)構(gòu)預(yù)測(cè),是最重要的課題之一。課題之一。4. 4. 計(jì)算機(jī)輔助基因識(shí)別計(jì)算機(jī)輔助基因識(shí)別 基本問(wèn)題是給定基因組序列后,正確識(shí)基本問(wèn)題是給定基因組序列后,正確識(shí)別基因的范圍和在基因組序列中的精確位別基因的范圍和在基因組序列中的精確位置。這是最重要的課題之一。置。這是最重要的課題之一。5. 5. 非編碼區(qū)分析和非編碼區(qū)分析和DNADNA語(yǔ)言研究語(yǔ)言研究 在人類(lèi)基因組中,編碼部分占總序列的在人類(lèi)基因組中,編碼部分占總序列的3

6、 3一一5 5,其他通常稱為,其他通常稱為“垃圾垃圾”DNADNA,其實(shí)一點(diǎn)其實(shí)一點(diǎn)也不是垃圾,只是我們暫時(shí)還不知道其重要的也不是垃圾,只是我們暫時(shí)還不知道其重要的功能。分析非編碼區(qū)功能。分析非編碼區(qū)DNADNA序列需要大膽的想象序列需要大膽的想象和嶄新的研究思路相方法。和嶄新的研究思路相方法。DNADNA序列作為一種序列作為一種遺傳語(yǔ)言,不僅體現(xiàn)在編碼序列之中,而且隱遺傳語(yǔ)言,不僅體現(xiàn)在編碼序列之中,而且隱含在非編碼序列之中。含在非編碼序列之中。6. 6. 分子進(jìn)化和比較基因組學(xué)分子進(jìn)化和比較基因組學(xué) 早期的工作主要是利用不同物種中同一種基因早期的工作主要是利用不同物種中同一種基因序列的異同

7、來(lái)研究生物的進(jìn)化,構(gòu)建進(jìn)化樹(shù)。既可序列的異同來(lái)研究生物的進(jìn)化,構(gòu)建進(jìn)化樹(shù)。既可以用以用DNADNA序列也可以用其編碼的氨基酸序列來(lái)做,甚序列也可以用其編碼的氨基酸序列來(lái)做,甚至可通過(guò)相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對(duì)來(lái)研究分子進(jìn)化。至可通過(guò)相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對(duì)來(lái)研究分子進(jìn)化。 近年來(lái)由于較多模式生物基因組測(cè)序任務(wù)的完近年來(lái)由于較多模式生物基因組測(cè)序任務(wù)的完成,為從整個(gè)基因組的角度來(lái)研究分子進(jìn)化提供了成,為從整個(gè)基因組的角度來(lái)研究分子進(jìn)化提供了條件。條件。7. 7. 序列重疊群裝配序列重疊群裝配 一般來(lái)說(shuō),根據(jù)現(xiàn)行的測(cè)序技術(shù),每次反應(yīng)只一般來(lái)說(shuō),根據(jù)現(xiàn)行的測(cè)序技術(shù),每次反應(yīng)只能測(cè)比能測(cè)比500 500 bpb

8、p或更多一些堿基對(duì)的序列,這就有一或更多一些堿基對(duì)的序列,這就有一個(gè)由大量的較短的序列全體構(gòu)成的重疊群。逐步把個(gè)由大量的較短的序列全體構(gòu)成的重疊群。逐步把它們拼接起來(lái)形成序列更長(zhǎng)的重疊群,直至得到完它們拼接起來(lái)形成序列更長(zhǎng)的重疊群,直至得到完整序列的過(guò)程整序列的過(guò)程稱為稱為重疊群裝配。重疊群裝配。8 8遺傳密碼的起源遺傳密碼的起源 遺傳密碼為什么是現(xiàn)在這樣的?這一直是一個(gè)遺傳密碼為什么是現(xiàn)在這樣的?這一直是一個(gè)謎。一種最簡(jiǎn)單的理論認(rèn)為,密碼子與氨基酸之間謎。一種最簡(jiǎn)單的理論認(rèn)為,密碼子與氨基酸之間的關(guān)系是生物進(jìn)化歷史上一次偶然的事件而造成的,的關(guān)系是生物進(jìn)化歷史上一次偶然的事件而造成的,并被固

9、定在現(xiàn)代生物最后的共同祖先里,一直延續(xù)并被固定在現(xiàn)代生物最后的共同祖先里,一直延續(xù)至今。不同于這種至今。不同于這種“凍結(jié)凍結(jié)”理論,有人曾分別提出理論,有人曾分別提出過(guò)選擇優(yōu)化、化學(xué)和歷史等三種學(xué)說(shuō)來(lái)解釋遺傳密過(guò)選擇優(yōu)化、化學(xué)和歷史等三種學(xué)說(shuō)來(lái)解釋遺傳密碼。隨著各種生物基因組測(cè)序任務(wù)的完成,為研究碼。隨著各種生物基因組測(cè)序任務(wù)的完成,為研究遺傳密碼的起源和檢驗(yàn)上述理論的真?zhèn)翁峁┝诵碌倪z傳密碼的起源和檢驗(yàn)上述理論的真?zhèn)翁峁┝诵碌乃夭摹K夭摹?9 9基于結(jié)構(gòu)的藥物設(shè)計(jì)基于結(jié)構(gòu)的藥物設(shè)計(jì) 人類(lèi)基因組計(jì)劃的目的之一在于闡明人的約人類(lèi)基因組計(jì)劃的目的之一在于闡明人的約1010萬(wàn)種蛋白質(zhì)的結(jié)構(gòu)、功能、相互

10、作用以及與各種人萬(wàn)種蛋白質(zhì)的結(jié)構(gòu)、功能、相互作用以及與各種人類(lèi)疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包類(lèi)疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)的藥物設(shè)計(jì)是生括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域。物信息學(xué)中的極為重要的研究領(lǐng)域。1010生物信息處理并行算法的研究生物信息處理并行算法的研究 由于生物信息數(shù)據(jù)的規(guī)模極其巨大,由于生物信息數(shù)據(jù)的規(guī)模極其巨大,因此國(guó)內(nèi)外都開(kāi)展了生物信息處理算法并因此國(guó)內(nèi)外都開(kāi)展了生物信息處理算法并行化方向的研究。主要是研究生物信息學(xué)行化方向的研究。主要是研究生物信息學(xué)中的一些關(guān)鍵的算法,研究其中的

11、可并行中的一些關(guān)鍵的算法,研究其中的可并行性然后將其固化到硬件芯片中,從而提性然后將其固化到硬件芯片中,從而提高整個(gè)計(jì)算系統(tǒng)的性能。高整個(gè)計(jì)算系統(tǒng)的性能。11. 11. 其它其它 如基因表達(dá)譜分析,代謝網(wǎng)絡(luò)分析,如基因表達(dá)譜分析,代謝網(wǎng)絡(luò)分析,基因芯片設(shè)計(jì)和蛋白質(zhì)組學(xué)數(shù)據(jù)分析逐基因芯片設(shè)計(jì)和蛋白質(zhì)組學(xué)數(shù)據(jù)分析逐漸成為生物信息學(xué)中新興的重要研究領(lǐng)域。漸成為生物信息學(xué)中新興的重要研究領(lǐng)域。 20012001年年9 9月,國(guó)家科學(xué)技術(shù)部對(duì)月,國(guó)家科學(xué)技術(shù)部對(duì)“生物和生物和現(xiàn)代農(nóng)業(yè)技術(shù)領(lǐng)域生物信息技術(shù)主題現(xiàn)代農(nóng)業(yè)技術(shù)領(lǐng)域生物信息技術(shù)主題”提出的提出的目標(biāo)是目標(biāo)是: 實(shí)現(xiàn)生物技術(shù)與信息技術(shù)以及其他學(xué)科的

12、實(shí)現(xiàn)生物技術(shù)與信息技術(shù)以及其他學(xué)科的結(jié)合,實(shí)現(xiàn)基因組數(shù)據(jù)、蛋白質(zhì)組和結(jié)構(gòu)基因結(jié)合,實(shí)現(xiàn)基因組數(shù)據(jù)、蛋白質(zhì)組和結(jié)構(gòu)基因組數(shù)據(jù)、天然及合成化合物數(shù)據(jù)的計(jì)算機(jī)處理、組數(shù)據(jù)、天然及合成化合物數(shù)據(jù)的計(jì)算機(jī)處理、分析和可視化,以及生物實(shí)驗(yàn)和生物分子的模分析和可視化,以及生物實(shí)驗(yàn)和生物分子的模擬設(shè)計(jì),解析蛋白質(zhì)三維結(jié)構(gòu)和蛋白質(zhì)組的時(shí)擬設(shè)計(jì),解析蛋白質(zhì)三維結(jié)構(gòu)和蛋白質(zhì)組的時(shí)空表達(dá)關(guān)系等,提高生物信息處理、分析和利空表達(dá)關(guān)系等,提高生物信息處理、分析和利利用的水平。利用的水平。三三. . 我國(guó)生物信息學(xué)研究的目標(biāo)我國(guó)生物信息學(xué)研究的目標(biāo)主要內(nèi)容是:主要內(nèi)容是: 1 1生物信息的獲取與開(kāi)發(fā)生物信息的獲取與開(kāi)發(fā) 2

13、 2生物信息加工和利用生物信息加工和利用 3 3結(jié)構(gòu)基因組和蛋白質(zhì)組學(xué)研究結(jié)構(gòu)基因組和蛋白質(zhì)組學(xué)研究 4 4高通量藥物篩選及相關(guān)技術(shù)高通量藥物篩選及相關(guān)技術(shù) 5. 5. 小分子藥物設(shè)計(jì)和分子設(shè)計(jì)小分子藥物設(shè)計(jì)和分子設(shè)計(jì) 6. 6. 生物芯片生物芯片 7. 7. 化學(xué)創(chuàng)新藥物和新劑型化學(xué)創(chuàng)新藥物和新劑型四四. 蛋白質(zhì)組研究中生物信息學(xué)的任務(wù)蛋白質(zhì)組研究中生物信息學(xué)的任務(wù)Proteomic analysis requires highly sophisticated bioinformatic tools in not only electrophoretic and MS separation

14、but also in the assignement of physicochemical properties and prediction of potential post-translational modifications and 3D structuresDatabases exist for the protein maps of a broad range of organisms, tissues, and disease statesUltimately, given the dynamic nature of the proteome, complex experim

15、ental details and related results need to be extrapolated in the context of the relevant biochemical pathways or disease implicationsFor example:How to classify proteins into functional classes?How to compare one proteome with another?How to include functional/activity/pathway information in databas

16、es?How to extract functional motifs from sequence data?How to predict phenotype from proteotype? How to correlate changes in protein expression with disease? How to distinguish important from unimportant changes in expression? How to compare, archive, retrieve gel data? How to rapidly, accurately id

17、entify proteins from MS and 2D gel data? How to include expression info in databases? How to predict 3D structure from 1D sequence? How to determine function from structure? How to classify proteins on basis of structure? How to recognize 3D motifs and patterns? How to use bioinformatics databases t

18、o help in 3D structure determination? How to predict which proteins will express well or produce stable, folded molecules?第二節(jié)第二節(jié) 數(shù)據(jù)庫(kù)的構(gòu)建數(shù)據(jù)庫(kù)的構(gòu)建 數(shù)據(jù)庫(kù)是生物信息學(xué)的主要內(nèi)容,各種數(shù)據(jù)數(shù)據(jù)庫(kù)是生物信息學(xué)的主要內(nèi)容,各種數(shù)據(jù)庫(kù)幾乎覆蓋了生物科學(xué)的各個(gè)領(lǐng)域。庫(kù)幾乎覆蓋了生物科學(xué)的各個(gè)領(lǐng)域。 美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室19791979年開(kāi)通的基年開(kāi)通的基因庫(kù)因庫(kù)GenbankGenbank,現(xiàn)在由現(xiàn)在由19881988年成立的國(guó)家生物信息

19、中年成立的國(guó)家生物信息中心心( (NCBI)NCBI)管理維護(hù)。管理維護(hù)。 歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲分子生物學(xué)實(shí)驗(yàn)室19821982年開(kāi)始服務(wù)的年開(kāi)始服務(wù)的EMBLEMBL數(shù)據(jù)庫(kù)和隨后建立的歐洲生物網(wǎng)數(shù)據(jù)庫(kù)和隨后建立的歐洲生物網(wǎng)( (EMBNet)EMBNet)19941994年改年改由當(dāng)年建在英國(guó)劍橋的歐洲生物信息研究所由當(dāng)年建在英國(guó)劍橋的歐洲生物信息研究所( (EBI)EBI)管管理。理。 日本日本19841984年著手建立國(guó)家級(jí)的核較數(shù)據(jù)庫(kù)年著手建立國(guó)家級(jí)的核較數(shù)據(jù)庫(kù)DDBJDDBJ,19871987年正式服務(wù)。目前絕大部分核酸和蛋白質(zhì)數(shù)據(jù)由年正式服務(wù)。目前絕大部分核酸和蛋白質(zhì)數(shù)據(jù)由美國(guó)

20、、歐洲和日本產(chǎn)生,以上三家共同組成了美國(guó)、歐洲和日本產(chǎn)生,以上三家共同組成了DDBJ/DDBJ/EMBIEMBIGeneBankGeneBank國(guó)際核酸序列數(shù)據(jù)庫(kù)。其他國(guó)國(guó)際核酸序列數(shù)據(jù)庫(kù)。其他國(guó)家如德國(guó)、法國(guó)、意大利等也紛紛建立自己的數(shù)據(jù)庫(kù),家如德國(guó)、法國(guó)、意大利等也紛紛建立自己的數(shù)據(jù)庫(kù),為本國(guó)服務(wù)。為本國(guó)服務(wù)。第三節(jié)第三節(jié) 蛋白質(zhì)組研究中常用的網(wǎng)站蛋白質(zhì)組研究中常用的網(wǎng)站及數(shù)據(jù)庫(kù)及數(shù)據(jù)庫(kù)從從1994 1994 年起每年第一期年起每年第一期 ( (Nucleic Acid Nucleic Acid Research)Research) 是分子生物學(xué)數(shù)據(jù)庫(kù)??墒欠肿由飳W(xué)數(shù)據(jù)庫(kù)???,由專人

21、綜述當(dāng)前的在線分子生物學(xué)數(shù)據(jù)庫(kù)資專人綜述當(dāng)前的在線分子生物學(xué)數(shù)據(jù)庫(kù)資源。源。一、蛋白質(zhì)數(shù)據(jù)庫(kù)一、蛋白質(zhì)數(shù)據(jù)庫(kù)1.1.SWISS-PROT/SWISS-PROT/TrEMBL TrEMBL 網(wǎng)址網(wǎng)址:http:/www.http:/www.expasyexpasy. .chch/ /sprotsprot/ /2.Protein Information Resource(PIR) 2.Protein Information Resource(PIR) 網(wǎng)址:網(wǎng)址:http:/http:/pirpir. .georgetowngeorgetown. .eduedu/ /3.3.NCBInr NCBI

22、nr 網(wǎng)址網(wǎng)址:http:/www.http:/www.ncbincbi. .nlmnlm. .nihnih. .govgov4.4.dbEST GenbankdbEST Genbank 一個(gè)分支一個(gè)分支5.5.OWL OWL 網(wǎng)址:網(wǎng)址: http:/http:/biochembiochem. .uclucl.ac.ac6.6.UniGene UniGene 由由NCBINCBI提供提供SWISS-PROT/SWISS-PROT/TrEMBLTrEMBL 高度注釋高度注釋( (比如蛋白功能描述、結(jié)構(gòu)域比如蛋白功能描述、結(jié)構(gòu)域結(jié)構(gòu)、轉(zhuǎn)錄后修飾、變異等結(jié)構(gòu)、轉(zhuǎn)錄后修飾、變異等) ),冗余程度,冗

23、余程度最低,與其他數(shù)據(jù)庫(kù)整合程度最高。最低,與其他數(shù)據(jù)庫(kù)整合程度最高。TrEMBLTrEMBL是是SWISS-PROTSWISS-PROT的補(bǔ)充,含有所有的的補(bǔ)充,含有所有的EMBLEMBL核苷酸的翻譯產(chǎn)物,但未整合進(jìn)核苷酸的翻譯產(chǎn)物,但未整合進(jìn)SWISS-PROTSWISS-PROT 。Protein Information Resource(PIR)Protein Information Resource(PIR) 廣泛的、注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)廣泛的、注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)。蛋白信息資源與慕尼黑蛋白序列信息中及庫(kù)。蛋白信息資源與慕尼黑蛋白序列信息中及日本國(guó)際蛋白質(zhì)信息數(shù)

24、據(jù)庫(kù)合作,產(chǎn)生的公共日本國(guó)際蛋白質(zhì)信息數(shù)據(jù)庫(kù)合作,產(chǎn)生的公共領(lǐng)域中最廣泛的熟練注釋的蛋白序列數(shù)據(jù)庫(kù)領(lǐng)域中最廣泛的熟練注釋的蛋白序列數(shù)據(jù)庫(kù)- -PIRPIR國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(kù)。國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(kù)。NCBInrNCBInr 是一個(gè)非冗余的蛋白質(zhì)數(shù)據(jù)庫(kù),由是一個(gè)非冗余的蛋白質(zhì)數(shù)據(jù)庫(kù),由NCBINCBI搜集,搜集,以供其搜索工具以供其搜索工具BLASTBLAST和和EntrezEntrez所用。所用。 dbESTdbEST 是是GenBankGenBank的分支的分支,含有從大量的生物中來(lái)的含有從大量的生物中來(lái)的一次反應(yīng)測(cè)序得到的一次反應(yīng)測(cè)序得到的cDNAcDNA或叫表達(dá)序列標(biāo)簽。或叫表達(dá)序列標(biāo)簽

25、。這是一個(gè)核酸數(shù)據(jù)庫(kù),被這是一個(gè)核酸數(shù)據(jù)庫(kù),被MascotMascot從從6 6個(gè)相位翻個(gè)相位翻譯得到。譯得到。OWLOWLOWLOWL混合蛋白質(zhì)數(shù)據(jù)庫(kù)混合蛋白質(zhì)數(shù)據(jù)庫(kù)( (Composite Protein Composite Protein Sequence Database)Sequence Database)是一個(gè)非冗余的蛋白質(zhì)序是一個(gè)非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù),由列數(shù)據(jù)庫(kù),由4 4個(gè)公用的一級(jí)資源組成:個(gè)公用的一級(jí)資源組成:SWISS-SWISS-PROTPROT、PIRPIR、GenbankGenbank和和NRL-3DNRL-3D。UniGeneUniGene 美國(guó)國(guó)家生物技術(shù)信息

26、中心美國(guó)國(guó)家生物技術(shù)信息中心( (NCBlNCBl) )提供提供的公用數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)將的公用數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)將GenBankGenBank中屬中屬于同一條基因的所有片段拼接成完整的基于同一條基因的所有片段拼接成完整的基因進(jìn)行收錄。因進(jìn)行收錄。二、蛋白質(zhì)組數(shù)據(jù)庫(kù)二、蛋白質(zhì)組數(shù)據(jù)庫(kù)1.1.AAindexAAindex: :(氨基酸索引數(shù)據(jù)庫(kù))氨基酸索引數(shù)據(jù)庫(kù)) 網(wǎng)址網(wǎng)址 http:/www.genome.ad.jp/dbget/2.GELBANK 3.Predictome 4.Proteome Analysi

27、s Database http:/www.ebi.ac.uk/proteome/5.REBASE http:/ /ch2d/7.YPL.dp http:/ypl.tugraze.at三三. . 蛋白質(zhì)序列基序蛋白質(zhì)序列基序( (Motif)Motif)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)1.Blocks 2.CDD /Structure/cdd/cdd/dhtml3.CluSTr http:/www.cbi.ac.uk/clustr/4.InterPro http:/www.ebi.

28、ac.uk/interpro/5.Pfam http:/www.sanger.ac.uk/Software/Pdam/6.PROSITE 6.PROSITE http:///prosite是由有生物學(xué)意義的是由有生物學(xué)意義的Pattern Pattern 和和ProfileProfile組成,用適當(dāng)?shù)挠?jì)算工具它可以有助于組成,用適當(dāng)?shù)挠?jì)算工具它可以有助于判斷一個(gè)新的序列屬于哪個(gè)家族判斷一個(gè)新的序列屬于哪個(gè)家族( (如果存如果存在的話在的話) ),或含有哪些已知的結(jié)構(gòu)域?;蚝心男┮阎慕Y(jié)構(gòu)域。7.7.其它數(shù)據(jù)庫(kù)如

29、下圖其它數(shù)據(jù)庫(kù)如下圖四、蛋白質(zhì)三維結(jié)構(gòu)和相關(guān)數(shù)據(jù)庫(kù)四、蛋白質(zhì)三維結(jié)構(gòu)和相關(guān)數(shù)據(jù)庫(kù) 1.1.PDB PDB http:///pdb/ / 是美國(guó)是美國(guó)BrookhavenBrookhaven實(shí)驗(yàn)室的大分子結(jié)構(gòu)實(shí)驗(yàn)室的大分子結(jié)構(gòu)數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù),用用x x射線晶體學(xué)和核磁共振法射線晶體學(xué)和核磁共振法( (NMR)NMR)得到的結(jié)構(gòu)數(shù)據(jù),得到的結(jié)構(gòu)數(shù)據(jù),其中含有通過(guò)其中含有通過(guò)X X射線晶體衍射線晶體衍射、核磁共振等實(shí)驗(yàn)手段測(cè)定的生物大分子射、核磁共振等實(shí)驗(yàn)手段測(cè)定的生物大分子的三維結(jié)構(gòu),主要是蛋白質(zhì)的三維結(jié)構(gòu),也的三維結(jié)構(gòu),主要是蛋白

30、質(zhì)的三維結(jié)構(gòu),也包括了核酸、糖類(lèi)、蛋白質(zhì)與核酸復(fù)合物的包括了核酸、糖類(lèi)、蛋白質(zhì)與核酸復(fù)合物的三維結(jié)構(gòu)。三維結(jié)構(gòu)。PDBPDB數(shù)據(jù)庫(kù)已含有約數(shù)據(jù)庫(kù)已含有約64,623 64,623 (2010/4/13)(2010/4/13)多個(gè)結(jié)構(gòu),多個(gè)結(jié)構(gòu),90%90%是蛋白質(zhì)的結(jié)構(gòu)是蛋白質(zhì)的結(jié)構(gòu)PDBPDB中的每條記錄有顯式序列(中的每條記錄有顯式序列(explicit sequenceexplicit sequence)和隱式序列和隱式序列(implicit sequence)(implicit sequence)信息。信息。 PDB PDB的隱式的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個(gè)原子的名稱和原子序列

31、即為立體化學(xué)數(shù)據(jù),包括每個(gè)原子的名稱和原子的三維坐標(biāo)。在實(shí)際應(yīng)用中,的三維坐標(biāo)。在實(shí)際應(yīng)用中,PDBPDB數(shù)據(jù)庫(kù)應(yīng)與結(jié)構(gòu)模數(shù)據(jù)庫(kù)應(yīng)與結(jié)構(gòu)模型顯示軟件相結(jié)合。由于型顯示軟件相結(jié)合。由于PDBPDB的主要信息是三維結(jié)構(gòu),的主要信息是三維結(jié)構(gòu),如果直接將三維結(jié)構(gòu)信息以文本的形式返回給用戶,如果直接將三維結(jié)構(gòu)信息以文本的形式返回給用戶,用戶將難以讀懂這些信息。實(shí)用的方法是通過(guò)分子模用戶將難以讀懂這些信息。實(shí)用的方法是通過(guò)分子模型軟件,以圖形方式顯示三維結(jié)構(gòu)。互聯(lián)網(wǎng)上有許多型軟件,以圖形方式顯示三維結(jié)構(gòu)?;ヂ?lián)網(wǎng)上有許多可以利用的分子模型軟件如可以利用的分子模型軟件如RasMolRasMol、 CHIME

32、 CHIME 、MolPOVMolPOV等,這些軟件能夠以各種各樣的模型顯示出生等,這些軟件能夠以各種各樣的模型顯示出生物大分子的三維結(jié)構(gòu)如結(jié)構(gòu)骨架模型、棒狀模型、球物大分子的三維結(jié)構(gòu)如結(jié)構(gòu)骨架模型、棒狀模型、球棒模型、空間填充模型和帶狀模型等。此外,棒模型、空間填充模型和帶狀模型等。此外,PDBPDB還還說(shuō)明了蛋白質(zhì)某些特定部位的二級(jí)結(jié)構(gòu)類(lèi)型如說(shuō)明了蛋白質(zhì)某些特定部位的二級(jí)結(jié)構(gòu)類(lèi)型如a a螺旋螺旋和和b b折疊。折疊。觀看生物分子觀看生物分子3 3D D微觀立體結(jié)構(gòu)的軟件微觀立體結(jié)構(gòu)的軟件, ,可以旋轉(zhuǎn)可以旋轉(zhuǎn), ,以多個(gè)模式觀看,并可以存成普通圖形文件。以多個(gè)模式觀看,并可以存成普通圖形文

33、件。 IEIE與與NetScapeNetScape瀏覽器插件瀏覽器插件, ,安裝后安裝后, ,可以直接用瀏覽器觀看可以直接用瀏覽器觀看PDBPDB格式的文件格式的文件, ,直接在瀏覽器中觀看直接在瀏覽器中觀看3 3D D分子。分子。 CHIME 2.6 SP6是是PDBPDB格式至格式至POVPOV格式轉(zhuǎn)化工具,可以將大分子格式轉(zhuǎn)化工具,可以將大分子PDBPDB格格式文件轉(zhuǎn)化為式文件轉(zhuǎn)化為POVPOV格式,以便用格式,以便用povpov-ray-ray進(jìn)行三維渲染,進(jìn)行三維渲染,生成質(zhì)量非常高的分子三維圖形。軟件有許多選項(xiàng),生成質(zhì)量非常高的分子三維圖形。軟件有許多選項(xiàng),只需設(shè)定這些選項(xiàng),便能生

34、成相應(yīng)的只需設(shè)定這些選項(xiàng),便能生成相應(yīng)的POVPOV格式文件,格式文件,直接調(diào)用直接調(diào)用PovPov-Ray-Ray軟件,生成相應(yīng)的非常高質(zhì)量的三維圖像。軟件,生成相應(yīng)的非常高質(zhì)量的三維圖像。MolPOVMolPOV 2.0.8 .CPHmodelsCPHmodelsCPHmodelsCPHmodels是采用同源建模來(lái)預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)的是采用同源建模來(lái)預(yù)測(cè)蛋白質(zhì)三級(jí)結(jié)構(gòu)的一個(gè)網(wǎng)絡(luò)服務(wù)器,同時(shí)也采用了以預(yù)測(cè)距離為基礎(chǔ)的一個(gè)網(wǎng)絡(luò)服務(wù)器,同時(shí)也采用了以預(yù)測(cè)距離為基礎(chǔ)的串線串線( (threading)threading)算法。網(wǎng)址:算法。網(wǎng)址:http:/www.cbs.dtu.d

35、k/services/CPHmodels/。 同源建模是先在蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)中搜索目標(biāo)蛋白的同同源建模是先在蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)中搜索目標(biāo)蛋白的同源蛋白作為模板,將目標(biāo)蛋白與模板進(jìn)行比對(duì),再運(yùn)源蛋白作為模板,將目標(biāo)蛋白與模板進(jìn)行比對(duì),再運(yùn)用一定的運(yùn)算方法,以模板結(jié)構(gòu)為基礎(chǔ)構(gòu)建模型,進(jìn)用一定的運(yùn)算方法,以模板結(jié)構(gòu)為基礎(chǔ)構(gòu)建模型,進(jìn)行模型優(yōu)化,將構(gòu)建的模型作為預(yù)測(cè)的結(jié)果。行模型優(yōu)化,將構(gòu)建的模型作為預(yù)測(cè)的結(jié)果。 串線算法是利用折疊識(shí)別預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的方法,串線算法是利用折疊識(shí)別預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的方法,首先從蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中挑選蛋白質(zhì)結(jié)構(gòu)建立折疊首先從蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中挑選蛋白質(zhì)結(jié)構(gòu)建立折疊子數(shù)據(jù)庫(kù),以折疊

36、子數(shù)據(jù)庫(kù)中的折疊結(jié)構(gòu)作為模板,子數(shù)據(jù)庫(kù),以折疊子數(shù)據(jù)庫(kù)中的折疊結(jié)構(gòu)作為模板,將目標(biāo)序列與這些模板一一匹配,通過(guò)計(jì)算打分函數(shù)將目標(biāo)序列與這些模板一一匹配,通過(guò)計(jì)算打分函數(shù)的值判斷匹配程度,根據(jù)打分值給模板結(jié)構(gòu)排序,其的值判斷匹配程度,根據(jù)打分值給模板結(jié)構(gòu)排序,其中打分最高的被認(rèn)為是目標(biāo)序列最可能采取的折疊結(jié)中打分最高的被認(rèn)為是目標(biāo)序列最可能采取的折疊結(jié)構(gòu)。構(gòu)。WX3 3.MMDB .MMDB http:/http:/sander.ebi.ac.uk/hsspsander.ebi.ac.uk/hssp/ / 所有實(shí)驗(yàn)測(cè)定的三維結(jié)構(gòu)所有實(shí)驗(yàn)測(cè)定的三維結(jié)構(gòu) 現(xiàn)在,許多蛋白質(zhì)家族的三維結(jié)構(gòu)已經(jīng)知道、現(xiàn)在

37、,許多蛋白質(zhì)家族的三維結(jié)構(gòu)已經(jīng)知道、因此很有可能在搜索序列數(shù)據(jù)庫(kù)時(shí)會(huì)碰到巳知結(jié)因此很有可能在搜索序列數(shù)據(jù)庫(kù)時(shí)會(huì)碰到巳知結(jié)構(gòu)的同源物。構(gòu)的同源物。EntrezEntrez的三維納構(gòu)數(shù)據(jù)庫(kù)的目標(biāo)就是的三維納構(gòu)數(shù)據(jù)庫(kù)的目標(biāo)就是使這些信息以及其提供的功能注釋能夠很方便地提使這些信息以及其提供的功能注釋能夠很方便地提供給分子生物學(xué)家。比如,人們可能會(huì)選與一個(gè)感供給分子生物學(xué)家。比如,人們可能會(huì)選與一個(gè)感興趣的序列相似的所有的序列,以及到所有已知的興趣的序列相似的所有的序列,以及到所有已知的三維結(jié)構(gòu)的鏈接。在確定一個(gè)已知結(jié)構(gòu)的同源物后,三維結(jié)構(gòu)的鏈接。在確定一個(gè)已知結(jié)構(gòu)的同源物后,人們可以通過(guò)觀察分子圖像相比對(duì)情況來(lái)推導(dǎo)近似人們可以通過(guò)觀察分子圖像相比對(duì)情況來(lái)推導(dǎo)近似的的3 3D D結(jié)構(gòu)。結(jié)構(gòu)。五五. . 蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)1.1.DSSPDSSP 蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)蛋白質(zhì)二級(jí)結(jié)構(gòu)數(shù)據(jù)庫(kù)DSSPDSSP(database of

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論