蛋白質(zhì)組相關(guān)生物信息學(xué)課件_第1頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)課件_第2頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)課件_第3頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)課件_第4頁(yè)
蛋白質(zhì)組相關(guān)生物信息學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 過去十年中,全世界的分子生物學(xué)家們所收集的原始信息不斷激增。在不太久之前,這些信息的分析整理工作只有不情愿的研究生去做,因?yàn)樗麄儗?duì)擺弄試管比敲擊鍵盤更有興趣,而現(xiàn)在有很多人已全身心地投入了這個(gè)領(lǐng)域。生物信息學(xué)正處于新興萌芽中,它可以不嚴(yán)格地定義為分子生物學(xué)和計(jì)算生物學(xué)的交叉,這個(gè)領(lǐng)域中已經(jīng)產(chǎn)生了大量重要的發(fā)現(xiàn),并有希望揭示更多大自然的奧秘。對(duì)大多數(shù)人而言,生物信息學(xué)的吸引力在于它是生物學(xué)中嶄新和有待開墾的領(lǐng)域;而對(duì)其他人,其吸引力蘊(yùn)藏在簡(jiǎn)化論者對(duì)化學(xué)層次上的細(xì)節(jié)的熱愛和系統(tǒng)遺傳學(xué)家對(duì)了解各物種體系之間內(nèi)在關(guān)系的興趣之中。生物信息學(xué)的好處早已作為談資得以廣泛宣揚(yáng),它被宣稱是能解決一切痼疾的仙丹

2、,或是肢解序列數(shù)據(jù)的強(qiáng)大工具,或簡(jiǎn)稱之為搞科學(xué)一條迷人途徑。而實(shí)際上,生物信息學(xué)是在艱難而有意義工作中的一種新的方法。這一領(lǐng)域中,研究方法大多在不斷變化并有待發(fā)展和完善,與當(dāng)年生物化學(xué)的黃金年代并無不同,那時(shí)人們選擇各種能溶解和分析目標(biāo)分子的手段,不象如今生化實(shí)驗(yàn)室中所用技術(shù)要成熟和精巧得多。然而,在生物信息學(xué)被推向前進(jìn)的競(jìng)賽中,一些人曾企圖將其從科學(xué)分支降級(jí)為購(gòu)買了合適工具包就完成的功能。而維護(hù)了生物信息學(xué)在科學(xué)領(lǐng)域中地位的正是學(xué)術(shù)用戶群體本身,無論他們是在私立大學(xué)里還是在政府贊助的研究中心里。生物信息學(xué)中已取得的卓越進(jìn)展就蘊(yùn)藏在從收集整理原始數(shù)據(jù),到開發(fā)更新更強(qiáng)的數(shù)據(jù)處理方法的工作之中,而

3、且一切均處于信息和技術(shù)自由共享的環(huán)境里。生物信息學(xué)群體的獨(dú)特之處在于,在商業(yè)部門之外,其“團(tuán)體精神”比生物學(xué)中許多競(jìng)爭(zhēng)性領(lǐng)域要開放得多。由此想法,本書試圖能讓那些想了解更多序列分析方法的科學(xué)家跳進(jìn)書中,來體驗(yàn)令人著迷的科學(xué)旅途。蛋白質(zhì)組研究中的生物信息學(xué) 第一節(jié) 生物信息學(xué)簡(jiǎn)介一、什么是生物信息學(xué) 生物信息學(xué)是隨著人類基因組計(jì)劃而發(fā)展起來的。生物信息學(xué)是一門新興的交叉學(xué)科。它包含了生物信息的獲取、處理、存儲(chǔ)、發(fā)布、分析和解釋等在內(nèi)的所有方面它綜合運(yùn)用數(shù)學(xué)、計(jì)算機(jī)科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。二、生物信息學(xué)的研究?jī)?nèi)容 生物信息學(xué)從有以下研究?jī)?nèi)容。 1序列比對(duì) 基

4、本問題是比較兩個(gè)或兩個(gè)以上符號(hào)序列的相似性或不相似性。序列比對(duì)是生物信息學(xué)的基礎(chǔ),非常重要。2. 結(jié)構(gòu)比對(duì) 比較兩個(gè)或兩個(gè)以上蛋白質(zhì)分子空間結(jié)構(gòu)的相似性或不相似性。3. 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè) 包括二級(jí)和三級(jí)結(jié)構(gòu)預(yù)測(cè),是最重要的課題之一。4. 計(jì)算機(jī)輔助基因識(shí)別 基本問題是給定基因組序列后,正確識(shí)別基因的范圍和在基因組序列中的精確位置。這是最重要的課題之一。5. 非編碼區(qū)分析和DNA語言研究 在人類基因組中,編碼部分占總序列的3一5,其他通常稱為“垃圾”DNA,其實(shí)一點(diǎn)也不是垃圾,只是我們暫時(shí)還不知道其重要的功能。分析非編碼區(qū)DNA序列需要大膽的想象和嶄新的研究思路相方法。DNA序列作為一種遺傳語言,

5、不僅體現(xiàn)在編碼序列之中,而且隱含在非編碼序列之中。6. 分子進(jìn)化和比較基因組學(xué) 早期的工作主要是利用不同物種中同一種基因序列的異同來研究生物的進(jìn)化,構(gòu)建進(jìn)化樹。既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至可通過相關(guān)蛋白質(zhì)的結(jié)構(gòu)比對(duì)來研究分子進(jìn)化。 近年來由于較多模式生物基因組測(cè)序任務(wù)的完成,為從整個(gè)基因組的角度來研究分子進(jìn)化提供了條件。7. 序列重疊群裝配 一般來說,根據(jù)現(xiàn)行的測(cè)序技術(shù),每次反應(yīng)只能測(cè)比500 bp或更多一些堿基對(duì)的序列,這就有一個(gè)由大量的較短的序列全體構(gòu)成的重疊群。逐步把它們拼接起來形成序列更長(zhǎng)的重疊群,直至得到完整序列的過程稱為重疊群裝配。8遺傳密碼的起源 遺傳密

6、碼為什么是現(xiàn)在這樣的?這一直是一個(gè)謎。一種最簡(jiǎn)單的理論認(rèn)為,密碼子與氨基酸之間的關(guān)系是生物進(jìn)化歷史上一次偶然的事件而造成的,并被固定在現(xiàn)代生物最后的共同祖先里,一直延續(xù)至今。不同于這種“凍結(jié)”理論,有人曾分別提出過選擇優(yōu)化、化學(xué)和歷史等三種學(xué)說來解釋遺傳密碼。隨著各種生物基因組測(cè)序任務(wù)的完成,為研究遺傳密碼的起源和檢驗(yàn)上述理論的真?zhèn)翁峁┝诵碌乃夭摹?9基于結(jié)構(gòu)的藥物設(shè)計(jì) 人類基因組計(jì)劃的目的之一在于闡明人的約10萬種蛋白質(zhì)的結(jié)構(gòu)、功能、相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)的藥物設(shè)計(jì)是生物信息學(xué)中的極為重要的研究領(lǐng)域。10生物信息處理并行

7、算法的研究 由于生物信息數(shù)據(jù)的規(guī)模極其巨大,因此國(guó)內(nèi)外都開展了生物信息處理算法并行化方向的研究。主要是研究生物信息學(xué)中的一些關(guān)鍵的算法,研究其中的可并行性然后將其固化到硬件芯片中,從而提高整個(gè)計(jì)算系統(tǒng)的性能。11. 其它 如基因表達(dá)譜分析,代謝網(wǎng)絡(luò)分析,基因芯片設(shè)計(jì)和蛋白質(zhì)組學(xué)數(shù)據(jù)分析逐漸成為生物信息學(xué)中新興的重要研究領(lǐng)域。 2001年9月,國(guó)家科學(xué)技術(shù)部對(duì)“生物和現(xiàn)代農(nóng)業(yè)技術(shù)領(lǐng)域生物信息技術(shù)主題”提出的目標(biāo)是: 實(shí)現(xiàn)生物技術(shù)與信息技術(shù)以及其他學(xué)科的結(jié)合,實(shí)現(xiàn)基因組數(shù)據(jù)、蛋白質(zhì)組和結(jié)構(gòu)基因組數(shù)據(jù)、天然及合成化合物數(shù)據(jù)的計(jì)算機(jī)處理、分析和可視化,以及生物實(shí)驗(yàn)和生物分子的模擬設(shè)計(jì),解析蛋白質(zhì)三維結(jié)

8、構(gòu)和蛋白質(zhì)組的時(shí)空表達(dá)關(guān)系等,提高生物信息處理、分析和利利用的水平。三. 我國(guó)生物信息學(xué)研究的目標(biāo)主要內(nèi)容是: 1生物信息的獲取與開發(fā) 2生物信息加工和利用 3結(jié)構(gòu)基因組和蛋白質(zhì)組學(xué)研究 4高通量藥物篩選及相關(guān)技術(shù) 5. 小分子藥物設(shè)計(jì)和分子設(shè)計(jì) 6. 生物芯片 7. 化學(xué)創(chuàng)新藥物和新劑型四. 蛋白質(zhì)組研究中生物信息學(xué)的任務(wù)Proteomic analysis requires highly sophisticated bioinformatic tools in not only electrophoretic and MS separation but also in the assign

9、ement of physicochemical properties and prediction of potential post-translational modifications and 3D structuresDatabases exist for the protein maps of a broad range of organisms, tissues, and disease statesUltimately, given the dynamic nature of the proteome, complex experimental details and rela

10、ted results need to be extrapolated in the context of the relevant biochemical pathways or disease implicationsFor example:How to classify proteins into functional classes?How to compare one proteome with another?How to include functional/activity/pathway information in databases?How to extract func

11、tional motifs from sequence data?How to predict phenotype from proteotype? How to correlate changes in protein expression with disease? How to distinguish important from unimportant changes in expression? How to compare, archive, retrieve gel data? How to rapidly, accurately identify proteins from M

12、S and 2D gel data? How to include expression info in databases? How to predict 3D structure from 1D sequence? How to determine function from structure? How to classify proteins on basis of structure? How to recognize 3D motifs and patterns? How to use bioinformatics databases to help in 3D structure

13、 determination? How to predict which proteins will express well or produce stable, folded molecules?第二節(jié) 數(shù)據(jù)庫(kù)的構(gòu)建 數(shù)據(jù)庫(kù)是生物信息學(xué)的主要內(nèi)容,各種數(shù)據(jù)庫(kù)幾乎覆蓋了生物科學(xué)的各個(gè)領(lǐng)域。 美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室1979年開通的基因庫(kù)Genbank,現(xiàn)在由1988年成立的國(guó)家生物信息中心(NCBI)管理維護(hù)。 歐洲分子生物學(xué)實(shí)驗(yàn)室1982年開始服務(wù)的EMBL數(shù)據(jù)庫(kù)和隨后建立的歐洲生物網(wǎng)(EMBNet)1994年改由當(dāng)年建在英國(guó)劍橋的歐洲生物信息研究所(EBI)管理。 日本1984年著手建

14、立國(guó)家級(jí)的核較數(shù)據(jù)庫(kù)DDBJ,1987年正式服務(wù)。目前絕大部分核酸和蛋白質(zhì)數(shù)據(jù)由美國(guó)、歐洲和日本產(chǎn)生,以上三家共同組成了DDBJ/EMBIGeneBank國(guó)際核酸序列數(shù)據(jù)庫(kù)。其他國(guó)家如德國(guó)、法國(guó)、意大利等也紛紛建立自己的數(shù)據(jù)庫(kù),為本國(guó)服務(wù)。第三節(jié) 蛋白質(zhì)組研究中常用的網(wǎng)站及數(shù)據(jù)庫(kù)從1994 年起每年第一期 (Nucleic Acid Research) 是分子生物學(xué)數(shù)據(jù)庫(kù)???,由專人綜述當(dāng)前的在線分子生物學(xué)數(shù)據(jù)庫(kù)資源。SWISS-PROT/TrEMBL 高度注釋(比如蛋白功能描述、結(jié)構(gòu)域結(jié)構(gòu)、轉(zhuǎn)錄后修飾、變異等),冗余程度最低,與其他數(shù)據(jù)庫(kù)整合程度最高。TrEMBL是SWISS-PROT的補(bǔ)充

15、,含有所有的EMBL核苷酸的翻譯產(chǎn)物,但未整合進(jìn)SWISS-PROT 。Protein Information Resource(PIR) 廣泛的、注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù)。蛋白信息資源與慕尼黑蛋白序列信息中及日本國(guó)際蛋白質(zhì)信息數(shù)據(jù)庫(kù)合作,產(chǎn)生的公共領(lǐng)域中最廣泛的熟練注釋的蛋白序列數(shù)據(jù)庫(kù)-PIR國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(kù)。NCBInr 是一個(gè)非冗余的蛋白質(zhì)數(shù)據(jù)庫(kù),由NCBI搜集,以供其搜索工具BLAST和Entrez所用。 dbEST 是GenBank的分支,含有從大量的生物中來的一次反應(yīng)測(cè)序得到的cDNA或叫表達(dá)序列標(biāo)簽。這是一個(gè)核酸數(shù)據(jù)庫(kù),被Mascot從6個(gè)相位翻譯得到。OWLOWL混

16、合蛋白質(zhì)數(shù)據(jù)庫(kù)(Composite Protein Sequence Database)是一個(gè)非冗余的蛋白質(zhì)序列數(shù)據(jù)庫(kù),由4個(gè)公用的一級(jí)資源組成:SWISS-PROT、PIR、Genbank和NRL-3D。UniGene 美國(guó)國(guó)家生物技術(shù)信息中心(NCBl)提供的公用數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)將GenBank中屬于同一條基因的所有片段拼接成完整的基因進(jìn)行收錄。7.其它數(shù)據(jù)庫(kù)如下圖 PDB中的每條記錄有顯式序列(explicit sequence)和隱式序列(implicit sequence)信息。 PDB的隱式序列即為立體化學(xué)數(shù)據(jù),包括每個(gè)原子的名稱和原子的三維坐標(biāo)。在實(shí)際應(yīng)用中,PDB數(shù)據(jù)庫(kù)應(yīng)與結(jié)構(gòu)

17、模型顯示軟件相結(jié)合。由于PDB的主要信息是三維結(jié)構(gòu),如果直接將三維結(jié)構(gòu)信息以文本的形式返回給用戶,用戶將難以讀懂這些信息。實(shí)用的方法是通過分子模型軟件,以圖形方式顯示三維結(jié)構(gòu)?;ヂ?lián)網(wǎng)上有許多可以利用的分子模型軟件如RasMol、 CHIME 、MolPOV等,這些軟件能夠以各種各樣的模型顯示出生物大分子的三維結(jié)構(gòu)如結(jié)構(gòu)骨架模型、棒狀模型、球棒模型、空間填充模型和帶狀模型等。此外,PDB還說明了蛋白質(zhì)某些特定部位的二級(jí)結(jié)構(gòu)類型如a螺旋和b折疊。觀看生物分子3D微觀立體結(jié)構(gòu)的軟件,可以旋轉(zhuǎn),以多個(gè)模式觀看,并可以存成普通圖形文件。 IE與NetScape瀏覽器插件,安裝后,可以直接用瀏覽器觀看PD

18、B格式的文件,直接在瀏覽器中觀看3D分子。 CHIME 2.6 SP6是PDB格式至POV格式轉(zhuǎn)化工具,可以將大分子PDB格式文件轉(zhuǎn)化為POV格式,以便用pov-ray進(jìn)行三維渲染,生成質(zhì)量非常高的分子三維圖形。軟件有許多選項(xiàng),只需設(shè)定這些選項(xiàng),便能生成相應(yīng)的POV格式文件,直接調(diào)用Pov-Ray軟件,生成相應(yīng)的非常高質(zhì)量的三維圖像。MolPOV 2.0.82.CPHmodelsWX23.MMDB http:/sander.ebi.ac.uk/hssp/ 所有實(shí)驗(yàn)測(cè)定的三維結(jié)構(gòu) 現(xiàn)在,許多蛋白質(zhì)家族的三維結(jié)構(gòu)已經(jīng)知道、因此很有可能在搜索序列數(shù)據(jù)庫(kù)時(shí)會(huì)碰到巳知結(jié)構(gòu)的同源物。Entrez的三維納構(gòu)

19、數(shù)據(jù)庫(kù)的目標(biāo)就是使這些信息以及其提供的功能注釋能夠很方便地提供給分子生物學(xué)家。比如,人們可能會(huì)選與一個(gè)感興趣的序列相似的所有的序列,以及到所有已知的三維結(jié)構(gòu)的鏈接。在確定一個(gè)已知結(jié)構(gòu)的同源物后,人們可以通過觀察分子圖像相比對(duì)情況來推導(dǎo)近似的3D結(jié)構(gòu)。 DSSP還包括一個(gè)實(shí)用程序,根據(jù)蛋白質(zhì)的三維結(jié)構(gòu)用它就可以計(jì)算一個(gè)蛋白質(zhì)所對(duì)應(yīng)的二級(jí)結(jié)構(gòu)。在DSSP數(shù)據(jù)庫(kù)中,蛋白質(zhì)的二級(jí)結(jié)構(gòu)共分7種類型,其編碼含義是:H代表a螺旋,E代表b折疊,G和I分別代表3-螺旋和p螺旋,B代表孤立的b橋,T代表氫鍵轉(zhuǎn)折,S代表彎曲。DSSP二級(jí)結(jié)構(gòu)實(shí)例 六. 在線蛋白工具樹立質(zhì)量法制觀念、提高全員質(zhì)量意識(shí)。7月-227月-22Sunday, July 31, 2022人生得意須盡歡,莫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論