蛋白質(zhì)生物信息學_第1頁
蛋白質(zhì)生物信息學_第2頁
蛋白質(zhì)生物信息學_第3頁
蛋白質(zhì)生物信息學_第4頁
蛋白質(zhì)生物信息學_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

關于蛋白質(zhì)生物信息學第一節(jié)生物信息學與蛋白質(zhì)工程一、生物信息學概述生物信息學是利用應用數(shù)學、信息學、統(tǒng)計學和計算機科學的方法研究生物學的問題。1987年,林華安首創(chuàng)Bioinformation一詞,被譽為”世界生物信息之父”。第2頁,共49頁,2024年2月25日,星期天生物信息學分子生物學與信息技術(尤其是互聯(lián)網(wǎng)技術)的結(jié)合體。研究材料和結(jié)果就是各種各樣的生物學數(shù)據(jù)研究工具是計算機研究方法包括對生物學數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。概述第3頁,共49頁,2024年2月25日,星期天研究內(nèi)容1、生物信息的收集、存儲、管理與提供2、基因組序列信息的提取和分析3、功能基因組相關信息分析4、生物大分子結(jié)構模擬和藥物設計5、生物信息分析的技術與方法研究第4頁,共49頁,2024年2月25日,星期天2001年2月,人類基因組工程測序的完成,使生物信息學走向了一個高潮。由于DNA自動測序技術的快速發(fā)展,DNA數(shù)據(jù)庫中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長,生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無疑問,我們正從一個積累數(shù)據(jù)向解釋數(shù)據(jù)的時代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊含著潛在突破性發(fā)現(xiàn)的可能。“生物信息學”正是從這一前提產(chǎn)生的交叉學科。發(fā)展條件第5頁,共49頁,2024年2月25日,星期天核心內(nèi)容是研究如何通過對DNA序列的統(tǒng)計計算分析,更加深入地理解DNA序列,結(jié)構,演化及其與生物功能之間的關系。研究課題涉及到分子生物學,分子演化及結(jié)構生物學,統(tǒng)計學及計算機科學等許多領域。第6頁,共49頁,2024年2月25日,星期天以數(shù)據(jù)(庫)為核心1數(shù)據(jù)庫的建立2生物學數(shù)據(jù)的檢索3生物學數(shù)據(jù)的處理4生物學數(shù)據(jù)的利用:計算生物學研究過程第7頁,共49頁,2024年2月25日,星期天由于生物信息學是基于分子生物學與多種學科交叉而成的新學科,現(xiàn)有的形勢仍表現(xiàn)為各種學科的簡單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒有行之有效的一般性方法;而對于大規(guī)模數(shù)據(jù)內(nèi)在的生成機制也沒有完全明了,這使得生物信息學的研究短期內(nèi)很難有突破性的結(jié)果。研究展望第8頁,共49頁,2024年2月25日,星期天要真正解決這一問題,最終不能從計算機科學得到,真正地解決可能還是得從生物學自身,從數(shù)學上的新思路來獲得本質(zhì)性的動力。毫無疑問,正如Dulbecco1986年所說:"DNA序列是人類的真諦,這個世界上發(fā)生的一切事情,都與這一序列息息相關"。但要完全破譯這一序列以及相關的內(nèi)容,我們還有相當長的路要走。研究展望第9頁,共49頁,2024年2月25日,星期天二、生物信息學與蛋白質(zhì)工程(一)蛋白質(zhì)序列分析,預測其理化性質(zhì)、空間結(jié)構及生物學功能(二)蛋白質(zhì)結(jié)構預測理論分析法:在理論計算的基礎上預測統(tǒng)計分析法:建立序列-結(jié)構的映射模型(三)蛋白質(zhì)功能預測P162(四)蛋白質(zhì)分子設計第10頁,共49頁,2024年2月25日,星期天三、生物信息學與蛋白質(zhì)組學1994、澳大利亞Wilkins和Willians提出蛋白質(zhì)組:由全部基因表達的全部蛋白質(zhì)及其存在方式,是一種細胞、組織或完整的生命體在特定時空上所擁有的全套蛋白質(zhì)蛋白質(zhì)組學:以蛋白質(zhì)為研究對象,闡明某生物體全部蛋白質(zhì)的表達模式及功能模式生物信息學理論、技術方法和軟件等在蛋白質(zhì)組學相關數(shù)據(jù)庫的建立、應用以及蛋白質(zhì)組分析等方面具有重要的應用第11頁,共49頁,2024年2月25日,星期天生物信息學作為一門新的學科領域,把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進行蛋白質(zhì)空間結(jié)構模擬和預測,然后依據(jù)特定蛋白質(zhì)的功能進行必要的藥物設計?;蚪M信息學,蛋白質(zhì)空間結(jié)構模擬以及藥物設計構成了生物信息學的3個重要組成部分。第12頁,共49頁,2024年2月25日,星期天第二節(jié)蛋白質(zhì)常用數(shù)據(jù)庫及應用一次數(shù)據(jù)庫:實驗獲得的原始數(shù)據(jù)。簡單歸類整理、注釋。Genbank、Swiss-Prot、PDB二次數(shù)據(jù)庫:在一次數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎上,根據(jù)研究內(nèi)容的需要,對相關生物知識和信息進一步分析整理。包括人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點庫TRANSFAC、蛋白質(zhì)結(jié)構家族分類庫SCOP等。第13頁,共49頁,2024年2月25日,星期天第二節(jié)、蛋白質(zhì)常用數(shù)據(jù)庫一、核酸數(shù)據(jù)庫NCBI的Genbank、EMBL、DDBJ等第14頁,共49頁,2024年2月25日,星期天二、蛋白質(zhì)數(shù)據(jù)庫(一)蛋白序列數(shù)據(jù)庫:SWISS-PROT、PIR、TreEMBL、UniProt、GenPept第15頁,共49頁,2024年2月25日,星期天(二)蛋白序列二次數(shù)據(jù)庫蛋白保守區(qū)域和功能位點數(shù)據(jù)庫,PROSITE、PRINTS、BLOCKS第16頁,共49頁,2024年2月25日,星期天(三)蛋白結(jié)構數(shù)據(jù)庫三維結(jié)構數(shù)據(jù)庫PBD、MMDB第17頁,共49頁,2024年2月25日,星期天全人源抗EGFR單克隆抗體紅色字體為信號肽,標黃部分為可變區(qū)重鏈可變區(qū)(HV)DNA序列(423bp)ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGACAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGATTCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTACAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATATCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGACCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTGGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA

第18頁,共49頁,2024年2月25日,星期天ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtaggagacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAATTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGCATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGGGACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAACATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGACCAAGGTGGAGATCAAACGTACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGT輕鏈全長(L)DNA序列(708bp)第19頁,共49頁,2024年2月25日,星期天GGTGGTGGTGGCTCTGGCGGTGGTGGCTCTGGTGGCGGTGGTTCT連接肽(G4S)3蛋白質(zhì)分子設計:VH-L-LVHVLCLlinker第20頁,共49頁,2024年2月25日,星期天第21頁,共49頁,2024年2月25日,星期天利用DNAman對VH-L-L的限制性內(nèi)切酶位點分析,結(jié)果顯示VH-L-L有31個限制性酶切位點,最多的是Eco57Ⅰ、TthlllⅠ分別有三個酶切位點。第22頁,共49頁,2024年2月25日,星期天第23頁,共49頁,2024年2月25日,星期天利用生物信息學軟件DNAman將VH-L-L的核苷酸序列翻譯為氨基酸序列第24頁,共49頁,2024年2月25日,星期天

利用NCBI提供的ORFFinder預測VH-L-L的ORF,從預測結(jié)果看出VH-L-L是一段連續(xù)的較長的ORF,它可能是一個完整的編碼序列第25頁,共49頁,2024年2月25日,星期天

利用ProtParam對VH-L-L的氨基酸序列及基本理化性質(zhì)進行了分析。結(jié)果顯示VH-L-L蛋白由392個氨基酸組成的穩(wěn)定蛋白,分子式為C1867H2894N494O596S11

,分子量42149.1,等電點5.98。理論推導半衰期為:30h(體外,哺乳動物的網(wǎng)織紅細胞內(nèi))、20h(體內(nèi),酵母細胞內(nèi))、10h(體內(nèi),大腸桿菌)。不穩(wěn)定參數(shù)是38.92,屬于穩(wěn)定蛋白。含的氨基酸如圖所示:Ser(S),Glu(G),Thr(T)最多,分別占15.1%,9.9%,7.7%;不含Pyl(0),Sec(U)。總帶正電荷殘基(Asp+Glu)為32,負電荷殘基(Arg+Lys)為29。總的親水性平均系數(shù)-0.169,預測該蛋白屬于親水性蛋白。第26頁,共49頁,2024年2月25日,星期天第27頁,共49頁,2024年2月25日,星期天第28頁,共49頁,2024年2月25日,星期天蛋白質(zhì)的親疏水性是影響蛋白質(zhì)空間結(jié)構的因素之一。利用ProtScale分析氨基酸親水性/疏水性,預測結(jié)果顯示該氨基酸序列中親水性和疏水性區(qū)域間隔存在,小部分為中性,在氨基酸序列20、170處出現(xiàn)了較高的疏水性,此處富含疏水性氨基酸??傮w來說,親水氨基酸多于疏水氨基酸,因此可以認為VH-L-L是親水性蛋白第29頁,共49頁,2024年2月25日,星期天第30頁,共49頁,2024年2月25日,星期天

利用Tmpred分析VH-L-L的跨膜區(qū),分析表明,該序列無跨膜區(qū),不是跨膜蛋白??梢灶A測該蛋白在膜外第31頁,共49頁,2024年2月25日,星期天利用NetPhos進行磷酸化位點分析,結(jié)果顯示磷酸化位點主要包括絲氨酸Ser位點:28個,蘇氨酸Thr:5個,酪氨酸Tyr:3個第32頁,共49頁,2024年2月25日,星期天

利用TargetP對VH-L-L蛋白的亞細胞定位進行預測,結(jié)果表明,VH-L-L是分泌到細胞周質(zhì)的蛋白第33頁,共49頁,2024年2月25日,星期天III 蛋白質(zhì)二級結(jié)構預測蛋白質(zhì)序列:

二級結(jié)構:↓第34頁,共49頁,2024年2月25日,星期天1、二級結(jié)構預測概述蛋白質(zhì)的二級結(jié)構預測的基本依據(jù)是: 每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構的傾向。二級結(jié)構預測問題是模式分類問題二級結(jié)構預測的目標:判斷每一段中心的殘基是否處于

螺旋、

折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構態(tài),即三態(tài)。

第35頁,共49頁,2024年2月25日,星期天蛋白質(zhì)結(jié)構預測主要有兩大類方法:(1)理論分析方法通過理論計算(如分子力學、分子動力學計算)進行結(jié)構預測。(2)統(tǒng)計的方法對已知結(jié)構的蛋白質(zhì)進行統(tǒng)計分析,建立序列到結(jié)構的映射模型,進而對未知結(jié)構的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預測結(jié)構。包括:經(jīng)驗性方法(Chou-Fasman)、結(jié)構規(guī)律提取方法(神經(jīng)網(wǎng)絡方法)、同源模型化方法第36頁,共49頁,2024年2月25日,星期天經(jīng)驗參數(shù)法由Chou和Fasman在70年代提出.是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預測方法。 通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結(jié)構構象的傾向性因子,進而利用這些傾向性因子預測蛋白質(zhì)的二級結(jié)構。

第37頁,共49頁,2024年2月25日,星期天經(jīng)驗參數(shù)法蛋白質(zhì)二級結(jié)構的組成規(guī)律性比較強三種基本二級結(jié)構平均占氨基酸殘基的85%各種二級結(jié)構非均勻地分布在蛋白質(zhì)中第38頁,共49頁,2024年2月25日,星期天有些蛋白質(zhì)中含有大量的

螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的

螺旋如鐵氧蛋白有些蛋白質(zhì)的二級結(jié)構以

折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M)傾向于形成

螺旋肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會形成

螺旋

第39頁,共49頁,2024年2月25日,星期天每種氨基酸出現(xiàn)在各種二級結(jié)構中傾向或者頻率是不同的例如:Glu主要出現(xiàn)在

螺旋中

Asp和Gly主要分布在轉(zhuǎn)角中

Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會出現(xiàn)在

螺旋中可以根據(jù)每種氨基酸殘基形成二級結(jié)構的傾向性或者統(tǒng)計規(guī)律進行二級結(jié)構預測第40頁,共49頁,2024年2月25日,星期天基本策略(1)

相似序列→相似結(jié)構QLMGERIRARRKKLKQLMGAERIRARRKKLK結(jié)構?第41頁,共49頁,2024年2月25日,星期天基本策略(2)

分類分析α螺旋提取樣本聚類分析學習分類規(guī)則預測….-Gly-Ala-Glu-Phe-….第42頁,共49頁,2024年2月

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論