蛋白質(zhì)生物信息學(xué)_第1頁
蛋白質(zhì)生物信息學(xué)_第2頁
蛋白質(zhì)生物信息學(xué)_第3頁
蛋白質(zhì)生物信息學(xué)_第4頁
蛋白質(zhì)生物信息學(xué)_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于蛋白質(zhì)生物信息學(xué)第1頁,講稿共49頁,2023年5月2日,星期三第一節(jié)生物信息學(xué)與蛋白質(zhì)工程一、生物信息學(xué)概述生物信息學(xué)是利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的方法研究生物學(xué)的問題。1987年,林華安首創(chuàng)Bioinformation一詞,被譽(yù)為”世界生物信息之父”。第2頁,講稿共49頁,2023年5月2日,星期三生物信息學(xué)分子生物學(xué)與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù)研究工具是計(jì)算機(jī)研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計(jì)算、模擬)。概述第3頁,講稿共49頁,2023年5月2日,星期三研究?jī)?nèi)容1、生物信息的收集、存儲(chǔ)、管理與提供2、基因組序列信息的提取和分析3、功能基因組相關(guān)信息分析4、生物大分子結(jié)構(gòu)模擬和藥物設(shè)計(jì)5、生物信息分析的技術(shù)與方法研究第4頁,講稿共49頁,2023年5月2日,星期三2001年2月,人類基因組工程測(cè)序的完成,使生物信息學(xué)走向了一個(gè)高潮。由于DNA自動(dòng)測(cè)序技術(shù)的快速發(fā)展,DNA數(shù)據(jù)庫中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長(zhǎng),生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無疑問,我們正從一個(gè)積累數(shù)據(jù)向解釋數(shù)據(jù)的時(shí)代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊(yùn)含著潛在突破性發(fā)現(xiàn)的可能?!吧镄畔W(xué)”正是從這一前提產(chǎn)生的交叉學(xué)科。發(fā)展條件第5頁,講稿共49頁,2023年5月2日,星期三核心內(nèi)容是研究如何通過對(duì)DNA序列的統(tǒng)計(jì)計(jì)算分析,更加深入地理解DNA序列,結(jié)構(gòu),演化及其與生物功能之間的關(guān)系。研究課題涉及到分子生物學(xué),分子演化及結(jié)構(gòu)生物學(xué),統(tǒng)計(jì)學(xué)及計(jì)算機(jī)科學(xué)等許多領(lǐng)域。第6頁,講稿共49頁,2023年5月2日,星期三以數(shù)據(jù)(庫)為核心1數(shù)據(jù)庫的建立2生物學(xué)數(shù)據(jù)的檢索3生物學(xué)數(shù)據(jù)的處理4生物學(xué)數(shù)據(jù)的利用:計(jì)算生物學(xué)研究過程第7頁,講稿共49頁,2023年5月2日,星期三由于生物信息學(xué)是基于分子生物學(xué)與多種學(xué)科交叉而成的新學(xué)科,現(xiàn)有的形勢(shì)仍表現(xiàn)為各種學(xué)科的簡(jiǎn)單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒有行之有效的一般性方法;而對(duì)于大規(guī)模數(shù)據(jù)內(nèi)在的生成機(jī)制也沒有完全明了,這使得生物信息學(xué)的研究短期內(nèi)很難有突破性的結(jié)果。研究展望第8頁,講稿共49頁,2023年5月2日,星期三要真正解決這一問題,最終不能從計(jì)算機(jī)科學(xué)得到,真正地解決可能還是得從生物學(xué)自身,從數(shù)學(xué)上的新思路來獲得本質(zhì)性的動(dòng)力。毫無疑問,正如Dulbecco1986年所說:"DNA序列是人類的真諦,這個(gè)世界上發(fā)生的一切事情,都與這一序列息息相關(guān)"。但要完全破譯這一序列以及相關(guān)的內(nèi)容,我們還有相當(dāng)長(zhǎng)的路要走。研究展望第9頁,講稿共49頁,2023年5月2日,星期三二、生物信息學(xué)與蛋白質(zhì)工程(一)蛋白質(zhì)序列分析,預(yù)測(cè)其理化性質(zhì)、空間結(jié)構(gòu)及生物學(xué)功能(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)理論分析法:在理論計(jì)算的基礎(chǔ)上預(yù)測(cè)統(tǒng)計(jì)分析法:建立序列-結(jié)構(gòu)的映射模型(三)蛋白質(zhì)功能預(yù)測(cè)P162(四)蛋白質(zhì)分子設(shè)計(jì)第10頁,講稿共49頁,2023年5月2日,星期三三、生物信息學(xué)與蛋白質(zhì)組學(xué)1994、澳大利亞Wilkins和Willians提出蛋白質(zhì)組:由全部基因表達(dá)的全部蛋白質(zhì)及其存在方式,是一種細(xì)胞、組織或完整的生命體在特定時(shí)空上所擁有的全套蛋白質(zhì)蛋白質(zhì)組學(xué):以蛋白質(zhì)為研究對(duì)象,闡明某生物體全部蛋白質(zhì)的表達(dá)模式及功能模式生物信息學(xué)理論、技術(shù)方法和軟件等在蛋白質(zhì)組學(xué)相關(guān)數(shù)據(jù)庫的建立、應(yīng)用以及蛋白質(zhì)組分析等方面具有重要的應(yīng)用第11頁,講稿共49頁,2023年5月2日,星期三生物信息學(xué)作為一門新的學(xué)科領(lǐng)域,把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計(jì)。基因組信息學(xué),蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計(jì)構(gòu)成了生物信息學(xué)的3個(gè)重要組成部分。第12頁,講稿共49頁,2023年5月2日,星期三第二節(jié)蛋白質(zhì)常用數(shù)據(jù)庫及應(yīng)用一次數(shù)據(jù)庫:實(shí)驗(yàn)獲得的原始數(shù)據(jù)。簡(jiǎn)單歸類整理、注釋。Genbank、Swiss-Prot、PDB二次數(shù)據(jù)庫:在一次數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上,根據(jù)研究?jī)?nèi)容的需要,對(duì)相關(guān)生物知識(shí)和信息進(jìn)一步分析整理。包括人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點(diǎn)庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等。第13頁,講稿共49頁,2023年5月2日,星期三第二節(jié)、蛋白質(zhì)常用數(shù)據(jù)庫一、核酸數(shù)據(jù)庫NCBI的Genbank、EMBL、DDBJ等第14頁,講稿共49頁,2023年5月2日,星期三二、蛋白質(zhì)數(shù)據(jù)庫(一)蛋白序列數(shù)據(jù)庫:SWISS-PROT、PIR、TreEMBL、UniProt、GenPept第15頁,講稿共49頁,2023年5月2日,星期三(二)蛋白序列二次數(shù)據(jù)庫蛋白保守區(qū)域和功能位點(diǎn)數(shù)據(jù)庫,PROSITE、PRINTS、BLOCKS第16頁,講稿共49頁,2023年5月2日,星期三(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫三維結(jié)構(gòu)數(shù)據(jù)庫PBD、MMDB第17頁,講稿共49頁,2023年5月2日,星期三全人源抗EGFR單克隆抗體紅色字體為信號(hào)肽,標(biāo)黃部分為可變區(qū)重鏈可變區(qū)(HV)DNA序列(423bp)ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGACAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGATTCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTACAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATATCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGACCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTGGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA第18頁,講稿共49頁,2023年5月2日,星期三ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtaggagacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAATTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGCATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGGGACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAACATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGACCAAGGTGGAGATCAAACGTACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGT輕鏈全長(zhǎng)(L)DNA序列(708bp)第19頁,講稿共49頁,2023年5月2日,星期三GGTGGTGGTGGCTCTGGCGGTGGTGGCTCTGGTGGCGGTGGTTCT連接肽(G4S)3蛋白質(zhì)分子設(shè)計(jì):VH-L-LVHVLCLlinker第20頁,講稿共49頁,2023年5月2日,星期三第21頁,講稿共49頁,2023年5月2日,星期三利用DNAman對(duì)VH-L-L的限制性內(nèi)切酶位點(diǎn)分析,結(jié)果顯示VH-L-L有31個(gè)限制性酶切位點(diǎn),最多的是Eco57Ⅰ、TthlllⅠ分別有三個(gè)酶切位點(diǎn)。第22頁,講稿共49頁,2023年5月2日,星期三第23頁,講稿共49頁,2023年5月2日,星期三利用生物信息學(xué)軟件DNAman將VH-L-L的核苷酸序列翻譯為氨基酸序列第24頁,講稿共49頁,2023年5月2日,星期三

利用NCBI提供的ORFFinder預(yù)測(cè)VH-L-L的ORF,從預(yù)測(cè)結(jié)果看出VH-L-L是一段連續(xù)的較長(zhǎng)的ORF,它可能是一個(gè)完整的編碼序列第25頁,講稿共49頁,2023年5月2日,星期三

利用ProtParam對(duì)VH-L-L的氨基酸序列及基本理化性質(zhì)進(jìn)行了分析。結(jié)果顯示VH-L-L蛋白由392個(gè)氨基酸組成的穩(wěn)定蛋白,分子式為C1867H2894N494O596S11

,分子量42149.1,等電點(diǎn)5.98。理論推導(dǎo)半衰期為:30h(體外,哺乳動(dòng)物的網(wǎng)織紅細(xì)胞內(nèi))、20h(體內(nèi),酵母細(xì)胞內(nèi))、10h(體內(nèi),大腸桿菌)。不穩(wěn)定參數(shù)是38.92,屬于穩(wěn)定蛋白。含的氨基酸如圖所示:Ser(S),Glu(G),Thr(T)最多,分別占15.1%,9.9%,7.7%;不含Pyl(0),Sec(U)??値д姾蓺埢?Asp+Glu)為32,負(fù)電荷殘基(Arg+Lys)為29??偟挠H水性平均系數(shù)-0.169,預(yù)測(cè)該蛋白屬于親水性蛋白。第26頁,講稿共49頁,2023年5月2日,星期三第27頁,講稿共49頁,2023年5月2日,星期三第28頁,講稿共49頁,2023年5月2日,星期三蛋白質(zhì)的親疏水性是影響蛋白質(zhì)空間結(jié)構(gòu)的因素之一。利用ProtScale分析氨基酸親水性/疏水性,預(yù)測(cè)結(jié)果顯示該氨基酸序列中親水性和疏水性區(qū)域間隔存在,小部分為中性,在氨基酸序列20、170處出現(xiàn)了較高的疏水性,此處富含疏水性氨基酸。總體來說,親水氨基酸多于疏水氨基酸,因此可以認(rèn)為VH-L-L是親水性蛋白第29頁,講稿共49頁,2023年5月2日,星期三第30頁,講稿共49頁,2023年5月2日,星期三

利用Tmpred分析VH-L-L的跨膜區(qū),分析表明,該序列無跨膜區(qū),不是跨膜蛋白??梢灶A(yù)測(cè)該蛋白在膜外第31頁,講稿共49頁,2023年5月2日,星期三利用NetPhos進(jìn)行磷酸化位點(diǎn)分析,結(jié)果顯示磷酸化位點(diǎn)主要包括絲氨酸Ser位點(diǎn):28個(gè),蘇氨酸Thr:5個(gè),酪氨酸Tyr:3個(gè)第32頁,講稿共49頁,2023年5月2日,星期三

利用TargetP對(duì)VH-L-L蛋白的亞細(xì)胞定位進(jìn)行預(yù)測(cè),結(jié)果表明,VH-L-L是分泌到細(xì)胞周質(zhì)的蛋白第33頁,講稿共49頁,2023年5月2日,星期三III 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)序列:

二級(jí)結(jié)構(gòu):↓第34頁,講稿共49頁,2023年5月2日,星期三1、二級(jí)結(jié)構(gòu)預(yù)測(cè)概述蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本依據(jù)是: 每一段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向。二級(jí)結(jié)構(gòu)預(yù)測(cè)問題是模式分類問題二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo):判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級(jí)結(jié)構(gòu)態(tài),即三態(tài)。

第35頁,講稿共49頁,2023年5月2日,星期三蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)主要有兩大類方法:(1)理論分析方法通過理論計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。(2)統(tǒng)計(jì)的方法對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而對(duì)未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。包括:經(jīng)驗(yàn)性方法(Chou-Fasman)、結(jié)構(gòu)規(guī)律提取方法(神經(jīng)網(wǎng)絡(luò)方法)、同源模型化方法第36頁,講稿共49頁,2023年5月2日,星期三經(jīng)驗(yàn)參數(shù)法由Chou和Fasman在70年代提出.是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。 通過統(tǒng)計(jì)分析,獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)。

第37頁,講稿共49頁,2023年5月2日,星期三經(jīng)驗(yàn)參數(shù)法蛋白質(zhì)二級(jí)結(jié)構(gòu)的組成規(guī)律性比較強(qiáng)三種基本二級(jí)結(jié)構(gòu)平均占氨基酸殘基的85%各種二級(jí)結(jié)構(gòu)非均勻地分布在蛋白質(zhì)中第38頁,講稿共49頁,2023年5月2日,星期三有些蛋白質(zhì)中含有大量的螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的螺旋如鐵氧蛋白有些蛋白質(zhì)的二級(jí)結(jié)構(gòu)以折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M)傾向于形成螺旋肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會(huì)形成螺旋

第39頁,講稿共49頁,2023年5月2日,星期三每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu主要出現(xiàn)在螺旋中

Asp和Gly主要分布在轉(zhuǎn)角中

Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)在螺旋中可以根據(jù)每種氨基酸殘基形成二級(jí)結(jié)構(gòu)的傾向性或者統(tǒng)計(jì)規(guī)律進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)第40頁,講稿共49頁,2023年5月2日,星期三基本策略(1)

相似序列→相似結(jié)構(gòu)QLMGERIRARRKKLKQLMGAERIRARRKKLK結(jié)構(gòu)?第41頁,講稿共49頁,2023年5月2日,星期三基本策略(2)

分類分析α螺旋提取樣本聚類分析學(xué)習(xí)分類規(guī)則預(yù)測(cè)….-Gly-Ala-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論