版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于蛋白質(zhì)生物信息學(xué)第1頁,講稿共49頁,2023年5月2日,星期三第一節(jié)生物信息學(xué)與蛋白質(zhì)工程一、生物信息學(xué)概述生物信息學(xué)是利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的方法研究生物學(xué)的問題。1987年,林華安首創(chuàng)Bioinformation一詞,被譽(yù)為”世界生物信息之父”。第2頁,講稿共49頁,2023年5月2日,星期三生物信息學(xué)分子生物學(xué)與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù)研究工具是計(jì)算機(jī)研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計(jì)算、模擬)。概述第3頁,講稿共49頁,2023年5月2日,星期三研究?jī)?nèi)容1、生物信息的收集、存儲(chǔ)、管理與提供2、基因組序列信息的提取和分析3、功能基因組相關(guān)信息分析4、生物大分子結(jié)構(gòu)模擬和藥物設(shè)計(jì)5、生物信息分析的技術(shù)與方法研究第4頁,講稿共49頁,2023年5月2日,星期三2001年2月,人類基因組工程測(cè)序的完成,使生物信息學(xué)走向了一個(gè)高潮。由于DNA自動(dòng)測(cè)序技術(shù)的快速發(fā)展,DNA數(shù)據(jù)庫中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長(zhǎng),生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無疑問,我們正從一個(gè)積累數(shù)據(jù)向解釋數(shù)據(jù)的時(shí)代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊(yùn)含著潛在突破性發(fā)現(xiàn)的可能?!吧镄畔W(xué)”正是從這一前提產(chǎn)生的交叉學(xué)科。發(fā)展條件第5頁,講稿共49頁,2023年5月2日,星期三核心內(nèi)容是研究如何通過對(duì)DNA序列的統(tǒng)計(jì)計(jì)算分析,更加深入地理解DNA序列,結(jié)構(gòu),演化及其與生物功能之間的關(guān)系。研究課題涉及到分子生物學(xué),分子演化及結(jié)構(gòu)生物學(xué),統(tǒng)計(jì)學(xué)及計(jì)算機(jī)科學(xué)等許多領(lǐng)域。第6頁,講稿共49頁,2023年5月2日,星期三以數(shù)據(jù)(庫)為核心1數(shù)據(jù)庫的建立2生物學(xué)數(shù)據(jù)的檢索3生物學(xué)數(shù)據(jù)的處理4生物學(xué)數(shù)據(jù)的利用:計(jì)算生物學(xué)研究過程第7頁,講稿共49頁,2023年5月2日,星期三由于生物信息學(xué)是基于分子生物學(xué)與多種學(xué)科交叉而成的新學(xué)科,現(xiàn)有的形勢(shì)仍表現(xiàn)為各種學(xué)科的簡(jiǎn)單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒有行之有效的一般性方法;而對(duì)于大規(guī)模數(shù)據(jù)內(nèi)在的生成機(jī)制也沒有完全明了,這使得生物信息學(xué)的研究短期內(nèi)很難有突破性的結(jié)果。研究展望第8頁,講稿共49頁,2023年5月2日,星期三要真正解決這一問題,最終不能從計(jì)算機(jī)科學(xué)得到,真正地解決可能還是得從生物學(xué)自身,從數(shù)學(xué)上的新思路來獲得本質(zhì)性的動(dòng)力。毫無疑問,正如Dulbecco1986年所說:"DNA序列是人類的真諦,這個(gè)世界上發(fā)生的一切事情,都與這一序列息息相關(guān)"。但要完全破譯這一序列以及相關(guān)的內(nèi)容,我們還有相當(dāng)長(zhǎng)的路要走。研究展望第9頁,講稿共49頁,2023年5月2日,星期三二、生物信息學(xué)與蛋白質(zhì)工程(一)蛋白質(zhì)序列分析,預(yù)測(cè)其理化性質(zhì)、空間結(jié)構(gòu)及生物學(xué)功能(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)理論分析法:在理論計(jì)算的基礎(chǔ)上預(yù)測(cè)統(tǒng)計(jì)分析法:建立序列-結(jié)構(gòu)的映射模型(三)蛋白質(zhì)功能預(yù)測(cè)P162(四)蛋白質(zhì)分子設(shè)計(jì)第10頁,講稿共49頁,2023年5月2日,星期三三、生物信息學(xué)與蛋白質(zhì)組學(xué)1994、澳大利亞Wilkins和Willians提出蛋白質(zhì)組:由全部基因表達(dá)的全部蛋白質(zhì)及其存在方式,是一種細(xì)胞、組織或完整的生命體在特定時(shí)空上所擁有的全套蛋白質(zhì)蛋白質(zhì)組學(xué):以蛋白質(zhì)為研究對(duì)象,闡明某生物體全部蛋白質(zhì)的表達(dá)模式及功能模式生物信息學(xué)理論、技術(shù)方法和軟件等在蛋白質(zhì)組學(xué)相關(guān)數(shù)據(jù)庫的建立、應(yīng)用以及蛋白質(zhì)組分析等方面具有重要的應(yīng)用第11頁,講稿共49頁,2023年5月2日,星期三生物信息學(xué)作為一門新的學(xué)科領(lǐng)域,把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測(cè),然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計(jì)。基因組信息學(xué),蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計(jì)構(gòu)成了生物信息學(xué)的3個(gè)重要組成部分。第12頁,講稿共49頁,2023年5月2日,星期三第二節(jié)蛋白質(zhì)常用數(shù)據(jù)庫及應(yīng)用一次數(shù)據(jù)庫:實(shí)驗(yàn)獲得的原始數(shù)據(jù)。簡(jiǎn)單歸類整理、注釋。Genbank、Swiss-Prot、PDB二次數(shù)據(jù)庫:在一次數(shù)據(jù)庫、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上,根據(jù)研究?jī)?nèi)容的需要,對(duì)相關(guān)生物知識(shí)和信息進(jìn)一步分析整理。包括人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點(diǎn)庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等。第13頁,講稿共49頁,2023年5月2日,星期三第二節(jié)、蛋白質(zhì)常用數(shù)據(jù)庫一、核酸數(shù)據(jù)庫NCBI的Genbank、EMBL、DDBJ等第14頁,講稿共49頁,2023年5月2日,星期三二、蛋白質(zhì)數(shù)據(jù)庫(一)蛋白序列數(shù)據(jù)庫:SWISS-PROT、PIR、TreEMBL、UniProt、GenPept第15頁,講稿共49頁,2023年5月2日,星期三(二)蛋白序列二次數(shù)據(jù)庫蛋白保守區(qū)域和功能位點(diǎn)數(shù)據(jù)庫,PROSITE、PRINTS、BLOCKS第16頁,講稿共49頁,2023年5月2日,星期三(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫三維結(jié)構(gòu)數(shù)據(jù)庫PBD、MMDB第17頁,講稿共49頁,2023年5月2日,星期三全人源抗EGFR單克隆抗體紅色字體為信號(hào)肽,標(biāo)黃部分為可變區(qū)重鏈可變區(qū)(HV)DNA序列(423bp)ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGACAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGATTCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTACAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATATCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGACCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTGGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA第18頁,講稿共49頁,2023年5月2日,星期三ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtaggagacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAATTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGCATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGGGACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAACATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGACCAAGGTGGAGATCAAACGTACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGT輕鏈全長(zhǎng)(L)DNA序列(708bp)第19頁,講稿共49頁,2023年5月2日,星期三GGTGGTGGTGGCTCTGGCGGTGGTGGCTCTGGTGGCGGTGGTTCT連接肽(G4S)3蛋白質(zhì)分子設(shè)計(jì):VH-L-LVHVLCLlinker第20頁,講稿共49頁,2023年5月2日,星期三第21頁,講稿共49頁,2023年5月2日,星期三利用DNAman對(duì)VH-L-L的限制性內(nèi)切酶位點(diǎn)分析,結(jié)果顯示VH-L-L有31個(gè)限制性酶切位點(diǎn),最多的是Eco57Ⅰ、TthlllⅠ分別有三個(gè)酶切位點(diǎn)。第22頁,講稿共49頁,2023年5月2日,星期三第23頁,講稿共49頁,2023年5月2日,星期三利用生物信息學(xué)軟件DNAman將VH-L-L的核苷酸序列翻譯為氨基酸序列第24頁,講稿共49頁,2023年5月2日,星期三
利用NCBI提供的ORFFinder預(yù)測(cè)VH-L-L的ORF,從預(yù)測(cè)結(jié)果看出VH-L-L是一段連續(xù)的較長(zhǎng)的ORF,它可能是一個(gè)完整的編碼序列第25頁,講稿共49頁,2023年5月2日,星期三
利用ProtParam對(duì)VH-L-L的氨基酸序列及基本理化性質(zhì)進(jìn)行了分析。結(jié)果顯示VH-L-L蛋白由392個(gè)氨基酸組成的穩(wěn)定蛋白,分子式為C1867H2894N494O596S11
,分子量42149.1,等電點(diǎn)5.98。理論推導(dǎo)半衰期為:30h(體外,哺乳動(dòng)物的網(wǎng)織紅細(xì)胞內(nèi))、20h(體內(nèi),酵母細(xì)胞內(nèi))、10h(體內(nèi),大腸桿菌)。不穩(wěn)定參數(shù)是38.92,屬于穩(wěn)定蛋白。含的氨基酸如圖所示:Ser(S),Glu(G),Thr(T)最多,分別占15.1%,9.9%,7.7%;不含Pyl(0),Sec(U)??値д姾蓺埢?Asp+Glu)為32,負(fù)電荷殘基(Arg+Lys)為29??偟挠H水性平均系數(shù)-0.169,預(yù)測(cè)該蛋白屬于親水性蛋白。第26頁,講稿共49頁,2023年5月2日,星期三第27頁,講稿共49頁,2023年5月2日,星期三第28頁,講稿共49頁,2023年5月2日,星期三蛋白質(zhì)的親疏水性是影響蛋白質(zhì)空間結(jié)構(gòu)的因素之一。利用ProtScale分析氨基酸親水性/疏水性,預(yù)測(cè)結(jié)果顯示該氨基酸序列中親水性和疏水性區(qū)域間隔存在,小部分為中性,在氨基酸序列20、170處出現(xiàn)了較高的疏水性,此處富含疏水性氨基酸。總體來說,親水氨基酸多于疏水氨基酸,因此可以認(rèn)為VH-L-L是親水性蛋白第29頁,講稿共49頁,2023年5月2日,星期三第30頁,講稿共49頁,2023年5月2日,星期三
利用Tmpred分析VH-L-L的跨膜區(qū),分析表明,該序列無跨膜區(qū),不是跨膜蛋白??梢灶A(yù)測(cè)該蛋白在膜外第31頁,講稿共49頁,2023年5月2日,星期三利用NetPhos進(jìn)行磷酸化位點(diǎn)分析,結(jié)果顯示磷酸化位點(diǎn)主要包括絲氨酸Ser位點(diǎn):28個(gè),蘇氨酸Thr:5個(gè),酪氨酸Tyr:3個(gè)第32頁,講稿共49頁,2023年5月2日,星期三
利用TargetP對(duì)VH-L-L蛋白的亞細(xì)胞定位進(jìn)行預(yù)測(cè),結(jié)果表明,VH-L-L是分泌到細(xì)胞周質(zhì)的蛋白第33頁,講稿共49頁,2023年5月2日,星期三III 蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)序列:
↓
二級(jí)結(jié)構(gòu):↓第34頁,講稿共49頁,2023年5月2日,星期三1、二級(jí)結(jié)構(gòu)預(yù)測(cè)概述蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本依據(jù)是: 每一段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向。二級(jí)結(jié)構(gòu)預(yù)測(cè)問題是模式分類問題二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo):判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級(jí)結(jié)構(gòu)態(tài),即三態(tài)。
第35頁,講稿共49頁,2023年5月2日,星期三蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)主要有兩大類方法:(1)理論分析方法通過理論計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。(2)統(tǒng)計(jì)的方法對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而對(duì)未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。包括:經(jīng)驗(yàn)性方法(Chou-Fasman)、結(jié)構(gòu)規(guī)律提取方法(神經(jīng)網(wǎng)絡(luò)方法)、同源模型化方法第36頁,講稿共49頁,2023年5月2日,星期三經(jīng)驗(yàn)參數(shù)法由Chou和Fasman在70年代提出.是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。 通過統(tǒng)計(jì)分析,獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)。
第37頁,講稿共49頁,2023年5月2日,星期三經(jīng)驗(yàn)參數(shù)法蛋白質(zhì)二級(jí)結(jié)構(gòu)的組成規(guī)律性比較強(qiáng)三種基本二級(jí)結(jié)構(gòu)平均占氨基酸殘基的85%各種二級(jí)結(jié)構(gòu)非均勻地分布在蛋白質(zhì)中第38頁,講稿共49頁,2023年5月2日,星期三有些蛋白質(zhì)中含有大量的螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的螺旋如鐵氧蛋白有些蛋白質(zhì)的二級(jí)結(jié)構(gòu)以折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M)傾向于形成螺旋肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會(huì)形成螺旋
第39頁,講稿共49頁,2023年5月2日,星期三每種氨基酸出現(xiàn)在各種二級(jí)結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu主要出現(xiàn)在螺旋中
Asp和Gly主要分布在轉(zhuǎn)角中
Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會(huì)出現(xiàn)在螺旋中可以根據(jù)每種氨基酸殘基形成二級(jí)結(jié)構(gòu)的傾向性或者統(tǒng)計(jì)規(guī)律進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)第40頁,講稿共49頁,2023年5月2日,星期三基本策略(1)
相似序列→相似結(jié)構(gòu)QLMGERIRARRKKLKQLMGAERIRARRKKLK結(jié)構(gòu)?第41頁,講稿共49頁,2023年5月2日,星期三基本策略(2)
分類分析α螺旋提取樣本聚類分析學(xué)習(xí)分類規(guī)則預(yù)測(cè)….-Gly-Ala-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆紅河市重點(diǎn)中學(xué)高三第二次模擬考試英語試卷含解析
- 四川省資陽市樂至中學(xué)2025屆高三第二次模擬考試語文試卷含解析
- 《屈原列傳》課件 2024-2025學(xué)年統(tǒng)編版高中語文選擇性必修中冊(cè)
- 2025屆云南省江城縣第一中學(xué)高三第三次模擬考試英語試卷含解析
- 2025屆甘肅省慶陽六中高考全國統(tǒng)考預(yù)測(cè)密卷語文試卷含解析
- 四川大學(xué)附屬中學(xué)2025屆高三適應(yīng)性調(diào)研考試英語試題含解析
- 上海市浦東區(qū)2025屆高三下學(xué)期一??荚囌Z文試題含解析
- 韶關(guān)市重點(diǎn)中學(xué)2025屆高三第二次聯(lián)考語文試卷含解析
- 安徽省泗縣樊集中學(xué)2025屆高三下第一次測(cè)試語文試題含解析
- 2025屆成都市樹德中學(xué)高考全國統(tǒng)考預(yù)測(cè)密卷語文試卷含解析
- 兒童流感診療及預(yù)防指南(2024醫(yī)生版)
- 【MOOC】國際交流學(xué)術(shù)英文寫作-湖南大學(xué) 中國大學(xué)慕課MOOC答案
- 工程計(jì)價(jià)學(xué)-001-國開機(jī)考復(fù)習(xí)資料
- 《管理的實(shí)踐》讀后感
- 專升本數(shù)學(xué)知到智慧樹章節(jié)測(cè)試課后答案2024年秋江蘇財(cái)會(huì)職業(yè)學(xué)院
- 《技術(shù)的含義及作用》課件
- 《孟母三遷》課本劇劇本:環(huán)境對(duì)成長(zhǎng)的重要性(6篇)
- 《富馬酸盧帕他定口崩片關(guān)鍵質(zhì)量屬性與標(biāo)準(zhǔn)研究》
- 走近非遺 課件 2024-2025學(xué)年湘美版(2024)初中美術(shù)七年級(jí)上冊(cè)
- 新生兒壞死性小腸結(jié)腸炎臨床診療指南解讀 課件
- 網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例
評(píng)論
0/150
提交評(píng)論