




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第一節(jié)生物信息學與蛋白質(zhì)工程一、生物信息學概述生物信息學是利用應(yīng)用數(shù)學、信息學、統(tǒng)計學和計算機科學的方法研究生物學的問題。1987年,林華安首創(chuàng)Bioinformation一詞,被譽為”世界生物信息之父”。本文檔共45頁;當前第1頁;編輯于星期三\8點41分生物信息學分子生物學與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。研究材料和結(jié)果就是各種各樣的生物學數(shù)據(jù)研究工具是計算機研究方法包括對生物學數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。概述本文檔共45頁;當前第2頁;編輯于星期三\8點41分研究內(nèi)容1、生物信息的收集、存儲、管理與提供2、基因組序列信息的提取和分析3、功能基因組相關(guān)信息分析4、生物大分子結(jié)構(gòu)模擬和藥物設(shè)計5、生物信息分析的技術(shù)與方法研究本文檔共45頁;當前第3頁;編輯于星期三\8點41分2001年2月,人類基因組工程測序的完成,使生物信息學走向了一個高潮。由于DNA自動測序技術(shù)的快速發(fā)展,DNA數(shù)據(jù)庫中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長,生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無疑問,我們正從一個積累數(shù)據(jù)向解釋數(shù)據(jù)的時代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊含著潛在突破性發(fā)現(xiàn)的可能?!吧镄畔W”正是從這一前提產(chǎn)生的交叉學科。發(fā)展條件本文檔共45頁;當前第4頁;編輯于星期三\8點41分核心內(nèi)容是研究如何通過對DNA序列的統(tǒng)計計算分析,更加深入地理解DNA序列,結(jié)構(gòu),演化及其與生物功能之間的關(guān)系。研究課題涉及到分子生物學,分子演化及結(jié)構(gòu)生物學,統(tǒng)計學及計算機科學等許多領(lǐng)域。本文檔共45頁;當前第5頁;編輯于星期三\8點41分以數(shù)據(jù)(庫)為核心1數(shù)據(jù)庫的建立2生物學數(shù)據(jù)的檢索3生物學數(shù)據(jù)的處理4生物學數(shù)據(jù)的利用:計算生物學研究過程本文檔共45頁;當前第6頁;編輯于星期三\8點41分由于生物信息學是基于分子生物學與多種學科交叉而成的新學科,現(xiàn)有的形勢仍表現(xiàn)為各種學科的簡單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒有行之有效的一般性方法;而對于大規(guī)模數(shù)據(jù)內(nèi)在的生成機制也沒有完全明了,這使得生物信息學的研究短期內(nèi)很難有突破性的結(jié)果。研究展望本文檔共45頁;當前第7頁;編輯于星期三\8點41分要真正解決這一問題,最終不能從計算機科學得到,真正地解決可能還是得從生物學自身,從數(shù)學上的新思路來獲得本質(zhì)性的動力。毫無疑問,正如Dulbecco1986年所說:"DNA序列是人類的真諦,這個世界上發(fā)生的一切事情,都與這一序列息息相關(guān)"。但要完全破譯這一序列以及相關(guān)的內(nèi)容,我們還有相當長的路要走。研究展望本文檔共45頁;當前第8頁;編輯于星期三\8點41分二、生物信息學與蛋白質(zhì)工程(一)蛋白質(zhì)序列分析,預(yù)測其理化性質(zhì)、空間結(jié)構(gòu)及生物學功能(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測理論分析法:在理論計算的基礎(chǔ)上預(yù)測統(tǒng)計分析法:建立序列-結(jié)構(gòu)的映射模型(三)蛋白質(zhì)功能預(yù)測P162(四)蛋白質(zhì)分子設(shè)計本文檔共45頁;當前第9頁;編輯于星期三\8點41分三、生物信息學與蛋白質(zhì)組學1994、澳大利亞Wilkins和Willians提出蛋白質(zhì)組:由全部基因表達的全部蛋白質(zhì)及其存在方式,是一種細胞、組織或完整的生命體在特定時空上所擁有的全套蛋白質(zhì)蛋白質(zhì)組學:以蛋白質(zhì)為研究對象,闡明某生物體全部蛋白質(zhì)的表達模式及功能模式生物信息學理論、技術(shù)方法和軟件等在蛋白質(zhì)組學相關(guān)數(shù)據(jù)庫的建立、應(yīng)用以及蛋白質(zhì)組分析等方面具有重要的應(yīng)用本文檔共45頁;當前第10頁;編輯于星期三\8點41分生物信息學作為一門新的學科領(lǐng)域,把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測,然后依據(jù)特定蛋白質(zhì)的功能進行必要的藥物設(shè)計。基因組信息學,蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計構(gòu)成了生物信息學的3個重要組成部分。本文檔共45頁;當前第11頁;編輯于星期三\8點41分第二節(jié)蛋白質(zhì)常用數(shù)據(jù)庫及應(yīng)用一次數(shù)據(jù)庫:實驗獲得的原始數(shù)據(jù)。簡單歸類整理、注釋。Genbank、Swiss-Prot、PDB二次數(shù)據(jù)庫:在一次數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上,根據(jù)研究內(nèi)容的需要,對相關(guān)生物知識和信息進一步分析整理。包括人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等。本文檔共45頁;當前第12頁;編輯于星期三\8點41分第二節(jié)、蛋白質(zhì)常用數(shù)據(jù)庫一、核酸數(shù)據(jù)庫NCBI的Genbank、EMBL、DDBJ等本文檔共45頁;當前第13頁;編輯于星期三\8點41分二、蛋白質(zhì)數(shù)據(jù)庫(一)蛋白序列數(shù)據(jù)庫:SWISS-PROT、PIR、TreEMBL、UniProt、GenPept本文檔共45頁;當前第14頁;編輯于星期三\8點41分(二)蛋白序列二次數(shù)據(jù)庫蛋白保守區(qū)域和功能位點數(shù)據(jù)庫,PROSITE、PRINTS、BLOCKS本文檔共45頁;當前第15頁;編輯于星期三\8點41分(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫三維結(jié)構(gòu)數(shù)據(jù)庫PBD、MMDB本文檔共45頁;當前第16頁;編輯于星期三\8點41分全人源抗EGFR單克隆抗體紅色字體為信號肽,標黃部分為可變區(qū)重鏈可變區(qū)(HV)DNA序列(423bp)ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGACAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGATTCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTACAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATATCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGACCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTGGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA
本文檔共45頁;當前第17頁;編輯于星期三\8點41分ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtaggagacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAATTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGCATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGGGACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAACATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGACCAAGGTGGAGATCAAACGTACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGT輕鏈全長(L)DNA序列(708bp)本文檔共45頁;當前第18頁;編輯于星期三\8點41分GGTGGTGGTGGCTCTGGCGGTGGTGGCTCTGGTGGCGGTGGTTCT連接肽(G4S)3蛋白質(zhì)分子設(shè)計:VH-L-LVHVLCLlinker本文檔共45頁;當前第19頁;編輯于星期三\8點41分本文檔共45頁;當前第20頁;編輯于星期三\8點41分利用DNAman對VH-L-L的限制性內(nèi)切酶位點分析,結(jié)果顯示VH-L-L有31個限制性酶切位點,最多的是Eco57Ⅰ、TthlllⅠ分別有三個酶切位點。本文檔共45頁;當前第21頁;編輯于星期三\8點41分本文檔共45頁;當前第22頁;編輯于星期三\8點41分利用生物信息學軟件DNAman將VH-L-L的核苷酸序列翻譯為氨基酸序列本文檔共45頁;當前第23頁;編輯于星期三\8點41分
利用NCBI提供的ORFFinder預(yù)測VH-L-L的ORF,從預(yù)測結(jié)果看出VH-L-L是一段連續(xù)的較長的ORF,它可能是一個完整的編碼序列本文檔共45頁;當前第24頁;編輯于星期三\8點41分
利用ProtParam對VH-L-L的氨基酸序列及基本理化性質(zhì)進行了分析。結(jié)果顯示VH-L-L蛋白由392個氨基酸組成的穩(wěn)定蛋白,分子式為C1867H2894N494O596S11
,分子量42149.1,等電點5.98。理論推導半衰期為:30h(體外,哺乳動物的網(wǎng)織紅細胞內(nèi))、20h(體內(nèi),酵母細胞內(nèi))、10h(體內(nèi),大腸桿菌)。不穩(wěn)定參數(shù)是38.92,屬于穩(wěn)定蛋白。含的氨基酸如圖所示:Ser(S),Glu(G),Thr(T)最多,分別占15.1%,9.9%,7.7%;不含Pyl(0),Sec(U)??値д姾蓺埢?Asp+Glu)為32,負電荷殘基(Arg+Lys)為29??偟挠H水性平均系數(shù)-0.169,預(yù)測該蛋白屬于親水性蛋白。本文檔共45頁;當前第25頁;編輯于星期三\8點41分本文檔共45頁;當前第26頁;編輯于星期三\8點41分本文檔共45頁;當前第27頁;編輯于星期三\8點41分蛋白質(zhì)的親疏水性是影響蛋白質(zhì)空間結(jié)構(gòu)的因素之一。利用ProtScale分析氨基酸親水性/疏水性,預(yù)測結(jié)果顯示該氨基酸序列中親水性和疏水性區(qū)域間隔存在,小部分為中性,在氨基酸序列20、170處出現(xiàn)了較高的疏水性,此處富含疏水性氨基酸。總體來說,親水氨基酸多于疏水氨基酸,因此可以認為VH-L-L是親水性蛋白本文檔共45頁;當前第28頁;編輯于星期三\8點41分本文檔共45頁;當前第29頁;編輯于星期三\8點41分
利用Tmpred分析VH-L-L的跨膜區(qū),分析表明,該序列無跨膜區(qū),不是跨膜蛋白。可以預(yù)測該蛋白在膜外本文檔共45頁;當前第30頁;編輯于星期三\8點41分利用NetPhos進行磷酸化位點分析,結(jié)果顯示磷酸化位點主要包括絲氨酸Ser位點:28個,蘇氨酸Thr:5個,酪氨酸Tyr:3個本文檔共45頁;當前第31頁;編輯于星期三\8點41分
利用TargetP對VH-L-L蛋白的亞細胞定位進行預(yù)測,結(jié)果表明,VH-L-L是分泌到細胞周質(zhì)的蛋白本文檔共45頁;當前第32頁;編輯于星期三\8點41分III 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)序列:
↓
二級結(jié)構(gòu):↓本文檔共45頁;當前第33頁;編輯于星期三\8點41分1、二級結(jié)構(gòu)預(yù)測概述蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測的基本依據(jù)是: 每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。二級結(jié)構(gòu)預(yù)測問題是模式分類問題二級結(jié)構(gòu)預(yù)測的目標:判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構(gòu)態(tài),即三態(tài)。
本文檔共45頁;當前第34頁;編輯于星期三\8點41分蛋白質(zhì)結(jié)構(gòu)預(yù)測主要有兩大類方法:(1)理論分析方法通過理論計算(如分子力學、分子動力學計算)進行結(jié)構(gòu)預(yù)測。(2)統(tǒng)計的方法對已知結(jié)構(gòu)的蛋白質(zhì)進行統(tǒng)計分析,建立序列到結(jié)構(gòu)的映射模型,進而對未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測結(jié)構(gòu)。包括:經(jīng)驗性方法(Chou-Fasman)、結(jié)構(gòu)規(guī)律提取方法(神經(jīng)網(wǎng)絡(luò)方法)、同源模型化方法本文檔共45頁;當前第35頁;編輯于星期三\8點41分經(jīng)驗參數(shù)法由Chou和Fasman在70年代提出.是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預(yù)測方法。 通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結(jié)構(gòu)構(gòu)象的傾向性因子,進而利用這些傾向性因子預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。
本文檔共45頁;當前第36頁;編輯于星期三\8點41分經(jīng)驗參數(shù)法蛋白質(zhì)二級結(jié)構(gòu)的組成規(guī)律性比較強三種基本二級結(jié)構(gòu)平均占氨基酸殘基的85%各種二級結(jié)構(gòu)非均勻地分布在蛋白質(zhì)中本文檔共45頁;當前第37頁;編輯于星期三\8點41分有些蛋白質(zhì)中含有大量的螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的螺旋如鐵氧蛋白有些蛋白質(zhì)的二級結(jié)構(gòu)以折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M)傾向于形成螺旋肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會形成螺旋
本文檔共45頁;當前第38頁;編輯于星期三\8點41分每種氨基酸出現(xiàn)在各種二級結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu主要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 單人船舶出售合同范本
- 萌芽課題申報書
- 提升編導能力課題申報書
- 和學校超市合作合同范本
- 賣場出租租賃合同范本
- 為課題申報書
- 勞動合同范例 海南
- 產(chǎn)品競拍合同范本
- 勞務(wù)與員工合同范本
- 加氫原料采購合同范本
- 泛讀2unit2-music
- 中學生防溺水安全教育課件(PPT 44頁)
- ISO-IEC17025-2017實驗室管理體系全套程序文件
- 2019版外研社高中英語選擇性必修二Unit 1 Growing up 單詞表
- 重慶危險性較大的分部分項工程安全管理實施細則
- 三菱 PLC FX2N-4AD 4DA 模擬量模塊教材(課堂PPT)
- 有機金屬化學1
- JIT標準作業(yè)作業(yè)指導書
- 安徽省2020-2021學年七年級語文下學期期末測試卷[含答案]
- 混凝土面板堆石壩接縫止水
- 人教版三年級數(shù)學下冊各單元教材分析(全冊共九個單元)
評論
0/150
提交評論