




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Outline生物學基本知識常用的生物數(shù)據(jù)及數(shù)據(jù)庫處理生物數(shù)據(jù)的基本處理方法本文檔共46頁;當前第1頁;編輯于星期二\18點46分生物學兩種主要信息載體生物基礎(chǔ)核酸分子與蛋白質(zhì)分子本文檔共46頁;當前第2頁;編輯于星期二\18點46分核酸分子生物基礎(chǔ)核酸的基本單元式核苷酸。核苷酸有一個磷酸基團、一個糖基團和一個含有氮原子的堿基基團構(gòu)成。根據(jù)糖基不同,核苷酸可分為:脫氧核糖核苷酸核糖核苷酸堿基糖基磷酸DNA(脫氧核糖核酸)RNA(核糖核酸)核苷+磷酸堿基+糖基核苷酸核酸聚合本文檔共46頁;當前第3頁;編輯于星期二\18點46分核酸分子–DNA和RNA生物基礎(chǔ)DNA的磷酸基團和糖基團都相同,堿基分為4種類型:腺嘌呤--A鳥嘌呤--G胞嘧啶--C胸腺嘧啶--TA只能與T配對C只能與G配對ACGT本文檔共46頁;當前第4頁;編輯于星期二\18點46分核酸分子–DNA和RNA生物基礎(chǔ)多個脫氧核苷酸通過5’和3’形成磷酸二酯鍵連接而成的長DNA單鏈。通過堿基互補配對形成互補鏈,兩條相互平行的DNA單鏈形成雙螺旋結(jié)構(gòu)。A--UC--GG--URNA通常是單鏈形式。RNA只有尿嘧啶(U)而沒有胸腺嘧啶(T)DNA主要存在于細胞核內(nèi),RAN在細胞核外也存在。配對原則:本文檔共46頁;當前第5頁;編輯于星期二\18點46分蛋白質(zhì)分子–生命活動的執(zhí)行者生物基礎(chǔ)蛋白質(zhì)是由氨基酸通過肽鍵相鏈接形成的聚合物。氨基酸-蛋白質(zhì)的基本組成單位,存在自然界中的氨基酸有300余種,但組成人體蛋白質(zhì)的氨基酸僅有20種。氨基酸有一個位于中心的碳原子(Cα)以及用共價鍵相連的四個基團組成。氨基酸的通式RCα氨基羧基側(cè)鏈甘氨酸HCH3丙氨酸氨基酸之間的差異主要體現(xiàn)在側(cè)鏈部分本文檔共46頁;當前第6頁;編輯于星期二\18點46分蛋白質(zhì)分子–生命活動的執(zhí)行者生物基礎(chǔ)20種標準氨基酸氨基酸名稱英文縮寫簡寫氨基酸名稱英文縮寫簡寫甘氨酸GlyG絲氨酸SerS丙氨酸AlaA蘇氨酸ThrT纈氨酸ValV天冬酰胺AsnN異亮氨酸IleI谷酰胺GlnQ亮氨酸LeuL酪氨酸TyrY苯丙氨酸PheF組氨酸HisH脯氨酸ProP天冬氨酸AspD甲硫氨酸MetM谷氨酸GluE色氨酸TrpW賴氨酸LysK半胱氨酸CysC精氨酸ArgR本文檔共46頁;當前第7頁;編輯于星期二\18點46分蛋白質(zhì)分子–生命活動的執(zhí)行者生物基礎(chǔ)氨基酸之間的差異主要體現(xiàn)在側(cè)鏈部分氨基酸的側(cè)鏈決定了不同氨基酸的物理化學性質(zhì)RCα氨基羧基側(cè)鏈本文檔共46頁;當前第8頁;編輯于星期二\18點46分蛋白質(zhì)分子–生命活動的執(zhí)行者生物基礎(chǔ)氨基酸的分類堿性氨基酸酸性氨基酸極性中性氨基酸非極性疏水氨基酸本文檔共46頁;當前第9頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)本文檔共46頁;當前第10頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)蛋白質(zhì)的一級結(jié)構(gòu)定義:蛋白質(zhì)的一級結(jié)構(gòu)指多肽鏈中氨基酸的排列順序。主要化學鍵:肽鍵一級結(jié)構(gòu)是蛋白質(zhì)空間構(gòu)象和特異生物功能的基礎(chǔ)。胰島素的一級結(jié)構(gòu)本文檔共46頁;當前第11頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)蛋白質(zhì)的二級結(jié)構(gòu)定義:蛋白質(zhì)分子中某一段肽鏈的局部空間結(jié)構(gòu),即該段肽鏈主鏈骨架原子的相對空間位置,并不涉及氨基酸殘基側(cè)鏈的構(gòu)象。主要化學鍵:氫鍵HHHH肽單元(peptideunit)本文檔共46頁;當前第12頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)肽平面及二面角本文檔共46頁;當前第13頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)二級結(jié)構(gòu)主要有以下幾種形式:螺旋(-helix)折疊(-sheet)轉(zhuǎn)角(-turn)無規(guī)卷曲(coil)
多肽鏈中有60%的區(qū)段為螺旋和折疊本文檔共46頁;當前第14頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)-螺旋多肽鏈主鏈圍繞中心軸形成右手螺旋狀結(jié)構(gòu),側(cè)鏈伸向螺旋外側(cè)每個氨基酸殘基(第n個)的羰基與多肽鏈C端方向的第4個殘基(第4+n個)的酰胺氮形成氫鍵本文檔共46頁;當前第15頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)-折疊多肽鏈充分伸展,相鄰肽單元之間折疊成鋸齒狀結(jié)構(gòu),側(cè)鏈位于鋸齒結(jié)構(gòu)的上下方兩段以上的β-折疊結(jié)構(gòu)平行排列,兩鏈間可順向平行,也可反向平行兩鏈間的肽鍵之間形成氫鍵,以穩(wěn)固β-折疊結(jié)構(gòu)。氫鍵與螺旋長軸垂直。本文檔共46頁;當前第16頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)-轉(zhuǎn)角含4個氨基酸殘基,第一個殘基的CO基團和第四個殘基的NH基團之間形成氫鍵,使多肽鏈的方向發(fā)生“U”形改變。本文檔共46頁;當前第17頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)超二級結(jié)構(gòu)在蛋白質(zhì)分子中,特別是球狀蛋白質(zhì)中,由若干相鄰的二級結(jié)構(gòu)單元(即α-螺旋、β-折疊和β-轉(zhuǎn)角等)彼此相互作用組合在一起,,形成有規(guī)則、在空間上能辨認的二級結(jié)構(gòu)組合體,充當三級結(jié)構(gòu)的構(gòu)件單元,稱超二級結(jié)構(gòu)。本文檔共46頁;當前第18頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)蛋白質(zhì)三級結(jié)構(gòu)在二級結(jié)構(gòu)基礎(chǔ)上的肽鏈再折疊形成的構(gòu)象。整條肽鏈中全部氨基酸殘基的相對空間位置,即肽鏈中所有原子在三維空間的排布位置。本文檔共46頁;當前第19頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)結(jié)構(gòu)域(domain)多肽鏈在超二級結(jié)構(gòu)基礎(chǔ)上進一步繞曲折疊而成的相對獨立的三維實體稱結(jié)構(gòu)域蛋白質(zhì)結(jié)構(gòu)中具有特異結(jié)構(gòu)和獨立功能的區(qū)域。本文檔共46頁;當前第20頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)結(jié)構(gòu)域(domain)本文檔共46頁;當前第21頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)肌紅蛋白的三級結(jié)構(gòu)分子中多肽主鏈由長短不等的8段直的α螺旋組成最大的螺旋含23個殘基最短的7個殘基,分子中幾乎80%的氨基酸殘基都處于α螺旋區(qū)中。拐彎是由1—8個殘基組成的無規(guī)則卷曲。本文檔共46頁;當前第22頁;編輯于星期二\18點46分蛋白質(zhì)分子的結(jié)構(gòu)生物基礎(chǔ)蛋白質(zhì)四級結(jié)構(gòu)每條完整三級結(jié)構(gòu)的多肽鏈,稱為亞基(subunit)蛋白質(zhì)分子中各亞基的空間排布及亞基接觸部位的布局和相互作用,稱為蛋白質(zhì)的四級結(jié)構(gòu)。本文檔共46頁;當前第23頁;編輯于星期二\18點46分Outline生物學基本知識常用的生物數(shù)據(jù)及數(shù)據(jù)庫處理生物數(shù)據(jù)的基本處理方法本文檔共46頁;當前第24頁;編輯于星期二\18點46分生物信息學數(shù)據(jù)庫Background生物分子數(shù)據(jù)高速增長
分子生物學及相關(guān)領(lǐng)域研究人員迅速獲得最新實驗數(shù)據(jù)
建立生物分子數(shù)據(jù)庫
本文檔共46頁;當前第25頁;編輯于星期二\18點46分生物信息學數(shù)據(jù)庫Background應(yīng)滿足5個方面的主要需求:(1)時間性(2)注釋(3)支撐數(shù)據(jù)(4)數(shù)據(jù)質(zhì)量(5)集成性本文檔共46頁;當前第26頁;編輯于星期二\18點46分生物信息學數(shù)據(jù)庫Background生物信息數(shù)據(jù)庫具備的幾個明顯特征:數(shù)據(jù)庫的更新速度不斷加快數(shù)據(jù)庫使用頻率增長更快數(shù)據(jù)庫的復(fù)雜程度不斷增加數(shù)據(jù)庫網(wǎng)絡(luò)化面向應(yīng)用先進的軟硬件配置本文檔共46頁;當前第27頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫BackgroundPDB(ProteinDataBank)是目前最主要的蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)庫。1970由美國Brookhaven國家實驗室建立,1988年,由美國RCSB(researchcollaboratoryforstructuralbiology)管理;含有通過實驗(X射線晶體衍射,核磁共振
NMR,冷凍電子顯微鏡)測定的生物大分子(蛋白質(zhì)、核酸
、糖類
、復(fù)合物)的三維結(jié)構(gòu)。以文本格式存放數(shù)據(jù),包括原子坐標、物種來源、測定方法、提交者信息、一級結(jié)構(gòu)、二級結(jié)構(gòu)等;
本文檔共46頁;當前第28頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫BackgroundPDB(ProteinDataBank)本文檔共46頁;當前第29頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫BackgroundPDB(ProteinDataBank)Jan08,2013本文檔共46頁;當前第30頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫BackgroundPDB的文件格式物種來源、測定方法、提交者信息、蛋白質(zhì)序列一級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)構(gòu)成蛋白質(zhì)的氨基酸的每個原子的三維坐標本文檔共46頁;當前第31頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫BackgroundSCOP(StructuralClassificationofProteins)提供已知結(jié)構(gòu)的蛋白質(zhì)之間結(jié)構(gòu)和進化關(guān)系的詳細描述。按結(jié)構(gòu)和進化關(guān)系對蛋白質(zhì)分類,分類結(jié)果是一個具有層次結(jié)構(gòu)的樹,其主要的層次是家族、超家族和折疊:家族:具有明顯的進化關(guān)系超家族:具有遠源進化關(guān)系,具有共同的進化源折疊類:主要結(jié)構(gòu)相似ROOT(根)CLASS(類)FOLD(折疊)SUPERFAMILY(超家族)FAMILY(家族)PROTEIN(蛋白)SPECIES(種)本文檔共46頁;當前第32頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫BackgroundSCOP(StructuralClassificationofProteins)本文檔共46頁;當前第33頁;編輯于星期二\18點46分蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫BackgroundCATH(Class,Architecture,Topology,Homology)CATH數(shù)據(jù)庫的分類基礎(chǔ)是蛋白質(zhì)結(jié)構(gòu)域。與SCOP不同的是,CATH把蛋白質(zhì)分為4類,即a主類、b主類,a-b類(a/b型和a+b型)和低二級結(jié)構(gòu)類。
類型(Clase):二級結(jié)構(gòu)構(gòu)架(Architecture):超二級結(jié)構(gòu)排列方式拓撲結(jié)構(gòu)(Topology):二級結(jié)構(gòu)的形狀和二級結(jié)構(gòu)間的聯(lián)系同源性(Homology):序列同源性本文檔共46頁;當前第34頁;編輯于星期二\18點46分Outline生物學基本知識常用的生物數(shù)據(jù)及數(shù)據(jù)庫處理生物數(shù)據(jù)的基本處理方法本文檔共46頁;當前第35頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法Method生物信息學所用的方法和技術(shù):數(shù)學統(tǒng)計方法動態(tài)規(guī)劃方法機器學習與模式識別技術(shù)數(shù)據(jù)庫技術(shù)及數(shù)據(jù)挖掘人工神經(jīng)網(wǎng)絡(luò)技術(shù)分子模型化技術(shù)量子力學和分子力學計算生物分子的計算機模擬因特網(wǎng)(Internet)技術(shù)本文檔共46頁;當前第36頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法數(shù)學統(tǒng)計方法:生物活動常常以大量、重復(fù)的形式出現(xiàn),既受到內(nèi)在因素的制約,又受到外界環(huán)境的隨機干擾。因此概率論和數(shù)學統(tǒng)計是現(xiàn)代生物學研究中一種常用的分析方法數(shù)據(jù)統(tǒng)計、因素分析、多元回歸分析是生物學研究必備的工具隱馬爾科夫模型(HiddenMarkovModels)在序列分析方面有著重要的應(yīng)用。與隱馬爾科夫模型相關(guān)的技術(shù)是馬爾科夫鏈(MarkovChain)數(shù)學統(tǒng)計方法Method本文檔共46頁;當前第37頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法2.動態(tài)規(guī)劃方法:動態(tài)規(guī)劃(DynamicProgramming)是一種解決多階段決策過程的最優(yōu)化方法或復(fù)雜空間的優(yōu)化搜索方法動態(tài)規(guī)劃解決問題的基本過程是:將一個問題的全局解分解為局部解,逆序遞推求出局部最優(yōu)解,隨著執(zhí)行過程的推進,“局部”逐漸接近“全局”,最終獲得全局最優(yōu)解Method本文檔共46頁;當前第38頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法3.機器學習與模式識別技術(shù):機器學習:模擬人類的學習過程,以計算機為工具獲取知識、積累經(jīng)驗遺傳算法采用隨機搜索方法,具有自適應(yīng)能力和便于并行計算神經(jīng)網(wǎng)絡(luò)的理論是基于人腦的結(jié)構(gòu),其目的是揭示一個系統(tǒng)是如何向環(huán)境學習的,這一種方法被稱為聯(lián)接主義模式識別:機器學習的一個主要任務(wù)。模式是對感興趣客體定量的或者結(jié)構(gòu)的描述,而模式識別就是利用計算機對客體進行鑒別,將相同或者相似的客體歸入同種類別中。模式識別主要有兩種方法:根據(jù)對象的統(tǒng)計特征進行識別根據(jù)對象的結(jié)構(gòu)特征進行識別Method本文檔共46頁;當前第39頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法3.機器學習與模式識別技術(shù):環(huán)境知識庫執(zhí)行反饋學習Method本文檔共46頁;當前第40頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法4.數(shù)據(jù)庫技術(shù)及數(shù)據(jù)挖掘:數(shù)據(jù)庫技術(shù)數(shù)據(jù)倉庫虛擬數(shù)據(jù)庫技術(shù)(VirtualDatabase,簡稱VDB)數(shù)據(jù)挖掘(datamining)又稱作數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KnowledgeDiscoveryinDatabase),它是從數(shù)據(jù)庫或數(shù)據(jù)倉庫中發(fā)現(xiàn)并提取隱藏在其中的信息的一種新技術(shù),它能自動分析數(shù)據(jù),對它們進行歸納性推理和聯(lián)想,尋找數(shù)據(jù)間內(nèi)在的某些關(guān)聯(lián),從中發(fā)掘出潛在的、對信息預(yù)測和決策行為起著十分重要作用的模式數(shù)據(jù)挖掘過程一般分為4個基本步驟:數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和結(jié)果分析Method本文檔共46頁;當前第41頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法5.人工神經(jīng)網(wǎng)絡(luò)技術(shù):人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,簡稱ANN)是通過模擬神經(jīng)元的特性以及腦的大規(guī)模并行結(jié)構(gòu)、信息的分布式和并行處理等機制建立的一種數(shù)學模型在生物信息學中,使用得最多的是反向傳播神經(jīng)網(wǎng)絡(luò)(BackPropagationNeuralNetwork,簡稱BP網(wǎng))。BP網(wǎng)被認為是穩(wěn)定性和魯棒性較強的人工神經(jīng)網(wǎng)絡(luò)之一,而且屬于有監(jiān)督學習的網(wǎng)絡(luò)模型。標準的BP網(wǎng)由三層神經(jīng)元組成:輸入層、隱藏層和輸出層Method本文檔共46頁;當前第42頁;編輯于星期二\18點46分生物數(shù)據(jù)的基本處理方法5.人工神經(jīng)網(wǎng)絡(luò)技術(shù):輸入層隱藏層輸出層反向傳播神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意Method本文檔共46頁;當前第43頁;編輯于星期二\18點46分生物數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小班家園共育活動方案計劃
- 特許投資分析中的技術(shù)應(yīng)用試題及答案
- 2024年計算機二級重要策略試題及答案
- 2024年流程優(yōu)化在投資中的應(yīng)用試題及答案
- 生態(tài)保護區(qū)的選址與地理因素-試題及答案
- 電子商務(wù)職教市場的品牌建設(shè)與形象傳播試題及答案
- 城市化進程對環(huán)境影響試題及答案
- 動物非感染性疾病新知試題及答案
- 2024互聯(lián)網(wǎng)營銷師效率提升試題及答案
- 2024年人力資源管理師考題解析試題及答案
- 2024年計算機二級WPS考試題庫(共380題含答案)
- 漢字的奧秘探索
- 《海上風電設(shè)備運輸規(guī)范》
- 2024年江蘇省徐州市中考數(shù)學真題卷及答案解析
- 2025屆云南省民族大學附屬中學高三(最后沖刺)數(shù)學試卷含解析
- 湖北省七市2025屆高三下學期第五次調(diào)研考試數(shù)學試題含解析
- 2024年太陽能電池片產(chǎn)業(yè)海外專利預(yù)警分析報告
- 2023河南專升本英語真題及答案
- 河流沿岸護欄安裝工程協(xié)議
- 前庭陣發(fā)癥-講稿
- 第十三屆全國交通運輸行業(yè)城市軌道交通列車司機(學生組)職業(yè)技能大賽技術(shù)方案
評論
0/150
提交評論