




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)庫(kù)系統(tǒng)專題Advanced Topics on Database Systems第七章 生物信息處理技術(shù)本章主要內(nèi)容遺傳信息的結(jié)構(gòu)和功能生物數(shù)據(jù)庫(kù)序列比對(duì)后綴樹(shù)基因表達(dá)數(shù)據(jù)分析數(shù)據(jù)庫(kù)專題講義遺傳信息的結(jié)構(gòu)和功能DNA分子結(jié)構(gòu)基因的結(jié)構(gòu)基因表達(dá)數(shù)據(jù)庫(kù)專題講義DNA分子結(jié)構(gòu)四種核苷酸 嘌呤: 腺嘌呤(adenine A) 鳥(niǎo)嘌呤(guanine G) 嘧啶:胞嘧啶(cytosine C) 胸腺嘧啶(thymine T)DNA分子的雙螺旋結(jié)構(gòu)數(shù)據(jù)庫(kù)專題講義DNA分子結(jié)構(gòu)DNA分子的堿基序列儲(chǔ)存和編碼了大量遺傳信息DNA分子的雙螺旋互補(bǔ)結(jié)構(gòu)直接表明了遺傳 信息復(fù)制和傳遞的機(jī)制DNA分子的雙螺旋互補(bǔ)
2、結(jié)構(gòu)為DNA損傷造成的遺傳信息丟失提供了保護(hù)措施DNA雙鏈的互補(bǔ)性是DNA分析研究的理論基礎(chǔ)數(shù)據(jù)庫(kù)專題講義基因的結(jié)構(gòu)大多數(shù)真核細(xì)胞基因的顯著特征是有非編碼的插入序列,稱為內(nèi)含子(intron)內(nèi)含子能夠轉(zhuǎn)錄成RNA,在翻譯成蛋白質(zhì)之前被加工剪接,因此不包含在mRNA序列中被內(nèi)含子隔開(kāi)的編碼序列為外顯子(exon),剪接后連在一起形成成熟的mRNA,參與指導(dǎo)蛋白質(zhì)合成不同基因的內(nèi)含子和外顯子數(shù)目和大小不同,一般基因越大,外顯子越多。內(nèi)含子可能遠(yuǎn)遠(yuǎn)大于外顯子,也可能內(nèi)含子中包含其他基因的編碼序列,即基因內(nèi)基因數(shù)據(jù)庫(kù)專題講義基因的結(jié)構(gòu)啟動(dòng)子(promoter) 一般位于基因轉(zhuǎn)錄啟始點(diǎn)上游100-20
3、0bp范圍,是能與DNA聚合酶和轉(zhuǎn)錄因子相互作用的核苷酸序列,包含一些DNA序列元件TATA框:人類許多基因在轉(zhuǎn)錄啟始點(diǎn)5端上游25-30bp處有一段高度保守序列,由7個(gè)堿基組成,TATAA/TAA/T,其中兩個(gè)堿基可以變化。 TATA框能與轉(zhuǎn)錄因子TFII結(jié)合,再與RNA聚合酶II形成復(fù)合物,準(zhǔn)確識(shí)別轉(zhuǎn)錄啟始點(diǎn),啟動(dòng)基因轉(zhuǎn)錄數(shù)據(jù)庫(kù)專題講義基因的結(jié)構(gòu)增強(qiáng)子(enchancer):是一個(gè)短序列元件,結(jié)合于轉(zhuǎn)錄因子,能增強(qiáng)基因的轉(zhuǎn)錄活性??晌挥诨虻娜魏挝恢茫涔δ芘c位置和序列方向無(wú)關(guān)。結(jié)合增強(qiáng)子的蛋白可和結(jié)合啟動(dòng)子的蛋白相互作用,增強(qiáng)基因表達(dá)終止子(terminater):是由AATAAA和一段
4、回文序列組成,AATAAA是多聚腺苷酸(polyA)的附加信號(hào),回文序列轉(zhuǎn)錄后形成發(fā)夾結(jié)構(gòu),阻礙RNA聚合酶繼續(xù)移動(dòng),轉(zhuǎn)錄終止數(shù)據(jù)庫(kù)專題講義基因表達(dá)中心法則DNA序列所蘊(yùn)藏的遺傳信息,經(jīng)過(guò)轉(zhuǎn)錄和翻譯,實(shí)現(xiàn)信息傳遞和指導(dǎo)蛋白質(zhì)合成,這一過(guò)程稱為基因表達(dá)基因表達(dá)成共線性,即DNA的先行核苷酸序列轉(zhuǎn)錄為RNA的線性核苷酸序列,RNA三連體密碼子轉(zhuǎn)譯成特定多肽的線性氨基酸序列這種DNA-RNA-蛋白質(zhì)的信息傳遞原則稱之為中心法則數(shù)據(jù)庫(kù)專題講義基因表達(dá)轉(zhuǎn)錄(transcription) - DNARNA的過(guò)程以DNA雙鏈中的一條作為模板,ATP、CTP、GTP、UTP作為前體RNA,在RNA聚合酶催化下
5、,按堿基互補(bǔ)方式合成RNA單鏈的過(guò)程。轉(zhuǎn)錄在細(xì)胞核中進(jìn)行,轉(zhuǎn)錄后的RNA堿基序列與DNA模板序列互補(bǔ),同非模板鏈一致,只是把T換成了U數(shù)據(jù)庫(kù)專題講義基因表達(dá)轉(zhuǎn)錄過(guò)程外顯子1外顯子2外顯子3GT - AGGT - AG內(nèi)含子1內(nèi)含子2E1E2E3GU - AGGU - AG基因啟動(dòng)子原始RNA轉(zhuǎn)錄E1E2E3GU - AGGU - AG原始RNA加工剪切成熟mRNA數(shù)據(jù)庫(kù)專題講義基因表達(dá)翻譯翻譯是指將mRNA轉(zhuǎn)譯成氨基酸序列的過(guò)程。成熟的mRNA從細(xì)胞核進(jìn)入細(xì)胞質(zhì),由核糖體和其他成分閱讀mRNA所攜帶的信息,指導(dǎo)多肽合成遺傳密碼表三個(gè)堿基組成一個(gè)遺傳密碼,對(duì)應(yīng)一個(gè)氨基酸數(shù)據(jù)庫(kù)專題講義基因表達(dá)fi
6、rst第二個(gè)核苷酸U C A GthirdUUUU 苯丙UUC 苯丙UUA 亮氨酸UUG 亮氨酸UCU 絲氨酸UCC 絲氨酸UCA 絲氨酸UCG 絲氨酸UAU 酪氨酸UAC 酪氨酸UAA 終止UAG 終止UGU 半胱UGC半胱UGA 終止UGG 色氨酸UCAGCCUU 亮氨酸CUC 亮氨酸CUA 亮氨酸CUG 亮氨酸CCU 脯氨酸CCC 脯氨酸CCA 脯氨酸CCG 脯氨酸CAU 組氨酸CAC 組氨酸CAA 谷酰CAG 谷酰CGU 精氨酸CGC 精氨酸CGA 精氨酸CGG 精氨酸UCAG數(shù)據(jù)庫(kù)專題講義基因表達(dá)first第二個(gè)核苷酸U C A GthirdAAUU 異亮AUC異亮AUA異亮AUG
7、蛋 起始ACU 蘇氨酸ACC蘇氨酸ACA蘇氨酸ACG蘇氨酸AAU 天酰AAC天酰AAA 賴氨酸AAG 賴氨酸AGU 絲氨酸AGC 絲氨酸AGA 精氨酸AGG 精氨酸UCAGGGUU 纈氨酸GUC 纈氨酸GUA 纈氨酸GUG 纈氨酸GCU 丙氨酸GCC丙氨酸GCA丙氨酸GCG丙氨酸GAU 天冬GAC 天冬GAA 谷氨酸GAG 谷氨酸GGU 甘氨酸GGC甘氨酸GGA甘氨酸GGG甘氨酸UCAG數(shù)據(jù)庫(kù)專題講義基因表達(dá)翻譯過(guò)程首先識(shí)別mRNA的AUG起始密碼子每三個(gè)連續(xù)核苷酸編碼一個(gè)氨基酸直到終止密碼子出現(xiàn)(UAA, UAG, UGA)數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)隨著基因測(cè)序技術(shù)快速發(fā)展,在Internet
8、上積累的大量的生物序列數(shù)據(jù),主要包括兩種類型DNA序列蛋白質(zhì)序列數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)生物序列數(shù)據(jù)的積累成爆炸性增長(zhǎng)數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)主要生物數(shù)據(jù)庫(kù) Bank EntriesGenbank 18,197,000Swissprot 115,106PDB 18,881數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)基因測(cè)試完成情況 19940 19951 2002109 eukaryotes (真核細(xì)胞基因) bacteria (細(xì)菌基因) archaea (?)108316數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)生物數(shù)據(jù)庫(kù)的種類序列數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)Generalspecial Genbank, embl PromotersPI
9、R, SwissprotGenomes GeneralSpecialPDBSpecific protein familiesfolds數(shù)據(jù)庫(kù)專題講義生物數(shù)據(jù)庫(kù)WWW資源NCBI: National Center of Biotechnology information (updated databases)search tool: ENTREZ數(shù)據(jù)庫(kù)專題講義序列比對(duì)序列比對(duì)的意義功能相似的基因具有相似的結(jié)構(gòu)結(jié)構(gòu)相似的基因具有相似的序列序列相似是生物信息學(xué)中的一種最基本的研究手段序列相似性可能意味著結(jié)構(gòu)和功能相似性同源序列是相似的,但相似序列可能是同源的數(shù)據(jù)庫(kù)專題講義序列比對(duì)全局比對(duì)局部比對(duì)AT
10、TGCAGTG-TCGAGCGTCAGGCTATTGCGTCGATCGCAC-GCACGCTCATATTGCAGTGGTCCCGCGTCAGGCTTAAATTGCGT-GGTCGCACTGCACGCT數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 兩兩比對(duì)ATTGCAGTGATCGATTGCGTCGATCGSolution 1:ATTGCAGTGATCG| |ATTGCGTCGATCGSolution 2:ATTGCAGT-GATCG| | | ATTGC-GTCGATCG數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 如何評(píng)價(jià)Solution 1:ATTGCAGTGATCG| |ATTGCGTCGATCGSolution 2:AT
11、TGCAGT-GATCG| | | ATTGC-GTCGATCG12 matches+2 gaps10 matches+ 3 mismatches數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 計(jì)分模式Match:+1Mismatch:-1Gap:-2Solution 1:ATTGCAGTGATCG| |ATTGCGTCGATCGSolution 2:ATTGCAGT-GATCG| | | ATTGC-GTCGATCGScore = 7Score = 8數(shù)據(jù)庫(kù)專題講義序列比對(duì)如何找到分值最高的比對(duì)結(jié)果動(dòng)態(tài)規(guī)劃(Dynamical Programming)主要思路是將一個(gè)復(fù)雜的問(wèn)題分解成若干個(gè)子問(wèn)題,利用局部?jī)?yōu)化來(lái)
12、不斷地找到全局優(yōu)化的過(guò)程數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃Seq 1) A G CSeq 2) A A A CNeedelman-Wunsch algorithm (1970)數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃先計(jì)算第0行與第0列A G CA A A Cmatch=1mismatch=-1indel=-2數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃 -中間單元的計(jì)算思想F(i-1,j-1)F(i,j)F(i,j-1)F(i-1,j)S(Xi,Yj)-d-d字符串 2字符串1第i-1位第 i位第j-1位第j位數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃 - 計(jì)算公式 F (i-1, j-1) + s(xi,
13、 yj)F(i,j)= max F (i-1, j) - d F (i, j-1) - d數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃A G CA A A Cmatch=1mismatch=-1indel=-2-1-3數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃找最佳比對(duì)結(jié)果 0A 1A 2-4-10-2A 3-6-3-2-1C 4-8-5-4-10A1G2C30-2-4-6-21-1-3數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃找最佳比對(duì)結(jié)果 0A 1A 2-4-10-2A 3-6-3-2-1C 4-8-5-4-10A1G2C30-2-4-6-21-1-3A G - CA A A CScore = -1數(shù)據(jù)庫(kù)專題
14、講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃找最佳比對(duì)結(jié)果 0A 1A 2-4-10-2A 3-6-3-2-1C 4-8-5-4-10A1G2C30-2-4-6-21-1-3A - G CA A A CScore = -1數(shù)據(jù)庫(kù)專題講義序列比對(duì) - 動(dòng)態(tài)規(guī)劃找最佳比對(duì)結(jié)果 0A 1A 2-4-10-2A 3-6-3-2-1C 4-8-5-4-10A1G2C30-2-4-6-21-1-3- A G CA A A CScore = -1數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local AlignmentF (i-1, j-1) + s(xi, yi)F(i,j)= max F (i-1, j) - dF (i, j-1) d
15、0數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local AlignmentATCTAATAATASmith-Waterman algorithm, 1981數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local Alignment初始狀態(tài)TCATAATAATA數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local AlignmentTCATAATAATA數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local AlignmentTACTAA TAATAScore = 3數(shù)據(jù)庫(kù)專題講義序列比對(duì) - Local AlignmentTACTAATAATAScore = 3數(shù)據(jù)庫(kù)專題講義基因表達(dá)數(shù)據(jù)分析基因的表達(dá)指從DNARNA蛋白質(zhì)合成的全過(guò)程基因表達(dá)的最終產(chǎn)物
16、是蛋白DNARNA(轉(zhuǎn)錄)以DNA的反編碼鏈為模板,在啟動(dòng)子的控制下以堿基互補(bǔ)的方式,合成一個(gè)RNA分子。RNA蛋白質(zhì)(翻譯)三個(gè)堿基編碼一個(gè)密碼子,一個(gè)密碼子對(duì)應(yīng)一種氨基酸。20種氨基酸是構(gòu)成蛋白質(zhì)的基本單位。數(shù)據(jù)庫(kù)專題講義基因表達(dá)數(shù)據(jù)分析基因通過(guò)表達(dá)控制著特定的蛋白質(zhì)組成(如血紅蛋白)所有的體細(xì)胞都含有同樣的基因但在細(xì)胞逐步分化后,往往有些基因表達(dá),有些不表達(dá),或僅在胚胎期或病理情況下表達(dá)數(shù)據(jù)庫(kù)專題講義基因表達(dá)數(shù)據(jù)分析基因表達(dá)數(shù)據(jù)通過(guò)對(duì)基因表達(dá)的實(shí)驗(yàn)研究,得到的相關(guān)數(shù)示例:酵母菌中部分基因的表達(dá)矩陣(后圖)目前流行的獲取基因表達(dá)數(shù)據(jù)的方法生物芯片數(shù)據(jù)庫(kù)專題講義基因表達(dá)數(shù)據(jù)分析數(shù)據(jù)庫(kù)專題講義基因表達(dá)數(shù)據(jù)分析生物芯片(Biochips)包括DNA芯片有時(shí)也被稱為基因芯片、或微陣列(Microarrays )組織芯片蛋白質(zhì)芯片細(xì)胞芯片 數(shù)據(jù)庫(kù)專題講義基因表達(dá)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度中式餐廳轉(zhuǎn)讓與地方特色菜品研發(fā)協(xié)議
- 婚后財(cái)產(chǎn)獨(dú)立核算及2025年度財(cái)務(wù)規(guī)劃合同
- 二零二五年度生鮮市場(chǎng)租賃及產(chǎn)品銷售合同
- 《倉(cāng)儲(chǔ)管理實(shí)務(wù)》課件-倉(cāng)儲(chǔ)管理實(shí)務(wù)課件
- 《公司金融》課件-公司金融課件 - 第5章
- 幼兒園獲獎(jiǎng)公開(kāi)課:幼小銜接科學(xué)活動(dòng)《身體里的洞》課件
- 民法與合同法的學(xué)習(xí)心得體會(huì)
- 高考化學(xué)備考人教課件第二章第7講離子共存離子的檢驗(yàn)和推斷
- 2024-2025學(xué)年課件地理(人教版2019)選擇性必修一4-1陸地水體及其相互關(guān)系
- 2018-2019學(xué)年高中一輪復(fù)習(xí)歷史人民版課件模塊二專題六第14講近代中國(guó)民族工業(yè)的興起發(fā)展和歷史命運(yùn)
- 發(fā)展我國(guó)銀發(fā)經(jīng)濟(jì)面臨的挑戰(zhàn)和優(yōu)化路徑研究
- 建(構(gòu))筑物消防員初級(jí)技能培訓(xùn)課件
- 2025年潛江市城市建設(shè)發(fā)展集團(tuán)招聘工作人員【52人】高頻重點(diǎn)提升(共500題)附帶答案詳解
- GA/T 2146-2024法庭科學(xué)涉火案件物證檢驗(yàn)移動(dòng)實(shí)驗(yàn)室建設(shè)通用要求
- DB50T 441-2012 渝菜 毛血旺烹飪技術(shù)規(guī)范
- 2024年05月富德生命人壽保險(xiǎn)股份有限公司招考筆試歷年參考題庫(kù)附帶答案詳解
- 醫(yī)防融合培訓(xùn)
- 高速鐵路設(shè)計(jì)規(guī)范
- 《電機(jī)能能效等級(jí)》課件
- 幼兒園課件之大班科學(xué)《四季的變化》
- 電商客服外包服務(wù)合同
評(píng)論
0/150
提交評(píng)論