版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、(完整)生物信息學(xué)復(fù)習(xí)提綱(完整)生物信息學(xué)復(fù)習(xí)提綱 編輯整理:尊敬的讀者朋友們:這里是精品文檔編輯中心,本文檔內(nèi)容是由我和我的同事精心編輯整理后發(fā)布的,發(fā)布之前我們對文中內(nèi)容進行仔細(xì)校對,但是難免會有疏漏的地方,但是任然希望((完整)生物信息學(xué)復(fù)習(xí)提綱)的內(nèi)容能夠給您的工作和學(xué)習(xí)帶來便利。同時也真誠的希望收到您的建議和反饋,這將是我們進步的源泉,前進的動力。本文可編輯可修改,如果覺得對您有幫助請收藏以便隨時查閱,最后祝您生活愉快 業(yè)績進步,以下為(完整)生物信息學(xué)復(fù)習(xí)提綱的全部內(nèi)容。生物信息學(xué)主要知識點一、基本名詞和概念1、bioinformatics 生物信息學(xué),狹義的生物信息學(xué)是指將計算
2、機科學(xué)和數(shù)學(xué)應(yīng)用于生物大分子信息的獲取、加工、存儲、分類、檢索與分析,以達到理解這些生物大分子信息的生物學(xué)意義的一門交叉學(xué)科。廣義上的生物信息學(xué)是指運用計算機技術(shù),處理、分析生物學(xué)數(shù)據(jù),以揭示生物學(xué)數(shù)據(jù)背后蘊藏的意義的所有知識體系。2、orf open reading frame,開放閱讀框,是指在給定的閱讀框架中,不包含終止密碼子的一串dna序列3、cds coding sequence,基因的編碼區(qū)(也叫coding region),是指dna或rna中由外顯子組成,編碼蛋白質(zhì)的部分。4、utr untranslated regions,即非翻譯區(qū),是指mrna分子兩端的非編碼片段,包括5
3、-utr(或稱“前導(dǎo)序列)和3-utr(或稱“尾隨序列”)5、genome 基因組,是指包含在一種生物的單倍體細(xì)胞中的全套染色體dna(部分病毒是rna)中的全部遺傳信息,包括基因和非編碼dna.6、proteomics 蛋白質(zhì)組學(xué),對特定的通路、細(xì)胞器、細(xì)胞、組織、器官和肌體中包含的所有蛋白質(zhì),進行鑒定、表征和定量,提供關(guān)于該系統(tǒng)準(zhǔn)確和全面數(shù)據(jù)的學(xué)科。7、transcriptome 轉(zhuǎn)錄組,也稱為“轉(zhuǎn)錄物組”,廣義上指在相同環(huán)境(或生理條件)下的一個細(xì)胞、組織或生物體中出現(xiàn)的所有rna的總和,包括mrna、rrna、trna及非編碼rna;狹義上則指細(xì)胞所能轉(zhuǎn)錄出的所有mrna.8、meta
4、bonomics 代謝組學(xué),屬于系統(tǒng)生物學(xué)的一個重要組成部分,效仿基因組學(xué)和蛋白質(zhì)組學(xué)的研究思想,對生物體內(nèi)所有代謝物進行定量分析,從而研究生命體對外界刺激、病理生理變化、以及本身基因突變而產(chǎn)生的其體內(nèi)代謝物水平的多元動態(tài)反應(yīng)。其研究對象大都是相對分子質(zhì)量1000以內(nèi)的小分子物質(zhì)。9、functional genomics 功能基因組學(xué),是一門利用結(jié)構(gòu)基因組學(xué)研究所得到的各種信息,建立和發(fā)展各種技術(shù)和實驗?zāi)P蛠頊y定基因和基因組非編碼序列的生物學(xué)功能的學(xué)科。10、genomic mapping 基因組作圖,就是確定界標(biāo)或基因在構(gòu)成基因組的每條染色體上的位置,以及同條染色體上各個界標(biāo)或基因之間的相
5、對距離。11、microarray dna微陣列,又稱基因芯片(gene chip),是由大量dna或寡核苷酸探針密集排列所形成的探針陣列,其工作的基本原理是通過雜交檢測信息。12、nucleotide 核苷酸,是指核苷( nucleoside)和磷酸( phosphate groups)結(jié)合的化學(xué)物質(zhì),包括單核苷酸(如amp、cmp等)、寡核苷酸(adp、atp、gtp等)和多核苷酸(dna、rna等).13、linux 是一種自由和開放源代碼的類unix操作系統(tǒng).14、perl practical extraction and report language,實用報表提取語言,是一種特別擅
6、長處理字符串文本數(shù)據(jù)的計算機編程語言,兼具腳本語言和高級語言的特征.15、alignment 序列比對,或叫聯(lián)配,是指在兩條或多條序列中尋找按照相同次序排布的一連串單字符或字符模塊的過程 16、blast basic local alignmeng search tools 同源序列比對工具的一個集合,也是一種兩兩序列比對算法的名稱17、phylogeny 系統(tǒng)發(fā)生(或系統(tǒng)發(fā)育),是指生物形成或進化的歷史18、orthologs 直系同源 指來自于不同物種的由垂直家系(物種形成)進化而來的基因或蛋白,并且典型的保留與原始基因或蛋白有相同的功能。19、paralogs 旁系同源,是指是指同一基因
7、組(或同系物種的基因組)中,由于始祖基因的加倍而橫向(horizontal)產(chǎn)生的幾個同源基因。20、cadd computer aided drug design 計算機輔助藥物設(shè)計21、hmm hidden markov model,隱馬爾科夫模型,一種用來描述含有隱含未知參數(shù)的馬爾可夫過程的統(tǒng)計模型。22、cpg島 是指哺乳類生物基因組中長度為0.54kb的一段富含胞嘧啶(c)、鳥嘌呤(g)及使兩者相連的磷酸酯鍵(p)成分的dna序列,幾乎都位于基因的啟動子區(qū)。二、常用生物信息學(xué)軟件或在線工具1。 clustal(或clustal x) 多序列比對軟件(x為視窗版,w為命令行版)2. p
8、hylip 一種命令行格式的分子系統(tǒng)發(fā)育分析軟件,包含多種算法3。 bioedit 一種以序列編輯與分析為主的功能比較全面的綜合性軟件4。 mega 一種視窗版的序列統(tǒng)計和進化分析的工具包(具備web序列數(shù)據(jù)庫檢索和多序列比對功能)5。 treeview 進化樹圖形編輯軟件6。 rasmol 三維分子結(jié)構(gòu)顯示和分析軟件7。 primer premier pcr引物設(shè)計軟件8。 rnastructure 建立在turner熱力學(xué)數(shù)據(jù)基礎(chǔ)上的rna二級結(jié)構(gòu)預(yù)測軟件9. promoterscan 一個預(yù)測分析啟動子區(qū)域的在線工具10。 cpgplot 預(yù)測cpg島的在線平臺11。 tmhmm 一個在
9、線分析蛋白質(zhì)跨膜區(qū)的工具12、psiped 采用雙層反饋神經(jīng)網(wǎng)絡(luò)通過對pst-blast搜索同源序列來預(yù)測蛋白質(zhì)二級結(jié)構(gòu)的在線工具。三、常用生物信息學(xué)數(shù)據(jù)庫平臺及其支撐機構(gòu)1、ncbi national center of biotechnology information,美國國立生物技術(shù)信息中心,其下建立的genbank是世界三大dna數(shù)據(jù)庫之一。2、ebi european bioinformatics institute 歐洲生物信息研究所,其下的embl(european molecular biology laboratory)數(shù)據(jù)庫是世界三大dna數(shù)據(jù)庫之一。3、ddbj dna
10、 data bank of japan日本dna數(shù)據(jù)庫4、acedb 最初是為秀麗新小桿線蟲建立的基因組數(shù)據(jù)庫,現(xiàn)已發(fā)展成為一個靈活和通用的數(shù)據(jù)庫管理系統(tǒng),可用于包括從細(xì)菌、真菌、寄生蟲、植物、昆蟲、動物到人類的基因組數(shù)據(jù)庫的數(shù)據(jù)分析。5、pdb protein data bank,是一個專門收錄蛋白質(zhì)及核酸等大分子三維結(jié)構(gòu)資料的數(shù)據(jù)庫。6、kegg kyoto encyclopedia of genes and genomes京都基因與基因組百科全書,是一個以基因與分子網(wǎng)絡(luò)為特色的一個數(shù)據(jù)庫,幫助研究者了解生物系統(tǒng)(如細(xì)胞,生物和生態(tài)系統(tǒng))的高層次功能,優(yōu)勢在于它所具有的pathway,將各
11、種生化反應(yīng)以網(wǎng)絡(luò)圖的形式展現(xiàn)。7、expasy expert protein analysis system,蛋白質(zhì)分析專家系統(tǒng),是由瑞士生物信息學(xué)研究所(swiss institute of bioinformatics )維護的一個提供從序列到結(jié)構(gòu)以及二維電泳等全套蛋白質(zhì)組學(xué)相關(guān)操作的綜合性在線服務(wù)平臺。8、cdd the conserved domain database ,ncbi下的蛋白質(zhì)保守結(jié)構(gòu)域數(shù)據(jù)庫四、常用分子系統(tǒng)發(fā)育分析算法及其工具算法分類拓?fù)湫螤顩Q定因素算法名稱算法英文縮寫距離矩陣法兩兩序列的進化距離非加權(quán)對群法或“不除權(quán)算術(shù)平均配對法” upgmafitchmargoli
12、ash法或“fm法”fm鄰接法nj離散特征法序列上每個堿基或氨基酸的狀態(tài)最大簡約法mp最大似然法ml分子進化分析軟件包phylip中的核酸序列分析程序 分子進化分析軟件包phylip中的蛋白質(zhì)序列分析工具 分子進化分析軟件phylip中的距離矩陣計算工具neighbor 統(tǒng)計分析(seqboot,即撥靴法或自舉法,用以產(chǎn)生大量的數(shù)據(jù)組)分子進化分析軟件包phylip中的進化樹繪制工具五、常用序列比對得分矩陣的種類和名稱得分矩陣種類得分矩陣名稱核酸矩陣等價矩陣blast矩陣轉(zhuǎn)換-顛換矩陣pam矩陣蛋白質(zhì)矩陣等價矩陣遺傳密碼矩陣疏水矩陣dayhoff氨基酸替換矩陣(pam)模塊氨基酸替換矩陣(bl
13、osum)六、基本理論和方法(1)生物信息學(xué)研究的基本方法和前沿技術(shù)基本方法:建立生物數(shù)據(jù)庫,數(shù)據(jù)庫檢索,序列分析,統(tǒng)計模型,算法 前沿技術(shù):數(shù)據(jù)管理技術(shù),數(shù)據(jù)倉庫、數(shù)據(jù)挖掘與數(shù)據(jù)庫中的知識發(fā)現(xiàn)技術(shù),圖像處理與可視化技術(shù)(2)識別基因的主要方法1、orf識別法 根據(jù)終止密碼子出現(xiàn)頻率、最長orf法等辨別編碼區(qū)(主要適用與原核序列)(下述方法可用于真核序列)2、基于密碼子出現(xiàn)頻率或密碼子第三位的偏好性的預(yù)測方法 3、同源性方法4、神經(jīng)網(wǎng)絡(luò)方法5、隱馬爾科夫模型法6、模式判斷分析法7、動態(tài)規(guī)劃方法8、基于剪切比對的識別方法(3)蛋白質(zhì)組學(xué)與基因組學(xué)的異同點不同點:a、與基因組的均一性相比,蛋白質(zhì)組
14、具有多樣性.即在同一生物個體的所有體細(xì)胞中基因是一樣的,但在生命發(fā)育不同階段的細(xì)胞中蛋白質(zhì)種類及數(shù)量卻是大相徑庭,不同組織中細(xì)胞表達的蛋白質(zhì)也有很大差異;b、基因組非常穩(wěn)定,而蛋白質(zhì)組則是動態(tài)變化的。即同一細(xì)胞在不同時期、不同條件下,其蛋白質(zhì)組也是在不斷地改變之中;c、蛋白質(zhì)研究技術(shù)遠比基因技術(shù)復(fù)雜和困難。相同點:都運用組學(xué)的研究方法,強調(diào)全面性和整體性。生物信息學(xué)在其中都起到越來越重要的作用。(4)比較基因組學(xué)的基本原理、意義和主要研究方法基本原理:通過模式生物基因組之間或者模式生物和人類基因組之間的比較和鑒別,在一種生物基因組中找到與另一種生物某個基因功能相似的基因,從而發(fā)現(xiàn)新基因。意義:為研究生物進化、分離人類遺傳病的候選基因以及預(yù)測新的基因功能提供依據(jù)。主要研究方法:系統(tǒng)發(fā)育概形法,rosetta stone法,基因鄰居法 (5)蛋白質(zhì)二級結(jié)構(gòu)和高級結(jié)構(gòu)預(yù)測方法1、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測方法主要有3類:a。 結(jié)合人工神經(jīng)網(wǎng)絡(luò)、遺傳算法等機器學(xué)習(xí)方法,統(tǒng)計氨基酸出現(xiàn)頻率,如chous-fasman方法,b. 基于單一序列或多序列比對信息分析,如gor方法和phd方法c。 以已知二級結(jié)構(gòu)為模板,建立保守片段或位置特異性計分矩陣,通過打分預(yù)測,如psiblastp方法2、蛋白質(zhì)高級結(jié)構(gòu)預(yù)測方法主要有:比較
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 半導(dǎo)體TOPCon光伏電池項目可行性研究報告
- 船后廣場建筑節(jié)能監(jiān)理細(xì)則
- 新版浙教版2024-2025學(xué)年度八年級數(shù)學(xué)上冊第1章三角形的初步知識綜合素質(zhì)評價含答案
- 時尚歷史回顧-時尚歷史與風(fēng)格
- 背光驅(qū)動電路的選擇策略和應(yīng)用
- 《烹飪營養(yǎng)與食品安全》課件 平衡膳食
- 2024八年級數(shù)學(xué)上冊第一章勾股定理2一定是直角三角形嗎習(xí)題課件新版北師大版
- 2024年河南客運從業(yè)資格證考試答題技巧
- 2024年山西客運考試應(yīng)用能力試題及答案
- 駕馭文學(xué)創(chuàng)作之藝-深度解析文學(xué)創(chuàng)作關(guān)鍵技巧
- 商務(wù)英語翻譯授課教案 第七單元
- 深圳高層次人才事項申請表
- 科學(xué)坐月子課件(PPT 31頁)
- 電瓶車風(fēng)險管控措施告知牌
- 萵苣種植管理ppt課件(PPT 21頁)
- 英文文獻閱讀ppt課件(PPT 24頁)
- 醫(yī)院患者診療信息安全風(fēng)險評估和應(yīng)急工作機制制定應(yīng)急預(yù)案XX醫(yī)院患者診療信息安全風(fēng)險應(yīng)急預(yù)案
- 《國際經(jīng)濟法》課件國際貨物貿(mào)易法笫一講 國際貨物買賣合同
- 負(fù)荷計算表(完美版)
- 行政法及公務(wù)員法專題與參考答案及解析
- 12.4 n次方根
評論
0/150
提交評論