生物信息學(xué)概論_第1頁
生物信息學(xué)概論_第2頁
生物信息學(xué)概論_第3頁
生物信息學(xué)概論_第4頁
生物信息學(xué)概論_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、2021-10-251生物信息學(xué)生物信息學(xué)Bioinformatics2021-10-252理論課講授內(nèi)容理論課講授內(nèi)容第一講第一講 生物信息學(xué)概論生物信息學(xué)概論第二講第二講 醫(yī)學(xué)信息學(xué)基礎(chǔ)及信息學(xué)基本技術(shù)醫(yī)學(xué)信息學(xué)基礎(chǔ)及信息學(xué)基本技術(shù)第三講第三講 生物信息中心、核酸和蛋白質(zhì)序列生物信息中心、核酸和蛋白質(zhì)序列 資源資源第四講第四講 生物信息重要數(shù)據(jù)庫生物信息重要數(shù)據(jù)庫2021-10-253第五講第五講 序列比對序列比對第六講第六講 生物醫(yī)學(xué)文獻(xiàn)及生物醫(yī)學(xué)文獻(xiàn)及PCR第七講第七講 序列特征分析序列特征分析第八講第八講 生物信息學(xué)與基因芯片生物信息學(xué)與基因芯片2021-10-254生物生物信息信息

2、學(xué)概論學(xué)概論2021-10-255內(nèi)容內(nèi)容生物信息學(xué)概況生物信息學(xué)概況生物信息學(xué)簡介生物信息學(xué)簡介 生物信息學(xué)、生物學(xué)基礎(chǔ)生物信息學(xué)、生物學(xué)基礎(chǔ) 歷史、內(nèi)容、任務(wù)、技術(shù)和方法歷史、內(nèi)容、任務(wù)、技術(shù)和方法 發(fā)展趨勢及研究熱點發(fā)展趨勢及研究熱點 生物信息學(xué)簡介生物信息學(xué)簡介2021-10-257三大自然科學(xué)之謎三大自然科學(xué)之謎 宇宙的起源宇宙的起源 生命的誕生生命的誕生 思維的奧秘思維的奧秘2021-10-2582021-10-259What is bioinformatics? from /wiki/Bioinformatics Bioinformat

3、ics and computational biology involve the use of techniques including applied mathematics, informatics, statistics, computer science, artificial intelligence, chemistry, and biochemistry to solve biological problems usually on the molecular level. Research in computational biology often overlaps wit

4、h systems biology. Major research efforts in the field include sequence alignment, gene finding, genome assembly, protein structure alignment, protein structure prediction, prediction of gene expression and protein-protein interactions, and the modeling of evolution. 2021-10-2510生物生物信息信息學(xué)學(xué) 說文解字:生物說文

5、解字:生物 + 信息信息 + 學(xué)學(xué) (bioinformatics) biology + information + theory 廣義廣義 應(yīng)用信息科學(xué)的方法和技術(shù),研究生物體系應(yīng)用信息科學(xué)的方法和技術(shù),研究生物體系和生物過程中信息的存貯、信息的內(nèi)涵和信息的和生物過程中信息的存貯、信息的內(nèi)涵和信息的傳遞,研究和分析生物體細(xì)胞、組織、器官的生傳遞,研究和分析生物體細(xì)胞、組織、器官的生理、病理、藥理過程中的各種生物信息,或者也理、病理、藥理過程中的各種生物信息,或者也可以說成是可以說成是生命科學(xué)生命科學(xué)中的中的信息科學(xué)信息科學(xué)。 狹義狹義 應(yīng)用應(yīng)用信息科學(xué)信息科學(xué)的理論、方法和技術(shù),管理、的理論

6、、方法和技術(shù),管理、分析和利用分析和利用生物分子生物分子數(shù)據(jù)。數(shù)據(jù)。 2021-10-2511生物學(xué)家生物學(xué)家( (生物學(xué)問題生物學(xué)問題) )數(shù)學(xué)物理學(xué)家數(shù)學(xué)物理學(xué)家計算機科學(xué)家計算機科學(xué)家( (基礎(chǔ)理論問題基礎(chǔ)理論問題) )工程師工程師(技術(shù)應(yīng)用)(技術(shù)應(yīng)用)計算生物學(xué)計算生物學(xué)/ /生物信息學(xué):生物信息學(xué):三種科學(xué)文化的融合三種科學(xué)文化的融合2021-10-2512A marriage of BiologyInformationtechnology2021-10-2513數(shù)據(jù)數(shù)據(jù)算法算法應(yīng)用應(yīng)用(Bioinformatics)美國人類基因組計劃實施五年后的總結(jié)美國人類基因組計劃實施五年后的

7、總結(jié)報告中,對生物信息學(xué)作了以下定義報告中,對生物信息學(xué)作了以下定義: 生物信息學(xué)是一門交叉科學(xué),它包含了生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處理、存儲、分發(fā)、分析生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面,綜合運用數(shù)學(xué)、和解釋等在內(nèi)的所有方面,綜合運用數(shù)學(xué)、計算機科學(xué)和生物學(xué)的各種工具,來闡明和計算機科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。理解大量數(shù)據(jù)所包含的生物學(xué)意義。2021-10-25152021-10-2516曼哈頓原子彈計劃曼哈頓原子彈計劃阿波羅登月計劃阿波羅登月計劃人類基因組計劃人類基因組計劃(Manhattan Proje

8、ct) 美國陸軍部于美國陸軍部于1942年年6月開始實施的利月開始實施的利用核裂變反應(yīng)來研用核裂變反應(yīng)來研制原子彈的計劃制原子彈的計劃 阿波羅計劃(阿波羅計劃(Projec Apollo),是美國從),是美國從1961年到年到1972年從事的年從事的一系列載人登月飛行任一系列載人登月飛行任務(wù)務(wù) 2021-10-251760年代初,美國總統(tǒng)年代初,美國總統(tǒng)Kennedy提出兩個科學(xué)計劃:提出兩個科學(xué)計劃:登月計劃登月計劃攻克腫瘤計劃攻克腫瘤計劃 人類遺傳信息的復(fù)雜性人類遺傳信息的復(fù)雜性人類基因組計劃人類基因組計劃(HGP,Human Genome Project)2021-10-2518生命活動

9、三要素:物質(zhì)、能量、信息生命活動三要素:物質(zhì)、能量、信息 DNA: 遺傳物質(zhì)遺傳物質(zhì)(遺傳信息的載體遺傳信息的載體) 雙螺旋結(jié)構(gòu)雙螺旋結(jié)構(gòu) A, C, G, T四種基本字符的復(fù)雜文本四種基本字符的復(fù)雜文本 基因基因(Gene):具有遺傳效應(yīng)的:具有遺傳效應(yīng)的DNA分子片段分子片段2021-10-2519 基因組基因組(Genome)(Genome):包含包含細(xì)胞或生物體細(xì)胞或生物體全套的遺傳信息的全部全套的遺傳信息的全部 遺傳物質(zhì)。遺傳物質(zhì)。原核生物原核生物( (細(xì)菌、病毒等細(xì)菌、病毒等) ) 真核生物真核生物( (真菌、植物、動物等真菌、植物、動物等) )人類基因組:人類基因組: 3.210

10、9 bp 2021-10-2520盡管比之于人類登月,盡管比之于人類登月,HGP的投入資金的投入資金要少得多,但要少得多,但HGP對人類生活的影響要對人類生活的影響要更為深遠(yuǎn)更為深遠(yuǎn)。因為隨著這個計劃的完成,。因為隨著這個計劃的完成,DNA分子中編碼的分子中編碼的遺傳信息將對人類存遺傳信息將對人類存在的化學(xué)基礎(chǔ)作出最終的回答在的化學(xué)基礎(chǔ)作出最終的回答。這將不。這將不僅幫助我們理解我們是如何作為健康的僅幫助我們理解我們是如何作為健康的人發(fā)揮正常功能的,而且也將在化學(xué)水人發(fā)揮正常功能的,而且也將在化學(xué)水平上解釋遺傳因子在各種疾病,如癌癥、平上解釋遺傳因子在各種疾病,如癌癥、早老癡呆癥、精神分裂癥等

11、一些嚴(yán)重危早老癡呆癥、精神分裂癥等一些嚴(yán)重危害人類健康的疾病中的作用。畢竟害人類健康的疾病中的作用。畢竟對人對人類自身更深入的了解是人類活動中最重類自身更深入的了解是人類活動中最重要的一個部分。要的一個部分。Watson ,1990,Science2021-10-25211984.12 猶他州阿爾塔組織會議,初步研討測定人類整個基猶他州阿爾塔組織會議,初步研討測定人類整個基 因組因組DNA序列的意義序列的意義1985 Dulbecco在在Science撰文撰文 “腫瘤研究的轉(zhuǎn)折點腫瘤研究的轉(zhuǎn)折點:人人 類基因組的測序類基因組的測序” 美國能源部美國能源部(DOE)提出提出“人類基因組計劃人類基

12、因組計劃”草案草案1987 美國能源部和國家衛(wèi)生研究院(美國能源部和國家衛(wèi)生研究院(NIH)聯(lián)合為)聯(lián)合為“人類人類 基因組計劃基因組計劃”下?lián)軉咏?jīng)費約下?lián)軉咏?jīng)費約550萬美元萬美元1989 美國成立美國成立“國家人類基因組研究中心國家人類基因組研究中心Watson擔(dān)任擔(dān)任 第一任主任第一任主任1990.10 經(jīng)美國國會批準(zhǔn),人類基因組計劃正式啟動經(jīng)美國國會批準(zhǔn),人類基因組計劃正式啟動2021-10-2522 第一個自由生物體流感嗜血菌第一個自由生物體流感嗜血菌(H. inf)的全的全基因組測序完成基因組測序完成1996 完成人類基因組計劃的遺傳作圖完成人類基因組計劃的遺傳作圖 啟動模式生

13、物基因組計劃啟動模式生物基因組計劃H.inf全基因組全基因組Saccharomyces cerevisiae釀酒酵母釀酒酵母Caenorhabditis elegans秀麗線蟲秀麗線蟲2021-10-25231997 大腸桿菌大腸桿菌(E.coli)全基因組測序完成全基因組測序完成1998 完成人類基因組計劃的物理作圖完成人類基因組計劃的物理作圖 開始人類基因組的大規(guī)模測序開始人類基因組的大規(guī)模測序 Celera公司加入,與公共領(lǐng)域競爭公司加入,與公共領(lǐng)域競爭 啟動水稻基因組計劃啟動水稻基因組計劃1999.7 第第5屆國際公共領(lǐng)域人類基因組測序會議,加快測序速度屆國際公共領(lǐng)域人類基因組測序會議

14、,加快測序速度大腸桿菌及其全基因組大腸桿菌及其全基因組水稻基因組計劃水稻基因組計劃2021-10-25242000 Celera公司宣布完成果蠅基因組測序公司宣布完成果蠅基因組測序 國際公共領(lǐng)域宣布完成第一個植物基因組國際公共領(lǐng)域宣布完成第一個植物基因組擬南芥全基擬南芥全基 因組的測序工作因組的測序工作Drosophila melanogaster果蠅果蠅Arabidopsis thaliana擬南芥擬南芥2021-10-25252001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共領(lǐng)域和公共領(lǐng)域和Celera公司同時宣布完成人類

15、基因組工作草圖公司同時宣布完成人類基因組工作草圖2001.2.15 Nature刊文發(fā)表國際公共領(lǐng)域結(jié)果刊文發(fā)表國際公共領(lǐng)域結(jié)果2001.2.16 Science刊文發(fā)表刊文發(fā)表Celera公司及其合作者結(jié)果公司及其合作者結(jié)果2021-10-2526 1999年年12月月1日日,22號染色體測序完成號染色體測序完成 2006年年5月月18日日, 美國和英國科學(xué)家在英國美國和英國科學(xué)家在英國自然自然雜志網(wǎng)絡(luò)版上發(fā)表了人類最后一個雜志網(wǎng)絡(luò)版上發(fā)表了人類最后一個染色體染色體1號染色體的基因測序號染色體的基因測序 全部人類基因組約有全部人類基因組約有2.91Gbp,約有,約有39000多多個基因;個基

16、因; 1號染色體包含基因數(shù)量最多,達(dá)號染色體包含基因數(shù)量最多,達(dá)3141個,是平均水平的兩倍,共有超過個,是平均水平的兩倍,共有超過2.23億個堿基對;億個堿基對; 19號染色體是含基因最豐富的號染色體是含基因最豐富的染色體,而染色體,而13號染色體含基因量最少號染色體含基因量最少2021-10-2527 隨著實驗數(shù)據(jù)和可利用信息急劇增加,信息的管理和隨著實驗數(shù)據(jù)和可利用信息急劇增加,信息的管理和分析成為分析成為HGP的一項重要的工作的一項重要的工作 發(fā)現(xiàn)生物學(xué)發(fā)現(xiàn)生物學(xué)規(guī)律規(guī)律解讀生物解讀生物遺傳密碼遺傳密碼認(rèn)識生命的本質(zhì)認(rèn)識生命的本質(zhì)研究基因組數(shù)據(jù)研究基因組數(shù)據(jù)之間的關(guān)系之間的關(guān)系分析現(xiàn)有

17、的分析現(xiàn)有的基因組數(shù)據(jù)基因組數(shù)據(jù)利用數(shù)學(xué)模型利用數(shù)學(xué)模型和計算技術(shù)和計算技術(shù)2021-10-2528 各學(xué)科參與、協(xié)作:生命科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、計算機各學(xué)科參與、協(xié)作:生命科學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、計算機 科學(xué)、材料科學(xué)以及倫理、法律等社會科學(xué)科學(xué)、材料科學(xué)以及倫理、法律等社會科學(xué) 首要科學(xué)問題首要科學(xué)問題 如何找到記載在基因組如何找到記載在基因組DNA一維結(jié)構(gòu)上控制生命時間、空間一維結(jié)構(gòu)上控制生命時間、空間 的調(diào)控信息的編碼方式和調(diào)節(jié)規(guī)律。的調(diào)控信息的編碼方式和調(diào)節(jié)規(guī)律。 應(yīng)用數(shù)學(xué)、復(fù)雜系統(tǒng)理論、信息論、非線性科學(xué)應(yīng)用數(shù)學(xué)、復(fù)雜系統(tǒng)理論、信息論、非線性科學(xué) 催生催生生物信息學(xué)、計算生物

18、學(xué)生物信息學(xué)、計算生物學(xué) 芯片技術(shù)芯片技術(shù) 交叉性技術(shù)領(lǐng)域:物理學(xué)、微電子信息技術(shù)、生化技術(shù)、信交叉性技術(shù)領(lǐng)域:物理學(xué)、微電子信息技術(shù)、生化技術(shù)、信 息技術(shù)、自動化、材料科學(xué)息技術(shù)、自動化、材料科學(xué) 結(jié)構(gòu)生物學(xué)結(jié)構(gòu)生物學(xué) 前沿領(lǐng)域之一:生物物理學(xué)、生物化學(xué)、晶體學(xué)、波譜學(xué)、前沿領(lǐng)域之一:生物物理學(xué)、生物化學(xué)、晶體學(xué)、波譜學(xué)、 光譜學(xué)以及光譜學(xué)以及X射線晶體衍射技術(shù)、核磁共振技術(shù)射線晶體衍射技術(shù)、核磁共振技術(shù)2021-10-2529 生物學(xué)數(shù)據(jù)的收集、存儲、管理與提供生物學(xué)數(shù)據(jù)的收集、存儲、管理與提供 基因組序列信息的提取和分析基因組序列信息的提取和分析 功能基因組相關(guān)信息分析功能基因組相關(guān)信息

19、分析 生物大分子結(jié)構(gòu)模擬和藥物設(shè)計生物大分子結(jié)構(gòu)模擬和藥物設(shè)計 生物信息分析的技術(shù)與方法研究生物信息分析的技術(shù)與方法研究 應(yīng)用與發(fā)展研究應(yīng)用與發(fā)展研究生物信息學(xué)的主要研究內(nèi)容生物信息學(xué)的主要研究內(nèi)容2021-10-2530基因組基因組數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)序列序列數(shù)據(jù)庫數(shù)據(jù)庫 蛋白質(zhì)蛋白質(zhì)結(jié)構(gòu)結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)庫 DDBJEMBLGenBankSWISS-PROT PDBPIR2021-10-2531數(shù)據(jù)庫搜索及序列比較數(shù)據(jù)庫搜索及序列比較 搜索同源序列在一定程度上就是通過序列比較尋找相搜索同源序列在一定程度上就是通過序列比較尋找相似序列似序列 序列比較序列比較的一個基本操作就是的一個基本操作

20、就是比對比對(Alignment),即),即將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)將兩個序列的各個字符(代表核苷酸或者氨基酸殘基)按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是按照對應(yīng)等同或者置換關(guān)系進行對比排列,其結(jié)果是兩個序列共有的排列順序,這是序列相似程度的一種兩個序列共有的排列順序,這是序列相似程度的一種定性描述定性描述 多重序列比對多重序列比對研究的是多個序列的共性。序列的多重研究的是多個序列的共性。序列的多重比對可用來搜索基因組序列的功能區(qū)域,也可用于研比對可用來搜索基因組序列的功能區(qū)域,也可用于研究一組蛋白質(zhì)之間的進化關(guān)系。究一組蛋白質(zhì)之間的進化關(guān)系。 2021-10-

21、2532基因組序列分析基因組序列分析 遺傳語言分析遺傳語言分析天書天書 基因組結(jié)構(gòu)分析基因組結(jié)構(gòu)分析 基因識別基因識別 基因功能注釋基因功能注釋 基因調(diào)控信息分析基因調(diào)控信息分析 基因組比較基因組比較CTCAGATTGAACGCTGGcGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGGAAGCAGCTTGCTGCTTCGCTGACGAGTGGCGGACGGGTGAGTAATGTCTGGGAAACTGCCTGATGGAGGGGGATAACTACTGGAAACGGTAGCTAATACCGCATAACGTCGCAAGACCAAAGAGGGGGACCTTCGGGCCTCTTGCC

22、ATCGGATGTGCCCAGATGGGATTAGCTAGTAGGTGGGGTAACGGCTCACCTAGGCGACGATCCCTAGCTGGTCTGAGAGGATGACCACCCACACTGGAACTGAGACGACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCGGGGAGGAAGGTGTTGAGGTTAATAACCTCATCGATTGACGTTACCCGCAGAAGAAGCACCGGCTAACTCCGTGCCAG

23、CAGCCGCGGTAATACGGAGGGTGCAAGCGTTAATCGGAATTACTGGGCGTAAAGCGCACGCAGGCGGTCTGTCAAGTCGGATGTGAAATCCCCGGGCTCAACCTGGGAACTGCATTCGAAACTGGCAGGCTAGAGTCTTGTAGAGGGGGGTAGAATTCCAGGTGTAGCGGTGAAATGCGTAGAGATCTGGAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAAAGACTGACGCTCAGGTGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATG

24、TCGACTTGGAGGTTGTGCCCTTGAGGCGTGGCTTCCGGAGCTAACGCGTTAAGTCGACCGCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAATGAATTGACGGGGGCCcGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCT

25、TTGTTGCCAGCGGTCAGGCCGGGAACTCAAAGGAGACTGCCAGTGATAAACTGGAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCGCATACAAAGAGAAGCGACCTCGCGAGAGCAAGCGGACCTCATAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTGGATCAGAATGCCACGGTGAATACGTTCCCGGGCCTTGTA2021-10-2534基因表達(dá)數(shù)據(jù)的分析與處理基因表

26、達(dá)數(shù)據(jù)的分析與處理 基因表達(dá)數(shù)據(jù)分析基因表達(dá)數(shù)據(jù)分析是目前生物信息學(xué)研究的熱是目前生物信息學(xué)研究的熱 點和重點點和重點 目前對基因表達(dá)數(shù)據(jù)的處理主要是進行目前對基因表達(dá)數(shù)據(jù)的處理主要是進行聚類分聚類分 析析,將表達(dá)模式相似的基因聚為一類,在此基將表達(dá)模式相似的基因聚為一類,在此基 礎(chǔ)上尋找相關(guān)基因,分析基因的功能礎(chǔ)上尋找相關(guān)基因,分析基因的功能 所用方法所用方法主要有:相關(guān)分析方法、模式識別技主要有:相關(guān)分析方法、模式識別技術(shù)中的層次式聚類方法、人工智能中的自組織術(shù)中的層次式聚類方法、人工智能中的自組織映射神經(jīng)網(wǎng)絡(luò)、主元分析方法映射神經(jīng)網(wǎng)絡(luò)、主元分析方法 等等 表達(dá)數(shù)據(jù)表達(dá)數(shù)據(jù)缺點缺點:僅反映

27、僅反映mRNA豐度,噪聲,豐度,噪聲,2021-10-2535蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測 蛋白質(zhì)的生物蛋白質(zhì)的生物功能功能由蛋白質(zhì)的由蛋白質(zhì)的結(jié)構(gòu)結(jié)構(gòu)所決定,蛋所決定,蛋白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑 蛋白質(zhì)結(jié)構(gòu)預(yù)測分為蛋白質(zhì)結(jié)構(gòu)預(yù)測分為: :二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測 蛋白質(zhì)折疊蛋白質(zhì)折疊2021-10-2536 在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別問題 在二級結(jié)構(gòu)預(yù)測方面主要方法有:在二級結(jié)構(gòu)預(yù)測方面主要方法有: 立體化學(xué)方法立體化學(xué)方法 圖論方法圖論方法 統(tǒng)計

28、方法統(tǒng)計方法 最鄰近決策方法最鄰近決策方法 基于規(guī)則的專家系統(tǒng)方法基于規(guī)則的專家系統(tǒng)方法 分子動力學(xué)方法分子動力學(xué)方法 人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)方法 預(yù)測準(zhǔn)確率超過預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的PHD系統(tǒng)系統(tǒng)2021-10-2537 在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法同源模型法 該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折該方法的依據(jù)是:相似序列的蛋白質(zhì)傾向于折疊成相似的三維空間結(jié)構(gòu)疊成相似的三維空間結(jié)構(gòu) 運用同源模型方法可以完成所有蛋白質(zhì)運用同源模型方法可以完成所有蛋白質(zhì)10-30%的空間結(jié)

29、構(gòu)預(yù)測工作的空間結(jié)構(gòu)預(yù)測工作 發(fā)展趨勢及研究熱點發(fā)展趨勢及研究熱點2021-10-2539系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)(Systems Biology): 由分析為主走向分析與綜合并舉的系統(tǒng)方法由分析為主走向分析與綜合并舉的系統(tǒng)方法 微觀微觀還原論還原論 整體整體系統(tǒng)論系統(tǒng)論統(tǒng)一生物學(xué)統(tǒng)一生物學(xué)(General Biology): 探索生命活動本質(zhì),產(chǎn)生統(tǒng)一的生命觀和統(tǒng)一的生物學(xué)探索生命活動本質(zhì),產(chǎn)生統(tǒng)一的生命觀和統(tǒng)一的生物學(xué)實驗、理論、計算生物學(xué):實驗、理論、計算生物學(xué): (Experimental, Theoretical, Computational Biology ) 生命科學(xué)與數(shù)、理、化、計

30、算機等學(xué)科的大綜合、大交叉生命科學(xué)與數(shù)、理、化、計算機等學(xué)科的大綜合、大交叉生物技術(shù)的產(chǎn)業(yè)化生物技術(shù)的產(chǎn)業(yè)化(Biotechnology): 基礎(chǔ)研究轉(zhuǎn)化為生產(chǎn)力基礎(chǔ)研究轉(zhuǎn)化為生產(chǎn)力 生物工程技術(shù)生物工程技術(shù)農(nóng)、林、醫(yī)藥農(nóng)、林、醫(yī)藥2021-10-2540生物大分子的結(jié)構(gòu)與功能研究生物大分子的結(jié)構(gòu)與功能研究基因組與細(xì)胞的研究基因組與細(xì)胞的研究基因組比較研究基因組比較研究關(guān)于遺傳、發(fā)育、分化、進化的綜合理論研究關(guān)于遺傳、發(fā)育、分化、進化的綜合理論研究腦科學(xué)和神經(jīng)科學(xué)研究腦科學(xué)和神經(jīng)科學(xué)研究行為科學(xué)研究行為科學(xué)研究生態(tài)學(xué)研究生態(tài)學(xué)研究人體功能研究人體功能研究研究手段:研究手段:實驗、理論、計算相結(jié)

31、合實驗、理論、計算相結(jié)合2021-10-2541 當(dāng)今生物信息學(xué)界的大部分人都當(dāng)今生物信息學(xué)界的大部分人都把注意力集中在把注意力集中在基因組、蛋白質(zhì)組、基因組、蛋白質(zhì)組、蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)以及與之相結(jié)合的以及與之相結(jié)合的藥物設(shè)藥物設(shè)計計上,隨蛋白組學(xué)、代謝組學(xué)進一步上,隨蛋白組學(xué)、代謝組學(xué)進一步的發(fā)展,將在的發(fā)展,將在整體整體水平進行。水平進行。 2021-10-2542基因組基因組 新基因的發(fā)現(xiàn)新基因的發(fā)現(xiàn) 通過計算分析從通過計算分析從EST(Expressed Sequence Tags)序列庫中拼接出完整的新基因編碼區(qū),)序列庫中拼接出完整的新基因編碼區(qū),也就是通俗所說的也就是通俗所說

32、的“電子克隆電子克隆”;通過計算分;通過計算分析從基因組析從基因組DNA序列中確定新基因編碼區(qū),經(jīng)序列中確定新基因編碼區(qū),經(jīng)過多年的積累,已經(jīng)形成許多分析方法,如根過多年的積累,已經(jīng)形成許多分析方法,如根據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與據(jù)編碼區(qū)具有的獨特序列特征、根據(jù)編碼區(qū)與非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布非編碼區(qū)在堿基組成上的差異、根據(jù)高維分布的統(tǒng)計方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方的統(tǒng)計方法、根據(jù)神經(jīng)網(wǎng)絡(luò)方法、根據(jù)分形方法和根據(jù)密碼學(xué)方法等。法和根據(jù)密碼學(xué)方法等。 2021-10-2543非蛋白編碼區(qū)生物學(xué)意義的分析非蛋白編碼區(qū)生物學(xué)意義的分析 2021-10-2544 非

33、蛋白編碼區(qū)約占人類基因組的非蛋白編碼區(qū)約占人類基因組的95%,其,其生物學(xué)意義目前尚不是很清楚,但從演化觀點生物學(xué)意義目前尚不是很清楚,但從演化觀點來看,其中必然蘊含著重要的生物學(xué)功能,由來看,其中必然蘊含著重要的生物學(xué)功能,由于它們并不編碼蛋白,一般認(rèn)為,它們的生物于它們并不編碼蛋白,一般認(rèn)為,它們的生物學(xué)功能可能體現(xiàn)在對基因表達(dá)的時空調(diào)控上。學(xué)功能可能體現(xiàn)在對基因表達(dá)的時空調(diào)控上。2021-10-2545研究非蛋白編碼區(qū)生物學(xué)意義的兩種策略:研究非蛋白編碼區(qū)生物學(xué)意義的兩種策略: 一種一種是基于已有的已經(jīng)為實驗證實的所有功能是基于已有的已經(jīng)為實驗證實的所有功能已知的已知的DNA元件的序列特

34、征,預(yù)測非蛋白編碼區(qū)元件的序列特征,預(yù)測非蛋白編碼區(qū)中可能含有的功能已知的中可能含有的功能已知的DNA元件,從而預(yù)測其元件,從而預(yù)測其可能的生物學(xué)功能,并通過實驗進行驗證;可能的生物學(xué)功能,并通過實驗進行驗證; 另一種另一種則是通過數(shù)理理論直接探索非蛋白編碼則是通過數(shù)理理論直接探索非蛋白編碼區(qū)的新的未知的序列特征,并從理論上預(yù)測其可區(qū)的新的未知的序列特征,并從理論上預(yù)測其可能的信息含義,最后同樣通過實驗驗證。能的信息含義,最后同樣通過實驗驗證。 2021-10-2546基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握基因組整體功能及其調(diào)節(jié)網(wǎng)絡(luò)的系統(tǒng)把握 把握生命的本質(zhì),僅僅掌握基因組中部分把握生命的本質(zhì),

35、僅僅掌握基因組中部分基因的表達(dá)調(diào)控是遠(yuǎn)遠(yuǎn)不夠的,因為生命現(xiàn)象基因的表達(dá)調(diào)控是遠(yuǎn)遠(yuǎn)不夠的,因為生命現(xiàn)象是基因組中所有功能單元相互作用共同制造出是基因組中所有功能單元相互作用共同制造出來的。來的。基因芯片基因芯片技術(shù)由于可以監(jiān)測基因組在各技術(shù)由于可以監(jiān)測基因組在各種時間斷面上的整體轉(zhuǎn)錄表達(dá)狀況,因此成為種時間斷面上的整體轉(zhuǎn)錄表達(dá)狀況,因此成為該領(lǐng)域中一項非常重要和關(guān)鍵的實驗技術(shù),對該領(lǐng)域中一項非常重要和關(guān)鍵的實驗技術(shù),對該技術(shù)所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,該技術(shù)所產(chǎn)生的大量實驗數(shù)據(jù)進行高效分析,從中獲得基因組運轉(zhuǎn)以及調(diào)控的整體從中獲得基因組運轉(zhuǎn)以及調(diào)控的整體系統(tǒng)的機系統(tǒng)的機制制或者是網(wǎng)絡(luò)機制,

36、便成了生物信息學(xué)在該領(lǐng)或者是網(wǎng)絡(luò)機制,便成了生物信息學(xué)在該領(lǐng)域中首先要解決的問題。域中首先要解決的問題。 2021-10-2547基因組演化與物種演化基因組演化與物種演化 (生命之樹)2021-10-2548 盡管已經(jīng)在分子演化方面取得了許多重要的成盡管已經(jīng)在分子演化方面取得了許多重要的成就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想就,但僅僅依靠某些基因或者分子的演化現(xiàn)象,就想闡明物種整體的演化歷史似乎不太可靠。例如,智人闡明物種整體的演化歷史似乎不太可靠。例如,智人與黑猩猩之間有與黑猩猩之間有98%-99%98%-99%的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,的結(jié)構(gòu)基因和蛋白質(zhì)是相同的,然而表型上卻具

37、有如此巨大的差異,這就不能不使我然而表型上卻具有如此巨大的差異,這就不能不使我們聯(lián)想到形形色色千差萬別的建筑樓群,它們的外觀們聯(lián)想到形形色色千差萬別的建筑樓群,它們的外觀如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別如此不同,但基礎(chǔ)的部件組成卻是幾乎一樣的,差別就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們就在于這些基礎(chǔ)部件的組織方式不同,這就提示我們基因組整體組織方式而不僅僅是個別基因在研究物種基因組整體組織方式而不僅僅是個別基因在研究物種演化歷史中的重要作用。由于基因組是物種所有遺傳演化歷史中的重要作用。由于基因組是物種所有遺傳信息的儲藏庫,從根本上決定著物種個體的發(fā)育和生信息的儲藏庫,從

38、根本上決定著物種個體的發(fā)育和生理,因此,理,因此,從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)從基因組整體結(jié)構(gòu)組織和整體功能調(diào)節(jié)網(wǎng)絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進行基因組整體絡(luò)方面,結(jié)合相應(yīng)的生理表征現(xiàn)象,進行基因組整體的演化研究,將是揭示物種真實演化歷史的最佳途徑。的演化研究,將是揭示物種真實演化歷史的最佳途徑。 2021-10-2549 基因組對生命體的整體控制必須通過它所表達(dá)的全部基因組對生命體的整體控制必須通過它所表達(dá)的全部蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能蛋白質(zhì)來執(zhí)行,由于基因芯片技術(shù)只能反映從基因組到反映從基因組到RNA的轉(zhuǎn)錄水平上的表達(dá)的轉(zhuǎn)錄水平上的表達(dá)情況,由于從情況,由于從RNA到

39、蛋白質(zhì)還到蛋白質(zhì)還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)我們還有許多中間環(huán)節(jié)的影響,因此僅憑基因芯片技術(shù)我們還不能最終掌握生物功能具體執(zhí)行者不能最終掌握生物功能具體執(zhí)行者蛋白質(zhì)的整體表蛋白質(zhì)的整體表達(dá)狀況;達(dá)狀況; 近幾年在發(fā)展基因芯片的同時,人們也發(fā)展了一套研近幾年在發(fā)展基因芯片的同時,人們也發(fā)展了一套研究究基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況基因組所有蛋白質(zhì)產(chǎn)物表達(dá)情況蛋白質(zhì)組蛋白質(zhì)組研究技研究技術(shù),從技術(shù)上來講包括術(shù),從技術(shù)上來講包括二維凝膠電泳技術(shù)二維凝膠電泳技術(shù)和和質(zhì)譜質(zhì)譜測序技測序技術(shù)。通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋術(shù)。通過二維凝膠電泳技術(shù)可以獲得某一時間截面上蛋白質(zhì)組的

40、表達(dá)情況,通過質(zhì)譜測序技術(shù)就可以得到所有白質(zhì)組的表達(dá)情況,通過質(zhì)譜測序技術(shù)就可以得到所有這些蛋白質(zhì)的序列組成。這些都是技術(shù)實現(xiàn)問題,最重這些蛋白質(zhì)的序列組成。這些都是技術(shù)實現(xiàn)問題,最重要的就是如何運用要的就是如何運用生物信息學(xué)理論方法生物信息學(xué)理論方法去分析所得到的去分析所得到的巨量數(shù)據(jù),從中還原出巨量數(shù)據(jù),從中還原出生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)生命運轉(zhuǎn)和調(diào)控的整體系統(tǒng)的分的分子機制。子機制。 蛋白質(zhì)組蛋白質(zhì)組 2021-10-2550 基因組和蛋白質(zhì)組研究的迅猛發(fā)基因組和蛋白質(zhì)組研究的迅猛發(fā)展,使許多新蛋白序列涌現(xiàn)出來,展,使許多新蛋白序列涌現(xiàn)出來,然而要想了解它們的功能,只有氨然而要想了解它們

41、的功能,只有氨基酸序列是遠(yuǎn)遠(yuǎn)不夠的,因為蛋白基酸序列是遠(yuǎn)遠(yuǎn)不夠的,因為蛋白質(zhì)的功能是通過其三維高級結(jié)構(gòu)來質(zhì)的功能是通過其三維高級結(jié)構(gòu)來執(zhí)行的,而且執(zhí)行的,而且蛋白質(zhì)三維結(jié)構(gòu)也不蛋白質(zhì)三維結(jié)構(gòu)也不一定是靜態(tài)的,在行使功能的過程一定是靜態(tài)的,在行使功能的過程中其結(jié)構(gòu)也會相應(yīng)的有所改變中其結(jié)構(gòu)也會相應(yīng)的有所改變。因因此,得到這些新蛋白的完整、精確此,得到這些新蛋白的完整、精確和動態(tài)的和動態(tài)的三維結(jié)構(gòu)三維結(jié)構(gòu)就成為擺在我們就成為擺在我們面前的緊迫任務(wù)。目前除了通過諸面前的緊迫任務(wù)。目前除了通過諸如如X射線晶體結(jié)構(gòu)分析、多維核磁共射線晶體結(jié)構(gòu)分析、多維核磁共振(振(NMR)波譜分析和電子顯微鏡)波譜分析

42、和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),二維晶體三維重構(gòu)(電子晶體學(xué),EC)等物理方法得到)等物理方法得到蛋白質(zhì)三維結(jié)蛋白質(zhì)三維結(jié)構(gòu)構(gòu)蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu) 2021-10-2551 另外一種廣另外一種廣泛使用的方法就是泛使用的方法就是通過通過計算機輔助預(yù)計算機輔助預(yù)測測的方法,目前,的方法,目前,一般認(rèn)為蛋白質(zhì)的一般認(rèn)為蛋白質(zhì)的折疊類型只有數(shù)百折疊類型只有數(shù)百到數(shù)千種,遠(yuǎn)遠(yuǎn)小到數(shù)千種,遠(yuǎn)遠(yuǎn)小于蛋白質(zhì)所具有的于蛋白質(zhì)所具有的自由度數(shù)目,而且自由度數(shù)目,而且蛋白質(zhì)的折疊類型蛋白質(zhì)的折疊類型與其氨基酸序列具與其氨基酸序列具有相關(guān)性,這樣就有相關(guān)性,這樣就有可能直接從蛋白有可能直接從蛋白質(zhì)的氨基酸序

43、列通質(zhì)的氨基酸序列通過計算機輔助方法過計算機輔助方法預(yù)測出蛋白質(zhì)的三預(yù)測出蛋白質(zhì)的三維結(jié)構(gòu)維結(jié)構(gòu) 2021-10-2552新藥設(shè)計新藥設(shè)計 2021-10-2553 隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白隨著結(jié)構(gòu)生物學(xué)的發(fā)展,相當(dāng)數(shù)量的蛋白質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測定,質(zhì)以及一些核酸、多糖的三維結(jié)構(gòu)獲得精確測定,基于生物大分子結(jié)構(gòu)知識的藥物設(shè)計成為當(dāng)前的基于生物大分子結(jié)構(gòu)知識的藥物設(shè)計成為當(dāng)前的熱點。生物信息學(xué)的研究不僅可提供熱點。生物信息學(xué)的研究不僅可提供生物大分子生物大分子空間結(jié)構(gòu)的信息空間結(jié)構(gòu)的信息,還能提供還能提供電子結(jié)構(gòu)電子結(jié)構(gòu)的信息,如的信息,如能級、表面電荷分布、分子軌道相互作用等以及能級、表面電荷分布、分子軌道相互

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論