第一章(更改) 生物信息學教程_第1頁
第一章(更改) 生物信息學教程_第2頁
第一章(更改) 生物信息學教程_第3頁
第一章(更改) 生物信息學教程_第4頁
第一章(更改) 生物信息學教程_第5頁
已閱讀5頁,還剩79頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

生物信息學主講人:彭曉莉課程特點多學科交叉,知識覆蓋面廣:生物、計算機、數(shù)學、物理、化學等內(nèi)容眾多,且應用領域寬廣:涉及從基因組序列分析直到藥物設計等實踐環(huán)節(jié)非常重要:生物信息數(shù)據(jù)資源與分析工具繁多知識更新快:理論方法尚不系統(tǒng)成熟,處于迅速發(fā)展變化階段缺乏合適的教材計算機方面網(wǎng)絡技術和數(shù)據(jù)庫(特別是關系型數(shù)據(jù)庫)管理技術數(shù)據(jù)整合和可視化數(shù)據(jù)挖掘(DataMining)與人工智能算法設計軟件研制數(shù)學方面統(tǒng)計學,是生物信息學的數(shù)學基礎之一概率論與隨機過程理論運籌學,如動態(tài)規(guī)劃法最優(yōu)化理論與算法幾何拓撲學函數(shù)論,如傅里葉變換,小波變換信息論,神經(jīng)網(wǎng)絡,計算數(shù)學;群論,組合數(shù)學等課程定位介紹生物信息學對于生命科學研究及生物技術相關產(chǎn)業(yè)發(fā)展的重要性沿著“從生物信息查詢、DNA和蛋白質相似性對比、蛋白質結構和功能預測”這一主線,介紹相關的生物信息學研究內(nèi)容、所涉及的主要方法與研究思路、所取得的研究成果及其解決問題的能力講授與研討相結合,請學有所長的同學參與部分講授教學計劃第一章生物信息學引論第二章生物信息學的發(fā)展和前景第三章常用生物信息學數(shù)據(jù)庫簡介第四章生物信息查詢第五章DNA和蛋白質相似性對比第六章蛋白質結構和功能預測

生物信息學實驗教學實驗1.使用Oligo和Primer軟件設計PCR引物實驗2.常用分子生物學數(shù)據(jù)庫的使用和數(shù)據(jù)格式、數(shù)據(jù)庫查詢與下載(Entrez.SRS)實驗3.核酸和蛋白質序列的進化分析(CLUSTALX、MEGA2軟件的使用)實驗4.蛋白質序列分析和結構預測主要參考書1《生物信息學》,DavidW.Mount著,鐘揚、王莉、張亮等譯,高等教育出版社,2003

2生物信息學——基因和蛋白質分析的實用指南(AndreasD.BaxevanisAndB.F.FrancisOuellette著).李衍達、孫子榮等譯.北京:清華大學出版社,2000

3《簡明生物信息學》,鐘揚等主編.高等教育出版社,2001

《探索基因組學、蛋白質組學和生物信息學》,孫子榮譯.科學出版社,2004

4《生物信息學方法與實踐》,張成崗賀福初編著.科學出版社,2002

5《生物信息學導論》,李巍等主編.鄭州大學出版社,2004

第一章

生物信息學引論研究背景生物信息學定義生物信息學研究內(nèi)容生物信息學研究方法研究背景從人類基因組計劃(HGP)說起為什么提出HGP?1961年,美國總統(tǒng)Kennedy提出兩個科學計劃:

登月計劃

攻克腫瘤計劃

人類遺傳信息的復雜性

人類基因組計劃(HGP,HumanGenomeProject)目標:整體上破解人類遺傳信息的奧秘1、“曼哈頓原子彈計劃”歷史遺留問題之產(chǎn)物2、對生命科學和醫(yī)學的科學影響

二十世紀三大科學計劃曼哈頓原子彈計劃(1942-46)阿波羅登月計劃(1961-69)人類基因組計劃(1990-2003)

HGP的驅動

1986年Science上DulbeccoR重要文章“腫瘤研究的轉折人類基因組的全序列分析”。包括腫瘤在內(nèi)的一切疾病的發(fā)生,都與基因相關。是“零敲碎打”?還是從整體上研究和分析整個人類基因組?他指出,這個世界上發(fā)生的一切事情,都與這人類的DNA序列相關。只有弄清人類基因組全部或大部分基因的工作情況,實施其它計劃才有可能。這樣的工作是任何一個實驗室難以單獨承擔的

DNA、基因、基因組生命活動三要素:物質、能量、信息DNA:遺傳物質(遺傳信息的載體)雙螺旋結構A,C,G,T四種基本字符的復雜文本

基因(Gene):具有遺傳效應的DNA分子片段基因組(Genome):包含細胞或生物體的全套遺傳信息的全部遺傳物質

原核生物(細菌、病毒等)真核生物(真菌、植物、動物等)人類基因組:3.2×109bp,含有約3萬個基因HGP歷史回顧1984.12猶他州阿爾塔組織會議,初步研討測定人類整個基因組DNA序列的意義1986.3Dulbecco在《Science》撰文“腫瘤研究的轉折點:人類基因組的測序”美國能源部(DOE)提出“人類基因組計劃”草案1987美國能源部和國家衛(wèi)生研究院(NIH)聯(lián)合為“人類基因組計劃”下?lián)軉咏?jīng)費約550萬美元1989美國成立“國家人類基因組研究中心”,Watson擔任第一任主任1990.10經(jīng)美國國會批準,人類基因組計劃正式啟動JamesWatsonWalterGilbert盡管比之于人類登月,HGP的投入資金要少得多,但HGP對人類生活的影響要更為深遠。因為隨著這個計劃的完成,DNA分子中編碼的遺傳信息將對人類存在的化學基礎作出最終的回答。這將不僅幫助我們理解我們是如何作為健康的人發(fā)揮正常功能的,而且也將在化學水平上解釋遺傳因子在各種疾病,如癌癥、早老癡呆癥、精神分裂癥等一些嚴重危害人類健康的疾病中的作用。畢竟對人類自身更深入的了解是人類活動中最重要的一個部分。

——Watson,1990,《Science》HGP的最初目標:通過國際合作,用15年時間(1990~2005)至少投入30億美元,構建詳細的人類基因組遺傳圖和物理圖,確定人類DNA的全部核苷酸序列,定位約10萬基因,并對其它生物進行類似研究。4張圖:遺傳圖物理圖序列圖基因圖HGP的終極目標闡明人類基因組全部DNA序列識別基因建立儲存這些信息的數(shù)據(jù)庫開發(fā)數(shù)據(jù)分析工具研究HGP實施所帶來的倫理、法律和社會問題HGP輔助計劃在人類基因組計劃中,還包括對五種生物基因組的研究:大腸桿菌、酵母、線蟲、果蠅和小鼠,稱之為人類的五種“模式生物”。

1995第一個自由生物體流感嗜血菌(H.inf)的全基因組測序完成

1996完成人類基因組計劃的遺傳作圖

啟動模式生物基因組計劃

H.Inf全基因組

1997大腸桿菌(E.coli)全基因組測序完成

1998完成人類基因組計劃的物理作圖

開始人類基因組的大規(guī)模測序

Celera公司加入,與公共領域競爭

啟動水稻基因組計劃

1999.7第5屆國際公共領域人類基因組測序會議,加快測序速度

2000Celera公司宣布完成果蠅基因組測序

國際公共領域宣布完成第一個植物基因組——擬南芥因組的測序工作

2000.6.26公共領域和Celera公司同時宣布完成人類基因組工作草圖

2001.2.15《Nature》刊文發(fā)表國際公共領域結果

2001.2.16《Science》刊文發(fā)表Celera公司及其合作者結果

AttheWhiteHouseonJune26,FrancisCollins(r),DirectoroftheNationalHumanGenomeResearchInstitute,PresidentClinton,andJ.CraigVenter,PresidentofCelaraGenomics,laudedthethousandsofscientistswhocontributedtothegenomesequence.

2001年8月26日人類基因組“中國卷”的繪制工作宣告完成。

2002年水稻、小鼠、瘧原蟲等基因組測序完成

2003年4月14日中、美、日、德、法、英等6國科學家宣布人類基因組序列圖繪制成功,人類基因組計劃的所有目標全部實現(xiàn)。

2003年10月,2004年10月人類基因組完成圖公布。

AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATA相當于3200本每本1000頁每頁1000字的“天書”地球生物圈約有140萬余種物種,其中2%以上至少有一段DNA序列被測定

▲真核生物12500種 ▲哺乳動物4200種 ▲真細菌3600種 ▲古細菌180種 ▲病毒1750種DNA序列數(shù)據(jù)增長趨勢功能基因組研究

功能相關海量數(shù)據(jù)轉錄組EST(ExpressedSequenceTag)SAGE(SerialAnalysisofGeneExpression)DNAMicroarray–largescalegeneexpressionanalysis蛋白質組2DGelElectrophoresis–proteinexpressionanalysisMassSpectrometry–proteinsequencingYeastTwo-Hybrid(Y2H)System–proteininteractionanalysis結構基因組X-rayCrystallographyNMR(NuclearMagneticResonance)Spectroscopy基因表達譜數(shù)據(jù)增長趨勢TheYeastcDNAMicroarrayPicture蛋白質序列數(shù)據(jù)增長情況蛋白質結構數(shù)據(jù)增長情況生物分子數(shù)據(jù)類型生物分子信息DNA序列數(shù)據(jù)

蛋白質序列數(shù)據(jù)

生物分子結構數(shù)據(jù)

生物分子功能數(shù)據(jù)

最基本直觀復雜

DNA核酸序列蛋白質氨基酸序列蛋白質結構蛋白質功能最基本的生物信息維持生命活動的機器第一部遺傳密碼第二部遺傳密碼?生命體系千姿百態(tài)的變化生物數(shù)據(jù)爆炸性增長:有人估計得到的結論是:生物數(shù)據(jù)量的積累已達到人類有史以來所說過的話的數(shù)百倍,而且還將以越來越快的速度增長。生物數(shù)據(jù)爆炸性增長所帶來的挑戰(zhàn)海量數(shù)據(jù)的存儲、管理、共享數(shù)據(jù)

知識,如何將這些數(shù)據(jù)變?yōu)樯飳W知識?……AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAA人類基因組以及其它模式生物基因組計劃的全面實施,使分子生物數(shù)據(jù)以爆炸性速度增長。在計算機科學領域,按照摩爾定律飛速前進的計算機硬件,以及逐步受到各國政府重視的信息高速公路計劃的實施,為生物信息資源的研究和應用帶來了福音。及時、充分、有效地利用網(wǎng)落上不斷增長的生物信息數(shù)據(jù)庫資源,已經(jīng)成為生命科學和生物技術研究開發(fā)的必要手段。核酸和蛋白質序列、結構、功能分析軟件已經(jīng)成為生物學、醫(yī)學、藥物學、農(nóng)學和環(huán)境科學等領域的必備工具。如何開發(fā)和利用生物信息數(shù)據(jù),已經(jīng)成了當今一個前沿領域和研究熱點。面對這種形勢,一門新興的邊緣學科--生物信息學應運而生。WhatisBioinformatics?WhatisBioinformatics?美國國家衛(wèi)生研究院(NIH)的定義:Bioinformatics(Research,development,orapplicationofcomputationaltoolsandapproachesforexpandingtheuseofbiological,medical,behavioralorhealthdata,includingthosetoacquire,store,organize,archive,analyze,orvisualizesuchdata.)

為拓展生物學、醫(yī)學、行為學和衛(wèi)生學數(shù)據(jù)的用途,而進行有關計算機方法手段的研究、開發(fā)與應用,包括此類數(shù)據(jù)的采集、存貯、整理、歸檔、分析與可視化WhatisBioinformatics?廣義定義:泛指任何與運用計算機及其網(wǎng)絡和數(shù)據(jù)庫進行大規(guī)模生物數(shù)據(jù)的收集,組織管理和分析相關的研究領域狹義定義:指用計算機的手段和方法來對生物遺傳的信息和數(shù)據(jù)進行管理和分析生物信息學(Bioinformatics)的來源Dr.HwaA.Lim(林華安)1987年提出“Bio-informatique”→“Bioinformatics”1955年出生于馬來西亞。聯(lián)合國Bioinformatics專家,UniversityofTexasatDallas分子與細胞生物學AdjunctProfessor、中國科學院基因遺傳研究所客座教授。1981年英國倫敦大學帝國學院(ImperialCollege,LondonUniversity)畢業(yè),1986年獲得美國RochesterUniversity生化物理學博士學位,30歲取得佛羅里達州立大學終生教授。1992年受聘擔任美國國家癌癥中心及美國國家科學基金會審核委員。1995年后,歷任多家生物科技公司生化信息執(zhí)行長、副總裁等高層管理職位。1997年,創(chuàng)立結合軟件與數(shù)據(jù)分析的專業(yè)顧問公司D’Trends,服務生物技術、制藥及衛(wèi)生保健等機構林華安最近又將Biothechnology、Information結合納米科技(Nano),提出Binformatics(生納信息學)生物信息學之父——林華安生物信息學—一門新興的交叉學科

(1).新興的交叉學科

Moleculebiology;Computerscience;Informaticsscience;Mathematics,Physicsetc.(2).生物信息學和其它生物學科研究的關系

生物信息學與其他學科之間的關系生物學.分子生物學醫(yī)學生物信息學數(shù)學.統(tǒng)計學計算機學.計算機網(wǎng)絡前基因組時代的“釣魚”和后基因組時代的“撈魚”WhenIgivetalkstoyoungscientistsseekingadviceaboutareasoffutureintensescientificexcitement,bioinformaticsismynumberonerecommendation.FrancisCollins,DirectorofHGPatNIH

Thenextstepintheprojectisthe“interpretationphase”.Thatisreallythefunpartofthewholeprojectbecausethenwefinallyhavethecompleteorderofalllayersofgeneticcodesandwehavetodiscoverwhatitallmeans.J.CraigVenter,HeadofCeleraGenomicsInc.

生物信息學的研究內(nèi)容

1.基因組信息學1).基因組信息的收集、存儲、管理與提供2).基因組序列信息的提取和分析基因的發(fā)現(xiàn)與鑒定;非編碼區(qū)的信息結構分析等3).基因組信息分析方法與技術的研究4).應用與發(fā)展研究2.蛋白質空間結構模擬與預測1).分子模擬技術2).蛋白質空間結構預測

3.藥物分子設計1).靶分子的確定2).藥物分子設計4.基因表達的調控,基因功能的預測;芯片表達,數(shù)據(jù)分析等5.分子的進化、生物的起源6.Network,Pathway(分子調控網(wǎng)絡、復雜疾病分子網(wǎng)絡)等

基因組研究的內(nèi)容:

結構基因組學(structuralgenomics)功能基因組學(functionalgenomics)結構基因組學(structuralgenomics):以全基因組測序為目標,弄清基因組中全部基因的位置和結構,為基因功能的研究奠定基礎目的:建立高分辨的遺傳圖譜、物理圖譜、轉錄圖譜和序列圖譜功能基因組學(functionalgenomics):以基因功能鑒定為目標,利用結構基因組學提供的信息,以高通量,大規(guī)模實驗方法及統(tǒng)計與計算機分析為特征,全面系統(tǒng)地分析全部基因的功能。研究角度包括:生物學功能、細胞學功能、發(fā)育學功能等

1.遺傳圖譜

2.物理圖譜

3.轉錄圖譜

4.序列圖譜

1結構基因組學結構基因組學遺傳圖譜:指基因或DNA標志在染色體上的相對位置與遺傳距離。CM表示(基因或DNA片段在染色體交換過程中分離的頻率)。通過該圖譜可分清各基因或DNA片段之間的相對距離與方向,如靠近著絲粒或端粒水稻1號染色體結構基因組學物理圖譜:指DNA序列上兩點間的實際距離。用于確定各遺傳標志間的物理距離有兩種物理圖譜:(1)以已定位的DNA序列標記位點(STS)為位標,以DNA實際長度為圖譜距離的基因組圖譜。(2)由YAC和/或細菌人工染色體(BAC)連續(xù)克隆重疊群組成的物理圖譜結構基因組學轉錄圖譜:以EST為位標,根據(jù)轉錄順序的位置和距離繪制的圖譜,它是染色體DNA某一區(qū)域內(nèi)所有可轉錄序列的分布圖,是基因圖的雛形結構基因組學人基因組1號染色體局部序列圖譜:以某一染色體上所含的全部堿基順序繪制的圖譜。基因組測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論