生物信息學(xué)概述下_第1頁
生物信息學(xué)概述下_第2頁
生物信息學(xué)概述下_第3頁
生物信息學(xué)概述下_第4頁
生物信息學(xué)概述下_第5頁
已閱讀5頁,還剩84頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、What is the total number of human genes? 28,0004,000 Only 1.1% of the genome is spanned by exons, whereas 24% is in introns, with 75% of the genome being intergenic DNA. One of the largest challenges is identifying the unknown functions that almost certainly exist in much of the “junk” DNA. Organism

2、 Year Millions Total Predicted Number of genes of bases coverage number per million bases sequenced (%) of genes sequenced Humangenomeroughdraft20012,6938431,78012 (publicsequence) Humangenomeroughdraft20012,6548339,11415 (Celerasequence) Arabidopsis thaliana 20001159225,498221 Drosophila metanogast

3、er20001166413,601117 Caenorhabditis elegans 1998979919,099197 Saccharomyces cerevisiae 199612935,800483 人類基因組非編碼區(qū)(“Junk”DNA)的構(gòu)成 至少包含如下類型的DNA成份或由其表達的RNA成分: 1. 內(nèi)含子(intron)、 2. 衛(wèi)星(Satellite)DNA、 3. 小衛(wèi)星(minisatellite)DNA、 4. 微衛(wèi)星(Microsatellite)DNA、 5. 非均一核RNA(簡稱hnRNA)、 6. 短散置元(shortinterspersedelements簡

4、稱SINE)、 7. 長散置元(1onginterspersedelements,簡稱LINE)、 8. 偽基因(Pseudogenes)、 9. 順式調(diào)控元件,如啟動子、增強子等也屬于非編碼序列。 重復(fù)序列在基因組中的比例 Human45% Arabidopsis11% C.elegans7% D.melanogaster3% Higher eukaryotes are believed to carry a large burden of “junk DNA” in their genomes. Although 98% of the human genome comprises non-

5、protein-coding DNA (1), the true density and distribution of functional nucleotides in these regions is currently unknown. Who share Ultraconserved Elements?Who share Ultraconserved Elements? human mouse rat chicken fish dog # of Ultraconserved Elements Theinsertionofarepetitivesequenceintoa genecan

6、influenceitstranscription.TheSINEs andotherrepeatscanactastissue-specific enhancersorsilencersoftheadjacentgenes. SmallRNA,microRNA,andRNA Interference(RNAi) EncyclopediaofDNAElements “DNA元件百科全書”計劃(Encyclopediaof DNAElements,簡稱ENCODE)發(fā)表了一系 列重要研究成果,挑戰(zhàn)了關(guān)于人類基因組 的傳統(tǒng)理論,即我們的基因組不是由孤立 的基因和大量“無用DNA片段”組成的,而 是

7、一個復(fù)雜的網(wǎng)絡(luò)系統(tǒng)。 編碼基因、調(diào)控元件以及非編碼RNA基因之 間,有著復(fù)雜的相互作用,共同控制著人 類的生理活動。 6.研究生物進化 1859,Darwin的物種起源對人類自然科學(xué)和自然 哲學(xué)發(fā)展的最重大貢獻之一。 進化論研究的核心是描述生物進化的歷史 (系統(tǒng)進化樹)和探索進化過程的機制。 當(dāng)前分子進化的研究已是進化論研究的重 要手段,并建立了一套依賴于核酸、蛋白 質(zhì)序列信息的理論方法。 l 序列相似性比較。常用的程序包有BLAST、FASTA 等; l 序列同源性分析。完成這一工作必須使用多序列 比較算法。常用的程序包有CLUSTALW等 l 構(gòu)建系統(tǒng)進化樹。象PYLIP、MEGA等; l

8、 穩(wěn)定性檢驗。 通用的方法使用 Bootstrap算法, 相應(yīng)的軟件已包括在構(gòu)建系統(tǒng)進化樹所用的軟件 包當(dāng)中。 一:發(fā)現(xiàn)同一種群基于不同分子序列所重構(gòu)出的進化 樹可能不同。 二:對“ 垂直進化”和“水平演化”之間關(guān)系的討論 正逐漸引起人們的重視。 三、基因的“橫向遷移現(xiàn)象”。即:基因可以在同時 存在的種群間遷移,其結(jié)果雖可導(dǎo)致序列差異,但這 種差異與進化無關(guān)。 如:對人類基因組的分析發(fā)現(xiàn),有幾十個人的基因只 與細菌基因相似,而在果蠅、線蟲中都不存在。所以 在當(dāng)前的分子進化研究中必須選擇垂直進化的分子作 為樣本。 序列差異和進化關(guān)系的爭論: 分子進化分析中,“ 相似性”和“同源性”是兩 個不同的

9、概念。 相似性只反映兩者類似,并不包含任何與進化相 關(guān)的暗示。同源性則是與共同祖先相關(guān)的相似性。 不同的生物分子替代速率不同。纖維蛋白約200萬 年有一個aa被替代。而組蛋白約3000萬年才被替 換一個,一些非編碼序列一兩萬年就可能被替換。 這些變化速率不同的分子可作為進化研究的分子 時標(biāo),有人稱之為分子鐘。 但隨著序列的增加,不支持分子鐘的假設(shè)。 植物L(fēng)FY同源基因系統(tǒng)樹 Phylogenyof23completelysequencedBacteriaandArchaeaspecies onthebasisof16srRNA. A)Phylogenetictreebuiltbyournewm

10、ethod.B)PhylogenetictreebuiltbyClustalwprogram. (MadebyR.S.Chen) Phylogenyof24completelysequencedBacteria,Archaeaand Eukaryaspecies.A)genomictree.(MadebyR.S.Chen) Phylogeny of T.tengcongensis based on Whole Genome ( Made by R.S.Chen) After Pace NR (1997) Science 276:734 1.1.7. 7. 完整基因組的比較研究完整基因組的比較研

11、究 1.1. 生命的起源?生命的進化?生命的起源?生命的進化? 2.2. 遺傳密碼的起源?遺傳密碼的起源? 3.3. 最小獨立生活的生物體至少需要多少基因?最小獨立生活的生物體至少需要多少基因? 4.4. 這些基因是如何使生物體活起來的?這些基因是如何使生物體活起來的? 5.5. 啤酒酵母,它有啤酒酵母,它有59325932個基因,最小的是生殖個基因,最小的是生殖 道枝原體它只有道枝原體它只有470470個基因。個基因。 6.6. 黑猩猩黑猩猩和人的基因組大小相似,都含有約和人的基因組大小相似,都含有約 3 03 0億堿基對,基因的數(shù)目也類似,且大部億堿基對,基因的數(shù)目也類似,且大部 同源。但

12、黑猩猩和人差異大同源。但黑猩猩和人差異大, ,為什么?為什么? 人類基因組與其它生物基因組比較人類基因組與其它生物基因組比較 通過幾個完整基因組的比較,統(tǒng)計出維持 生命活動所需要的最少基因個數(shù)為250個左右。 比較鼠和人的基因組就會發(fā)現(xiàn),盡管兩者 基因組大小和基因數(shù)目類似,但基因組的組 織卻差別很大。例如存在于鼠1 號染色體上 的基因已分布到人的1、2、5、6、8、13、18 號7個染色體上了。 在同一界中,某些核糖體蛋白排列順序的 差異能反映出物種間的親緣關(guān)系,親緣關(guān)系 越近,基因排列順序越接近。這樣就可以通 過比較基因的排列順序來研究物種間的系統(tǒng) 發(fā)育關(guān)系。 人與鼠染色體的差別人與鼠染色體

13、的差別 Thedistributionofmousehomologygenesinthehumanchromosome (DatafromGenBank,CoordinatebyR.S.Chen) Thedistributionofmousehomologygenesinthehumanchromosome (DatafromGenBank,CoordinatebyR.S.Chen) * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

14、* * * * * * * * * * * * * * * * * * * * * genes in this No. chromosome of distribution of mouse homology genes mouse in human chromosome 1 1 1 1、2 2、5 5、6 6、8 8、1313、18 18 2 2 2 2、7 7、9 9、1010、1111、1515、2020 3 1 3 1、3 3、4 4、8 8 4 1 4 1、6 6、8 8、9 9 5 1 5 1、4 4、7 7、1212、1313、1818、22 22 6 2 6 2、3 3、7 7

15、、1010、12 12 7 6 7 6、1010、1111、1515、1616、19 19 8 1 8 1、4 4、8 8、1313、1616、19 19 9 3 9 3、6 6、1111、1515、19 19 10 6 10 6、1010、1212、1919、2121、22 22 11 2 11 2、5 5、7 7、1616、1717、22 22 12 2 12 2、7 7、14 14 13 1 13 1、5 5、6 6、7 7、9 9、1515、17 17 14 3 14 3、8 8、1010、1313、1414、X X 15 5 15 5、8 8、1212、22 22 16 3 16 3

16、、8 8、1616、2121、2222 17 6 17 6、1616、1919、21 21 18 5 18 5、1010、18 18 19 9 19 9、1010、1111、X X X X X X * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 8.從功能基因組到系統(tǒng)生物學(xué) 功能基因組研究功能基因組研究: : 不僅需要了解基因的序列,還要了 解基因的功能,也

17、就是要了解在不同的時間、不同的組織 中基因的表達譜。 研究不同時間、不同組織的基因表達譜的技術(shù)有: 在核酸層次上的基因芯片(或稱DNA芯片); 在蛋白質(zhì)層次上的大規(guī)模蛋白質(zhì)分離和序列鑒定技術(shù), 也稱蛋白質(zhì)譜技術(shù)和蛋白質(zhì)組研究。 芯片雜交:DNA芯片基質(zhì)有硅片、玻片和金屬片。 蛋白質(zhì)二維凝膠電泳和測序質(zhì)譜相結(jié)合的技術(shù)在蛋白 質(zhì)水平上監(jiān)測基因表達的功能譜。 酵母雙雜交技術(shù)研究蛋白質(zhì)的相互作用。 需要解決的關(guān)鍵問題:需要解決的關(guān)鍵問題: 表達譜數(shù)據(jù)挖掘和知識發(fā)現(xiàn)就成了該研究成功 與否的關(guān)鍵。需要發(fā)展新的方法和工具。 對大規(guī)模基因功能表達譜的分析也導(dǎo)致了新的 方法學(xué)問題?;虮磉_譜的數(shù)據(jù)和蛋白質(zhì)譜的

18、數(shù)據(jù),既有圖象,又是在時空多維水平上展開 的數(shù)據(jù)。 芯片等的設(shè)計上也需要從理論到軟件的支持。 應(yīng)用分析系應(yīng)用分析系 統(tǒng)獲得的統(tǒng)獲得的48 小時晝夜交小時晝夜交 替的表達譜替的表達譜 信息信息 cDNAcDNA微陣列雜交的聚類分析微陣列雜交的聚類分析 Protein interaction network: direct/indirect; static/dynamic From the Cell to Protein Machines By R.S.Chen 9. 蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計 蛋白質(zhì)功能取決于蛋白質(zhì)的空間結(jié)構(gòu)蛋白質(zhì)功能取決于蛋白質(zhì)的空間結(jié)構(gòu) 蛋白質(zhì)結(jié)構(gòu)決定

19、于蛋白質(zhì)的序列(這是蛋白質(zhì)結(jié)構(gòu)決定于蛋白質(zhì)的序列(這是 目前基本共認的假設(shè)),蛋白質(zhì)結(jié)構(gòu)的目前基本共認的假設(shè)),蛋白質(zhì)結(jié)構(gòu)的 信息隱含在蛋白質(zhì)序列之中。信息隱含在蛋白質(zhì)序列之中。 9. 蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計蛋白質(zhì)結(jié)構(gòu)模擬與藥物設(shè)計 要找到蛋白質(zhì)功能的分子基礎(chǔ),必須知道它們的 三維結(jié)構(gòu),與此同時,設(shè)計藥物也需要了解與藥物相 應(yīng)的蛋白質(zhì)受體的三維結(jié)構(gòu)。 目前,X射線晶體學(xué)技術(shù)、多維核磁共振(NMR) 波譜學(xué)技術(shù)、二維電子衍射和三維圖像重構(gòu)技術(shù)等是 蛋白質(zhì)空間結(jié)構(gòu)測定的有效手段。 每天可測出幾個生物大分子空間結(jié)構(gòu),但遠小于 蛋白質(zhì)序列信息增長的速度。預(yù)測這些蛋白的空間結(jié) 構(gòu),進而實現(xiàn)針對性的藥物

20、設(shè)計,就成了迫在眉睫的 任務(wù)。這也是大規(guī)模的計算問題。 蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定蛋白質(zhì)的生物功能由蛋白質(zhì)的結(jié)構(gòu)所決定 ,蛋,蛋 白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑。白質(zhì)結(jié)構(gòu)預(yù)測成為了解蛋白質(zhì)功能的重要途徑。 蛋白質(zhì)結(jié)構(gòu)預(yù)測分為蛋白質(zhì)結(jié)構(gòu)預(yù)測分為: 二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測 空間結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測 二級結(jié)構(gòu)預(yù)測二級結(jié)構(gòu)預(yù)測 在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別在一定程度上二級結(jié)構(gòu)的預(yù)測可以歸結(jié)為模式識別 問題問題 在二級結(jié)構(gòu)預(yù)測方面主要方法有:在二級結(jié)構(gòu)預(yù)測方面主要方法有: 立體化學(xué)方法立體化學(xué)方法 圖論方法圖論方法 統(tǒng)計方法統(tǒng)計方法 最鄰近決策方法最鄰近決策方法 基

21、于規(guī)則的專家系統(tǒng)方法基于規(guī)則的專家系統(tǒng)方法 分子動力學(xué)方法分子動力學(xué)方法 人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)方法 預(yù)測準(zhǔn)確率超過預(yù)測準(zhǔn)確率超過70%的第一個軟件是基于神經(jīng)網(wǎng)絡(luò)的第一個軟件是基于神經(jīng)網(wǎng)絡(luò) 的的PHD系統(tǒng)系統(tǒng) 空間結(jié)構(gòu)預(yù)測空間結(jié)構(gòu)預(yù)測 在空間結(jié)構(gòu)預(yù)測方面,比較成功的在空間結(jié)構(gòu)預(yù)測方面,比較成功的 理論方法是同源建模法理論方法是同源建模法 該方法的依據(jù)是:相似序列的蛋白該方法的依據(jù)是:相似序列的蛋白 質(zhì)傾向于折疊成相似的三維空間結(jié)質(zhì)傾向于折疊成相似的三維空間結(jié) 構(gòu)構(gòu) 運用同源模型方法可以完成所有蛋運用同源模型方法可以完成所有蛋 白質(zhì)白質(zhì)10-30%的空間結(jié)構(gòu)預(yù)測工作的空間結(jié)構(gòu)預(yù)測工作 DN

22、ARNAprotein Central dogma of molecular biology genometranscriptomeproteome Central dogma of bioinformatics and genomics DNARNA cDNA ESTs UniGene phenotype genomic DNA databases protein sequence databases protein Pic5 Phenylketonuria (PKU) is caused by a deficiency of the iron-containing enzyme pheny

23、lalanine hydroxylase (PAH), which converts phenylalanine to tyrosine. Pic6 Pic7 后基因組時代 Post-genome era 后基因組時代的挑戰(zhàn): 1. 蛋白組學(xué): 序列-結(jié)構(gòu)-功能 2.研究生物的生長代謝的過程和疾病的機制 3.基因組藥物 生物信息學(xué)離不開高性能計算機。 并需要信息學(xué)家的參與。 急需有自主知識產(chǎn)權(quán)的生物信息處理軟件平臺 和大量高效的快速的新算法的開發(fā)及改進。 后基因組時代 Post-genome era 基因組數(shù)據(jù) DNA, Protein 序列序列 生物信息學(xué) 軟件平臺 Blast Gensca

24、n Blocks 生物學(xué)家 計算生物學(xué)模型/算法 軟件 計算機專家計算機專家 串行 后基因組學(xué)數(shù)據(jù) 并行 數(shù)據(jù)庫 proteomicsdata Proteomics tools Identificationandcharacterization DNA-Protein Similaritysearches Patternandprofilesearches Post-translationalmodificationprediction Primarystructureanalysis Secondarystructureprediction Tertiarystructure Transme

25、mbraneregionsdetection Alignment 四、生物信息學(xué)的應(yīng)用與發(fā)展研究 生物信息學(xué)相關(guān)的分析與應(yīng)用算法、軟件和數(shù)據(jù)庫, 都具有重要的經(jīng)濟價值,最終都會形成商品,提供 經(jīng)濟和社會效益。 1. 疾病相關(guān)的基因信息及相關(guān)算法和軟件開發(fā) 2. 建立與動、植物良種繁育相關(guān)的基因組數(shù)據(jù)庫,發(fā) 展分子標(biāo)記輔助育種技術(shù) 3. 研究與發(fā)展藥物設(shè)計軟件和基于生物信息的分子生 物學(xué)技術(shù) MajorApplicationsI:OverallGenomeCharacterization OverallOccurrenceof aCertainFeaturein theGenome e.g.ho

26、wmanykinases inYeast CompareOrganisms andTissues Expressionlevelsin CancerousvsNormal Tissues Databases,Statistics II:FromFindingHomologstodrugdesign III:DrugDesigning UnderstandingHowStructuresBind OtherMolecules(Function) DesigningInhibitors Docking,StructureModeling Three-dimensionalmolecularstru

27、ctureisoneofthefoundationsof structure-baseddrugdesign.Often,dataareavailablefortheshapeofa proteinandadrugseparately,butnotforthetwotogether.Dockingisthe processbywhichtwomoleculesfittogetherin3Dspace. 生物信息學(xué)與新藥研制生物信息學(xué)與新藥研制 未來的藥物研究將是基于生物信息知識挖掘的過未來的藥物研究將是基于生物信息知識挖掘的過 程程 數(shù)據(jù) 處理 關(guān)聯(lián) 分析 發(fā)現(xiàn) 藥物 作用 對象 確定 靶標(biāo)

28、分子 針對 靶標(biāo) 設(shè)計 藥物 基因組學(xué)與藥靶的選擇基因組學(xué)與藥靶的選擇 已有數(shù)十種模式菌或致病菌基因組 完成測序,所有的基因都是潛在的靶, 根據(jù)不同標(biāo)準(zhǔn)進行優(yōu)選。 通過分析某一化合物是否為某一特 定生化反應(yīng)或分子間相互作用(藥靶) 的抑制物,確定有無成藥的可能。 產(chǎn)生于基因組學(xué)的信息極大地方便 了靶的選擇。利用基因組DNA序列 信息指導(dǎo)生化及功能研究(抗菌素), 克服致病菌抗藥性。 Proteininhibitors(Virusasanexample) attachment,entryandfusioninhibitors DNApolymeraseinhibitors integrasein

29、hibitors interferons maturationinhibitors monoclonalantibodies neuraminidaseinhibitors NS3proteaseinhibitors nucleosidereversetranscriptaseinhibitors proteaseinhibitors reversetranscriptaseinhibitors RNApolymeraseinhibitors Designingnucleicacidinhibitors (AntisenseoligonucleotidesorRNAi) TargetingmR

30、NA TargetingmicroRNA TargetinggenomicDNA InterferemRNAprocessing Aptamersoligonucleotideorpeptidemoleculesthatbind toaspecifictargetmolecule PLoSONEpaper Wang X, Gou D, Xu S-y (2010) Polymerase-Endonuclease Amplification Reaction (PEAR) for Large-Scale Enzymatic Production of Antisense Oligonucleoti

31、des. PLoS ONE 5(1): e8430. doi:10.1371/journal.pone.0008430 Bioinformatics and Pharmacutics 在BIOINFORMATICS沒有誕生之前,一個新 藥的問世需要十年時間,數(shù)億美元的R&D, 而BIOINFORMATICS已將這個過程減少三分 之二,R&D的費用也相應(yīng)大大減少。許多中 小BIOTECH公司也看到了BIOINFORMATICS 的巨大作用和潛在的商機,紛紛投資 BIOINFORMATICS研究項目。 (PGP) Personal genetic testing 23andme To provid

32、e an introduction to bioinformatics with a focus on the National Center for Biotechnology Information (NCBI) and EBI To focus on the analysis of DNA, RNA and proteins To introduce you to the analysis of genomes To combine theory and practice to help you solve research problems What are the goals of

33、this course? 五、生物信息學(xué)的現(xiàn)狀五、生物信息學(xué)的現(xiàn)狀 今后今后DNADNA序列數(shù)據(jù)的增長將更為驚人。生物學(xué)數(shù)據(jù)序列數(shù)據(jù)的增長將更為驚人。生物學(xué)數(shù)據(jù) 的積累并不僅僅表現(xiàn)在的積累并不僅僅表現(xiàn)在DNADNA序列方面,與其同步的序列方面,與其同步的 還有蛋白質(zhì)的一級結(jié)構(gòu),即氨基酸序列的增長。還有蛋白質(zhì)的一級結(jié)構(gòu),即氨基酸序列的增長。 與正在以指數(shù)增長的生物學(xué)數(shù)據(jù)相比,人類相關(guān)知與正在以指數(shù)增長的生物學(xué)數(shù)據(jù)相比,人類相關(guān)知 識的增長(粗略地用每年發(fā)表的生物、醫(yī)學(xué)論文數(shù)識的增長(粗略地用每年發(fā)表的生物、醫(yī)學(xué)論文數(shù) 來代表)顯得十分緩慢。一方面是巨量的數(shù)據(jù),另來代表)顯得十分緩慢。一方面是巨量

34、的數(shù)據(jù),另 一方面是我們在醫(yī)學(xué)、藥物、農(nóng)業(yè)和環(huán)保等方面對一方面是我們在醫(yī)學(xué)、藥物、農(nóng)業(yè)和環(huán)保等方面對 新知識的渴求,這些新知識將幫助人們改善其生存新知識的渴求,這些新知識將幫助人們改善其生存 環(huán)境和提高生活質(zhì)量。環(huán)境和提高生活質(zhì)量。 各國政府和工業(yè)界對生物信息學(xué)研究極為重視, 投入了大量資金。歐美各國及日本相繼成立了生物信 息中心,如美國的國家生物技術(shù)信息中心、歐洲生物 信息學(xué)研究所、日本信息生物學(xué)中心等。這些機構(gòu)相 互合作,共同維護著GenBank、EMBL、DDBJ三大基因 序列數(shù)據(jù)庫。 美國一些最著名的大學(xué),如哈佛、斯坦福和普林 斯頓大學(xué)等都投資幾千萬到一億多美元成立了生物、 物理、數(shù)學(xué)

35、等學(xué)科交叉的新中心,諾貝爾獎獲得者朱 棣文領(lǐng)導(dǎo)的斯坦福大學(xué)的中心還命名為Bio-X。 據(jù)報導(dǎo),只有50名員工的德國Lion生物信息學(xué)公司,將通過 掃描公共數(shù)據(jù)庫中的序列來發(fā)現(xiàn)500個可能的藥物作用靶點, 以一億美元的價格預(yù)售給德國Bayer公司。 NIH已向美國國會建議投資160億美元在美國建立520個將 生物學(xué)與計算結(jié)合起來的中心, 來處理海量的基因組相關(guān)信 息。 法國議會科技決策評估辦公室,最近評估了基因工程、生物 信息學(xué)和組合化學(xué)等學(xué)科的應(yīng)用前景及法國的對策。 美國出現(xiàn)了大批的基于生物信息學(xué)的公司,實施了許多生物 信息學(xué)研究計劃,主要與藥物設(shè)計,基因工程藥物,生物芯 片,代謝工程與化學(xué)工

36、程密切相關(guān)。 生物信息學(xué)工業(yè) 屬于基礎(chǔ)研究,以探索生物學(xué)自然學(xué)自然規(guī)律為己任; 又屬于應(yīng)用研究,它的許多研究成果可以較快或立即 產(chǎn)業(yè)化,成為價值很高的產(chǎn)品。 人類基因組計劃的完成為生物醫(yī)藥工業(yè)提供了大量可 用于新藥開發(fā)的原材料。有些基因產(chǎn)物可以直接作為 藥物,而有些基因則可以成為藥物作用的對象( “靶 點”)。 生物信息學(xué)為分子生物學(xué)家提供了大量對基因序列進 行分析的工具,不但可以從資料的獲取、基因功能的 預(yù)測、藥物篩選過程中的信息處理等方面大大加快新 藥開發(fā)的進程,而且可以大大加快傳統(tǒng)的基因發(fā)現(xiàn)和 研究。 據(jù)報導(dǎo),只有50名員工的德國Lion生物信息學(xué)公司,將通 過掃描公共數(shù)據(jù)庫中的序列來發(fā)

37、現(xiàn)500個可能的藥物作用靶 點,以一億美元的價格預(yù)售給德國Bayer公司。 NIH已向美國國會建議投資160億美元在美國建立520個將 生物學(xué)與計算結(jié)合起來的中心, 來處理海量的基因組相關(guān) 信息。 法國議會科技決策評估辦公室,最近評估了基因工程、生 物信息學(xué)和組合化學(xué)等學(xué)科的應(yīng)用前景及法國的對策。 美國出現(xiàn)了大批的基于生物信息學(xué)的公司,實施了許多生 物信息學(xué)研究計劃,主要與藥物設(shè)計,基因工程藥物,生 物芯片,代謝工程與化學(xué)工程密切相關(guān)。 六、與生物信息學(xué)關(guān)系密切的學(xué)科 1.與生物信息學(xué)關(guān)系密切的數(shù)學(xué)領(lǐng)域 統(tǒng)計學(xué):包括多元統(tǒng)計學(xué),是生物信息學(xué)的數(shù)學(xué)基礎(chǔ); 概率論與隨機過程理論,如隱馬爾科夫鏈模型

38、(HMM); 運籌學(xué):如動態(tài)規(guī)劃法是序列比對的基本工具, 最優(yōu)化理論與算法:在蛋白質(zhì)空間結(jié)構(gòu)預(yù)測和分子對接 研究中有重要應(yīng)用, 函數(shù)論: 如傅里葉變換等都是生物信息學(xué)中的常規(guī)工 具; 信息論:在分子進化、蛋白質(zhì)結(jié)構(gòu)預(yù)測、序列比對中 有重要應(yīng)用,而人工神經(jīng)網(wǎng)絡(luò)方法則用途極為廣泛; 組合數(shù)學(xué): 在分子進化和基因組序列研究中十分有用。 原則上講,各種數(shù)學(xué)理論或多或少或直接或間接都應(yīng) 該在生物學(xué)研究中有各種各樣的應(yīng)用,其中包括生物 信息學(xué). 2.生物信息學(xué)密切相關(guān)的計算機科學(xué)技術(shù)生物信息學(xué)密切相關(guān)的計算機科學(xué)技術(shù) 網(wǎng)絡(luò)技術(shù) 數(shù)據(jù)庫管理技術(shù)(特別是關(guān)系型數(shù)據(jù)庫) 實驗室數(shù)據(jù)信息管理系統(tǒng)(LIMS)。 數(shù)

39、據(jù)整合和可視化 數(shù)據(jù)挖掘(DataMining) 基于Linux/Unix操作系統(tǒng)的各種軟件包 人工智能 神經(jīng)網(wǎng)絡(luò) 算法的復(fù)雜性研究。 參考文獻參考文獻 1、生物信息學(xué)生物信息學(xué) 孫嘯孫嘯 東南大學(xué)(課程講義)東南大學(xué)(課程講義) 2、生物信息學(xué)概論生物信息學(xué)概論 羅靜初羅靜初 北京大學(xué)北京大學(xué) 北京大學(xué)出版社北京大學(xué)出版社 3、生物信息學(xué)生物信息學(xué)(863高科技叢書)高科技叢書) 趙國平趙國平 中科院上海生命科學(xué)院中科院上海生命科學(xué)院 科學(xué)出版社科學(xué)出版社 4、生物信息學(xué)生物信息學(xué)基因和蛋白質(zhì)分析的使用指南基因和蛋白質(zhì)分析的使用指南 李衍達李衍達 清華大學(xué)清華大學(xué) 清華大學(xué)出版社清華大學(xué)出版社 5、簡明生物信息學(xué)簡明生物信息學(xué) 鐘揚鐘揚 復(fù)旦大學(xué)復(fù)旦大學(xué) 高等教育出版社高等教育出版社 6、bioinformatic

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論