生物信息學(xué)發(fā)展概況及研究進(jìn)展_第1頁
生物信息學(xué)發(fā)展概況及研究進(jìn)展_第2頁
生物信息學(xué)發(fā)展概況及研究進(jìn)展_第3頁
生物信息學(xué)發(fā)展概況及研究進(jìn)展_第4頁
生物信息學(xué)發(fā)展概況及研究進(jìn)展_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

生物信息學(xué)發(fā)展概況及研究進(jìn)展韓龍生物化學(xué)與分子生物學(xué)20102005311概述生物信息學(xué)是在生命科學(xué)、計算機(jī)科學(xué)和數(shù)學(xué)的基礎(chǔ)上逐步發(fā)展而形成的一門新興的邊緣學(xué)科,它以核酸和蛋白質(zhì)為主要研究對象,以數(shù)學(xué)、計算機(jī)科學(xué)為主要研究手段,對生物學(xué)實(shí)驗數(shù)據(jù)進(jìn)行獲取、加工、存儲、檢索與分析,從而達(dá)到揭示數(shù)據(jù)所蘊(yùn)含的生物學(xué)意義的目的[1]。生物信息學(xué)的發(fā)展大致經(jīng)歷了前基因組時代、基因組時代和后基因組時代。目前,它的主要研究內(nèi)容已經(jīng)從對DNA和蛋白質(zhì)序列比較、編碼區(qū)分析、分子進(jìn)化轉(zhuǎn)移到大規(guī)模的數(shù)據(jù)整合、可視化,轉(zhuǎn)移到比較基因組學(xué)、代謝網(wǎng)絡(luò)分析、基因表達(dá)譜網(wǎng)絡(luò)分析、蛋白質(zhì)技術(shù)數(shù)據(jù)分析處理、蛋白質(zhì)結(jié)構(gòu)與功能分析以及藥物靶點(diǎn)篩選等[1]。在后基因組時代的今天,生物信息學(xué)已經(jīng)成為目前極其熱門的系統(tǒng)生物學(xué)研究的重要手段。利用各種功能的軟件系統(tǒng)平臺,目前生物信息學(xué)方法主要通過序列比對與分析、功能基因組與基因表達(dá)數(shù)據(jù)的分析、蛋白質(zhì)結(jié)構(gòu)預(yù)測以及基于結(jié)構(gòu)的藥物設(shè)計等方面應(yīng)用于各個生命科學(xué)研究領(lǐng)域。1.1序列比對與分析序列比對是生物信息學(xué)的基礎(chǔ),是比較兩個或兩個以上符號序列的相似性或不相似性。兩個序列的比對現(xiàn)在已有較成熟的動態(tài)規(guī)劃算法,以及在此基礎(chǔ)上編寫的比對軟件包——BLAST和FASTA;兩個以上序列的多重序列是生物信息學(xué)中尚未解決的一個NP完全的組合優(yōu)化問題,是目前研究的熱點(diǎn)[2]。比較經(jīng)典的算法有SAGA算法[3]、CLUSTAL算法以及隱馬爾可夫模型(HiddenMarkovModels,HMM)多重序列比對算法,另外,如Notredame等[4]開發(fā)的T-Coffee算法、Timo等[5]設(shè)計的Kalign算法、張琎等[6]設(shè)計的基于GC-GM多序列比對窮舉遺傳算法,是通過窮舉某個特定范圍內(nèi)的所有序列的長度取值,來確定最終最佳比對長度的一種多序列比對算法。這些算法已應(yīng)用于各種多序列比對軟件,并在應(yīng)用中不斷得到優(yōu)化。1.2功能基因組學(xué)在后基因時代的今天,基因組學(xué)的研究已從結(jié)構(gòu)基因組學(xué)(Structuralgenomics)轉(zhuǎn)向功能基因組學(xué)(Functionalgenomics)[1]。功能基因組的任務(wù)是進(jìn)行基因組功能注釋(Genomeannotation),了解基因功能、認(rèn)識基因與疾病的關(guān)系、掌握基因的產(chǎn)物及其在生命活動中的作用。基因的時空差異表達(dá)是功能基因組學(xué)研究的理論基礎(chǔ)。經(jīng)典的減法雜交、差式篩選、cDNA替代差異分析以及mRNA差異顯示等技術(shù)已被廣泛應(yīng)用于鑒定和克隆差異表達(dá)的基因。近年來應(yīng)用較熱的主要是基因表達(dá)系列分析(Serialanalysisofgeneexpression,SAGE)、cDNA微陣列(cDNAmicroarray)和DNA芯片(DNAchip)等差異表達(dá)分析技術(shù)。如由Liang和Pardee等發(fā)明的差異顯示反轉(zhuǎn)錄PCR(Differentialdisplay-reversetranscriptasePCR,DDRT-PCR)技術(shù)[8]。1.3蛋白質(zhì)結(jié)構(gòu)預(yù)測蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學(xué)的重要應(yīng)用,分為二級結(jié)構(gòu)預(yù)測和空間結(jié)構(gòu)預(yù)測。二級結(jié)構(gòu)預(yù)測的目標(biāo)就是預(yù)測某一個片段中心的殘基是α螺旋,還是β折疊,或是其他結(jié)構(gòu),常用的方法有立體化學(xué)方法、圖論方法、統(tǒng)計方法、最鄰近決策方法、基于規(guī)則的專家系統(tǒng)方法、分子動力學(xué)方法和人工神經(jīng)網(wǎng)絡(luò)方法。在空間結(jié)構(gòu)預(yù)測方面,比較成功的理論方法是同源模型法。運(yùn)用同源模型法可以完成所有蛋白質(zhì)10%到30%的空間結(jié)構(gòu)預(yù)測工作[7]。目前尚沒有普遍可行的方案實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確預(yù)測,大多數(shù)方案為啟發(fā)式的。1.4基于結(jié)構(gòu)的藥物設(shè)計基于生物大分子結(jié)構(gòu)的藥物設(shè)計是生物信息學(xué)研究的熱點(diǎn)。利用現(xiàn)有的海量生物數(shù)據(jù)進(jìn)行潛在藥物靶點(diǎn)定位是生物信息學(xué)藥物設(shè)計的主要策略。目前研究比較熱的是計算機(jī)輔助藥物設(shè)計(Computeraideddrugdesign)。計算機(jī)輔助藥物設(shè)計就是通過模擬和計算受體與配體的這種相互作用,進(jìn)行先導(dǎo)化合物的優(yōu)化設(shè)計,大致包括活性位點(diǎn)分析法、數(shù)據(jù)庫搜索、全新藥物設(shè)計。目前活性位點(diǎn)分析軟件主要有DRID、GREEN、HSITE等[7]。通過搜索數(shù)據(jù)庫來獲得藥物靶點(diǎn)是其中一個手段,主要分為基于配體的方法和基于受體的分析方法;另外,全新藥物設(shè)計的方法越來越受到人們的重視,現(xiàn)已開發(fā)出一批實(shí)用性較強(qiáng)的軟件,主要有LUDI[9]、Leapfrog[10]、GROW、SPROU等,其中LUDI最為常用。2生物信息學(xué)的研究方法生物信息學(xué)是計算機(jī)科學(xué)、數(shù)學(xué)和生物學(xué)界面的一門多學(xué)科的交叉學(xué)科。生物信息學(xué)數(shù)據(jù)庫主要分為兩大類,包括基本數(shù)據(jù)庫和二級數(shù)據(jù)庫。基本數(shù)據(jù)庫是對原始生物實(shí)驗數(shù)據(jù)進(jìn)行簡單的整理和歸類。主要包括核酸數(shù)據(jù)庫,如GenBank、EMBL、DDBJ等;基因組數(shù)據(jù)庫,如GDB、GenCards等;蛋白質(zhì)序列數(shù)據(jù)庫,如SWISS-PROT、PRI、TrEMBL等;蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB。二級庫是在一級庫的基礎(chǔ)上,結(jié)合工作的需要將部分?jǐn)?shù)據(jù)從一級庫中取出,經(jīng)過重新組合(包括一定的修正或調(diào)整)而成的數(shù)據(jù)庫。由于其專一性強(qiáng),數(shù)據(jù)量相對較少,但質(zhì)量高,數(shù)據(jù)庫結(jié)構(gòu)設(shè)計精制。目前生物信息學(xué)的研究對象主要是核酸序列和蛋白質(zhì)序列,其主要任務(wù)是分析研究序列數(shù)據(jù)庫中所含的各種信息,特別是DNA序列中的遺傳及調(diào)控信息以及研究蛋白質(zhì)序列與結(jié)構(gòu)及功能的關(guān)系\o"刁雪濤,2008#20"ADDINEN.CITE<EndNote><Cite><Author>刁雪濤</Author><Year>2008</Year><RecNum>20</RecNum><DisplayText><styleface="superscript">16</style></DisplayText><record><rec-number>20</rec-number><foreign-keys><keyapp="EN"db-id="pxrpevra6pxrznestptxapvq0e9xe9tvt9ar">20</key></foreign-keys><ref-typename="JournalArticle">17</ref-type><contributors><authors><author><styleface="normal"font="default"charset="134"size="100%">刁雪濤,張小芳,宋潔,金梅</style></author></authors></contributors><titles><title><styleface="normal"font="default"charset="134"size="100%">生物信息學(xué)研究進(jìn)展</style></title><secondary-title><styleface="normal"font="default"charset="134"size="100%">安徽農(nóng)學(xué)通報</style></secondary-title></titles><periodical><full-title>安徽農(nóng)學(xué)通報</full-title></periodical><pages>160-1162</pages><volume>14</volume><number>22</number><dates><year>2008</year></dates><urls></urls></record></Cite></EndNote>16。GenBank(/genbank)是由位于Bethesda的美國國家生物技術(shù)信息中心(NationalCenterforBiotechnologyInformation,NCBI)成立和維護(hù)的DNA和RNA序列數(shù)據(jù)庫,是國際核酸序列數(shù)據(jù)庫合作項目的一部分,它與歐洲分子生物學(xué)實(shí)驗室(EuropenaMolecularBiologyLaboratory,EMBL)(http://www.ebi.ac.uk/)和日本核酸序列數(shù)據(jù)庫(DNADataBankofJapan,DDBJ)(http://www.ddbj.nig.ac.jp/)一起構(gòu)成當(dāng)今世界上最權(quán)威最廣泛的核酸序列數(shù)據(jù)庫。收錄的序列包括基因組DNA序列、互補(bǔ)脫氧核糖核酸(complementarydeoxyribonucleicacid,cDNA)序列、表達(dá)序列標(biāo)簽(expressedsequencetagsEST)序列、序列標(biāo)簽位點(diǎn)(sequencetaggedsite,STS)、載體序列以及專利序列等,每條記錄都有編碼(codingsequence,CDS)特征的注釋,還包括氨基酸的翻譯。它是一個有來自于16500多種生物且以每月2000多種新物種的速度增長的巨大核酸數(shù)據(jù)庫。具體訪問GenBank的方式可通過Entrez搜索引擎、基本局部比對搜索工具(BasicLocalAlignmentSearchTool,BLAST)進(jìn)行序列同源性搜索、dbEST搜索以及dbSTS搜索。每種搜索方式又可以通過關(guān)鍵詞、作者、GenBank接受號、種類分類等進(jìn)行查詢。SWISS-PROT(/sprot/sprot-top.html)蛋白序列數(shù)據(jù)庫是由日內(nèi)瓦大學(xué)醫(yī)學(xué)生物化學(xué)系與EMBL于1987年共同開發(fā)維護(hù),現(xiàn)由EMBL的分支機(jī)構(gòu)歐洲生物信息學(xué)研究所(EuropeanBioinformaticsInstitute,EBI)進(jìn)行維護(hù),旨在向基因組和蛋白質(zhì)組以及相關(guān)的分子生物學(xué)研究人員提供有關(guān)蛋白質(zhì)序列的最新信息。SWISS-PROT涉及已知蛋白質(zhì)的功能、序列、結(jié)構(gòu)域的結(jié)構(gòu)、翻譯后修飾及其位點(diǎn)、突變體等。具體訪問SWISS-PRO時,可通過關(guān)鍵詞、SWISS-PROT接受號、作者等方式進(jìn)行查詢。為了保持高質(zhì)量的注解,使序列盡快地有效變得至關(guān)重要。因此,TrEMBL于1996年成立,它是對SWISS-PROT的計算機(jī)注解的補(bǔ)充,這樣使SWISS-PROT蛋白質(zhì)序列數(shù)據(jù)庫變得更加充實(shí)和重要。PDB()創(chuàng)建于1971年。其是美國自然科學(xué)基金會、能源部和國立衛(wèi)生研究院共同投資,由美國布魯克海文國家實(shí)驗室(BrookhavenNationalLaboratory)建立的,主要由X射線晶體衍射和核磁共振測得的生物大分子的三維結(jié)構(gòu)所組成的全世界最完整的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫。它位于美國結(jié)構(gòu)生物信息學(xué)聯(lián)合研究所(ResearchCollaboratoryforStructuralBioinformatics,RCSB),受美國國家科學(xué)基金等7種政府基金的資助。PDB主要可應(yīng)用于蛋白質(zhì)結(jié)構(gòu)預(yù)測和結(jié)構(gòu)同源性比較,是進(jìn)行生物分子結(jié)構(gòu)研究的基本數(shù)據(jù)依據(jù)。3生物信息學(xué)展望近兩年來的生物信息學(xué)研究論文統(tǒng)計結(jié)果分析表明,在后基因組時代,生物信息學(xué)的主要研究內(nèi)容已經(jīng)從對DNA和蛋白質(zhì)序列進(jìn)行比較,編碼區(qū)分析,分子進(jìn)化轉(zhuǎn)移到大規(guī)模的數(shù)據(jù)整合,可視化,轉(zhuǎn)移到比較基因組學(xué),代謝網(wǎng)絡(luò)分析,基因表達(dá)譜網(wǎng)絡(luò)分析,蛋白質(zhì)組技術(shù)數(shù)據(jù)分析處理,蛋白質(zhì)結(jié)構(gòu)與功能分析以及藥物靶點(diǎn)篩選等,分別與功能基因組,蛋白質(zhì)組,結(jié)構(gòu)基因組等研究領(lǐng)域互相配合,緊密相關(guān),成為目前極其熱門的系統(tǒng)生物學(xué)研究的重要的基石[17]。生物信息學(xué)的前景是誘人的,是我們了解生命科學(xué)的一個簡單快速的手段作為一個數(shù)學(xué)、計算機(jī)和生物的交叉學(xué)科,數(shù)學(xué)、計算機(jī)學(xué)科的發(fā)展對于生物信息學(xué)的發(fā)展是至關(guān)重要的。在生物信息學(xué)發(fā)展的過程中,面對越來越龐大的數(shù)據(jù)的積累,如何去挖掘這些數(shù)據(jù)的信息,以及數(shù)據(jù)庫的維持和建立和相關(guān)軟件的研發(fā)的利用,都將左右著生物信息學(xué)的發(fā)展。像目前對于蛋白質(zhì)或RNA的高級結(jié)構(gòu)還很難預(yù)測,而且對于不同的軟件得出的結(jié)論也缺乏一致性,生物信息學(xué)所研究的結(jié)果也許并不能反應(yīng)生物的真實(shí)信息,如何提高它的可信度和準(zhǔn)確性也是研究人員所要思考的。雖然軟件的使用是快捷的,但是它并不是萬能的,在生物信息學(xué)探索的道路中還有很多盲區(qū),探索才剛剛開始[18]。參考文獻(xiàn)[1]RoosDS.Bioinformatics-TryingtoSwiminaSeaofData[J].Sciences,2001,291(5507):1260-1261.[2]DemkinVV.BioinformaticanalysisofnucleotidesequencesrecordsretrievedfromGenBank[J].MolGeneMikrobiolVirusol,2009,2:36-39.[3]NotredameC,HigginsDG.SAGA:sequencealignmentbygeneticalgorithm[J].NucleicAcidsRes,1996,24(8):1515-1524.[4]NotredameC,HigginsDG,HeringaJ.T-Coffee:Anovelmethodforfastandaccuratemultiplesequencealignment[J].JMolBio,2000,302(1):205-217.[5]LassmannT,SonnhammerE.Kalign-anaccurateandfastmultiplesequencealignmentalgorithm[J].BMCBioinformatics,2005,6(1):298.[6]張琎,張遠(yuǎn).基于GC-GM的多序列比對窮舉遺傳算法[J].計算機(jī)應(yīng)用,2010,30(1):146-149.[7]馮思玲.生物信息學(xué)技術(shù)研究[J].信息技術(shù),2009,5:20-22.[8]高銳,臧春龍,張傳東.功能基因組學(xué)研究進(jìn)展[J].畜牧獸醫(yī)科技信息,2008,3:12-20.[9]BohmHJ.LUDI:rule-basedautomaticdesignofnewsubstituentsforenzymeinhibitorleads[J].JComputAidedMolDes,1992,6(6):593-606.[10]XiaoMJ,HuangLS,DongQF,etal.Leapfrog:OptimalOpportunisticRoutinginProbabilisticallyCon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論