生物信息學(xué)講課三_第1頁
生物信息學(xué)講課三_第2頁
生物信息學(xué)講課三_第3頁
生物信息學(xué)講課三_第4頁
生物信息學(xué)講課三_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

三、完整基因組的比較研究是一個新方向

研究生命是從哪里起源的?生命是如何進化的?遺傳密碼是如何起源的?估計最小獨立生活的生物至少需要多少基因,這些基因是如何使它們活起來的?比如,鼠和人的基因組大小相似,都含有約三十億堿基對,基因的數(shù)目也類似??墒鞘蠛腿瞬町惔_如此之大,這是為什么?同樣,有的科學(xué)家估計不同人種間基因組的差別僅為0.1%;人猿間差別約為1%。但他們表型間的差異十分顯著。這又為什么?

完整基因組序列的比較研究是解決這些問題的重要途徑。Thedistributionofmousehomologygenesinthehumanchromosome

(DatafromGenBank,CoordinatebyR.S.Chen)

*************************************************************************

genesinthisNo.chromosomeofdistributionofmousehomologygenesmouseinhumanchromosome11、2、5、6、8、13、1822、7、9、10、11、15、2031、3、4、841、6、8、951、4、7、12、13、18、2262、3、7、10、1276、10、11、15、16、1981、4、8、13、16、1993、6、11、15、19106、10、12、19、21、22112、5、7、16、17、22122、7、14131、5、6、7、9、15、17143、8、10、13、14、X155、8、12、22163、8、16、21、22176、16、19、21185、10、18199、10、11、XXX***********************************************************************

Studyonconservationofgeneorderin

completegenomes.Weanalyzedthegeneorderof70ribosomalproteinsin16completegenomes.Thesegeneswouldform9-14operonsineachgenome.Theresultsshowthat:

(1)therearemorethat20ribosomalproteinscontainedinrpL3andrpL4operons,thegeneorderofthesegenesareveryconservedinbothEu-bacteriaandArchae-bacteria;(2)someoperons’structurearespecialtoEu-bacteriaandArchae-bacteriarespectively;(3)ineachkingdom,somedifferenceofgeneorderindifferencespeciescouldbeusedtoinfertheevolutionaryrelationshipofthesespecies.

Thismethodprovidesanewwaytostudytheevolutionaryrelationshipofthoseoldspecies.

*chromosome13arerelativelystable,forinstance,whereaschromosome12inmenandchromosome16inwomenareenormouslyfickle.

*whyvertebrateshavefourtimesasmanyHOXgenes,agroupofkeydevelopmentalgenes,asdofruitflies.

四、基于序列數(shù)據(jù)的生物進化研究當(dāng)前面臨的問題

自1859年Darwin的物種起源(OriginofSpecies)發(fā)表以來,進化論成為對人類自然科學(xué)和自然哲學(xué)發(fā)展的最重大貢獻之一。進化論研究的核心是描述生物進化的歷史(系統(tǒng)進化樹)和探索進化過程的機制。自本世紀(jì)中葉以來,隨著分子生物學(xué)的不斷發(fā)展,進化論的研究也進入了分子水平。當(dāng)前分子進化的研究已是進化論研究的重要手段,并建立了一套依賴于核酸、蛋白質(zhì)序列信息的理論方法。l

序列相似性比較。就是將待研究序列與DNA或蛋白質(zhì)序列庫進行比較,用于確定該序列的生物屬性,也就是找出與此序列相似的已知序列是什么。完成這一工作只需要使用兩兩序列比較算法。常用的程序包有BLAST、FASTA等;l

序列同源性分析。是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。這是理論分析方法中最關(guān)鍵的一步。完成這一工作必須使用多序列比較算法。常用的程序包有CLUSTAL等;l

構(gòu)建系統(tǒng)進化樹。根據(jù)序列同源性分析的結(jié)果,重建反映物種間進化關(guān)系的進化樹。為完成這一工作已發(fā)展了多種軟件包,象PYLIP、MEGA等;l

穩(wěn)定性檢驗。為了檢驗構(gòu)建好的進化樹的可靠性,需要進行統(tǒng)計可靠性檢驗,通常構(gòu)建過程要隨機地進行成百上千次,只有以大概率(70%以上)出現(xiàn)的分支點才是可靠的。通用的方法使用Bootstrap算法,相應(yīng)的軟件已包括在構(gòu)建系統(tǒng)進化樹所用的軟件包當(dāng)中。為便于使用者查找表三給出了進化分析相關(guān)軟件的因特網(wǎng)地址。進化分析相關(guān)軟件的因特網(wǎng)地址********************************************************序列分析和多序列比較#CLUSTALWsoftware#BCMSearchLauncher

:8088/searchlauncher/launcher.html系統(tǒng)進化樹構(gòu)建和穩(wěn)定性分析#Hennig86/~mes/hennig/software.html*******************************************************

humangenomeshares223geneswithbacteria--genesthatdonotexistintheworm,fly,oryeast.

Areticulatedtree,ornet,whichmightmoreappropriatelyrepresentlife'shistory.

MoreandmoreLGT(LateralGeneTransfer)werediscoveredandreported.Somepeopleguess1.5%~14.5%ofgenesinagenomearerelatedwithLGT,evenrRNAmoleculesareinvolvedinLGT;

Garcia-VallvéS,RomeuA,PalauJ.,GenomeRes,2000,11,1719~1725

YapWH,ZhangZ,WangY.,J.Bacteriol.1999,181:5201~5209

Somepeopleargueitisimpossibletoreconstructauniversallifetree;

PennisiE.,Science,1999,284:1305~1307DoolittleRF.,Nature,1998,392:339~342Asmoreandmorewholegenomesequenceandtherelateddatabecomeavailable,itispossibletore-considerthephylogenyandclusteringpropertiesofspeciesinmorebroadmeasurements,eveninlevelofwholegenome.

PhylogenyBasedonWholeGenomeasinferredfromCompleteInformationSetAnalysis(CISA)

wepresentanewmethodbasedoninformationtheorytocalculatethephylogenicdistancebetweenbiologicalsequences,including16sRibosomalRNA,whichisusedformethodproof-test,24completelysequencedgenomes,aswellasallpredictedORFproductsofthem,creatingPhylogenyofgenomeandproteomeusingneighboring-joiningalgorithm.Scientistshavealreadybeenconsciousofthatnootherbiologicalsequencecanbringmorephylogeneticinformationthanthegenome.However,previousalgorithmsdon’thavetheabilitytohandlesuchmegabaselevelnucleicacidoraminoacidsequences,whoselengthsizesareinmostcasesunequal.Methods

Letbeanalphabetofmsymbols,andsuppose

isasetofsequencesformedfromthesymbolset

.Wedenotethesetofalldifferentsequencesformedfromwithlengthlby;

thenthenumberm(l)ofallsequencesof

equals.Forasequence,let

beitslengthanddenotethenumberof

contiguoussubsequencesinSkwhichmatchthei-thsequenceof

lLk.Itiseasytoseethat

,foreachlLkandk.Letting,weobtainadistributionwhereThus,foreachsequence,wecangetauniquesetofdistributions

.Thissetcontainsallprimaryinformationofasequence:

inparticular,uniquelydeterminestheoriginalsequence,sowecall

thissetacompleteinformationsetofthesequence.

Afunctionofmeasuringofinformationdiscrepancyhasbeenintroduced(abbreviatedasFDOD)9,11Todevelopadiscrepancymeasureofsequences,ameasurebasedontheFDODfunction10isasfollow:whereisdefinedas0asintheKullback-Leiberentropy(Kullback,1959);sdenotesthenumberofthesequences;ldenotesthewindowsize.TheFDODfunctionischaracterizedbyaaxiomsetsimilartoShannon’saxioms:non-negativity,symmetry,continuity,identityandsymmetricrecursiveness.Forsdistributions(),thisFDODfunctionalsohasthefollowingproperties:boundedness,maximum,convexity,monotonicity,andsoon.Meanwhile,it’seasytoseethat,usingthismeasure,themaximumdiscrepancybetweenanytwosequencesislessthanorequalto1,whiletheminimumoneisequalto0.Phylogenyof23completelysequencedBacteriaandArchaeaspeciesonthebasisof16srRNA.

A)Phylogenetictreebuiltbyournewmethod.B)PhylogenetictreebuiltbyClustalwprogram.

Phylogenyof24completelysequencedBacteria,ArchaeaandEukaryaspecies.

A)genomictree.

PhylogenyofT.tengcongensisbasedonWholeGenomeTheCompositionofProteinswithdifferentfunctions(COG)inaWholeProteomeRevealstheOrganism’sPhylogenyandClusteringPropertiesThecompositiondifferencesofproteinsofCOGclassesfor36organismsMethod

Wetookthe17functionalclassesofCOGs(ClustersofOrthologousGroups)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論