系統(tǒng)發(fā)育分析_第1頁(yè)
系統(tǒng)發(fā)育分析_第2頁(yè)
系統(tǒng)發(fā)育分析_第3頁(yè)
系統(tǒng)發(fā)育分析_第4頁(yè)
系統(tǒng)發(fā)育分析_第5頁(yè)
已閱讀5頁(yè),還剩90頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

系統(tǒng)發(fā)育分析第一頁(yè),共九十五頁(yè),編輯于2023年,星期三系統(tǒng)發(fā)育分析概論地球大約是在45億年前形成的。第二頁(yè),共九十五頁(yè),編輯于2023年,星期三地質(zhì)學(xué)、古生物學(xué)和地球化學(xué)直接或間接證據(jù)都表明:大約在地球形成10億年之后,我們這個(gè)星球開始出現(xiàn)生命,主要是些類似簡(jiǎn)單桿狀細(xì)菌的原始生物。但在同期的、另外一些被認(rèn)為是由光合微生物與沉積物形成的片層狀化石,它們類似于綠硫細(xì)菌和多細(xì)胞絲狀細(xì)菌,這些原始生命大概都是厭氧型的。含有產(chǎn)氧型光合細(xì)菌——藍(lán)細(xì)菌的層疊石則發(fā)現(xiàn)于25-30億年前的地質(zhì)年代中,藍(lán)細(xì)菌的出現(xiàn),給地球帶來(lái)了氧氣。而后,各種真核生物才隨之出現(xiàn)。第三頁(yè),共九十五頁(yè),編輯于2023年,星期三相關(guān)概念:所謂進(jìn)化(evolution)是生物與其生存環(huán)境相互作用過(guò)程中,其遺傳系統(tǒng)隨時(shí)間發(fā)生一系列不可逆的改變,在大多數(shù)情況下,導(dǎo)致生物表型改變和對(duì)生存環(huán)境的相對(duì)適應(yīng)。第四頁(yè),共九十五頁(yè),編輯于2023年,星期三第五頁(yè),共九十五頁(yè),編輯于2023年,星期三第六頁(yè),共九十五頁(yè),編輯于2023年,星期三

系統(tǒng)發(fā)育(phylogeny)指的是研究各類生物進(jìn)化的歷史。構(gòu)建系統(tǒng)發(fā)育過(guò)程有助于通過(guò)物種間隱含的種系關(guān)系揭示進(jìn)化動(dòng)力的實(shí)質(zhì)。第七頁(yè),共九十五頁(yè),編輯于2023年,星期三第八頁(yè),共九十五頁(yè),編輯于2023年,星期三第九頁(yè),共九十五頁(yè),編輯于2023年,星期三

系統(tǒng)發(fā)育分析(phylogeneticanalysis

)就是要推斷或者評(píng)估這些進(jìn)化關(guān)系。第十頁(yè),共九十五頁(yè),編輯于2023年,星期三Evidencefrommorphological,biochemical,andgenesequencedatasuggeststhatallorganismsonEartharegeneticallyrelated,andthegenealogicalrelationshipsoflivingthingscanberepresentedbyavastevolutionarytree,theTreeofLife.TheTreeofLifethenrepresentsthephylogenyoforganisms.AllorganismsareconnectedbythepassageofgenesalongthebranchesofthephylogeneticTreeofLife.第十一頁(yè),共九十五頁(yè),編輯于2023年,星期三LivingorganismssitlikeleavesatthetipsofthebranchesoftheTreeofLife.Theirevolutionaryhistoryisrepresentedbyaseriesofancestorswhicharesharedhierarchicallybydifferentsubsetsoftheorganismsthatarealivetoday.第十二頁(yè),共九十五頁(yè),編輯于2023年,星期三通過(guò)系統(tǒng)發(fā)育分析所推斷出來(lái)的進(jìn)化關(guān)系一般用分枝圖表(進(jìn)化樹)來(lái)描述,這個(gè)進(jìn)化樹就描述了同一譜系的進(jìn)化關(guān)系,包括了分子進(jìn)化(基因樹)、物種進(jìn)化以及分子進(jìn)化和物種進(jìn)化的綜合。第十三頁(yè),共九十五頁(yè),編輯于2023年,星期三Aphylogenetictreeofbeachbeetles.Somebrancheshavegoneextinctinthepast,whileothersrepresentspecieslivingtoday.第十四頁(yè),共九十五頁(yè),編輯于2023年,星期三直系/旁系同源基因的判定估計(jì)分歧時(shí)間重建祖先序列/性狀發(fā)現(xiàn)生物序列上自然選擇影響較大的重要位點(diǎn)確定基因重組的發(fā)生位點(diǎn)識(shí)別和疾病關(guān)聯(lián)的突變確定病原體的分類系統(tǒng)發(fā)育分析的用途:第十五頁(yè),共九十五頁(yè),編輯于2023年,星期三在現(xiàn)代系統(tǒng)發(fā)育學(xué)研究中,研究的重點(diǎn)已經(jīng)不再是生物的形態(tài)學(xué)特征或者其他特性,而是生物大分子尤其是序列。第十六頁(yè),共九十五頁(yè),編輯于2023年,星期三20世紀(jì)70年代以前,生物類群間的親緣關(guān)系主要是根據(jù)形態(tài)結(jié)構(gòu)、生理生化、行為習(xí)性等表型特征以及少量的化石資料來(lái)判斷它們之間的親緣關(guān)系。第十七頁(yè),共九十五頁(yè),編輯于2023年,星期三20世紀(jì)70年代以后研究生物的系統(tǒng)發(fā)育,主要是分析和比較生物大分子的結(jié)構(gòu)特征,特別是蛋白質(zhì)、RNA和DNA這些反映生物基因組特征的分子序列,作為判斷各類生物進(jìn)化關(guān)系的主要特征。第十八頁(yè),共九十五頁(yè),編輯于2023年,星期三

分子進(jìn)化(molecularevolution)是指從物種的一些分子特性出發(fā)了解物種之間的系統(tǒng)發(fā)育關(guān)系。第十九頁(yè),共九十五頁(yè),編輯于2023年,星期三依據(jù)K14序列的不同,用貝葉斯推斷繪制bichir(一種魚)的系統(tǒng)發(fā)育樹,第二十頁(yè),共九十五頁(yè),編輯于2023年,星期三隨著基因組測(cè)序計(jì)劃的實(shí)施,基因組的海量信息為若干生物領(lǐng)域重大問(wèn)題的研究提供了有力的幫助,分子進(jìn)化研究再次成為生命科學(xué)中最引人注目的領(lǐng)域之一。重大問(wèn)題包括:遺傳密碼的起源、基因組結(jié)構(gòu)的形成與演化、進(jìn)化的動(dòng)力、生物進(jìn)化等等。第二十一頁(yè),共九十五頁(yè),編輯于2023年,星期三人與老鼠的基因組大小相似,都含有約30億堿基對(duì),基因的數(shù)量也相近,可人與老鼠為何差異如此之大?從進(jìn)化的角度如此解釋?是否可以在浩如煙海的基因組密碼中獲得答案?第二十二頁(yè),共九十五頁(yè),編輯于2023年,星期三分子進(jìn)化研究的基礎(chǔ)核苷酸和氨基酸序列中含有生物進(jìn)化歷史的全部信息。假設(shè)第二十三頁(yè),共九十五頁(yè),編輯于2023年,星期三在各種不同的發(fā)育譜系及足夠大的進(jìn)化時(shí)間尺度中,許多序列的進(jìn)化速率幾乎是恒定不變的。分子鐘理論第二十四頁(yè),共九十五頁(yè),編輯于2023年,星期三直系同源

Orthologs,由共同的祖先進(jìn)化所產(chǎn)生的。如確定為直系同源則表示兩者來(lái)自于不同物種的由垂直家系(物種形成)進(jìn)化而來(lái)的,并且典型的保留與原始蛋白或基因有相同的功能。

第二十五頁(yè),共九十五頁(yè),編輯于2023年,星期三旁系同源

Paralogs,由于復(fù)制所產(chǎn)生的。如確定為旁系同源則表示該蛋白或基因是在一定物種中的來(lái)源于復(fù)制所得,可能會(huì)進(jìn)化出新的與原來(lái)有關(guān)的功能。第二十六頁(yè),共九十五頁(yè),編輯于2023年,星期三OrthologsandParalogsaretwotypesofhomologoussequences.

Orthologydescribesgenesindifferentspeciesthatderivefromacommonancestor.Orthologousgenesmayormaynothavethesamefunction.Paralogydescribeshomologousgeneswithinasinglespeciesthatdivergedbygeneduplication.第二十七頁(yè),共九十五頁(yè),編輯于2023年,星期三用于分子進(jìn)化研究的序列必須是直系同源的。第二十八頁(yè),共九十五頁(yè),編輯于2023年,星期三分子進(jìn)化研究的方法主要通過(guò)描述物種的系統(tǒng)發(fā)育過(guò)程來(lái)解釋物種進(jìn)化動(dòng)力的實(shí)質(zhì)。第二十九頁(yè),共九十五頁(yè),編輯于2023年,星期三表型性關(guān)系(Phenetic)和遺傳性關(guān)系(Cladistic)表型性關(guān)系是根據(jù)一組物體的表型性狀所獲得的相似性;遺傳性關(guān)系含有祖先的信息,因而可用于研究進(jìn)化。這兩種關(guān)系可以用系統(tǒng)進(jìn)化樹(Phylogenetictree

)或樹狀圖(Dendrogram

)來(lái)表示。第三十頁(yè),共九十五頁(yè),編輯于2023年,星期三表型分枝圖(Phenogram)進(jìn)化分枝圖(Cladogram)表型性關(guān)系遺傳性關(guān)系進(jìn)化分枝圖可以顯示類群間的進(jìn)化時(shí)間,而表型分枝圖不需要時(shí)間概念。第三十一頁(yè),共九十五頁(yè),編輯于2023年,星期三系統(tǒng)進(jìn)化樹的種類有根樹(Rooted)和無(wú)根樹(unRooted)。反映樹上物種或基因的時(shí)間順序只反映分類單元之間的距離,不涉及誰(shuí)是誰(shuí)的祖先問(wèn)題第三十二頁(yè),共九十五頁(yè),編輯于2023年,星期三構(gòu)建系統(tǒng)進(jìn)化樹的數(shù)據(jù)特征數(shù)據(jù)(Characterdata):提供了基因、個(gè)體、群體或物種的信息。距離數(shù)據(jù)(Distancedata):提供了成對(duì)基因、個(gè)體、群體或物種的信息。第三十三頁(yè),共九十五頁(yè),編輯于2023年,星期三這些數(shù)據(jù)可以矩陣的形式表達(dá)。距離矩陣(distancematrix)是在計(jì)算得到的距離數(shù)據(jù)基礎(chǔ)上獲得的,距離的計(jì)算總體上是要依據(jù)一定的遺傳模型,并能夠表示出兩個(gè)分類單位間的變化量。系統(tǒng)樹的構(gòu)建質(zhì)量依賴于距離估算的準(zhǔn)確性。

第三十四頁(yè),共九十五頁(yè),編輯于2023年,星期三遺傳模型在分子進(jìn)化研究中,我們往往認(rèn)定這樣的一個(gè)假設(shè),即序列是同源的,它們具有單一祖先序列;這一祖先序列在進(jìn)化過(guò)程中發(fā)生了一系列的核苷酸突變。第三十五頁(yè),共九十五頁(yè),編輯于2023年,星期三第三十六頁(yè),共九十五頁(yè),編輯于2023年,星期三在以上的假設(shè)基礎(chǔ)上,進(jìn)一步假設(shè)每一堿基具有同等機(jī)率突變?yōu)榱硗?種堿基中的任何一種,其頻率常數(shù)為μ/3,μ為堿基替換頻率。其中轉(zhuǎn)換和顛換具有不同的頻率,а和β。Judes-Cantor單參數(shù)模型(上三角部分)和Kimura兩參數(shù)模型(下三角部分)。第三十七頁(yè),共九十五頁(yè),編輯于2023年,星期三第三十八頁(yè),共九十五頁(yè),編輯于2023年,星期三距離K適用于顯示兩條序列從一個(gè)祖先序列趨異進(jìn)化以來(lái)的時(shí)間,并能用于序列間系統(tǒng)樹的構(gòu)建。在計(jì)算時(shí),均需要將序列作初步的列線分析。第三十九頁(yè),共九十五頁(yè),編輯于2023年,星期三以下是在兩參數(shù)模型下證實(shí),由于趨異變化,由轉(zhuǎn)換造成差異(I型變化)或由顛換造成差異(Ⅱ型變化)的堿基,隨時(shí)間而變化:如果k=а+2β是單位時(shí)間堿基替換的總頻率,則適合作為系統(tǒng)樹的距離尺度為:該類距離可用于有關(guān)系統(tǒng)樹距離矩陣中,用樣本比值代入公式就可估計(jì)這些距離。第四十頁(yè),共九十五頁(yè),編輯于2023年,星期三兔和雞的β-球蛋白序列長(zhǎng)438bp,有58個(gè)I型變化、63個(gè)Ⅱ型變化。因此,pI=0.1324,PII=0.1438,K距離為0.3513。這與只根據(jù)相同堿基比例q=0.7237所得Jukes-Cantor距離0.3446沒有本質(zhì)上的差異?!谒氖豁?yè),共九十五頁(yè),編輯于2023年,星期三DNA序列距離K又可稱為DNA序列間的分歧度(sequencedivergence),即序列間相異性的一個(gè)指標(biāo)。蛋白質(zhì)序列的分歧度分為兩序列同義變化的分歧度(KS)和非同義變化的分歧度(KA),根據(jù)Jukes-Cautor單參數(shù)模型和Kimura兩參數(shù)模型等遺傳模型,可以分別計(jì)算得到兩序列的分歧度(或稱為蛋白質(zhì)序列間的距離)。第四十二頁(yè),共九十五頁(yè),編輯于2023年,星期三對(duì)DNA序列進(jìn)行系統(tǒng)發(fā)育分析的四個(gè)主要步驟是比對(duì),建立取代模型,建立進(jìn)化樹以及進(jìn)化樹評(píng)估。如何繪制系統(tǒng)進(jìn)化樹第四十三頁(yè),共九十五頁(yè),編輯于2023年,星期三多重比對(duì)

進(jìn)行多重比對(duì)的基本步驟包括:選擇合適的比對(duì)程序;然后從比對(duì)結(jié)果中提取系統(tǒng)發(fā)育的數(shù)據(jù)集,至于如何提取有效數(shù)據(jù),取決于所選擇的建樹程序如何處理容易引起歧義的比對(duì)區(qū)域和插入—?jiǎng)h除序列(即所謂的indel狀態(tài)或者空位狀態(tài))。第四十四頁(yè),共九十五頁(yè),編輯于2023年,星期三計(jì)算機(jī)依賴性:無(wú)依賴;部分依賴;完全依賴。系統(tǒng)發(fā)育調(diào)用:無(wú)調(diào)用;先驗(yàn)調(diào)用;遞歸調(diào)用。比對(duì)參數(shù)評(píng)估:先驗(yàn)評(píng)估;動(dòng)態(tài)評(píng)估;遞歸評(píng)估。比對(duì)特征:基本結(jié)構(gòu)(比如序列);高級(jí)結(jié)構(gòu)。數(shù)學(xué)優(yōu)化:統(tǒng)計(jì)優(yōu)化;非統(tǒng)計(jì)優(yōu)化。多重比對(duì)程序的屬性第四十五頁(yè),共九十五頁(yè),編輯于2023年,星期三一個(gè)典型的比對(duì)過(guò)程包括:首先應(yīng)用CLUSTALW/X程序,然后進(jìn)行手工比對(duì),最后提交給一個(gè)建樹程序。這個(gè)過(guò)程有如下特征選項(xiàng):(1)部分依賴于計(jì)算機(jī)(也就是說(shuō),需要手工調(diào)整);(2)需要一個(gè)先驗(yàn)的系統(tǒng)發(fā)育標(biāo)準(zhǔn)(也就是說(shuō)需要一個(gè)前導(dǎo)樹);(3)使用先驗(yàn)評(píng)估方法和動(dòng)態(tài)評(píng)估方法(推薦)對(duì)比對(duì)參數(shù)進(jìn)行評(píng)估;(4)對(duì)基本結(jié)構(gòu)(序列)進(jìn)行比對(duì);(5)應(yīng)用非統(tǒng)計(jì)數(shù)學(xué)優(yōu)化。第四十六頁(yè),共九十五頁(yè),編輯于2023年,星期三不能直接把計(jì)算機(jī)比對(duì)結(jié)果提交給建樹程序,因?yàn)榻涑绦虿荒馨l(fā)現(xiàn)比對(duì)的錯(cuò)誤;尤其是那些包含在比對(duì)程序包中(比如,CLUSTALandTREEinProPack)的建樹程序,因?yàn)樵谶@些程序包中的建樹程序更加不嚴(yán)格。我們必須通過(guò)分子結(jié)構(gòu);功能和堿基取代過(guò)程作出一些假定,并且結(jié)合另外一些獨(dú)立的系統(tǒng)發(fā)育證據(jù),對(duì)整個(gè)比對(duì)進(jìn)行考察。注意第四十七頁(yè),共九十五頁(yè),編輯于2023年,星期三在系統(tǒng)進(jìn)化過(guò)程中,會(huì)出現(xiàn)堿基、核酸和氨基酸的替代。對(duì)于生物而言某種程度上的替代是被允許的。目前,還沒有一種簡(jiǎn)單的計(jì)算機(jī)程序可以對(duì)較復(fù)雜的變量進(jìn)行評(píng)估,同樣,現(xiàn)有的建樹軟件也不可能理解這些復(fù)雜變量。因此建立取代模型既影響比對(duì),也影響建樹。取代模型

第四十八頁(yè),共九十五頁(yè),編輯于2023年,星期三建樹方法距離矩陣法(Distancematrixmethod)最大簡(jiǎn)約法(Maximumparsimony,MP)最大似然法(MaximumlikelihoodML)第四十九頁(yè),共九十五頁(yè),編輯于2023年,星期三距離矩陣法(distancematrixmethod)是根據(jù)每對(duì)物種之間的距離,其計(jì)算一般很直接,所生成的樹的質(zhì)量取決于距離尺度的質(zhì)量。距離通常取決于遺傳模型。第五十頁(yè),共九十五頁(yè),編輯于2023年,星期三距離矩陣法平均連接聚類法(UPGMA)系統(tǒng)樹可建立在(遺傳)距離矩陣的基礎(chǔ)上。這里的遺傳距離為所有成對(duì)實(shí)用分類單位(operationaltaxonomicunits,OTU)之間的距離。第五十一頁(yè),共九十五頁(yè),編輯于2023年,星期三t個(gè)實(shí)用分類單位(OTU)間的距離矩陣第五十二頁(yè),共九十五頁(yè),編輯于2023年,星期三第五十三頁(yè),共九十五頁(yè),編輯于2023年,星期三每對(duì)序列間Jukes-Cantor距離取決于每對(duì)序列間差異核普酸的觀察數(shù)。如果在兩條序列中相同堿基的比例為q,則距離K可估計(jì)為:第五十四頁(yè),共九十五頁(yè),編輯于2023年,星期三第五十五頁(yè),共九十五頁(yè),編輯于2023年,星期三第五十六頁(yè),共九十五頁(yè),編輯于2023年,星期三第五十七頁(yè),共九十五頁(yè),編輯于2023年,星期三第五十八頁(yè),共九十五頁(yè),編輯于2023年,星期三Fitch-Margoliash算法第五十九頁(yè),共九十五頁(yè),編輯于2023年,星期三第六十頁(yè),共九十五頁(yè),編輯于2023年,星期三第六十一頁(yè),共九十五頁(yè),編輯于2023年,星期三依此類推第六十二頁(yè),共九十五頁(yè),編輯于2023年,星期三第六十三頁(yè),共九十五頁(yè),編輯于2023年,星期三d第六十四頁(yè),共九十五頁(yè),編輯于2023年,星期三第六十五頁(yè),共九十五頁(yè),編輯于2023年,星期三如果設(shè)置樹根I,并假定從工到現(xiàn)在所有序列的兩個(gè)分枝具有相等的變更率,因而從G到工的距離g與從H到I的距離h是相等的,則有根樹就可以采用與UPGMA提供的相同拓?fù)浞椒▉?lái)獲得。所以g=h=0.092,且從G到I的距離g為g減去G的高度,即0.032。將所有這些分枝長(zhǎng)度一起考慮便得到有根系統(tǒng)樹。第六十六頁(yè),共九十五頁(yè),編輯于2023年,星期三第六十七頁(yè),共九十五頁(yè),編輯于2023年,星期三鄰接法(Neighbor一joiningMethod)該方法通過(guò)確定距離最近(或相鄰)的成對(duì)分類單位來(lái)使系統(tǒng)樹的總距離達(dá)到最小。相鄰是指兩個(gè)分類單位在某一無(wú)根分叉樹中僅通過(guò)一個(gè)節(jié)點(diǎn)(node)相連。人與黑猩猩是相鄰的,人與大猩猩則不是;如果人與黑猩猩組成一個(gè)新類,則該新類與大猩猩又成為相鄰??傊?,通過(guò)循序地將相鄰點(diǎn)合并成新的點(diǎn),就可以建立一個(gè)相應(yīng)的拓?fù)錁洹5诹隧?yè),共九十五頁(yè),編輯于2023年,星期三第六十九頁(yè),共九十五頁(yè),編輯于2023年,星期三第七十頁(yè),共九十五頁(yè),編輯于2023年,星期三第七十一頁(yè),共九十五頁(yè),編輯于2023年,星期三第七十二頁(yè),共九十五頁(yè),編輯于2023年,星期三第一步,星號(hào)(or)和長(zhǎng)臂猿(gi)之間的Mij值最小,則它們用節(jié)點(diǎn)1取代,進(jìn)入第2步,則新節(jié)點(diǎn)(節(jié)點(diǎn)1)到這二個(gè)節(jié)點(diǎn)的距離為:第七十三頁(yè),共九十五頁(yè),編輯于2023年,星期三第七十四頁(yè),共九十五頁(yè),編輯于2023年,星期三第七十五頁(yè),共九十五頁(yè),編輯于2023年,星期三最大簡(jiǎn)約法最大簡(jiǎn)約(maximumparsimony)法較少涉及遺傳假設(shè),它通過(guò)尋求物種間最小的變更數(shù)來(lái)完成的。第七十六頁(yè),共九十五頁(yè),編輯于2023年,星期三對(duì)于每種可能的拓?fù)浣Y(jié)構(gòu),每一節(jié)點(diǎn)的序列就是產(chǎn)生兩個(gè)直接后裔序列所需變更最小的序列。然后可以找到整個(gè)系統(tǒng)樹所需的變更總數(shù),具有最小總數(shù)的系統(tǒng)樹就是最簡(jiǎn)約的。簡(jiǎn)約法明顯注重每一物種觀測(cè)的特征值,而不是概括特征值之間差異的序列間距離。如果有一組物種的序列可供利用,那么連接它們的最為簡(jiǎn)約的拓?fù)浣Y(jié)構(gòu)就可能得到。但一般無(wú)法獲得分枝長(zhǎng)度。第七十七頁(yè),共九十五頁(yè),編輯于2023年,星期三對(duì)于最大化的簡(jiǎn)約,只需考慮那些信息位點(diǎn)(Informativesite)。對(duì)于DNA序列,信息位點(diǎn)是指那些至少存在2個(gè)不同的堿基且每個(gè)不同堿基至少出現(xiàn)兩次的位點(diǎn)。只有一個(gè)堿基且只在一個(gè)序列中出現(xiàn)的位點(diǎn)不屬于信息位點(diǎn),因?yàn)槟欠N獨(dú)特的堿基位點(diǎn)是由于在直接通向它所在序列的分枝上發(fā)生單個(gè)堿基變更所引起的。這種堿基變更可與任何拓?fù)浣Y(jié)構(gòu)相容。第七十八頁(yè),共九十五頁(yè),編輯于2023年,星期三以表為例,只有位點(diǎn)5,7,9為信息位點(diǎn)。第七十九頁(yè),共九十五頁(yè),編輯于2023年,星期三存在5個(gè)信息位點(diǎn):25,39,44,47,54。第八十頁(yè),共九十五頁(yè),編輯于2023年,星期三第八十一頁(yè),共九十五頁(yè),編輯于2023年,星期三最大似然法注:最大似然估計(jì)是一種統(tǒng)計(jì)方法,它用來(lái)求一個(gè)樣本集的相關(guān)概率密度函數(shù)的參數(shù)。對(duì)于模型的巨大依賴性是最大似然(maximumlikelihood)法的特征,該方法在計(jì)算上繁雜,但為統(tǒng)計(jì)推斷提供了基礎(chǔ)。第八十二頁(yè),共九十五頁(yè),編輯于2023年,星期三當(dāng)考慮實(shí)施最大似然法時(shí),該方法先假定系統(tǒng)樹的形式,然后選擇分枝長(zhǎng)度以使產(chǎn)生特定系統(tǒng)樹的資料的似然值最大化。通過(guò)比較不同系統(tǒng)樹的似然函數(shù)值,將具有最大似然值的系統(tǒng)樹看作最佳估計(jì)。一個(gè)直接的問(wèn)題是隨著OTU的增加,系統(tǒng)樹的數(shù)目迅速增加。當(dāng)樹端具有n個(gè)OTU時(shí),無(wú)根分歧樹(在每一內(nèi)部樹節(jié)上連接著兩個(gè)分枝的樹)的數(shù)目為(2n-5)!/[(n-3)!2-3]。當(dāng)n=3,4,6,8和10時(shí),該數(shù)分別為1,3,105,10395,2027025。具有n個(gè)樹端的有根樹數(shù)目與具有n+1個(gè)樹端的無(wú)根樹數(shù)目相同。實(shí)際應(yīng)用時(shí),只研究所有系統(tǒng)樹的一個(gè)亞集。第八十三頁(yè),共九十五頁(yè),編輯于2023年,星期三第八十四頁(yè),共九十五頁(yè),編輯于2023年,星期三第八十五頁(yè),共九十五頁(yè),編輯于2023年,星期三三種方法的比較

距離矩陣方法簡(jiǎn)單,只計(jì)算兩個(gè)序列的差異數(shù)量。這個(gè)數(shù)量被看作進(jìn)化距離,而其準(zhǔn)確大小依賴于進(jìn)化模型的選擇。然后運(yùn)行一個(gè)聚類算法,從最相似(也就是說(shuō),兩者之間的距離最短)的序列開始,通過(guò)距離值方陣計(jì)算出實(shí)際的進(jìn)化樹,或者通過(guò)將總的樹枝長(zhǎng)度最小化而優(yōu)化出進(jìn)化樹。第八十六頁(yè),共九十五頁(yè),編輯于2023年,星期三用最大節(jié)約方法搜索進(jìn)化樹的原理是要求用最小的改變來(lái)解釋所要研究的分類群之間觀察到的差異。第八十七頁(yè),共九十五頁(yè),編輯于2023年,星期三用于系統(tǒng)發(fā)育推論的最大似然方法評(píng)估所選定的進(jìn)化模型能夠產(chǎn)生實(shí)際觀察到的數(shù)據(jù)的可能性。如果兩個(gè)姐妹分類群都有核苷酸“A”,那么,如果假定原先的核苷酸是“C”,得到現(xiàn)在的“A”的可能性比起假定原先就是“A”的可能性要小得多。所有可能出現(xiàn)的幾率被加和,產(chǎn)生一個(gè)特定位點(diǎn)的似然值,然后這個(gè)數(shù)據(jù)集的所有比對(duì)位點(diǎn)似然值的加和就是整個(gè)進(jìn)化樹的似然值。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論