![第五章分子系統(tǒng)發(fā)育分析課件_第1頁](http://file4.renrendoc.com/view/04807ade1f4608bd7b468e931de96453/04807ade1f4608bd7b468e931de964531.gif)
![第五章分子系統(tǒng)發(fā)育分析課件_第2頁](http://file4.renrendoc.com/view/04807ade1f4608bd7b468e931de96453/04807ade1f4608bd7b468e931de964532.gif)
![第五章分子系統(tǒng)發(fā)育分析課件_第3頁](http://file4.renrendoc.com/view/04807ade1f4608bd7b468e931de96453/04807ade1f4608bd7b468e931de964533.gif)
![第五章分子系統(tǒng)發(fā)育分析課件_第4頁](http://file4.renrendoc.com/view/04807ade1f4608bd7b468e931de96453/04807ade1f4608bd7b468e931de964534.gif)
![第五章分子系統(tǒng)發(fā)育分析課件_第5頁](http://file4.renrendoc.com/view/04807ade1f4608bd7b468e931de96453/04807ade1f4608bd7b468e931de964535.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第五章分子系統(tǒng)發(fā)育分析5.1分子進(jìn)化的基本概念5.2分子進(jìn)化模型與序列分歧度計算5.3分子系統(tǒng)樹的構(gòu)建5.4分子系統(tǒng)樹的檢驗5.5分子系統(tǒng)發(fā)育分析軟件及應(yīng)用5.1分子進(jìn)化的基本概念系統(tǒng)發(fā)生(phylogeny)——是指生物形成或進(jìn)化的歷史系統(tǒng)發(fā)生學(xué)(phylogenetics)——研究物種之間的進(jìn)化關(guān)系系統(tǒng)發(fā)生樹(phylogenetictree)——表示形式,描述物種之間進(jìn)化關(guān)系5.1分子進(jìn)化的基本概念同源性與相似性關(guān)于現(xiàn)代人起源的研究:
線粒體DNA ——所有現(xiàn)代人都是一個非洲女性的后代分類單元(物種或序列)物種之間的進(jìn)化關(guān)系
有根樹與無根樹有根樹的數(shù)目ABCABCDDDDD無根樹的數(shù)目ABCABCDDDNumberofTaxaNumberofunrootedtrees
Numberofrootedtrees
313431551510561059457945103958103951351359135135202702510202702534459425有根樹與無根樹的數(shù)目5.2分子進(jìn)化模型
與序列分歧度計算5.2.1核苷酸序列進(jìn)化5.2.2蛋白質(zhì)編碼序列進(jìn)化5.2.3核苷酸序列分歧度5.2.4蛋白質(zhì)編碼序列分歧度5.2.1核苷酸序列進(jìn)化ATCGJukesandCantor(1969)的單參數(shù)模型嘌呤嘧啶在t時間內(nèi)DNA序列上某個位點的堿基由A突變到G的概率為在t時間內(nèi)DNA序列上某個位點的堿基為A保持不變的概率為JukesandCantor(1969)的單參數(shù)模型在t+t時間內(nèi)核苷酸在某個位點上堿基為A保持不變的概率為表示在0到t這段時間內(nèi)DNA序列上某個位點的堿基為A保持不變的概率因此,在0到t這段時間內(nèi)DNA序列上某個位點的堿基保持不變的概率為因此,在0到t這段時間內(nèi)DNA序列上某個位點的堿基發(fā)生突變的概率為1下面考慮在0到t這段時間內(nèi)DNA序列上某個位點的堿基發(fā)生突變的平均次數(shù)設(shè)表示0到t這段時間內(nèi)DNA序列上某個位點的堿基發(fā)生突變的次數(shù)為n的概率,則突變率2即在0到t這段時間內(nèi)DNA序列上某個位點的堿基發(fā)生突變的次數(shù)服從泊松分布,平均次數(shù)為,方差也為。兩條DNA序列分歧度的計算AACGACGATCGAAGGACGATCG:Species2AACGATGATCG:Species1tt
Thetimeis2tbetweenSpecies1andSpecies2
定義兩條DNA序列間的分歧度為K=2t
對于JukesandCantor模型Sp1:AAGCCTCGGGGCCCTTATTTTTTG||||||||||||||||||Sp2:AATCTCCGGGGCCTCTATTTTTTTp=0.25K=0.304099Geneticdistancesarescaledtobethenumberofsubstitutionspersite.Kimura(1980)的兩參數(shù)模型ATCG嘌呤嘧啶
堿基的轉(zhuǎn)換(transition)
堿基的顛換(transversion)(1)(2)(3)(4)(1)-(3)代入(1)式,得推導(dǎo)KK80AACGACGATCGAAGGACGATCG:Species2AACGACTATCG:Species1tt
Thetimeis2tbetweenSpecies1andSpecies2
定義兩條DNA序列間的分歧度為K=2t=2(+2)t
設(shè)Ns為轉(zhuǎn)換數(shù),Nv為顛換數(shù),則Ps=P=Ns/L,Pv=Q=Nv/LSp1:AAGCCTCGGGGCCCTTATTTTTTG||||||||||||||||||Sp2:AATCTCCGGGGCCTCTATTTTTTTWhatarePandQ?P=4/24,Q=2/24K值的取樣誤差其中P=4/24Q=2/24p=6/24L=24Implicationsofsubstitutionsinprotein-codingregionsNonsynonymoussubstitution:ThrTyrLeuLeuACCTATTTGCTGACCTCTTTGCTGThrSer
LeuLeuSynonymoussubstitution:ThrTyrLeuLeuACCTATTTGCTGACCTCCTTGCTGThrTyrLeuLeuTheratesofnucleotidesubstitutionsinthethirdpositionaremuchhigherthaninthefirstandsecondpositions,duetoredundancyinthethirdposition:Changesinthefirstandsecondpositionfrequentlychangestheresultingaminoacid,whilechangesinthethirdpositionaretypicallysynonymous.Countingthenumberofsynonymous&nonsynonymoussubstitutionsbetweenapairofhomologoussequences:Inthe“evolutionarymethod,”wetakeintoaccountallpossibleevolutionarypathwaysbetweeneachpairofhomologouscodons.sdandndarethenumberofsynonymous&nonsynonymoussubstitutionspercodon.ForGTT(Val)andGTA(Val),thereisonesynonymousdifferenceandnononsynonymousdifferences.Therefore,sdandndare1&0,respectively.Itismorecomplicatedwhentherearemultiplesubstitutionspercodon:Multiplesubstitutionspercodon:Thereare6pathwaysbetweenTTGandAGA:TTG(Leu)<->ATG(Met)<->AGG(Arg)<->AGA(Arg)TTG(Leu)<->ATG(Met)<->ATA(Ile)<->AGA(Arg)TTG(Leu)<->TGG(Trp)<->AGG(Arg)<->AGA(Arg)TTG(Leu)<->TGG(Trp)<->TGA(Ter)<->AGA(Arg)TTG(Leu)<->TTA(Leu)<->ATA(Ile)<->AGA(Arg)TTG(Leu)<->TTA(Leu)<->TGA(Ter)<->AGA(Arg)Subs:S,N1,20,31,2*1,2*Wecanignore4&6,whichinvolvestopcodons.sdandndarethen?and9/4,respectively.ThetotalnumberofsubstitutionsThetotalnumberofsubstitutionsareSdandNd,whicharethesumsofsdandndforallcodonsinthecomparedsequences.NotethatSd+Ndisequaltothetotalnumberofnucleotidedifferencesbetweenthetwosequencescompared.Sincesomesubstitutionsmightbemorecommonduetotransition-transversionbias,wecanmodifyourestimateswithparametersfortheseratesTheproportionofsubstitutionsWhileSdandNd
provideuswithinformationaboutthenumberofsubstitutions,wearemoreinterestedintherelativeratesofthesesubstitutionsbetweendifferentgenes.Therefore,weestimatetheproportionofdifferences:Ks=Sd/S&KA=Nd/NWhereS&Narethenumbersofsynonymousandnonsynonymoussites;S+N=3C(thetotalnumberofcodons).TheratesKs&KAareestimatedusingtheJukes-Cantormethod,assumingequalnucleotidefrequencyandnotransition-transversionbias.Add’lparameterscanbeaddediftheseassumptionsarenotvalid.Seq1SerThrGluMetCysLeu
TCAACTGAGATGTGTTTASeq2TCAACAGAGATATGTCTASerThrGluIleCysLeu Sd=2
Nd=1Onesubstitutioninthecodon:Seq1SerThrGluMetCysLeu
TCGACAGAGATGTGTTTASeq2TCGACAGAGATGTGTCTTSerThrGluMetCysLeuSeveralpathwaysproblem1. TTACTA
CTT2. TTATTTCTTTwosubstitutioninthecodonSeveralpathwaysproblem
LeuLeuLeu1. TTA
CTA
CTT2. TTATTT
CTT
LeuPheLeu
Sd=2Nd=0
Sd=0Nd=2Averagepathways Sd=(2+0)/2=1
Nd=(0+2)/2=1Seq1 SerThrGluMetCysLeu
TCGACAGAGATGTGTTTASeq2 TCGACAGAGCGCTGTTTA SerThrGluArgCysLeuSeveralpathwaysproblem1. ATGATC
AGC
CGC2. ATGATC
CTC
CGC3. ATGAGGAGC
CGC4. ATGAGGCGGCGC5. ATGCTG
CTC
CGC6. ATGCTG
CGGCGCThreesubstitutioninthecodonSeveralpathwaysproblemMetIleSerArg1.ATGATC
AGCCGCMetIleLeuArg2.ATGATCCTCCGCMetArgSerArg3.ATGAGGAGCCGCMetArgArgArg4.ATGAGG
CGG
CGCMetLeuLeuArg5.ATG
CTG
CTC
CGCMetLeuArgArg6.ATG
CTG
CGG
CGC
Sd=0Nd=3AveragepathwaysSd=(0+0+0+2+1+1)/6=0.67Nd=(3+3+3+1+2+2)/6=2.33
Sd=0Nd=3
Sd=0Nd=3
Sd=2Nd=1
Sd=1Nd=2
Sd=1Nd=2Calculatethenumbersof
synonymousandnonsynonymoussites苯基丙氨酸半胱氨酸
SerThrGluMetCysLeuS1
TCAACTGAGATGTGTTTA NNSNNSNN1/3SNNNNN1/2S1/3SN1/3S
2/3N1/2N2/3N2/3N SerThrGluIleCysLeuS2 TCAACAGAGATATGTCTA NNSNNSNN1/3SNN2/3SNN1/2S1/3SNS
2/3N1/3N1/2N2/3NExample:Seq1SerThrGluMetCysLeu
TCAACTGAGATGTGTTTASeq2TCAACAGAGATATGTCTASerThrGluIleCysLeuS=4.1667N=13.8333Sd=0+1+0+0+0+1=2Nd=0+0+0+1+0+0=1DivergenceforSynonymousandNonsynonymoususingJukesandCantor’sModelinThisExample5.3分子系統(tǒng)樹的構(gòu)建5.3.1距離矩陣法5.3.2簡約法UPGMA法鄰接法Fitch-Margoliash法最大簡約法進(jìn)化簡約法其他方法方法比較
距離矩陣法—UPGMA法設(shè)類群OTUp和OTUq中含有np和nq個原始類群,并且它們聚合成類群OTUr,則OTUr與OTUi間的距離dr,i為例5—1OTU1OTU2OTU3OTU4
OTU1OTU2
OTU3
OTU4UnweightedPair-GroupMethodusingArithmeticaverages第一步:將OTU1和OTU2聚合為OTUr1,則OTUr1OTU3OTU4OTUr1OTU3OTU4第二步:將OTUr1和OTU3聚合為OTUr2,則OTUr2OTU4OTUr2
OTU4第三步:將OTUr2和OTU4聚合為OTUr3,結(jié)束。用UPGMA法構(gòu)建的系統(tǒng)樹
距離矩陣法—鄰近法ABCDEABCDEABCDEABCDEABCDE鄰近法的計算步驟對于所有的分類單元i,計算選擇一對分類單元i和j,使最小將i和j歸并為新的類(ij),在樹中添加一個新的節(jié)點,代表新生成的分類,計算從i和j到新節(jié)點的分支長度:計算新類與其它類的距離:如果有兩個以上的分類存在,則繼續(xù)執(zhí)行循環(huán);否則用長度為Di,j的分支連接剩余的兩個類。例5-25個分類群5SrRNA的例子BsuBstLviAmoMluBsuBstLviAmoMlu0.30930.3387670.3958670.4524670.420533設(shè)LviAmo0.11140.1681BsuBstLviAmoMluBsuBstLviAmoMluu1()()u10.12220.17980.17980.12220.27190.2719BsuBstu1
MluBsuBstu1
Mlu0.26310.27850.28690.3551BsuBstu1
Mlu設(shè)LviAmo0.11140.1681Bsu0.04920.0730BsuBstu1
MluBsuBstu1
Mlu
u2BstMlu
u2
BstMlu
u2BstMlu
u2
BstMlu0.30580.32040.3970
u2BstMluLviAmo0.11140.1681Bsu0.04920.0730設(shè)Bst0.06460.0500Mlu0.1412
距離矩陣法
—Fitch-Margoliash法距離定義:某個分類單元到一個合并類的距離定義為這個分類單元到這個合并類中的分類單元的平均距離ACED例5—3設(shè)A—D4個類群間的距離為:ABCDABCDACAve.BDACBDAC①②③ABCDABCDBD(AC)B
D(AC)ACBD①②③②-③:④①+④調(diào)整ACDB
最大簡約法推斷序列中堿基替換的數(shù)為最小的進(jìn)化樹適用于較短的、相似度較高的序列算法并不復(fù)雜,但能保證獲得最優(yōu)樹常用的軟件有PAUP和PHYLIP以一個例子說明最大簡約法位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCGAdaptedfromLiandGraur1991四條序列可能有3種無根樹一些位點有信息,這些點偏愛其中的一棵樹,信息位點的字母至少在兩條序列中出現(xiàn)只須分析信息位點,如位點5、7、9GCAA1234位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCGGGACA1324GACA1423樹1樹2樹3AAAAAACTG1234位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCGCATCG1324AGCT1423樹1樹2樹3TTCATGGAA1234位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCGGGAGA1324GAGA1423樹1樹2樹3AAAAAAGAG1234位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCGAAAGG1324AGGA1423樹1樹2樹3AAGAAGGAA1234GGAGA1324GAGA1423AAAAAGGCC1234GGCGC1324GCGC1423CCCCCAGAG1234AAAGG1324AGGA1423AAGAA位點5位點7位點9堿基替換總數(shù)455GGAGGGACAACGGGAACA位點123456789序列1AAGAGTGCA序列2AGCCGTGCG序列3AGATATCCA序列4AGAGATCCG
進(jìn)化簡約法以四個分類群為例說明考慮三種可能的系統(tǒng)樹,分別稱為X型、Y型、Z型:ABCDACBDADBC位點1234567891011121314151617181920SAAUCAGGCUUGCACUAACUGGSBAGGAGAAGUAAGGCCACUUCSCAGGUGUAAUCAGGGCAGAACSDAGCUACCUUUUGCAACGAUA將每個位點的堿基轉(zhuǎn)換成單位矢量11111333133111331112123413311341111
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年全球及中國中置電機(jī)自行車行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國PTZ電子體積校正器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國軍用飛行器模擬器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國工業(yè)木鋸機(jī)行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 期末測試卷01【考試范圍:6-10單元】(原卷版)
- 2025國際商業(yè)代理合同詳細(xì)版樣本
- 擔(dān)保合同范文集錦年
- 健身房私教合同范文
- 電力設(shè)備采購合同模板
- 2025XL數(shù)字地震儀器租賃合同
- 綠色能源項目融資計劃書范文
- 《人工智能發(fā)展史》課件
- 小學(xué)一年級數(shù)學(xué)20以內(nèi)的口算題(可直接打印A4)
- 一個28歲的漂亮小媳婦在某公司打工-被老板看上之后
- 馬工程教育哲學(xué)課件第十章 教育哲學(xué)與教師發(fā)展
- GB/T 11376-2020金屬及其他無機(jī)覆蓋層金屬的磷化膜
- 成功源于自律 主題班會課件(共34張ppt)
- 新青島版(五年制)五年級下冊小學(xué)數(shù)學(xué)全冊導(dǎo)學(xué)案(學(xué)前預(yù)習(xí)單)
- (完整word版)重點監(jiān)管的危險化學(xué)品名錄(完整版)
- 高級工程師電子版職稱證書在網(wǎng)上打印步驟
- 品牌形象的12個原型
評論
0/150
提交評論