LECTURE5種下數(shù)據(jù)分析方法_第1頁
LECTURE5種下數(shù)據(jù)分析方法_第2頁
LECTURE5種下數(shù)據(jù)分析方法_第3頁
LECTURE5種下數(shù)據(jù)分析方法_第4頁
LECTURE5種下數(shù)據(jù)分析方法_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、種下數(shù)據(jù)分析方法種下數(shù)據(jù)分析方法Data Analysis at Intraspecies Level黃原2010-3主要內容主要內容1. 大進化與小進化的聯(lián)系與區(qū)別大進化與小進化的聯(lián)系與區(qū)別2. 用于種下研究的分子標記和數(shù)據(jù)類型用于種下研究的分子標記和數(shù)據(jù)類型3. 種下遺傳多樣性和分化參數(shù)及應用種下遺傳多樣性和分化參數(shù)及應用4. 種下系統(tǒng)發(fā)育分析及應用種下系統(tǒng)發(fā)育分析及應用5. 種界確定種界確定1. 大進化與小進化的聯(lián)系大進化與小進化的聯(lián)系與區(qū)別與區(qū)別進化模式不同進化模式不同大進化大進化=種上分類單元進化:樹狀分歧進化為主。種上分類單元進化:樹狀分歧進化為主。 種間由于生殖隔離和突變以及分歧

2、導致有完全不同種間由于生殖隔離和突變以及分歧導致有完全不同的基因型的固定,從而形成非重疊的基因庫的基因型的固定,從而形成非重疊的基因庫( non- overlapping gene pools)和相互的單系)和相互的單系性性 (reciprocally monophyletic lineages)。 小進化小進化=種下進化:網(wǎng)狀形式的進化種下進化:網(wǎng)狀形式的進化 種內群體內種內群體內/間的個體因隨機交配有發(fā)生重組的機間的個體因隨機交配有發(fā)生重組的機會,從而使個體的基因譜系呈現(xiàn)網(wǎng)狀關系會,從而使個體的基因譜系呈現(xiàn)網(wǎng)狀關系( reticulating relationships =tokogeny

3、)。種間樹狀進化種間樹狀進化遺傳分歧遺傳分歧種內網(wǎng)狀進化種內網(wǎng)狀進化遺傳多態(tài)性遺傳多態(tài)性研究內容的區(qū)別研究內容的區(qū)別種下研究種下研究 (1) 群體遺傳結構(群體遺傳結構(population genetic structure) (2) 群體分化(群體分化(population subdivision) (3) 譜系生物地理學(譜系生物地理學(phylogeography) (4) 分子進化動力分子進化動力(the forces of molecular evolution) (5) 個體個體/群體群體/亞種系統(tǒng)發(fā)育關系亞種系統(tǒng)發(fā)育關系(individuals/populations/subs

4、pecies phylogenetic analysis)種上研究種上研究 (1) 種界確定(種界確定(species boundary delimitation) (2) 分類單元單系性檢驗(分類單元單系性檢驗(testing taxa monophyly) (3) 系統(tǒng)發(fā)育關系重建(系統(tǒng)發(fā)育關系重建(phylogenetic relationship among taxa) (4) 性狀進化(性狀進化(character evolution)研究方法的區(qū)別研究方法的區(qū)別采用分子標記不同采用分子標記不同 抽樣策略不同(抽樣策略不同(Sampling strategy)數(shù)據(jù)分析方法不同數(shù)據(jù)分析

5、方法不同Molecules and their useful rangesin phylogenetic relationships Species Genera FamilyOrderClassDivisions Spacersitsmt DNANu rDNATaylor, et al., 1991; more sufficient statistically significant results; sufficient statistically significant results2. 用于種下研究的分子標記和用于種下研究的分子標記和數(shù)據(jù)類型數(shù)據(jù)類型分子標記分子標記SNPSSRRAP

6、DAFLP單核苷酸多態(tài)性單核苷酸多態(tài)性SNP:single nucleotide polymorphisms SNP是指由于單個核苷酸的變異所引起的是指由于單個核苷酸的變異所引起的DNA序列多態(tài)性。序列多態(tài)性。 A single base change, occurring in a population at a frequency of 1% is termed a single nucleotide polymorphism (SNP). When a single base change occurs at 1% it is considered to be a mutation. 微

7、衛(wèi)星微衛(wèi)星MicrosatellitesDesign primers to “flanking regions”微衛(wèi)星基因分型原理微衛(wèi)星基因分型原理 Li (1998). 隨機擴增多態(tài)性隨機擴增多態(tài)性DNA RAPD: randomly amplified polymorphic DNARAPD profile of DNA from 23 samples AFLP: amplified fragment length polymorphismDigestion of DNA with two enzymesLigation of adaptersPrimers complementary t

8、o adapters and to 3 region of some of the fragmentsAFLP Gel分子標記的性質分子標記的性質顯示方式:顯示方式: 共顯性共顯性(codominant)標記可以識別所有的等位基標記可以識別所有的等位基因,包括雜合子和隱性等位基因。因,包括雜合子和隱性等位基因。 顯性顯性(dominant)標記只能識別顯性等位基因,無標記只能識別顯性等位基因,無法區(qū)分雜合子和隱性等位基因的純合子法區(qū)分雜合子和隱性等位基因的純合子 。座位數(shù)目:座位數(shù)目: 單座位單座位(single locus)標記可以識別等位基因。標記可以識別等位基因。 多座位多座位(mult

9、iple loci)標記一般無法識別等位基因。標記一般無法識別等位基因。遺傳方式遺傳方式父系遺傳標記父系遺傳標記Y ChromosomeHaploid, none or little recombination1.91095.410 9 per site per year 母系遺傳標記母系遺傳標記Mitochondrial DNAHaploid, none or little recombination3.5108 per site per year 雙親遺傳標記雙親遺傳標記nDNADiploid, undergoes recombination基因型與基因分型基因型與基因分型(genotyp

10、e and genotyping)一個個體在某一座位上所擁有的一對等位基因類一個個體在某一座位上所擁有的一對等位基因類型被稱作基因型型被稱作基因型( genotype ) 。檢定個體在特定座位上的基因型的方法被稱作基檢定個體在特定座位上的基因型的方法被稱作基因分型因分型( genotyping) 。 單倍型與單倍型分型單倍型與單倍型分型haplotype and haplotyping單倍型是指在一條單倍型是指在一條DNA上多態(tài)性的分上多態(tài)性的分子標記的不同等位基因之間的組合。子標記的不同等位基因之間的組合。單倍型分型:單倍型分型:單倍型分型方法單倍型分型方法對于位于對于位于Y染色體或染色體或

11、mtDNA以及男性以及男性X染色染色體上的任何標記,每種基因型均為單倍型。體上的任何標記,每種基因型均為單倍型。對于位于常染色體及女性對于位于常染色體及女性X染色體上的標記,染色體上的標記,如果研究的座位為純合子,則可以直接得到如果研究的座位為純合子,則可以直接得到單倍型;如果研究的座位為雜合子,則得到單倍型;如果研究的座位為雜合子,則得到2個聯(lián)合的單倍型??梢酝ㄟ^個聯(lián)合的單倍型。可以通過3種方法獲得單倍種方法獲得單倍型。型。二倍體標記的單倍型分型方法二倍體標記的單倍型分型方法從二倍體的基因型推導單倍型的方法:從二倍體的基因型推導單倍型的方法:等位基因分離法:等位基因分離法: 等位基因特異性等

12、位基因特異性PCR;克隆法;體細胞雜;克隆法;體細胞雜交法。交法。統(tǒng)計推論法:統(tǒng)計推論法: Clarck算法;最大似然法;貝葉斯法。算法;最大似然法;貝葉斯法。家系分析法:家系分析法:單倍型塊單倍型塊Haplotype Blocks染色體在一代代的傳遞中同源片段發(fā)生重組染色體在一代代的傳遞中同源片段發(fā)生重組,多代之后祖先染色體片段的原有排布已被打多代之后祖先染色體片段的原有排布已被打亂。那些沒有被重組打破的區(qū)域相互間被重亂。那些沒有被重組打破的區(qū)域相互間被重組區(qū)域隔開組區(qū)域隔開,這些區(qū)域就是單倍型塊。這些區(qū)域就是單倍型塊。 單倍型單倍型塊的長度一般為塊的長度一般為3 92 kb 。 人類基因組

13、的人類基因組的65% -85% 是以單倍型塊方式是以單倍型塊方式組織起來的組織起來的. 識別單倍型的意義識別單倍型的意義構建基因樹的基礎構建基因樹的基礎識別致病基因識別致病基因理解重組和理解重組和LD模式模式單倍型的起源與進化單倍型的起源與進化位于位于Y染色體和染色體和mtDNA上的單倍體分子標記無重組,上的單倍體分子標記無重組,因而單倍型多樣性僅僅是由于突變產(chǎn)生。因而單倍型多樣性僅僅是由于突變產(chǎn)生。二倍體分子標記的單倍型的起源有突變和重組二種二倍體分子標記的單倍型的起源有突變和重組二種原因。如果重組是隨機發(fā)生的,則原因。如果重組是隨機發(fā)生的,則n個等位基因可個等位基因可以有以有2n種單倍型。

14、種單倍型。任何任何2個標記之間發(fā)生重組的可能性取決于它們的個標記之間發(fā)生重組的可能性取決于它們的相互距離和位置。不同座位的等位基因之間由于重相互距離和位置。不同座位的等位基因之間由于重組降低而導致的組降低而導致的association稱為連鎖不平衡稱為連鎖不平衡(linkage disequilibrium,LD)。)。3. 種下遺傳多樣性和分化參種下遺傳多樣性和分化參數(shù)及應用數(shù)及應用物種遺傳變異程度的度量物種遺傳變異程度的度量 測量遺傳變異參數(shù)的方法隨所研究標記的類型和測量遺傳變異參數(shù)的方法隨所研究標記的類型和遺傳方式而異。一般地,物種的遺傳變異可以從遺傳方式而異。一般地,物種的遺傳變異可以

15、從三個方面來描述:三個方面來描述:遺傳多樣性:遺傳變異的量遺傳多樣性:遺傳變異的量遺傳分化:遺傳變異在群體之間的分布遺傳分化:遺傳變異在群體之間的分布遺傳距離:遺傳變異在成對群體之間的數(shù)量。遺傳距離:遺傳變異在成對群體之間的數(shù)量。遺傳多樣性遺傳多樣性 遺傳多樣性通常用于描述生物學實體(個體,遺傳多樣性通常用于描述生物學實體(個體,群體和物種)內存在的遺傳變異。雜合度和群體和物種)內存在的遺傳變異。雜合度和多態(tài)性水平是多態(tài)性水平是2個在個體、群體和物種個在個體、群體和物種3個水個水平上定量描述多樣性的參數(shù)。平上定量描述多樣性的參數(shù)。 廣義的多樣性包括廣義的多樣性包括2個組分:豐富度個組分:豐富度

16、(richness)和均勻度()和均勻度(evenness)。前)。前者測量變異的數(shù)量,后者指示變異的分布。者測量變異的數(shù)量,后者指示變異的分布。 等位基因豐富度的測量等位基因豐富度的測量1 等位基因多樣性(等位基因多樣性(allelic diversity)或豐富度()或豐富度(allelic richness):每個座位上):每個座位上出現(xiàn)的等位基因數(shù)量的平均值。計算時也包括單態(tài)座位??梢砸匀后w或物種為出現(xiàn)的等位基因數(shù)量的平均值。計算時也包括單態(tài)座位??梢砸匀后w或物種為單位計算。單位計算。 2 多態(tài)座位百分數(shù)多態(tài)座位百分數(shù) :當一個座位上最常見的等位基因的頻率:當一個座位上最常見的等位基因

17、的頻率0.95時該座位稱多態(tài)時該座位稱多態(tài)座位。多態(tài)座位的定義是人為的,在當代文獻中,只要表現(xiàn)出任何水平的變異座位。多態(tài)座位的定義是人為的,在當代文獻中,只要表現(xiàn)出任何水平的變異就認為是多態(tài)座位,而并不特別強調就認為是多態(tài)座位,而并不特別強調0.95或或0.99的標準。的標準。 3 多態(tài)座位的平均等位基因數(shù)(多態(tài)座位的平均等位基因數(shù)(mean number of alleles per polymorphic locus):計算方法同上但不包括單態(tài)座位。):計算方法同上但不包括單態(tài)座位。 4 平均觀測雜合度(平均觀測雜合度(mean observed heterozygosity,Ho):在所

18、觀測的座位上):在所觀測的座位上雜合子的數(shù)量占所有檢測座位的比例。該參數(shù)廣泛用于二倍體生物的共顯性標雜合子的數(shù)量占所有檢測座位的比例。該參數(shù)廣泛用于二倍體生物的共顯性標記中,顯然,單倍體生物是無雜合性可言的。當用于多倍體生物時對數(shù)據(jù)的解記中,顯然,單倍體生物是無雜合性可言的。當用于多倍體生物時對數(shù)據(jù)的解釋須十分謹慎。該參數(shù)對顯性標記不適合,因為無法識別出雜合性的個體。釋須十分謹慎。該參數(shù)對顯性標記不適合,因為無法識別出雜合性的個體。5 平均期望雜合度平均期望雜合度(Expected heterozygosity He),是根據(jù)哈溫定律所估算的期望,是根據(jù)哈溫定律所估算的期望值:值:He=1/m

19、Pij(1-Pij)M:基因座總數(shù):基因座總數(shù)N:各基因位上的等位基因數(shù):各基因位上的等位基因數(shù)Pij:第:第i個基因座的第個基因座的第j個等位基因的頻率。個等位基因的頻率。 Neis基因多樣性參數(shù)(基因多樣性參數(shù)(gene diversity statistics)基因多樣性首先由Nei(1973)提出,通常被看作是期望雜合度(expected heterozygosity)。 Nei(1973)提出的基因多樣性的計算:HT為總的期望雜合度,p為k個等位基因中的第i個在所有群體中的平均頻率?;蚨鄻有员粡V泛使用,但該參數(shù)也存在缺陷。如其值在0-1之間變化,隨著一個座位上的等位基因頻率接近相等

20、時,它變得不靈敏,此外,該參數(shù)嚴重依賴于2個最常見等位基因的頻率。 211i kTiiHp 單倍體基因組的考慮單倍體基因組的考慮 單倍體基因組的標記在計算基因多樣性參數(shù)時也用同樣的方法,如計數(shù)單倍型的數(shù)目。對于單倍體標記獨特的參數(shù)是計算單倍型多樣性(haplotype diversity)。 群體遺傳分化的度量群體遺傳分化的度量1 Neis GST 2 Wrights F-statisticsNeis GST總遺傳多樣性(HT)是以期望的總雜合度來度量的。HT可以分解成存在于群體內部的基因多樣性部分HS和存在于群體間的基因多樣性的部分DST(Nei, 1973)。即 HTHSDST HS為每一

21、群體內的期望雜合度的平均值,即 其中p為每個群體中第k個座位上的第i個等位基因的平均頻率(在所有群體中的均值)。多樣性指數(shù)HT、HS、DST可以用于計算遺傳分化參數(shù)GST,GST定義為群體之間相對于群體混合后(即總群體)的基因多樣性,Nei(1973)稱為基因分化系數(shù)(coefficient of gene differentiation): GSTDST/ HT GST值在01之間變化,當HTHS時 GST0,表示等位基因頻率在所有群體中相同,群體之間沒有遺傳分化;當HS0時 GST1,亦即群體內部無變異,而每個群體都固定了不同的等位基因,因而群體達到了最大的分化,所有檢測的變異都分布在不同

22、的群體中。在動物中,活動哪里強的鳥類的GST值是脊椎動物中最低的;同樣能夠飛行的昆蟲是無脊椎動物中最低的。 211i kSiHp Wrights F-statistics多樣性指數(shù)HT、HS也可以用于計算每個個體的平均觀測雜合度HI,也可以用于F-統(tǒng)計值來分析群體的遺傳結構。Wright描述的HT和HS分別是在假定處于哈代-溫伯格平衡時的全部群體的總的期望雜合度和群體內的平均期望雜合度,因而Wright和Nei對HT和HS的定義是不同的,盡管他們二人所使用的符號和計算公式相同。Wright基于在個體、群體和總群體(total population)3個水平上的變異情況提出3種分析方法。 Wri

23、ghts F-statisticsWrights F-statisticsWrights F-statisticsWrights F-statistics遺傳距離的計算遺傳距離的計算Neis遺傳距離遺傳距離Chord distanceJaccard相似系數(shù)相似系數(shù)核苷酸多樣度1. Average number of pairwise nucleotide differences between seqs.jiijnn2/ ) 1(12. Normalize to the length of the sequences (L)L核苷酸多樣度 nucleotide diversity1. ACAG

24、CATTAGCA2. ATAGCAATAGCT3. ATAGCAATACCT(1/3)*(3+1+4) = 8/3(8/3)/12 = 0.222A pair of sequences are on average 22.2% differentExample:# of pairs# of differences between sequences遺傳數(shù)據(jù)的分析方法遺傳數(shù)據(jù)的分析方法多元分析方法多元分析方法 Multidimensional Scaling,MS Principal Components Analysis,PCA譜系生物地理學(譜系生物地理學(phylogeography)分析

25、)分析 Genetic boundary analysis Spatial autocorrelation Nested cladistic analysis系統(tǒng)發(fā)育分析方法系統(tǒng)發(fā)育分析方法遺傳多樣性的應用遺傳多樣性的應用遺傳變異參數(shù)可以應用于估計基因流、遺傳遺傳變異參數(shù)可以應用于估計基因流、遺傳結構、分類學、識別遺傳瓶頸、群體演化歷結構、分類學、識別遺傳瓶頸、群體演化歷史、群體大小歷史過程及保育生物學等方面。史、群體大小歷史過程及保育生物學等方面。哈迪哈迪-溫伯格平衡是遺傳變異應用的基礎,已溫伯格平衡是遺傳變異應用的基礎,已經(jīng)發(fā)展了多種成熟的方法了分析偏離哈代經(jīng)發(fā)展了多種成熟的方法了分析偏離

26、哈代-溫溫伯格平衡的因素。伯格平衡的因素。溯祖理論(溯祖理論(coalescent theory)是遺傳變異)是遺傳變異應用的基礎。應用的基礎。一個典型的群體基因型數(shù)據(jù)的分一個典型的群體基因型數(shù)據(jù)的分析內容析內容 1. 多態(tài)性、遺傳多樣性和雜合度水平分析(多態(tài)性、遺傳多樣性和雜合度水平分析(Levels of polymorphism, genetic diversity and heterozygosity)2. 觀測基因型與哈迪觀測基因型與哈迪-溫伯格平衡的符合及數(shù)據(jù)同質性溫伯格平衡的符合及數(shù)據(jù)同質性(Conformity to Hardy-Weinberg equilibrium and

27、 homogeneity of data)3. 使用使用F-統(tǒng)計值進行的群體遺傳結構分析統(tǒng)計值進行的群體遺傳結構分析(Hierarchical analysis of genetic structure with F-statistics,including level of significance)4. 使用遺傳距離分析群體遺傳結構和群體之間關系使用遺傳距離分析群體遺傳結構和群體之間關系(Analysis of genetic structure with pairwise genetic distance, phenogram)5. 多變量因子分析多變量因子分析Multivariate

28、analysis (Principle Component Analysis or Factor analysis).6. 連鎖分析(連鎖分析(Linkage analysis) 4. 種下系統(tǒng)發(fā)育分析及應用種下系統(tǒng)發(fā)育分析及應用基因譜系基因譜系Gene Genealogy來自同一個物種內由微進化來自同一個物種內由微進化(microevolutionary )過程產(chǎn)生的)過程產(chǎn)生的不同等位基因拷貝序列構建的樹狀圖不同等位基因拷貝序列構建的樹狀圖稱為基因譜系(稱為基因譜系(gene genealogy),),以區(qū)別于來自不同物種序列、反映大以區(qū)別于來自不同物種序列、反映大進化(進化(macroe

29、volutionary )過程的)過程的系統(tǒng)樹。基因譜系上的基因序列代表系統(tǒng)樹?;蜃V系上的基因序列代表了群體中存在的不同等位基因了群體中存在的不同等位基因/單倍型,單倍型,它們可以存在于不同個體、也可以是它們可以存在于不同個體、也可以是同一個體。同一個體。 基因譜系構建基因譜系構建構建基因譜系的方法與構建普通的系統(tǒng)樹完全一樣,構建基因譜系的方法與構建普通的系統(tǒng)樹完全一樣,所不同的只是對等位基因序列的確定。所不同的只是對等位基因序列的確定。從等位基因序列構建樹狀圖的最大障礙是重組問題,從等位基因序列構建樹狀圖的最大障礙是重組問題,因為重組事件將因為重組事件將2個不同的等位基因的部分混合成個不同

30、的等位基因的部分混合成一個新等位基因,從而使等位基因之間的關系表現(xiàn)一個新等位基因,從而使等位基因之間的關系表現(xiàn)為網(wǎng)絡關系,而不是樹狀分支關系。這種關系違反為網(wǎng)絡關系,而不是樹狀分支關系。這種關系違反了系統(tǒng)發(fā)育分析的基本假設。了系統(tǒng)發(fā)育分析的基本假設。 如果重組頻率不太高的話,可以識別出從來沒有發(fā)如果重組頻率不太高的話,可以識別出從來沒有發(fā)生過重組的局部的單倍型模塊(生過重組的局部的單倍型模塊(haplotype blocks)。)。 基因譜系與系統(tǒng)樹基因譜系與系統(tǒng)樹 二種水平的系統(tǒng)發(fā)育分析的區(qū)別:二種水平的系統(tǒng)發(fā)育分析的區(qū)別:1) 抽樣的一個現(xiàn)存群體可以是某些群體的祖先,抽樣的一個現(xiàn)存群體可以

31、是某些群體的祖先,而在物種以上的比較中祖先一般是不存在的。而在物種以上的比較中祖先一般是不存在的。 2) 祖先群體與后代群體一樣可以產(chǎn)生新的突變。祖先群體與后代群體一樣可以產(chǎn)生新的突變。3) 由于重組形成等位基因或單倍型之間的網(wǎng)狀關由于重組形成等位基因或單倍型之間的網(wǎng)狀關系系(tokogeny)而非二分歧樹。而非二分歧樹。4) 群體水平上序列的分歧程度較低,傳統(tǒng)的系統(tǒng)群體水平上序列的分歧程度較低,傳統(tǒng)的系統(tǒng)發(fā)育分析方法在應用這樣的數(shù)據(jù)建立的系統(tǒng)發(fā)育樹發(fā)育分析方法在應用這樣的數(shù)據(jù)建立的系統(tǒng)發(fā)育樹的準確性較低。的準確性較低。 基因譜系基因譜系在分析群體數(shù)據(jù)時,我們需要一種新的能夠在分析群體數(shù)據(jù)時,

32、我們需要一種新的能夠考慮群體數(shù)據(jù)特征的系統(tǒng)發(fā)育分析方法。傳考慮群體數(shù)據(jù)特征的系統(tǒng)發(fā)育分析方法。傳統(tǒng)的二分歧樹模型不能用于基因譜系的建立,統(tǒng)的二分歧樹模型不能用于基因譜系的建立,網(wǎng)絡方法更符合群體水平的譜系關系。目前網(wǎng)絡方法更符合群體水平的譜系關系。目前已經(jīng)提出了多種網(wǎng)絡系統(tǒng)發(fā)育分析方法,已經(jīng)提出了多種網(wǎng)絡系統(tǒng)發(fā)育分析方法,Posada和和Crandall(2001)對這些方法進)對這些方法進行了總結。這些方法中以基于算法的方法占行了總結。這些方法中以基于算法的方法占大多數(shù),基于優(yōu)化標準的方法較少。大多數(shù),基于優(yōu)化標準的方法較少。基因譜系基因譜系單倍型的進化歷史有樹狀和網(wǎng)絡狀二種,從單倍型的進化

33、歷史有樹狀和網(wǎng)絡狀二種,從來沒有發(fā)生過重組的來沒有發(fā)生過重組的DNA片段與種間分歧的片段與種間分歧的序列一樣為樹狀,而大多數(shù)單倍型之間有網(wǎng)序列一樣為樹狀,而大多數(shù)單倍型之間有網(wǎng)狀的進化關系或多歧分枝(同時形成的單倍狀的進化關系或多歧分枝(同時形成的單倍型)。因而單倍型之間的譜系關系可以用多型)。因而單倍型之間的譜系關系可以用多種不同的圖示表示,如種不同的圖示表示,如cladogram,phylogram或或haplotypic tree。當有重組和。當有重組和基因水平轉移是樹狀圖不能很好地表達他們基因水平轉移是樹狀圖不能很好地表達他們之間的關系,這種情況下用網(wǎng)絡更好。之間的關系,這種情況下用網(wǎng)

34、絡更好。 最小生成網(wǎng)絡法最小生成網(wǎng)絡法最小生成網(wǎng)絡法(最小生成網(wǎng)絡法(minimum-spanning network,MSN),軟件包),軟件包ARLEQUIN V2.0中有此算法(中有此算法(Schneider等,等,2000)。這是)。這是一種從成對單倍型之間的距離矩陣中構建最一種從成對單倍型之間的距離矩陣中構建最小生成樹(小生成樹(minimum-spanning tree,MST)的算法(的算法(Rohlf,1973)經(jīng)過改進以在一個)經(jīng)過改進以在一個圖上包含所有可能的圖上包含所有可能的MST的方法(的方法(Excoffier and Smouse,1994)。多個最小生成樹只)。多

35、個最小生成樹只在取樣的單倍型之間才有連接,沒有推論未在取樣的單倍型之間才有連接,沒有推論未取樣單倍型的能力。取樣單倍型的能力。 統(tǒng)計簡約法統(tǒng)計簡約法TCS統(tǒng)計簡約法(統(tǒng)計簡約法(statistical parsimony),),Templeton等,等,1992。軟件包。軟件包TCS V1.13(Clement等,等,2000)中有此算法。該法首先尋找)中有此算法。該法首先尋找未校正的距離中不低于未校正的距離中不低于5%的概率(稱為簡約上限,的概率(稱為簡約上限,parsimony limit)違反簡約性原則的距離,接著從)違反簡約性原則的距離,接著從具有最小距離的單倍型開始迭代地建立各單倍型

36、之具有最小距離的單倍型開始迭代地建立各單倍型之間地連接,直到所有的單倍型都連上,或者對應于間地連接,直到所有的單倍型都連上,或者對應于簡約上限距離的單倍型連通上為止。盡管應用簡約上限距離的單倍型連通上為止。盡管應用TCS可以推論遺失的單倍型節(jié)點,但在文獻中還沒有正可以推論遺失的單倍型節(jié)點,但在文獻中還沒有正式的描述推論的算法。式的描述推論的算法。 中值連接法中值連接法中值連接法(中值連接法(median-joining network,MJN),軟件包),軟件包NETWORKS V2.0(Bandelt等,等,1999)中有此算法。該法首)中有此算法。該法首先將所有的先將所有的MSTs根據(jù)類似

37、于根據(jù)類似于Excoffier and Smouse(1994)提出的算法聯(lián)合在單一網(wǎng))提出的算法聯(lián)合在單一網(wǎng)絡上(絡上(MSN),接著應用簡約性標準推論出),接著應用簡約性標準推論出MSN上遺失的單倍型節(jié)點并將其添加到上遺失的單倍型節(jié)點并將其添加到MSN上,以使上,以使MSN的總樹長最小。的總樹長最小。 最簡約樹聯(lián)合法最簡約樹聯(lián)合法最簡約樹聯(lián)合法(最簡約樹聯(lián)合法(union of most parsimonious trees,UMP),由),由Cassens等(等(2005)提出。該)提出。該法需要二個連續(xù)的步驟,首先,采用法需要二個連續(xù)的步驟,首先,采用MP法分析數(shù)法分析數(shù)據(jù)并保存據(jù)并保

38、存MPT及其分支長度信息;接著使用下述算及其分支長度信息;接著使用下述算法將所有保存的法將所有保存的MPTs聯(lián)合在一個圖上。算法是:聯(lián)合在一個圖上。算法是:將所有將所有MPTs連通到單一網(wǎng)絡上;將不同連通到單一網(wǎng)絡上;將不同MPTs上具有相同的分枝、單倍型或分枝單倍型(無論是上具有相同的分枝、單倍型或分枝單倍型(無論是取樣的單倍型還是推論的單倍型)合并,在這個過取樣的單倍型還是推論的單倍型)合并,在這個過程中,從一棵或多棵程中,從一棵或多棵MPTs上獲得的獨特的譜系路上獲得的獨特的譜系路徑的環(huán)(徑的環(huán)(cycles)仍然維持不變。)仍然維持不變。 基因譜系的應用基因譜系的應用 (1)基因譜系可

39、以用于檢驗自然選擇作用)基因譜系可以用于檢驗自然選擇作用 (2)中性理論的檢驗)中性理論的檢驗 (3)基因流估計)基因流估計 (4)從基因譜系推論群體進化)從基因譜系推論群體進化(5)從基因譜系推論群體參數(shù))從基因譜系推論群體參數(shù) 基因譜系應用的理論基礎基因譜系應用的理論基礎哈迪哈迪-溫伯格(溫伯格(Hardy-Wenberg equilibrium)中性理論(中性理論(neutral theory)溯祖理論(溯祖理論(coalescent theory)判斷群體分化判斷群體分化Pons and Petit(1996)提出了利用)提出了利用DNA序序列數(shù)據(jù)判斷群體分化的方法:從列數(shù)據(jù)判斷群體分

40、化的方法:從DNA序列中序列中計算出計算出Gst和和Nst二個參數(shù),二個參數(shù),Gst僅考慮單倍僅考慮單倍型頻率,而型頻率,而Nst考慮單倍型之間的相似性,數(shù)考慮單倍型之間的相似性,數(shù)據(jù)集中有顯著遺傳分化發(fā)生可以通過比較據(jù)集中有顯著遺傳分化發(fā)生可以通過比較Nst接近于接近于0來檢驗,而來檢驗,而Gst和和Nst差異的統(tǒng)計學差異的統(tǒng)計學顯著性提供了單倍型的系統(tǒng)發(fā)育及其地理分顯著性提供了單倍型的系統(tǒng)發(fā)育及其地理分布信息,即當布信息,即當NstGst時,有著密切相關時,有著密切相關的單倍型多在同一群體而不是不同群體中存的單倍型多在同一群體而不是不同群體中存在。在。 單倍型譜系與地理分布的關系單倍型譜系

41、與地理分布的關系單倍型譜系樹:根據(jù)單倍型的序列信息建立的單倍型譜系樹:根據(jù)單倍型的序列信息建立的基因樹?;驑洹伪缎偷牡乩矸植迹鹤R別出的單倍型在地理空單倍型的地理分布:識別出的單倍型在地理空間的分布式樣。間的分布式樣。如果單倍型樹與地理分布一致,則如果單倍型樹與地理分布一致,則NstGst。如果單倍型之間沒有特定的關系,則如果單倍型之間沒有特定的關系,則NstGst。如果關系密切的單倍型之間不在相同分布區(qū)域如果關系密切的單倍型之間不在相同分布區(qū)域的群體中出現(xiàn),則的群體中出現(xiàn),則NstGst。 基因流估計基因流估計傳統(tǒng)方法是應用等位酶、傳統(tǒng)方法是應用等位酶、SSR等無序分子標等無序分子標記,在

42、中性模型下(假定群體處于基因流和記,在中性模型下(假定群體處于基因流和漂變作用的平衡狀態(tài))計算群體遺傳結構相漂變作用的平衡狀態(tài))計算群體遺傳結構相關參數(shù)進行間接估計。群體等位基因的地理關參數(shù)進行間接估計。群體等位基因的地理變異被用于計算聯(lián)合參數(shù)變異被用于計算聯(lián)合參數(shù)Nm(作為群體之間(作為群體之間每世代遷移個體的平均數(shù))。每世代遷移個體的平均數(shù))。Nm大于大于1表示表示基因流的效應大于漂變的效應,基因流的效應大于漂變的效應,Nm小于小于1說說明基因流受到限制,或無基因流。明基因流受到限制,或無基因流。 基因流估計基因流估計Templeton法常稱為嵌套進化枝分析(法常稱為嵌套進化枝分析(nes

43、ted clade analysis),該法將地理分布信息疊加到基因譜系上,采用),該法將地理分布信息疊加到基因譜系上,采用嚴密的統(tǒng)計學方法來檢驗地理分布與基因譜系的關聯(lián)強度,嚴密的統(tǒng)計學方法來檢驗地理分布與基因譜系的關聯(lián)強度,并由此來解釋造成這種原因的進化過程。并由此來解釋造成這種原因的進化過程。具體做法是:首先,采用統(tǒng)計簡約法建立無根支序圖具體做法是:首先,采用統(tǒng)計簡約法建立無根支序圖(cladogram),從這個基因樹上可以形成一系列的嵌套的),從這個基因樹上可以形成一系列的嵌套的進化枝。然后,將地理信息疊加到支序圖上,計算出進化枝進化枝。然后,將地理信息疊加到支序圖上,計算出進化枝距離

44、(距離(clade distance,Dc)和嵌套進化枝距離()和嵌套進化枝距離(nested clade distance,Dn)。進化枝距離)。進化枝距離Dc是從進化枝地理中是從進化枝地理中心到各進化枝成員的平均空間距離(心到各進化枝成員的平均空間距離(km),而嵌套進化枝),而嵌套進化枝距離是嵌套進化枝地理中心到嵌套進化枝各成員之間的平均距離是嵌套進化枝地理中心到嵌套進化枝各成員之間的平均空間距離。最后,采用排列檢驗(空間距離。最后,采用排列檢驗(permutation test)確定)確定對這種模式的支持度。對這種模式的支持度。 從基因譜系估計群口歷史從基因譜系估計群口歷史nGrant

45、 and Bowen(1998)通過比較)通過比較mtDNA單倍型和核苷酸單倍型和核苷酸多態(tài)性(多態(tài)性(nucleotide diversity)作為估算群口歷史)作為估算群口歷史(demographic)的方法)的方法n 5. 種界確定種界確定種界確定問題種界確定問題系統(tǒng)生物學的兩大主要任務就是為物種定系統(tǒng)生物學的兩大主要任務就是為物種定界和重建它們的系統(tǒng)發(fā)育關系界和重建它們的系統(tǒng)發(fā)育關系 。超越主觀判斷,發(fā)展種界確定的客觀操作超越主觀判斷,發(fā)展種界確定的客觀操作方法一直都是一個挑戰(zhàn)。傳統(tǒng)分類學家用方法一直都是一個挑戰(zhàn)。傳統(tǒng)分類學家用宏觀的形態(tài)學數(shù)據(jù)來為物種定界;之后隨宏觀的形態(tài)學數(shù)據(jù)來為物

46、種定界;之后隨著分子生物學技術的發(fā)展,分子數(shù)據(jù)也逐著分子生物學技術的發(fā)展,分子數(shù)據(jù)也逐步應用到種界確定上來,最近,很多研究步應用到種界確定上來,最近,很多研究提出了用提出了用DNA序列數(shù)據(jù)來檢驗傳統(tǒng)的、形序列數(shù)據(jù)來檢驗傳統(tǒng)的、形態(tài)學上的分類,尤其是線粒體態(tài)學上的分類,尤其是線粒體DNA(mtDNA)的分析。)的分析。 種界確定的分子方法分類種界確定的分子方法分類不依賴于系統(tǒng)樹的方法:不依賴于系統(tǒng)樹的方法: (1)雜交帶屏障法)雜交帶屏障法 (2)遺傳距離與地理距離關聯(lián)法)遺傳距離與地理距離關聯(lián)法 (3)絕對遺傳距離法)絕對遺傳距離法 (4)重組域法)重組域法 (5)群體聚集分析)群體聚集分析依

47、賴于系統(tǒng)樹的方法:依賴于系統(tǒng)樹的方法: (6)分支單倍型聚集法)分支單倍型聚集法 (7)譜系排它性標準)譜系排它性標準 (8)內聚性檢驗法)內聚性檢驗法遺傳距離與地理距離關聯(lián)法遺傳距離與地理距離關聯(lián)法Good與與Wake所提出的方法是直接根據(jù)所提出的方法是直接根據(jù)“遺傳距離遺傳距離-地理距離圖地理距離圖”來檢測物種界限。這里的遺傳距離根來檢測物種界限。這里的遺傳距離根據(jù)異型酶座位來計算。在該方法中需要對取樣樣本據(jù)異型酶座位來計算。在該方法中需要對取樣樣本進行兩兩比較,在進行兩兩比較,在“遺傳距離遺傳距離-地理距離直角坐標系地理距離直角坐標系”上標出每對比較的結果,然后對所得到的結果做擬上標出每

48、對比較的結果,然后對所得到的結果做擬合趨勢線。若擬合趨勢線過坐標原點,則表明基因合趨勢線。若擬合趨勢線過坐標原點,則表明基因交流的程度和地理距離相關,取樣樣本可被認為是交流的程度和地理距離相關,取樣樣本可被認為是同一物種;相反,若擬合趨勢線嚴重偏離坐標原點,同一物種;相反,若擬合趨勢線嚴重偏離坐標原點,則表明樣本相互之間基因交流程度與地理距離之間則表明樣本相互之間基因交流程度與地理距離之間的分歧度不同,取樣樣本可能包含了多個物種。在的分歧度不同,取樣樣本可能包含了多個物種。在用這種方法時可以事先在總樣本內定義幾個子集,用這種方法時可以事先在總樣本內定義幾個子集,這樣在總樣本包含多個物種時同時可

49、以檢測出哪些這樣在總樣本包含多個物種時同時可以檢測出哪些樣本屬于同一物種樣本屬于同一物種 。Good & Wake的遺傳距離法。(a)表示取樣樣本之間兩兩比較的遺傳距離-地理距離散點圖;(b)表示事先定義的兩個子集A、B內部的擬合趨勢線;(c)表示所有樣本整體散點圖的擬合趨勢線。根據(jù)Good & Wake的觀點,子集A、B分別為獨立的物種,整體取樣包含多個物種。 絕對遺傳距離法絕對遺傳距離法Highton于于1990年提出了另一個根據(jù)遺傳距離來為年提出了另一個根據(jù)遺傳距離來為物種定界的方法。該方法不考慮地理距離,而是從物種定界的方法。該方法不考慮地理距離,而是從樣本之間的遺傳距

50、離的分布頻率來為物種定界。樣本之間的遺傳距離的分布頻率來為物種定界。Highton認為樣本之間的遺傳距離是由不同程度的認為樣本之間的遺傳距離是由不同程度的生殖隔離所產(chǎn)生的,并指出生殖隔離所產(chǎn)生的,并指出Nei D0.15時所比較的時所比較的兩個樣本屬于同一物種,而兩個樣本屬于同一物種,而Nei D0.15時則認為該時則認為該屬于不同的物種。這個觀點可以通過屬于不同的物種。這個觀點可以通過D距離的分布距離的分布頻率柱狀圖來進行直觀判斷。若取樣樣本頻率柱狀圖來進行直觀判斷。若取樣樣本D值頻率值頻率分布只在分布只在Nei D0.15有一個峰值,則可認為取樣樣有一個峰值,則可認為取樣樣本屬于同一物種;相反,若本屬于同一物種;相反,若D值頻率分布在值頻率分布在Nei

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論