人類群體遺傳學(xué)—第一講_第1頁
人類群體遺傳學(xué)—第一講_第2頁
人類群體遺傳學(xué)—第一講_第3頁
人類群體遺傳學(xué)—第一講_第4頁
人類群體遺傳學(xué)—第一講_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、人類群體遺傳學(xué)基本原理和分析方法,中科院-馬普學(xué)會計算生物學(xué)伙伴研究所,中國科學(xué)院上海生命科學(xué)研究院研究生課程 人類群體遺傳學(xué),徐書華 金 力,20082009學(xué)年第二學(xué)期人類群體遺傳學(xué)分析方法課程表 上課時間:每周四上午10:00-11:50 上課地點:中科大廈4樓403室第7教室,第一講 Hardy-Weinberg平衡檢驗及其應(yīng)用,Hardy-Weinberg Equilibrium (HWE)定律 HWE的偏離(固定指數(shù)) HWE的偏離( Wahlund定律) HWE在單基因遺傳疾病研究中的應(yīng)用 HWE在多基因復(fù)雜疾病研究中的應(yīng)用 檢驗HWE的常用方法和軟件 全基因組數(shù)據(jù)中的HWE檢驗

2、問題,Why do students need to know Hardy-Weinberg Equilibrium?,As Thomas Merten (1992) states: If you have ever been asked questions such as the ones that follow, you begin to see why studying population genetics might be useful: 1. Im confused! How can O be the most common of the blood types if it is

3、a recessive trait? 2. If Huntingtons disease is a dominant trait, shouldnt three-fourths of the population have Huntingtons while one-fourth have the normal phenotype? 3. Shouldnt recessive traits be gradually swamped out so they disappear from the population?,基本概念,突變(mutation) 遺傳多態(tài)性(genetic polymor

4、phism) 遺傳座位(locus) 等位基因(allele) 核苷酸位點(nucleotide) 序列(sequence) 位點(site) 分離位點(segregating site),基本概念,單倍體(haploid)、二倍體(diploid) 基因型(genotype) 雜合子(heterozygote)、純合子(homozygotye) 等位基因頻率(allele frequency) 基因型頻率(genotype frequency),一個群體由N個個體組成,其中有一對常染色體等位基因A, a,其頻率分別以p、q表示 。 可能的基因型為AA,Aa,aa三種,其頻率分別以D、H、R表

5、示,其中D+H+R=1。,若群體中有,n1 AA n2 Aa n3 aa N=n1+n2+n3,合計,1,計算基因型頻率,等位基因A的頻率,等位基因a的頻率,其中,p+q=D+H/2+H/2+R=1,計算等位基因頻率,精 子 A(p) a(q) 卵 A(p) AA(p2) Aa(pq) 子 a(q) Aa(pq) aa(q2) 由表可見子代基因型組成:p2+2pq+q2=1 這里基因型AA的頻率為p2,基因型aa的頻率為 q2,基因型Aa的頻率為2pq。 AA:Aa:aa= p2:2pq:q2,子一代向下一代提供的配子中兩種基因頻率分別是: A=p2+1/2(2pq)=p2+pq=p(p+q)

6、=p a=q2+ 1/2(2pq)=q2+pq=q(p+q)=q 由此可見,子代基因A的頻率仍然是p,基因a的頻率仍然是q,而且將以這種頻率在所有世代傳遞下去,這就是遺傳平衡。,p2 2pq q2,Hardy-Weinberg平衡定律,Hardy-Weinberg平衡定律,群體中的等位基因頻率以及基因型頻率并不隨世代的推移而變化。,保持群體HWE的理論條件,Random mating No differential fertility of the genotypes Equal genotype frequencies in the two sexes No mutation No immi

7、gration No differential emigration No differential viability Infinite population size,人類進化中的5個基本動力元素,突變(mutation) 婚配 (random mating) 選擇 (selection) 漂變 (drift) 遷移 (migration),現(xiàn)代人群是一個HWE群體嗎?,有趣的是,對于一個特定的地理群體,絕大部分基因組區(qū)域處于HWE狀態(tài)。,HWE平衡群體的性質(zhì)(1),雜合體的比例為H=2pq,H的最大值為1/2,當(dāng)q=1/2,p=1/2時,H取最大值1/2,HWE平衡群體的性質(zhì)(2),Aa

8、Aa的交配頻率永遠為AAaa交配頻率的2倍 AaAa=H2=4p2q2 AAaa=2DR=2p2q2,因此,隱性基因“a”在群體中不易消失,總是保持一定頻率。當(dāng)一般群體中隱性個體稀少的時候,其中大多數(shù)為AaAa交配的后代。,例如 人類白化病被認為是一個簡單的隱性性狀,某地白化病的嬰兒的發(fā)病率q2 (aa)=1/10000 , q(a)=1/100 但群體中,雜合子的比例要大得多,其中由AaAa得到的aa個體占,當(dāng)q很小時,p=1,則H-Ws law取得一種極限形式,H=2q 差不多所有的隱性基因都處于雜合狀態(tài)中,雜合子個體的比例約為隱性基因頻率的兩倍。上述白化病 q=0.01,一般q2可看作發(fā)

9、病率,雜合子的頻率=2,HWE平衡群體的性質(zhì)(3),HWE在單基因遺傳疾病研究中的應(yīng)用,計算基因型頻率 隨機交配時純合子(基因型)的頻率可用配子(基因)頻率平方求得 ; 雜合子頻率=2x隱性等位基因頻率(如前所述). 計算隱性性狀的發(fā)病率(出生前死亡) 計算等位基因頻率,計算等位基因頻率(隱性),如已知某種常染色體隱性遺傳病(白化?。┰谝惶囟ㄈ巳褐蓄l率,就能計算這個異常基因的攜帶者和基因頻率。白化病發(fā)?。╝a)(q2)的頻率為110000,即其基因型頻率,則致病基因(a)頻率1/100= 0.01;基因A的頻率10.01=0.99;而雜合子攜帶者的頻率為2pq=2991001100150。因此

10、,在比例中,每個受累的個體將有200個左右在臨床上無癥狀的攜帶者。,計算等位基因頻率(顯性),常染色體顯性遺傳病,如并指癥,在一個群體多為雜合子(Aa)發(fā)病。 雜合子(H)的頻率為2pq,由于q值大,近于1,故H2p,p=1/2H。因此,只要知道雜合子發(fā)病率,就易求得基因A的頻率。如并指癥的發(fā)病率為 11000,H12000,p=1/2H=1/4000,即致病基因A的頻率為0.000025。,在已知某一性狀頻率的群體中,確定等位基因頻率和雜合子攜帶者頻率。,例如:已知白化病的發(fā)病率為1/20000,求白化病致病基因頻率q和攜帶者頻率。 白化病為AR遺傳病,患者為致病基因的純合子,因此: 發(fā)病率

11、(aa) = q2 = 1/20000 a= q =0.007 A=p = 1 q =0.993 攜帶者頻率(Aa) = 2pq = 2 0.993 0.007 = 0.0139 這提示人群中有1.4%為白化病致病基因攜帶者,對于遺傳咨詢很重要。,對于一種罕見的AD遺傳病 致病基因頻率p很低,p2可以忽略,因此: 2pq p2 + 2pq 患者幾乎都以雜合子形式出現(xiàn),=1, 對于一種罕見的XD遺傳病 致病基因頻率p很低,正?;蝾l率q1 男性患者 = 致病基因頻率 = p 女性患者 = p2 + 2pq = 2p 男性患者 女性患者 女性患病率是男性患病率的2倍,= 1/2, 對于一種罕見的A

12、R遺傳病 致病基因頻率q很低,正?;蝾l率p1 : 雜合攜帶者頻率 = 2pq =2q 即雜合攜帶者頻率約為致病基因頻率的2倍。 雜合攜帶者 2pq 2 純合患者 q2 q 提示: 致病基因頻率q越低,致病基因在群體中主要以雜合攜帶者形式存在。,=,=, 對于一種罕見的XR遺傳病 致病基因頻率q很低, 男性患者 = 致病基因頻率 = q 女性患者 = 致病基因頻率的平方 = q2 男性患者 q 1 女性患者 q2 q 提示:疾病越罕見,q越低,女性患者越罕見。,=,=,HWE的偏離(固定指數(shù)),固定指數(shù)(F): 如果一個座位上有兩個等位基因,Hardy-Weinberg比率的任何偏差可以由參量

13、F來度量,F(xiàn)稱為固定指數(shù),則基因型頻率可以由下式給出:,由以上第二式可得:,固定指數(shù)F可正可負,視情況而定。 可以看出,當(dāng)h0小于h時,F(xiàn)取正值;當(dāng)h0大于h時,F(xiàn)取負值。在近親交配時,雜合子頻率的觀察值減小,F(xiàn)就取正值。,隨機交配(h)情況下雜合子的預(yù)期頻率,群體(h0)中下雜合子的觀察頻率,上式可寫成,亞群體(sub-population),以上考慮的是一個簡單的群體,不論其是否近親交配。 然而,實際上大多數(shù)的自然群體可被再分為許多不同的繁殖單位或亞群體(sub-population),盡管這些群體并不是完全隔離的。這種情況下,研究群體內(nèi)和群體間的遺傳變異就顯得十分重要。,可再分群體中的基

14、因型頻率,假定一個群體可分為s個亞群體,每一個亞群體都滿足Hardy-Weiberg平衡。設(shè)xk為第k個亞群體中等位基因A1的頻率,則基因型A1A1,A1A2,A2A2的頻率分別為,我們用wk來表示第k個亞群體的相對大小,且總和為1。則A1A1,A1A2,A2A2在整個群體中的頻率為:,其中,和,是亞群體中等位基因頻率的均值和方差。,可再分群體中的固定指數(shù),比較,我們知道,,因此,表明如果一個群體被分為多個交配單位,純合子的頻率要高于Hardy-Weinberg比率。這個性質(zhì)首先由Wahlund(1928)發(fā)現(xiàn),被稱為Wahlund定律,也稱Wahlund現(xiàn)象。 當(dāng)?shù)任换蝾l率在所有亞群體中一

15、致時,F(xiàn)為0;而當(dāng)每個亞群體都被固定為某一個等位基因時,F(xiàn)為1。,HWE的偏離(Wahlund定律),Wahlund現(xiàn)象的啟示,群體結(jié)構(gòu)(population structure)的存在! 反之,當(dāng)F為負值的時候,,雜合子頻率比Hardy-Weinberg平衡時預(yù)期的要高,意味著雜合優(yōu)勢,某種程度的自然選擇發(fā)生。,雜合優(yōu)勢與平衡選擇(后面“自然選擇”章節(jié)細談),檢驗HWE的常用方法,X2-test,觀察值,期望值,實例,例 MN血型基因頻率的計算,結(jié)論:三個基因型頻率的觀察值與HWE定律所期望的頻率沒有顯著差異。,精確檢驗,Am.J.Hum.Genet 2005, 76:887-893,HWE

16、在復(fù)雜疾病遺傳研究中的應(yīng)用,數(shù)據(jù)分析中,檢測可能的數(shù)據(jù)質(zhì)量問題(typing error)。 Case-control study 一般要求所有檢測位點在control中處于HWE。 多個位點處于HWD暗示近親婚配或群體結(jié)構(gòu)的存在。 在排除其他可能的因素以后,篩選可能受到自然選擇的基因。,全基因組數(shù)據(jù)中的HWE檢驗問題,Affymetrix 500K, Illumina 650K 多重檢驗(multiple testing)問題 If you have 10,000 genes in your genome, and perform a statistical analysis, a p-va

17、lue cutoff of 0.05 allows a 5% chance of error. That means that 500 genes out of 10,000 could be found to be significant by chance alone.,多重檢驗校正方法,Bonferroni correction Bonferroni Step-down (Holm) correction Westfall and Young Permutation Benjamini and Hochberg False Discovery Rate,Bonferroni correc

18、tion,The p-value of each gene is multiplied by the number of genes in the gene list. If the corrected p-value is still below the error rate, the gene will be significant: Corrected P-value= p-value * n (number of genes in test) 0.05 As a consequence, if testing 1000 genes at a time, the highest acce

19、pted individual p-value is 0.00005, making the correction very stringent. The expected number of false positives will be 0.05.,Bonferroni Step-down (Holm) correction,This correction is very similar to the Bonferroni, but a little less stringent: 1) The p-value of each gene is ranked from the smalles

20、t to the largest. 2) The first p-value is multiplied by the number of genes present in the gene list; if the end value is less than 0.05, the gene is significant; Corrected P-value= p-value * n 0.05 3) The second p-value is multiplied by the number of genes less 1. Corrected P-value= p-value * n-1 0

21、.05 4) The third p-value is multiplied by the number of genes less 2. Corrected P-value= p-value * n-2 0.05 It follows that sequence until no gene is found to be significant.,Westfall and Young Permutation,The Westfall and Young permutation follows a step-down procedure similar to the Holm method, c

22、ombined with a bootstrapping method to compute the p-value distribution: 1) P-values are calculated for each gene based on the original data set and ranked. 2) The permutation method creates a pseudo-data set by dividing the data into artificial treatment and control groups. 3) P-values for all gene

23、s are computed on the pseudo-data set. 4) The successive minima of the new p-values are retained and compared to the original ones. 5) This process is repeated a large number of times, and the roportion of resampled data sets where the minimum pseudo-p-value is less than the original p-value is the adjusted p-value. Because of the permutations, the method is very slow.,Benjamini and Hochberg False Discovery Rate,This correction is the least stringent of all 4 options, and therefo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論