w06-GWAS結(jié)果分析課件_第1頁
w06-GWAS結(jié)果分析課件_第2頁
w06-GWAS結(jié)果分析課件_第3頁
w06-GWAS結(jié)果分析課件_第4頁
w06-GWAS結(jié)果分析課件_第5頁
已閱讀5頁,還剩125頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Genome-wideAssociationStudy

---GWAS1Genome-wideAssociationStudy

發(fā)展歷史1996年-Risch最早提出了GWAS設(shè)想;2001年-Hansen等最早應(yīng)用GWAS于植物Seabeet的研究中;2005年-Klein等在Science雜志上最早報(bào)道了GWAS在人類中的研究,發(fā)現(xiàn)了與年齡相關(guān)性的黃斑變性病癥顯著相關(guān)的基因。2發(fā)展歷史1996年-Risch最早提出了GWAS設(shè)想;2什么是GWAS全基因組關(guān)聯(lián)分析:利用全基因組范圍內(nèi)篩選出高密度的分子標(biāo)記對(duì)所研究的群體進(jìn)行掃描,分析掃描得出的分子標(biāo)記數(shù)據(jù)與表型性狀之間關(guān)聯(lián)關(guān)系的方法。即:GWAS利用全基因組范圍內(nèi)的LD(連鎖不平衡)來確定影響某些表型性狀或數(shù)量性狀的基因。3什么是GWAS全基因組關(guān)聯(lián)分析:利用全基因組范圍內(nèi)篩選出高密分子標(biāo)記是遺傳標(biāo)記的一種遺傳標(biāo)記(geneticmarker):指可追蹤染色體、染色體某一階段、某個(gè)基因座在家系中傳遞的任何一種遺傳特性?;咎卣鳎嚎蛇z傳性、可識(shí)別性遺傳標(biāo)記類型形態(tài)標(biāo)記(morphologicalmarkers)細(xì)胞學(xué)標(biāo)記(cytologicalmarkers)生化標(biāo)記(biochemicalmarkers)分子標(biāo)記(molecularmarkers)4分子標(biāo)記是遺傳標(biāo)記的一種4形態(tài)學(xué)標(biāo)記能夠用肉眼識(shí)別和觀察,并能明確顯示遺傳多態(tài)性的外部形態(tài)特征優(yōu)點(diǎn):簡(jiǎn)單直觀、經(jīng)濟(jì)方便;缺點(diǎn):標(biāo)記數(shù)少、多態(tài)性低、容易受環(huán)境條件的影響、并且有一些標(biāo)記與不良形狀連鎖。5形態(tài)學(xué)標(biāo)記能夠用肉眼識(shí)別和觀察,并能明確顯示遺傳多態(tài)性的外部細(xì)胞學(xué)標(biāo)記能夠顯示遺傳多態(tài)性的細(xì)胞學(xué)特征。主要指染色體核型、帶型和數(shù)量特性的變異等,它們反映了染色體在結(jié)構(gòu)和數(shù)量上的遺傳多態(tài)性。染色體核型:數(shù)量、大小、著絲粒位置等;染色體數(shù)量:?jiǎn)误w、缺體、三體等;染色體結(jié)構(gòu):缺失、易位、倒位、重復(fù)等。特點(diǎn):優(yōu)點(diǎn):不易受環(huán)境影響,呈孟德爾方式遺傳;缺點(diǎn):常伴有對(duì)生物有害的表型效應(yīng),難以獲得相應(yīng)的標(biāo)記材料;或者觀測(cè)和鑒定比較困難;需要花費(fèi)較大的人力和較長(zhǎng)時(shí)間來培育,難度較大等。6細(xì)胞學(xué)標(biāo)記能夠顯示遺傳多態(tài)性的細(xì)胞學(xué)特征。主要指染色體核型、生物標(biāo)記是指以生物體內(nèi)的某些生化形狀作遺傳標(biāo)記,如血型、血清蛋白、種子儲(chǔ)藏蛋白、同工酶和等位酶等。特點(diǎn):優(yōu)點(diǎn):表現(xiàn)近中性,對(duì)生物經(jīng)濟(jì)性狀一般沒有大的不良影響;直接反映基因產(chǎn)物差異,受環(huán)境影響較小。缺點(diǎn):可用標(biāo)記數(shù)量少,染色方法和電泳技術(shù)有一定難度。7生物標(biāo)記是指以生物體內(nèi)的某些生化形狀作遺傳標(biāo)記,如血型、血清分子標(biāo)記廣義:是指可遺傳的并可檢測(cè)的DNA序列或蛋白質(zhì)。狹義:DNA標(biāo)記,指能反映生物個(gè)體或種群間基因組中某種差異的特異DNA片段。優(yōu)勢(shì):直接以DNA的形式表現(xiàn),在生物體的各個(gè)組織、各個(gè)發(fā)育階段可檢測(cè)到,不受季節(jié)、環(huán)境限制。數(shù)量多多態(tài)性高;表現(xiàn)為中性,不影響目標(biāo)形狀的表達(dá)許多標(biāo)記表現(xiàn)為共顯性,能區(qū)別純合體和雜合體8分子標(biāo)記廣義:是指可遺傳的并可檢測(cè)的DNA序列或蛋白質(zhì)。8第一代:限制性片段長(zhǎng)度多態(tài)性(RestrictionFragmentLengthPolymorphism,RFLP)第二代:微衛(wèi)星多態(tài)性(microsatellite)第三代:SNPSNP:SingleNucleotidePolymorphism,單核苷酸多態(tài)性指同一位點(diǎn)不同等位基因之間核苷酸的差異。分子標(biāo)記9第一代:限制性片段長(zhǎng)度多態(tài)性分子標(biāo)記9理論上講,SNP既可能是二等位多態(tài)性,也可能是3個(gè)或4個(gè)等位多態(tài)性,但后兩者非常少見,幾乎可以忽略;占所有已知多態(tài)性的90%以上;SNP數(shù)目:目前,測(cè)得大約1500~3000萬個(gè)SNP位點(diǎn)。分為:同義SNP(synonymousSNP)和非同義SNP(non-synonymousSNP)。10理論上講,SNP既可能是二等位多態(tài)性,也可能是3個(gè)或4個(gè)等位SNPs的基因型人體除性染色體外,每個(gè)染色體都有兩份,個(gè)體所擁有的一對(duì)等位基因的類型稱作基因型。核定個(gè)體的基因型,稱作基因分型。11SNPs的基因型人體除性染色體外,每個(gè)染色體都有兩份,個(gè)體所SNP雙等位基因標(biāo)記主要等位基因(majorallele):在一般人群中較多見的等位基因;次要等位基因(minorallele):四種可能的形式一種轉(zhuǎn)換(C>T或G>A):2/3三種顛換(C>A或G>T,C>G或G>C,T>A或A>T)12SNP雙等位基因標(biāo)記12SNP作為遺傳標(biāo)記的優(yōu)勢(shì)變異程度不如微衛(wèi)星數(shù)量巨大,分布密度高:人類基因組中1SNP/1000bp更穩(wěn)定的遺傳特性:多數(shù)并不位于基因編碼區(qū),甚至不在基因區(qū),穩(wěn)定而無害基因分型簡(jiǎn)單:快速、大批量、自動(dòng)化13SNP作為遺傳標(biāo)記的優(yōu)勢(shì)13SNP概念界定基因組DNA的差異

cDNA中發(fā)現(xiàn)的:可能是RNA編輯的結(jié)果?單堿基的插入和缺失?疾病易感等位基因?在正常人(無病個(gè)體)中可出現(xiàn)SNP&mutation14SNP概念界定基因組DNA的差異14基因型和表型15基因型和表型15SNP的檢測(cè)PCRSNP芯片新一代測(cè)序……16SNP的檢測(cè)PCR16GWAS的目的尋找哪些SNP標(biāo)記與疾病相關(guān)關(guān)聯(lián)分析17GWAS的目的尋找哪些SNP標(biāo)記與疾病相關(guān)17基本流程建立研究群體,選擇盡可能大的群體作研究樣本,建立目標(biāo)性狀數(shù)據(jù)庫。提取樣本DNA,進(jìn)行質(zhì)量控制以達(dá)到基因分型的要求,對(duì)基因型數(shù)據(jù)進(jìn)行檢測(cè)和質(zhì)量控制以達(dá)到后續(xù)關(guān)聯(lián)分析的要求。利用合適的統(tǒng)計(jì)模型對(duì)SNP和目標(biāo)性狀進(jìn)行關(guān)聯(lián)分析;對(duì)關(guān)聯(lián)分析的結(jié)果進(jìn)行高級(jí)分析及驗(yàn)證。18基本流程建立研究群體,選擇盡可能大的群體作研究樣本,建立目標(biāo)關(guān)聯(lián)分析19關(guān)聯(lián)分析19GWAS分類基于無關(guān)個(gè)體(unrelatedindividual)的關(guān)聯(lián)分析:(1)病例-對(duì)照分析法(Case-controlanalysis),主要用來研究質(zhì)量性狀,即是否患??;(2)基于隨機(jī)群體的關(guān)聯(lián)分析(Population-basedassociationanalysis):主要用來研究數(shù)量性狀。基于家系的關(guān)聯(lián)分析(Family-basedassociation):傳遞不平衡檢驗(yàn)法(TransmissionDisequilibriumTest,TDT)20GWAS分類基于無關(guān)個(gè)體(unrelatedindividGWAS分類家系數(shù)據(jù)分析遺傳標(biāo)記與疾病數(shù)量表型和質(zhì)量表型的關(guān)聯(lián)可以排除人群混雜對(duì)于關(guān)聯(lián)分析的影響,但其在發(fā)現(xiàn)陽性關(guān)聯(lián)的檢驗(yàn)方面不如相同樣本量的病例對(duì)照研究有效。當(dāng)前的人口狀況使得大規(guī)模的家系數(shù)據(jù)很難獲得,目前的研究中病例對(duì)照研究居多。21GWAS分類家系數(shù)據(jù)分析遺傳標(biāo)記與疾病數(shù)量表型和質(zhì)量表型的關(guān)2222GWAS試驗(yàn)設(shè)計(jì)單階段設(shè)計(jì)(One-stagedesign):一次性選用足夠大的樣本量,對(duì)每一個(gè)樣本都進(jìn)行SNP基因型分型,然后分析相關(guān)性狀與每個(gè)SNP的關(guān)聯(lián)效應(yīng);兩階段設(shè)計(jì)(Two-stagedesign)或多階段設(shè)計(jì)(Multiple-stagedesign):(1)先選擇一個(gè)小樣本量進(jìn)行SNP分型,統(tǒng)計(jì)分析時(shí)在較為寬松的P值條件下先篩選出與目標(biāo)性狀呈顯著相關(guān)的SNPs;(2)然后在大樣本中對(duì)第一步中已經(jīng)篩選出的SNPs進(jìn)行分型,結(jié)合兩個(gè)階段的分析結(jié)果進(jìn)行最后統(tǒng)計(jì)。23GWAS試驗(yàn)設(shè)計(jì)單階段設(shè)計(jì)(One-stagedesign質(zhì)量控制24質(zhì)量控制24質(zhì)量控制25質(zhì)量控制25質(zhì)量控制26質(zhì)量控制26質(zhì)量控制27質(zhì)量控制27質(zhì)量控制28質(zhì)量控制28關(guān)聯(lián)分析的理論基礎(chǔ)連鎖不平衡(LinkageDisequilibrium,LD):又稱等位基因關(guān)聯(lián),是指同一條染色體上,兩個(gè)等位基因間的非隨機(jī)相關(guān)。即:當(dāng)位于同一條染色體的兩個(gè)等位基因同時(shí)存在的概率大于人群中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí),就稱這兩個(gè)位點(diǎn)處于LD狀態(tài)。D=P(AB)-P(A)*P(B)29關(guān)聯(lián)分析的理論基礎(chǔ)連鎖不平衡(LinkageDisequiLD產(chǎn)生的原因30LD產(chǎn)生的原因30LD的度量31LD的度量31D’的意義32D’的意義32D’值的95%可信區(qū)間(95%)33D’值的95%可信區(qū)間(95%)33r2的意義34r2的意義34影響LD的因素35影響LD的因素35影響LD的因素36影響LD的因素36基于SNP的LD關(guān)聯(lián)分析37基于SNP的LD關(guān)聯(lián)分析37基于SNP的LD關(guān)聯(lián)分析38基于SNP的LD關(guān)聯(lián)分析38LD作圖LD作圖是將一段基因的所有SNPs的LD關(guān)系標(biāo)記在基因序列中,用來觀察重組熱點(diǎn)。作圖方法有:LD散點(diǎn)圖(dotplot)LD矩陣圖(LDmatrix)鄰近LD窗口分析(adjacentLDwindowanalysis)39LD作圖LD作圖是將一段基因的所有SNPs的LD關(guān)系標(biāo)記在基LD散點(diǎn)圖40LD散點(diǎn)圖40LD矩陣圖(LDmatrix)41LD矩陣圖(LDmatrix)41鄰近LD窗口分析42鄰近LD窗口分析424343關(guān)聯(lián)檢驗(yàn)的模型假定:某個(gè)SNP位點(diǎn)有兩個(gè)等位基因:A,a;形成三個(gè)基因型:AA,Aa,aa。假設(shè)A是minor位點(diǎn)。當(dāng)我們檢驗(yàn)該SNP位點(diǎn)與疾病的關(guān)系時(shí),我們不知道該位點(diǎn)以何種方式起作用(等位,基因型,顯性,隱性)。44關(guān)聯(lián)檢驗(yàn)的模型假定:某個(gè)SNP位點(diǎn)有兩個(gè)等位基因:A,a;形關(guān)聯(lián)檢驗(yàn)的模型GenotypicModelHypothesis:all3differentgenotypeshavedifferenteffects:AAvs.Aa

vs.aa卡方檢驗(yàn)45關(guān)聯(lián)檢驗(yàn)的模型GenotypicModel454646關(guān)聯(lián)檢驗(yàn)的模型2.DominantModelHypothesis:thegeneticeffectsofAAandAaarethesame(assumingAistheminorallele):AA+Aavs.aa47關(guān)聯(lián)檢驗(yàn)的模型2.DominantModel47關(guān)聯(lián)檢驗(yàn)的模型3.RecessiveModelHypothesis:thegeneticeffectsofAaandaaarethesame(Aistheminorallele):AAvs.Aa+aa48關(guān)聯(lián)檢驗(yàn)的模型3.RecessiveModel48關(guān)聯(lián)檢驗(yàn)的模型4.AllelicModelHypothesis:thegeneticeffectsofalleleAandalleleaaredifferent:Avs.a49關(guān)聯(lián)檢驗(yàn)的模型4.AllelicModel49關(guān)聯(lián)檢驗(yàn)OddRatio值(OR)關(guān)聯(lián)檢驗(yàn)中如果某SNP與某疾病的關(guān)聯(lián)p值小于顯著性水平,則拒絕不關(guān)聯(lián)的零假設(shè),支持該SNP與疾病存在關(guān)聯(lián)的假設(shè),OR值的目的是進(jìn)一步估計(jì)其關(guān)聯(lián)的強(qiáng)度。點(diǎn)估計(jì)和區(qū)間估計(jì)50關(guān)聯(lián)檢驗(yàn)OddRatio值(OR)50關(guān)聯(lián)檢驗(yàn)51關(guān)聯(lián)檢驗(yàn)51關(guān)聯(lián)檢驗(yàn)95%CI(ConfidenceInterval)的計(jì)算lnOR近似地服從正態(tài)分布52關(guān)聯(lián)檢驗(yàn)95%CI(ConfidenceIntervaR在GWAS中的應(yīng)用PublicDatabaseHapMapSNPediadbSNPOMIM53R在GWAS中的應(yīng)用PublicDatabase53TheSNPassociationanalysisRpackage:SNPassoc54TheSNPassociationanalysisR>mySNP=snp(SNPs$snp10001,sep=“/”)55>mySNP=snp(SNPs$snp10001,sep=5656575758585959606061616262ThewholegenomeSNPassociationanalysis>data(HapMap)>str(HapMap)>str(HapMap.SNPs.pos)63ThewholegenomeSNPassociati6464TheSNPannotationandenrichmentMotivationOncewehavesomeSNPsthatarepotentiallyinterestingfromthepointofviewofassociationwiththephenotype,itisextremelyimportantandinterestingtoknowaboutthegeneorgenomicregionthattheybelongto.Rpackage:NCBI2R>install.packages(“NCBI2R”)>library(NCBI2R)65TheSNPannotationandenrichmGenome-wideAssociationStudy

---GWAS66Genome-wideAssociationStudy

發(fā)展歷史1996年-Risch最早提出了GWAS設(shè)想;2001年-Hansen等最早應(yīng)用GWAS于植物Seabeet的研究中;2005年-Klein等在Science雜志上最早報(bào)道了GWAS在人類中的研究,發(fā)現(xiàn)了與年齡相關(guān)性的黃斑變性病癥顯著相關(guān)的基因。67發(fā)展歷史1996年-Risch最早提出了GWAS設(shè)想;2什么是GWAS全基因組關(guān)聯(lián)分析:利用全基因組范圍內(nèi)篩選出高密度的分子標(biāo)記對(duì)所研究的群體進(jìn)行掃描,分析掃描得出的分子標(biāo)記數(shù)據(jù)與表型性狀之間關(guān)聯(lián)關(guān)系的方法。即:GWAS利用全基因組范圍內(nèi)的LD(連鎖不平衡)來確定影響某些表型性狀或數(shù)量性狀的基因。68什么是GWAS全基因組關(guān)聯(lián)分析:利用全基因組范圍內(nèi)篩選出高密分子標(biāo)記是遺傳標(biāo)記的一種遺傳標(biāo)記(geneticmarker):指可追蹤染色體、染色體某一階段、某個(gè)基因座在家系中傳遞的任何一種遺傳特性?;咎卣鳎嚎蛇z傳性、可識(shí)別性遺傳標(biāo)記類型形態(tài)標(biāo)記(morphologicalmarkers)細(xì)胞學(xué)標(biāo)記(cytologicalmarkers)生化標(biāo)記(biochemicalmarkers)分子標(biāo)記(molecularmarkers)69分子標(biāo)記是遺傳標(biāo)記的一種4形態(tài)學(xué)標(biāo)記能夠用肉眼識(shí)別和觀察,并能明確顯示遺傳多態(tài)性的外部形態(tài)特征優(yōu)點(diǎn):簡(jiǎn)單直觀、經(jīng)濟(jì)方便;缺點(diǎn):標(biāo)記數(shù)少、多態(tài)性低、容易受環(huán)境條件的影響、并且有一些標(biāo)記與不良形狀連鎖。70形態(tài)學(xué)標(biāo)記能夠用肉眼識(shí)別和觀察,并能明確顯示遺傳多態(tài)性的外部細(xì)胞學(xué)標(biāo)記能夠顯示遺傳多態(tài)性的細(xì)胞學(xué)特征。主要指染色體核型、帶型和數(shù)量特性的變異等,它們反映了染色體在結(jié)構(gòu)和數(shù)量上的遺傳多態(tài)性。染色體核型:數(shù)量、大小、著絲粒位置等;染色體數(shù)量:?jiǎn)误w、缺體、三體等;染色體結(jié)構(gòu):缺失、易位、倒位、重復(fù)等。特點(diǎn):優(yōu)點(diǎn):不易受環(huán)境影響,呈孟德爾方式遺傳;缺點(diǎn):常伴有對(duì)生物有害的表型效應(yīng),難以獲得相應(yīng)的標(biāo)記材料;或者觀測(cè)和鑒定比較困難;需要花費(fèi)較大的人力和較長(zhǎng)時(shí)間來培育,難度較大等。71細(xì)胞學(xué)標(biāo)記能夠顯示遺傳多態(tài)性的細(xì)胞學(xué)特征。主要指染色體核型、生物標(biāo)記是指以生物體內(nèi)的某些生化形狀作遺傳標(biāo)記,如血型、血清蛋白、種子儲(chǔ)藏蛋白、同工酶和等位酶等。特點(diǎn):優(yōu)點(diǎn):表現(xiàn)近中性,對(duì)生物經(jīng)濟(jì)性狀一般沒有大的不良影響;直接反映基因產(chǎn)物差異,受環(huán)境影響較小。缺點(diǎn):可用標(biāo)記數(shù)量少,染色方法和電泳技術(shù)有一定難度。72生物標(biāo)記是指以生物體內(nèi)的某些生化形狀作遺傳標(biāo)記,如血型、血清分子標(biāo)記廣義:是指可遺傳的并可檢測(cè)的DNA序列或蛋白質(zhì)。狹義:DNA標(biāo)記,指能反映生物個(gè)體或種群間基因組中某種差異的特異DNA片段。優(yōu)勢(shì):直接以DNA的形式表現(xiàn),在生物體的各個(gè)組織、各個(gè)發(fā)育階段可檢測(cè)到,不受季節(jié)、環(huán)境限制。數(shù)量多多態(tài)性高;表現(xiàn)為中性,不影響目標(biāo)形狀的表達(dá)許多標(biāo)記表現(xiàn)為共顯性,能區(qū)別純合體和雜合體73分子標(biāo)記廣義:是指可遺傳的并可檢測(cè)的DNA序列或蛋白質(zhì)。8第一代:限制性片段長(zhǎng)度多態(tài)性(RestrictionFragmentLengthPolymorphism,RFLP)第二代:微衛(wèi)星多態(tài)性(microsatellite)第三代:SNPSNP:SingleNucleotidePolymorphism,單核苷酸多態(tài)性指同一位點(diǎn)不同等位基因之間核苷酸的差異。分子標(biāo)記74第一代:限制性片段長(zhǎng)度多態(tài)性分子標(biāo)記9理論上講,SNP既可能是二等位多態(tài)性,也可能是3個(gè)或4個(gè)等位多態(tài)性,但后兩者非常少見,幾乎可以忽略;占所有已知多態(tài)性的90%以上;SNP數(shù)目:目前,測(cè)得大約1500~3000萬個(gè)SNP位點(diǎn)。分為:同義SNP(synonymousSNP)和非同義SNP(non-synonymousSNP)。75理論上講,SNP既可能是二等位多態(tài)性,也可能是3個(gè)或4個(gè)等位SNPs的基因型人體除性染色體外,每個(gè)染色體都有兩份,個(gè)體所擁有的一對(duì)等位基因的類型稱作基因型。核定個(gè)體的基因型,稱作基因分型。76SNPs的基因型人體除性染色體外,每個(gè)染色體都有兩份,個(gè)體所SNP雙等位基因標(biāo)記主要等位基因(majorallele):在一般人群中較多見的等位基因;次要等位基因(minorallele):四種可能的形式一種轉(zhuǎn)換(C>T或G>A):2/3三種顛換(C>A或G>T,C>G或G>C,T>A或A>T)77SNP雙等位基因標(biāo)記12SNP作為遺傳標(biāo)記的優(yōu)勢(shì)變異程度不如微衛(wèi)星數(shù)量巨大,分布密度高:人類基因組中1SNP/1000bp更穩(wěn)定的遺傳特性:多數(shù)并不位于基因編碼區(qū),甚至不在基因區(qū),穩(wěn)定而無害基因分型簡(jiǎn)單:快速、大批量、自動(dòng)化78SNP作為遺傳標(biāo)記的優(yōu)勢(shì)13SNP概念界定基因組DNA的差異

cDNA中發(fā)現(xiàn)的:可能是RNA編輯的結(jié)果?單堿基的插入和缺失?疾病易感等位基因?在正常人(無病個(gè)體)中可出現(xiàn)SNP&mutation79SNP概念界定基因組DNA的差異14基因型和表型80基因型和表型15SNP的檢測(cè)PCRSNP芯片新一代測(cè)序……81SNP的檢測(cè)PCR16GWAS的目的尋找哪些SNP標(biāo)記與疾病相關(guān)關(guān)聯(lián)分析82GWAS的目的尋找哪些SNP標(biāo)記與疾病相關(guān)17基本流程建立研究群體,選擇盡可能大的群體作研究樣本,建立目標(biāo)性狀數(shù)據(jù)庫。提取樣本DNA,進(jìn)行質(zhì)量控制以達(dá)到基因分型的要求,對(duì)基因型數(shù)據(jù)進(jìn)行檢測(cè)和質(zhì)量控制以達(dá)到后續(xù)關(guān)聯(lián)分析的要求。利用合適的統(tǒng)計(jì)模型對(duì)SNP和目標(biāo)性狀進(jìn)行關(guān)聯(lián)分析;對(duì)關(guān)聯(lián)分析的結(jié)果進(jìn)行高級(jí)分析及驗(yàn)證。83基本流程建立研究群體,選擇盡可能大的群體作研究樣本,建立目標(biāo)關(guān)聯(lián)分析84關(guān)聯(lián)分析19GWAS分類基于無關(guān)個(gè)體(unrelatedindividual)的關(guān)聯(lián)分析:(1)病例-對(duì)照分析法(Case-controlanalysis),主要用來研究質(zhì)量性狀,即是否患??;(2)基于隨機(jī)群體的關(guān)聯(lián)分析(Population-basedassociationanalysis):主要用來研究數(shù)量性狀?;诩蚁档年P(guān)聯(lián)分析(Family-basedassociation):傳遞不平衡檢驗(yàn)法(TransmissionDisequilibriumTest,TDT)85GWAS分類基于無關(guān)個(gè)體(unrelatedindividGWAS分類家系數(shù)據(jù)分析遺傳標(biāo)記與疾病數(shù)量表型和質(zhì)量表型的關(guān)聯(lián)可以排除人群混雜對(duì)于關(guān)聯(lián)分析的影響,但其在發(fā)現(xiàn)陽性關(guān)聯(lián)的檢驗(yàn)方面不如相同樣本量的病例對(duì)照研究有效。當(dāng)前的人口狀況使得大規(guī)模的家系數(shù)據(jù)很難獲得,目前的研究中病例對(duì)照研究居多。86GWAS分類家系數(shù)據(jù)分析遺傳標(biāo)記與疾病數(shù)量表型和質(zhì)量表型的關(guān)8722GWAS試驗(yàn)設(shè)計(jì)單階段設(shè)計(jì)(One-stagedesign):一次性選用足夠大的樣本量,對(duì)每一個(gè)樣本都進(jìn)行SNP基因型分型,然后分析相關(guān)性狀與每個(gè)SNP的關(guān)聯(lián)效應(yīng);兩階段設(shè)計(jì)(Two-stagedesign)或多階段設(shè)計(jì)(Multiple-stagedesign):(1)先選擇一個(gè)小樣本量進(jìn)行SNP分型,統(tǒng)計(jì)分析時(shí)在較為寬松的P值條件下先篩選出與目標(biāo)性狀呈顯著相關(guān)的SNPs;(2)然后在大樣本中對(duì)第一步中已經(jīng)篩選出的SNPs進(jìn)行分型,結(jié)合兩個(gè)階段的分析結(jié)果進(jìn)行最后統(tǒng)計(jì)。88GWAS試驗(yàn)設(shè)計(jì)單階段設(shè)計(jì)(One-stagedesign質(zhì)量控制89質(zhì)量控制24質(zhì)量控制90質(zhì)量控制25質(zhì)量控制91質(zhì)量控制26質(zhì)量控制92質(zhì)量控制27質(zhì)量控制93質(zhì)量控制28關(guān)聯(lián)分析的理論基礎(chǔ)連鎖不平衡(LinkageDisequilibrium,LD):又稱等位基因關(guān)聯(lián),是指同一條染色體上,兩個(gè)等位基因間的非隨機(jī)相關(guān)。即:當(dāng)位于同一條染色體的兩個(gè)等位基因同時(shí)存在的概率大于人群中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí),就稱這兩個(gè)位點(diǎn)處于LD狀態(tài)。D=P(AB)-P(A)*P(B)94關(guān)聯(lián)分析的理論基礎(chǔ)連鎖不平衡(LinkageDisequiLD產(chǎn)生的原因95LD產(chǎn)生的原因30LD的度量96LD的度量31D’的意義97D’的意義32D’值的95%可信區(qū)間(95%)98D’值的95%可信區(qū)間(95%)33r2的意義99r2的意義34影響LD的因素100影響LD的因素35影響LD的因素101影響LD的因素36基于SNP的LD關(guān)聯(lián)分析102基于SNP的LD關(guān)聯(lián)分析37基于SNP的LD關(guān)聯(lián)分析103基于SNP的LD關(guān)聯(lián)分析38LD作圖LD作圖是將一段基因的所有SNPs的LD關(guān)系標(biāo)記在基因序列中,用來觀察重組熱點(diǎn)。作圖方法有:LD散點(diǎn)圖(dotplot)LD矩陣圖(LDmatrix)鄰近LD窗口分析(adjacentLDwindowanalysis)104LD作圖LD作圖是將一段基因的所有SNPs的LD關(guān)系標(biāo)記在基LD散點(diǎn)圖105LD散點(diǎn)圖40LD矩陣圖(LDmatrix)106LD矩陣圖(LDmatrix)41鄰近LD窗口分析107鄰近LD窗口分析4210843關(guān)聯(lián)檢驗(yàn)的模型假定:某個(gè)SNP位點(diǎn)有兩個(gè)等位基因:A,a;形成三個(gè)基因型:AA,Aa,aa。假設(shè)A是minor位點(diǎn)。當(dāng)我們檢驗(yàn)該SNP位點(diǎn)與疾病的關(guān)系時(shí),我們不知道該位點(diǎn)以何種方式起作用(等位,基因型,顯性,隱性)。109關(guān)聯(lián)檢驗(yàn)的模型假定:某個(gè)SNP位點(diǎn)有兩個(gè)等位基因:A,a;形關(guān)聯(lián)檢驗(yàn)的模型GenotypicModelHypothesis:all3differentgenotypeshavedifferenteffects:AAvs.Aa

vs.aa卡方檢驗(yàn)110關(guān)聯(lián)檢驗(yàn)的模型GenotypicModel4511146關(guān)聯(lián)檢驗(yàn)的模型2.DominantModelHypothesis:thegeneticeffectsofAAandAaarethesame(assumingAistheminorallele):AA+Aavs.aa112關(guān)聯(lián)檢驗(yàn)的模型2.DominantModel47關(guān)聯(lián)檢驗(yàn)的模型3.RecessiveModelHypothesis:thegeneticeffectsofAaandaaarethesame(Aistheminorallele):AAvs.Aa+aa113關(guān)聯(lián)檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論