版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
全基因組關(guān)聯(lián)分析周家蓬博士zhoujp@QQ群:2598041811全基因組關(guān)聯(lián)分析周家蓬博士1基本概念歷史、現(xiàn)狀和趨勢(shì)一般流程研究策略應(yīng)用價(jià)值2基本概念歷史、現(xiàn)狀和趨勢(shì)一般流程研究策略應(yīng)用價(jià)值2全基因組關(guān)聯(lián)研究Genome-wideassociationstudy(GWAS)檢測(cè)全基因組范圍的遺傳變異與可觀(guān)測(cè)性狀間的遺傳關(guān)聯(lián)3全基因組關(guān)聯(lián)研究Genome-wideassociatio遺傳變異的檢測(cè)SNP芯片
Affymetrix:500Kchip(Randomlydistributed)
Illumina:550Kchip(gene-based)高通量測(cè)序
Illumina/Solexa:DNA-seq,RNA-seq4遺傳變異的檢測(cè)SNP芯片4遺傳變異的數(shù)量“單倍型圖譜計(jì)劃1”(Nature2005)SNP:1M“單倍型圖譜計(jì)劃2”(Nature2007)SNP:4M“單倍型圖譜計(jì)劃3”(Nature2010)SNP:10M
5遺傳變異的數(shù)量“單倍型圖譜計(jì)劃1”(Nature2005SNP和SNP基因型TTCAGTCAGATTCCAGCCCTTCAGTCAGATTCCAGCCC樣本1樣本2TTCAGTCAGATTCCAGCCCTTCAGTCAGAGTCCAGCCC6SNP和SNP基因型TTCAGTCAGATTCCAGCCCT表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀表型校正:去除outliers,取特征值,取剩余值模型:混合線(xiàn)性模型方程組算法:SNP,單倍型,CNV,Gene-set(SNPs)Add.,Dom.,Rec.,Int.Frequentist,Bayesian方差/秩和,均值/中位數(shù)打分值,似然比
Bonferroni,F(xiàn)DR,Permutation,Bootstrap7表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀7編碼基因型Foronemarkerwithtwoalleles,therecanbethreepossiblegenotypes:GenotypeCodingAA2Aa1aa08編碼基因型Foronemarkerwithtwoa病例/對(duì)照設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)individualaffectiongenderSNP1SNP2…SNPn11F21…221M22…130F12…241F11…250M0-9…1sampleidcase/controlgenotypes9病例/對(duì)照設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)individualaffectio遺傳假設(shè)和遺傳模型GenotypicmodelHypothesis:all3differentgenotypeshavedifferenteffectsGenotypeGenotypicValueAAμAAAaμAaaaμaaAAvs.Aavs.aa10遺傳假設(shè)和遺傳模型GenotypicmodelGenotyDominantmodelHypothesis:thegeneticeffectsofAAandAaarethesameGenotypeGenotypicValueAAμA-AaμA-aaμaaAAandAavs.aa遺傳假設(shè)和遺傳模型(續(xù))11DominantmodelGenotypeGenotypiRecessivemodelHypothesis:thegeneticeffectsofAaandaaarethesameGenotypeGenotypicValueAAμA-Aaμa-aaμaaAAvs.Aaandaa12遺傳假設(shè)和遺傳模型(續(xù))RecessivemodelGenotypeGenotypAllelicmodelHypothesis:thegeneticeffectsofalleleAandalleleaaredifferentGenotypeGenotypicValueAA2μAAaμA+μaaa2μaAvs.a13遺傳假設(shè)和遺傳模型(續(xù))AllelicmodelGenotypeGenotypic卡方檢驗(yàn)GenotypicmodelNullhypothesis:Independence
AAAaaacasesnAAnAanaacontrolsmAAmAamaadf=214卡方檢驗(yàn)GenotypicmodelAAAaaacasesChi-squaredteststatistic:OistheobservedcellcountsEistheexpectedcellcounts,undernullhypothesisofindependence
統(tǒng)計(jì)量15Chi-squaredteststatistic:統(tǒng)計(jì)量Rcode>Statistics<-rchisq(1000,df=5)>hist(Statistics,prob=T)>curve(dchisq(x,df=5),col='blue',add=TRUE)>curve(dchisq(x,df=2),col='red',add=TRUE)>P<-1-pchisq(10,df=2);P[1]0.006737947
統(tǒng)計(jì)量P值16Rcode統(tǒng)計(jì)量P值16GWAS的歷史2005年,Science雜志報(bào)道了第一篇GWAS研究:年齡相關(guān)性黃斑變性之后陸續(xù)出現(xiàn)了有關(guān)冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂癥以及相關(guān)表型的報(bào)道17GWAS的歷史2005年,Science雜志報(bào)道了第一篇GWGWAS的現(xiàn)狀18GWAS的現(xiàn)狀18GWAS的趨勢(shì)19GWAS的趨勢(shì)19探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般到特殊)“穆勒五法”:求同法、求異法、求同求異法、共變法、排除法全基因組關(guān)聯(lián)研究主要基于共變法思想科學(xué)技術(shù)史之父薩頓認(rèn)為科學(xué)是人類(lèi)唯一具有累積性和繼承性的活動(dòng)20探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般一般流程使用SNP分型芯片獲得高通量的基因型對(duì)基因型進(jìn)行質(zhì)量評(píng)估和控制若為質(zhì)量性狀,需進(jìn)行群體分層檢測(cè);如為數(shù)量性狀,則對(duì)表型進(jìn)行協(xié)變量校正采用若干遺傳模型進(jìn)行全基因組關(guān)聯(lián)分析增加額外的數(shù)據(jù)進(jìn)行結(jié)果驗(yàn)證21一般流程使用SNP分型芯片獲得高通量的基因型21AHMU案例IlluminaHuman610Quad
BeadChipCallrate<90%,MAF
<1%,HWE
P
<10-71139病例vs.1132對(duì)照,PCA分析Cochran-Armitage趨勢(shì)檢驗(yàn)5182病例vs.6516對(duì)照,539病例vs.824對(duì)照NatGenet.2009Feb;41(2):205-210.22AHMU案例IlluminaHuman610QuadB計(jì)算過(guò)程PLINK
/~purcell/plink/plink–fileAHMU–mind0.05–maf0.01–hwe0.000001–model–outAHMU23計(jì)算過(guò)程PLINK23輸入輸出AHMU.pedAHMU.mapAHMU.model24輸入輸出AHMU.ped24GWAS主要策略Meta分析缺失填充通路分析互作分析25GWAS主要策略Meta分析缺失填充通路分析互作分析25Meta分析定義合并多個(gè)研究數(shù)據(jù),增加樣本量,提高檢測(cè)效力,發(fā)現(xiàn)新易感位點(diǎn)成功案例
Ⅱ型糖尿病、克隆病、多發(fā)性硬化、類(lèi)風(fēng)濕性關(guān)節(jié)炎、直結(jié)腸癌等26Meta分析定義26Meta分析分析步驟檢測(cè)研究異質(zhì)性選擇模型固定效應(yīng)模型,隨機(jī)誤差(弱)隨機(jī)效應(yīng)模型,群體分層(強(qiáng))單因素分析合并各研究檢驗(yàn)統(tǒng)計(jì)量、標(biāo)準(zhǔn)誤或p值常用軟件
METAL、Comprehensive
Meta-analysis等27Meta分析分析步驟27缺失填充定義缺失基因型填充(Imputation)主要是為了解決致病變異或其緊密連鎖標(biāo)簽分型遺漏的問(wèn)題成功案例約1/3-1/2的GWAS文章使用該技術(shù)28缺失填充定義28缺失填充分析步驟對(duì)自產(chǎn)數(shù)據(jù)進(jìn)行基因型質(zhì)量控制選擇合適的參考數(shù)據(jù)庫(kù),對(duì)高質(zhì)量的基因型數(shù)據(jù)進(jìn)行缺失填充根據(jù)計(jì)算得出的準(zhǔn)確率(info>0.8)對(duì)填充基因型進(jìn)行篩選過(guò)濾進(jìn)行關(guān)聯(lián)分析常用軟件
BEAGLE、IMPUTE、MACH和PLINK等29缺失填充分析步驟29通路分析定義將SNPs按照生物學(xué)通路分組,比較各通路在病例/對(duì)照或連續(xù)性狀數(shù)量上的差異成功案例克隆病、I型糖尿病、類(lèi)風(fēng)濕性關(guān)節(jié)炎、精神分裂癥、乳腺癌等30通路分析定義30通路分析分析步驟選擇生物通路(KEGG)選擇Tag
SNPs(HapMap)多因素分析顯著SNPs結(jié)果綜合常用軟件
GSEA、IPA等31通路分析分析步驟31互作分析定義研究基因-基因、基因-環(huán)境間交互作用成功案例老年黃斑變性、帕金森病、直腸癌、膀胱癌,哮喘等32互作分析定義32互作分析分析步驟選擇顯著及近似顯著SNPs選擇風(fēng)險(xiǎn)環(huán)境因素構(gòu)建互作模型多因素分析常用軟件
PLINK、Random
Jungle、BEAM等33互作分析分析步驟33其他策略?xún)呻A段法精細(xì)定位/目標(biāo)測(cè)序表型/性狀聯(lián)合單倍型分析34其他策略?xún)呻A段法34遺傳變異的檢測(cè)SNP芯片
Affymetrix:500Kchip(Randomlydistributed)
Illumina:550Kchip(gene-based)高通量測(cè)序
Illumina/Solexa:DNA-seq,RNA-seq35遺傳變異的檢測(cè)SNP芯片35高通量測(cè)序Next-generationsequencing(NGS)平行測(cè)序36高通量測(cè)序Next-generationsequencinSNP分型:
coverage&variantfrequency37參考基因組序列個(gè)體正向序列個(gè)體反向序列SNP分型:
coverage&variantfreq遺傳變異的種類(lèi)占總變異的90%單核苷酸多態(tài)性SinglenucleotidepolymorphismSNP1-50bp
DNA片段插入缺失Insertion-deletionInDel>50bpDNA片段結(jié)構(gòu)變異Structural
variationSV38遺傳變異的種類(lèi)占總變異的90%單核苷酸多態(tài)性Singlen遺傳變異的數(shù)量“千人基因組計(jì)劃”(Nature2012)SNP:38MInDel:1.4MSV:14K39遺傳變異的數(shù)量“千人基因組計(jì)劃”(Nature2012)3效應(yīng)大小vs.變異頻率4040效應(yīng)大小vs.變異頻率4040家系病例或極端性狀個(gè)體
NatRevGenet.2010Jun;11(6):415-25.41家系病例或極端性狀個(gè)體NatRevGenet.2010外顯子突變是孟德?tīng)柤膊≈饕∫?;多向性效?yīng)影響復(fù)雜疾病價(jià)格相對(duì)低廉目前主要用于檢測(cè)孟德?tīng)柤膊⌒碌牟呗曰蚍椒ǎ篖asso,折疊法,聚合法外顯子組測(cè)序42外顯子突變是孟德?tīng)柤膊≈饕∫?;多向性效?yīng)影響復(fù)雜疾病外顯子Lasso嶺回歸:|beta|2<tLasso回歸:|beta|<t貝葉斯:全概率&損失函數(shù)機(jī)器學(xué)習(xí):SVM43Lasso嶺回歸:|beta|2<tLa低覆蓋度測(cè)序+缺失基因型填充44Pasaniucet.al.,2012低覆蓋度測(cè)序+缺失基因型填充44Pasaniucet.a策略評(píng)估Pasaniuc等證實(shí)覆蓋度低至0.1-0.5X依然可以通過(guò)后續(xù)的填充方法獲得高密度芯片的效果45策略評(píng)估Pasaniuc等證實(shí)覆蓋度低至0.1-0.5X依然策略評(píng)估(續(xù))Howie等發(fā)明了一種pre-phasing的填充方法,該方法通過(guò)對(duì)GWAS樣本個(gè)體進(jìn)行連鎖相構(gòu)建,進(jìn)而利用參考庫(kù)的單倍型進(jìn)行缺失基因型填充46策略評(píng)估(續(xù))Howie等發(fā)明了一種pre-phasing的NGS-GWAS水稻農(nóng)藝性狀14種運(yùn)用重測(cè)序技術(shù)對(duì)517個(gè)中國(guó)水稻地方品系進(jìn)行進(jìn)化及GWAS分析~1X重測(cè)序KNN基因型填充算法MLM遺傳模型
NatGenet.2010Oct;42:961–967.47NGS-GWAS水稻農(nóng)藝性狀14種47高密度芯片低覆蓋度測(cè)序基本特點(diǎn)芯片基于正常人群中的高頻SNP標(biāo)記設(shè)計(jì),沒(méi)有與疾病相關(guān)的突變信息可以同時(shí)檢測(cè)到人群中的高頻SNP和未被發(fā)現(xiàn)的低頻突變最高分辨率根據(jù)不同的芯片型號(hào),一般在30-100bp精確到單個(gè)堿基覆蓋范圍只能局限于芯片內(nèi)容,無(wú)法獲得全部基因組信息僅受到能夠定位到基因組的reads數(shù)據(jù)量影響,可獲得全基因組的信息技術(shù)原理雜交原理,實(shí)驗(yàn)環(huán)境和樣本對(duì)實(shí)驗(yàn)重復(fù)有很大影響合成測(cè)序,重復(fù)性好動(dòng)態(tài)量程弱信號(hào)被舍棄,強(qiáng)信號(hào)會(huì)飽和沒(méi)有局限數(shù)據(jù)產(chǎn)出選擇不可以可以背景噪音高低數(shù)據(jù)延展性隨著人類(lèi)基因組的進(jìn)一步完善,測(cè)序數(shù)據(jù)可以進(jìn)一步深挖高密度芯片vs.低覆蓋度測(cè)序48高密度芯片低覆蓋度測(cè)序基本特點(diǎn)芯片基于正常人群中的高頻SNP測(cè)序成本49測(cè)序成本49GWAS:Array-basedvs.NGS-based50GWAS:Array-basedvs.NGS-base基本流程高通量測(cè)序基因分型:
CLCGenomicsWorkbench&ServerBWA/Bowtie+SAMtools/GATK+IGV全基因組關(guān)聯(lián)分析:
PLINK,TASSEL,QTDT/FBATBEAGLE/IMPUTE+SNPTEST可視化和注釋?zhuān)?/p>
IGV/gPlink+ANNOVAR/Annotation.pl51基本流程高通量測(cè)序基因分型:51GWAS模塊52植物育種動(dòng)物育種人類(lèi)疾病TASSELQTDTFBATPBATPLINKSNPTESTMENDELBEAMIMPUTEBEAGLEMETALHAPLOVIEWFASTSNPLinuxC/C++RPerlPythonMySQLGWAS模塊52植物育種動(dòng)物育種人類(lèi)疾病TASSELQTDT應(yīng)用藥物治療抗抑郁藥、精神疾病藥物、丙型肝炎治療,肝損害等副作用,為個(gè)體化醫(yī)療奠定理論基礎(chǔ)意義中國(guó)每年因藥物不良反應(yīng)住院治療的病人已逾250萬(wàn)人,其中約20萬(wàn)人因此死亡,個(gè)體化醫(yī)療勢(shì)在必行53應(yīng)用藥物治療53丙型肝炎治療丙肝全球1.7億人感染的病毒性疾病,無(wú)根治辦法,治療效果因人而異IL28B基因
TT基因型攜帶者痊愈率約1/4;CC基因型攜帶者痊愈率達(dá)4/5
09年GWAS最具價(jià)值成果正在美國(guó)申請(qǐng)專(zhuān)利54丙型肝炎治療丙肝54應(yīng)用動(dòng)植物育種在牛豬雞、玉米小麥等方面,歐美農(nóng)業(yè)部等國(guó)家機(jī)構(gòu)和Euribrid、Hubbard、MetaMoprhix等公司都已開(kāi)展全基因組選擇意義在提高動(dòng)植物產(chǎn)品的產(chǎn)量和質(zhì)量的同時(shí),還可以有效管理生物多樣性,使得遺傳增益不會(huì)破壞某些未來(lái)可能需要的性狀55應(yīng)用動(dòng)植物育種55全基因組選擇GenomicSelection,GS
利用整個(gè)基因組的標(biāo)記信息和各性狀值來(lái)估計(jì)每個(gè)標(biāo)記或染色體片段的效應(yīng)值,然后將效應(yīng)值加和即得到基因組育種值丹麥案例
2012年人均GDP達(dá)$59928,農(nóng)業(yè)大國(guó)
2008年GS用于牛育種;2010年引入豬育種56全基因組選擇GenomicSelection,GS56演講完畢,謝謝觀(guān)看!演講完畢,謝謝觀(guān)看!全基因組關(guān)聯(lián)分析周家蓬博士zhoujp@QQ群:25980418158全基因組關(guān)聯(lián)分析周家蓬博士1基本概念歷史、現(xiàn)狀和趨勢(shì)一般流程研究策略應(yīng)用價(jià)值59基本概念歷史、現(xiàn)狀和趨勢(shì)一般流程研究策略應(yīng)用價(jià)值2全基因組關(guān)聯(lián)研究Genome-wideassociationstudy(GWAS)檢測(cè)全基因組范圍的遺傳變異與可觀(guān)測(cè)性狀間的遺傳關(guān)聯(lián)60全基因組關(guān)聯(lián)研究Genome-wideassociatio遺傳變異的檢測(cè)SNP芯片
Affymetrix:500Kchip(Randomlydistributed)
Illumina:550Kchip(gene-based)高通量測(cè)序
Illumina/Solexa:DNA-seq,RNA-seq61遺傳變異的檢測(cè)SNP芯片4遺傳變異的數(shù)量“單倍型圖譜計(jì)劃1”(Nature2005)SNP:1M“單倍型圖譜計(jì)劃2”(Nature2007)SNP:4M“單倍型圖譜計(jì)劃3”(Nature2010)SNP:10M
62遺傳變異的數(shù)量“單倍型圖譜計(jì)劃1”(Nature2005SNP和SNP基因型TTCAGTCAGATTCCAGCCCTTCAGTCAGATTCCAGCCC樣本1樣本2TTCAGTCAGATTCCAGCCCTTCAGTCAGAGTCCAGCCC63SNP和SNP基因型TTCAGTCAGATTCCAGCCCT表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀表型校正:去除outliers,取特征值,取剩余值模型:混合線(xiàn)性模型方程組算法:SNP,單倍型,CNV,Gene-set(SNPs)Add.,Dom.,Rec.,Int.Frequentist,Bayesian方差/秩和,均值/中位數(shù)打分值,似然比
Bonferroni,F(xiàn)DR,Permutation,Bootstrap64表型&模型和算法表型:質(zhì)量性狀和數(shù)量性狀7編碼基因型Foronemarkerwithtwoalleles,therecanbethreepossiblegenotypes:GenotypeCodingAA2Aa1aa065編碼基因型Foronemarkerwithtwoa病例/對(duì)照設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)individualaffectiongenderSNP1SNP2…SNPn11F21…221M22…130F12…241F11…250M0-9…1sampleidcase/controlgenotypes66病例/對(duì)照設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)individualaffectio遺傳假設(shè)和遺傳模型GenotypicmodelHypothesis:all3differentgenotypeshavedifferenteffectsGenotypeGenotypicValueAAμAAAaμAaaaμaaAAvs.Aavs.aa67遺傳假設(shè)和遺傳模型GenotypicmodelGenotyDominantmodelHypothesis:thegeneticeffectsofAAandAaarethesameGenotypeGenotypicValueAAμA-AaμA-aaμaaAAandAavs.aa遺傳假設(shè)和遺傳模型(續(xù))68DominantmodelGenotypeGenotypiRecessivemodelHypothesis:thegeneticeffectsofAaandaaarethesameGenotypeGenotypicValueAAμA-Aaμa-aaμaaAAvs.Aaandaa69遺傳假設(shè)和遺傳模型(續(xù))RecessivemodelGenotypeGenotypAllelicmodelHypothesis:thegeneticeffectsofalleleAandalleleaaredifferentGenotypeGenotypicValueAA2μAAaμA+μaaa2μaAvs.a70遺傳假設(shè)和遺傳模型(續(xù))AllelicmodelGenotypeGenotypic卡方檢驗(yàn)GenotypicmodelNullhypothesis:Independence
AAAaaacasesnAAnAanaacontrolsmAAmAamaadf=271卡方檢驗(yàn)GenotypicmodelAAAaaacasesChi-squaredteststatistic:OistheobservedcellcountsEistheexpectedcellcounts,undernullhypothesisofindependence
統(tǒng)計(jì)量72Chi-squaredteststatistic:統(tǒng)計(jì)量Rcode>Statistics<-rchisq(1000,df=5)>hist(Statistics,prob=T)>curve(dchisq(x,df=5),col='blue',add=TRUE)>curve(dchisq(x,df=2),col='red',add=TRUE)>P<-1-pchisq(10,df=2);P[1]0.006737947
統(tǒng)計(jì)量P值73Rcode統(tǒng)計(jì)量P值16GWAS的歷史2005年,Science雜志報(bào)道了第一篇GWAS研究:年齡相關(guān)性黃斑變性之后陸續(xù)出現(xiàn)了有關(guān)冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂癥以及相關(guān)表型的報(bào)道74GWAS的歷史2005年,Science雜志報(bào)道了第一篇GWGWAS的現(xiàn)狀75GWAS的現(xiàn)狀18GWAS的趨勢(shì)76GWAS的趨勢(shì)19探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般到特殊)“穆勒五法”:求同法、求異法、求同求異法、共變法、排除法全基因組關(guān)聯(lián)研究主要基于共變法思想科學(xué)技術(shù)史之父薩頓認(rèn)為科學(xué)是人類(lèi)唯一具有累積性和繼承性的活動(dòng)77探求因果關(guān)系邏輯推理:歸納法(從特殊到一般)、演繹法(從一般一般流程使用SNP分型芯片獲得高通量的基因型對(duì)基因型進(jìn)行質(zhì)量評(píng)估和控制若為質(zhì)量性狀,需進(jìn)行群體分層檢測(cè);如為數(shù)量性狀,則對(duì)表型進(jìn)行協(xié)變量校正采用若干遺傳模型進(jìn)行全基因組關(guān)聯(lián)分析增加額外的數(shù)據(jù)進(jìn)行結(jié)果驗(yàn)證78一般流程使用SNP分型芯片獲得高通量的基因型21AHMU案例IlluminaHuman610Quad
BeadChipCallrate<90%,MAF
<1%,HWE
P
<10-71139病例vs.1132對(duì)照,PCA分析Cochran-Armitage趨勢(shì)檢驗(yàn)5182病例vs.6516對(duì)照,539病例vs.824對(duì)照NatGenet.2009Feb;41(2):205-210.79AHMU案例IlluminaHuman610QuadB計(jì)算過(guò)程PLINK
/~purcell/plink/plink–fileAHMU–mind0.05–maf0.01–hwe0.000001–model–outAHMU80計(jì)算過(guò)程PLINK23輸入輸出AHMU.pedAHMU.mapAHMU.model81輸入輸出AHMU.ped24GWAS主要策略Meta分析缺失填充通路分析互作分析82GWAS主要策略Meta分析缺失填充通路分析互作分析25Meta分析定義合并多個(gè)研究數(shù)據(jù),增加樣本量,提高檢測(cè)效力,發(fā)現(xiàn)新易感位點(diǎn)成功案例
Ⅱ型糖尿病、克隆病、多發(fā)性硬化、類(lèi)風(fēng)濕性關(guān)節(jié)炎、直結(jié)腸癌等83Meta分析定義26Meta分析分析步驟檢測(cè)研究異質(zhì)性選擇模型固定效應(yīng)模型,隨機(jī)誤差(弱)隨機(jī)效應(yīng)模型,群體分層(強(qiáng))單因素分析合并各研究檢驗(yàn)統(tǒng)計(jì)量、標(biāo)準(zhǔn)誤或p值常用軟件
METAL、Comprehensive
Meta-analysis等84Meta分析分析步驟27缺失填充定義缺失基因型填充(Imputation)主要是為了解決致病變異或其緊密連鎖標(biāo)簽分型遺漏的問(wèn)題成功案例約1/3-1/2的GWAS文章使用該技術(shù)85缺失填充定義28缺失填充分析步驟對(duì)自產(chǎn)數(shù)據(jù)進(jìn)行基因型質(zhì)量控制選擇合適的參考數(shù)據(jù)庫(kù),對(duì)高質(zhì)量的基因型數(shù)據(jù)進(jìn)行缺失填充根據(jù)計(jì)算得出的準(zhǔn)確率(info>0.8)對(duì)填充基因型進(jìn)行篩選過(guò)濾進(jìn)行關(guān)聯(lián)分析常用軟件
BEAGLE、IMPUTE、MACH和PLINK等86缺失填充分析步驟29通路分析定義將SNPs按照生物學(xué)通路分組,比較各通路在病例/對(duì)照或連續(xù)性狀數(shù)量上的差異成功案例克隆病、I型糖尿病、類(lèi)風(fēng)濕性關(guān)節(jié)炎、精神分裂癥、乳腺癌等87通路分析定義30通路分析分析步驟選擇生物通路(KEGG)選擇Tag
SNPs(HapMap)多因素分析顯著SNPs結(jié)果綜合常用軟件
GSEA、IPA等88通路分析分析步驟31互作分析定義研究基因-基因、基因-環(huán)境間交互作用成功案例老年黃斑變性、帕金森病、直腸癌、膀胱癌,哮喘等89互作分析定義32互作分析分析步驟選擇顯著及近似顯著SNPs選擇風(fēng)險(xiǎn)環(huán)境因素構(gòu)建互作模型多因素分析常用軟件
PLINK、Random
Jungle、BEAM等90互作分析分析步驟33其他策略?xún)呻A段法精細(xì)定位/目標(biāo)測(cè)序表型/性狀聯(lián)合單倍型分析91其他策略?xún)呻A段法34遺傳變異的檢測(cè)SNP芯片
Affymetrix:500Kchip(Randomlydistributed)
Illumina:550Kchip(gene-based)高通量測(cè)序
Illumina/Solexa:DNA-seq,RNA-seq92遺傳變異的檢測(cè)SNP芯片35高通量測(cè)序Next-generationsequencing(NGS)平行測(cè)序93高通量測(cè)序Next-generationsequencinSNP分型:
coverage&variantfrequency94參考基因組序列個(gè)體正向序列個(gè)體反向序列SNP分型:
coverage&variantfreq遺傳變異的種類(lèi)占總變異的90%單核苷酸多態(tài)性SinglenucleotidepolymorphismSNP1-50bp
DNA片段插入缺失Insertion-deletionInDel>50bpDNA片段結(jié)構(gòu)變異Structural
variationSV95遺傳變異的種類(lèi)占總變異的90%單核苷酸多態(tài)性Singlen遺傳變異的數(shù)量“千人基因組計(jì)劃”(Nature2012)SNP:38MInDel:1.4MSV:14K96遺傳變異的數(shù)量“千人基因組計(jì)劃”(Nature2012)3效應(yīng)大小vs.變異頻率9797效應(yīng)大小vs.變異頻率4040家系病例或極端性狀個(gè)體
NatRevGenet.2010Jun;11(6):415-25.98家系病例或極端性狀個(gè)體NatRevGenet.2010外顯子突變是孟德?tīng)柤膊≈饕∫?;多向性效?yīng)影響復(fù)雜疾病價(jià)格相對(duì)低廉目前主要用于檢測(cè)孟德?tīng)柤膊⌒碌牟呗曰蚍椒ǎ篖asso,折疊法,聚合法外顯子組測(cè)序99外顯子突變是孟德?tīng)柤膊≈饕∫颍欢嘞蛐孕?yīng)影響復(fù)雜疾病外顯子Lasso嶺回歸:|beta|2<tLasso回歸:|beta|<t貝葉斯:全概率&損失函數(shù)機(jī)器學(xué)習(xí):SVM100Lasso嶺回歸:|beta|2<tLa低覆蓋度測(cè)序+缺失基因型填充101Pasaniucet.al.,2012低覆蓋度測(cè)序+缺失基因型填充44Pasaniucet.a策略評(píng)估Pasaniuc等證實(shí)覆蓋度低至0.1-0.5X依然可以通過(guò)后續(xù)的填充方法獲得高密度芯片的效果102策略評(píng)估Pasaniuc等證實(shí)覆蓋度低至0.1-0.5X依然策略評(píng)估(續(xù))Howie等發(fā)明了一種pre-phasing的填充方法,該方法通過(guò)對(duì)GWAS樣本個(gè)體進(jìn)行連鎖相構(gòu)建,進(jìn)而利用參考庫(kù)的單倍型進(jìn)行缺失基因型填充103策略評(píng)估(續(xù))Howie等發(fā)明了一種pre-phasing的NGS-GWAS水稻農(nóng)藝性狀14種運(yùn)用重測(cè)序技術(shù)對(duì)517個(gè)中國(guó)水稻地方品系進(jìn)行進(jìn)化及GWAS分析~1X重測(cè)序KNN基因型填充算法MLM遺傳模型
NatGenet.2010Oct;42:961–967.10
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 畢業(yè)證書(shū)采購(gòu)合同
- 報(bào)廢物資回收保密協(xié)議書(shū)
- 山東省煙臺(tái)招遠(yuǎn)市(五四制)2024-2025學(xué)年七年級(jí)上學(xué)期期中考試地理試題
- 防火防震演練心得小學(xué)
- 《棉滌綸低彈絲包芯本色紗》
- 甘肅省定西市2024-2025學(xué)年高三上學(xué)期11月聯(lián)考質(zhì)量檢測(cè)數(shù)學(xué)試題
- 2025年1月廣東省高中合格性學(xué)業(yè)水平考試數(shù)學(xué)模擬測(cè)試(五)
- 古馬隆樹(shù)脂相關(guān)項(xiàng)目投資計(jì)劃書(shū)
- 硼粉系列行業(yè)相關(guān)投資計(jì)劃提議范本
- 人工智能AI芯片行業(yè)相關(guān)投資計(jì)劃提議
- 一企一標(biāo)準(zhǔn)一崗一清單手冊(cè)模板
- 中西文化鑒賞知到章節(jié)答案智慧樹(shù)2023年鄭州大學(xué)
- 第四單元(知識(shí)清單)【 新教材精講精研精思 】 七年級(jí)語(yǔ)文上冊(cè) (部編版)
- 2023統(tǒng)編高中語(yǔ)文選擇性必修下冊(cè)《蜀相》《書(shū)憤》群文閱讀優(yōu)質(zhì) 課件
- 答題卡(六年級(jí)數(shù)學(xué))
- 潛水員體檢表
- 生物學(xué)科活動(dòng)葉脈書(shū)簽制作
- 小學(xué)語(yǔ)文2-6年級(jí)詞語(yǔ)表
- 中國(guó)偵查史知到章節(jié)答案智慧樹(shù)2023年吉林警察學(xué)院
- 捅馬蜂窩優(yōu)質(zhì)獲獎(jiǎng)?wù)n件
- 電子版體溫單
評(píng)論
0/150
提交評(píng)論