GWAS的基本原理學(xué)習(xí)課件_第1頁
GWAS的基本原理學(xué)習(xí)課件_第2頁
GWAS的基本原理學(xué)習(xí)課件_第3頁
GWAS的基本原理學(xué)習(xí)課件_第4頁
GWAS的基本原理學(xué)習(xí)課件_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PLINK/~purcell/plink/統(tǒng)計遺傳學(xué)PLINK國際流行的統(tǒng)計分析軟件1、全基因組關(guān)聯(lián)分析工具。2、由人類遺傳研究中心(CHGR),馬薩諸塞州總醫(yī)院(MGH),哈佛大學(xué)和麻省理工學(xué)院的Broad研究所等機(jī)構(gòu)科研人員所開發(fā)。3、主要針對基因型/表型數(shù)據(jù)的分析4、軟件可以使用命令行分析5、也可以使用基于JAVA語言的圖形界面gPLINK?,F(xiàn)在許多現(xiàn)存的基因分析軟件不能夠用來處理基因組大數(shù)據(jù),為了解決這個問題,開發(fā)了plink軟件?;贑語言的全基因組關(guān)聯(lián)分析。

人類基因組中識別導(dǎo)致某種特殊疾病的基因,分析人類復(fù)雜遺傳疾病,研究與疾病相關(guān)的基因突變。主要的功能模塊包括:數(shù)據(jù)處理,質(zhì)量控制的基本統(tǒng)計,群體分層分析,單位點(diǎn)的基本關(guān)聯(lián)分析,家系數(shù)據(jù)的傳遞不平衡檢驗(yàn),多點(diǎn)連鎖分析,單倍體關(guān)聯(lián)分析,拷貝數(shù)變異分析,Meta分析等等。

全基因組關(guān)聯(lián)分析GWAS(Genome-wideassociationstudy;GWAS):應(yīng)用基因組中數(shù)以百萬計的單核苷酸多態(tài);SNP為分子遺傳標(biāo)記,進(jìn)行全基因組水平上的對照分析或相關(guān)性分析,通過比較發(fā)現(xiàn)影響復(fù)雜性狀的基因變異的一種新策略。

世界范圍的人類群體,在表型上可謂千差萬別,但是基因組上的差異卻非常小,而且這種差異大多數(shù)表現(xiàn)為SNP(Singlenucleotidepolymorphism,單核苷酸多態(tài)性)。Case&control刀鱭篩選出最顯著的SNPPlink-IBSIBS(IdentityByState,狀態(tài)一致):在兩個或兩個以上的個體當(dāng)中,如果一個DNA片段具有相同的核苷酸序列,就說這個DNA片段是IBS。IBD(IdentityByDes-cent,同源一致):如果IBS片段是遺傳自同一個祖先且中間過程沒有發(fā)生過重組事件,就說這個片段是IBD。顯著的SNP由1和2組成的2n個序列,每一個SNP基因型對應(yīng)兩個序列。對于任意一個個體的SNP基因型數(shù)據(jù)進(jìn)行處理(忽略ACGT的差別)如22,21,12,11分別對應(yīng)于SNP基因型,aaaAAaAA。然后把這些序列轉(zhuǎn)換為由0、1、2組成的數(shù)量為n的SNP序列,表示為:第i個個體第k個SNP第i個個體的SNP基因型為:第j個個體的SNP基因型為:這兩個個體間的第K個snp的IBS狀態(tài)為:只考慮狀態(tài)值是0和非0的情況:個體i和個體j的SNP的IBS狀態(tài)值非0的區(qū)域滿足一定閾值就作為候選IBD片段,可以表示為:

個體IBS狀態(tài)值非0的SNP數(shù)量每個SNP上各個體之間的差異:

數(shù)據(jù)個體的總數(shù)目把N個體的數(shù)據(jù)分成case和control兩組進(jìn)行分析,其中case包含個l個體,control包含m個個體,然后對這兩組數(shù)據(jù)分別進(jìn)行評價分析,對每個SNP得到各自的S值。PLINK-LD(連鎖不平衡)配子不平衡,是單倍型中等位基因之間的統(tǒng)計相關(guān)性。P(AB)=P(A)*P(B)單倍體基因型A和B

2、實(shí)際觀察到的群體中單倍體基因型A和B同時出現(xiàn)的概率

1、如果不存在連鎖不平衡——相互獨(dú)立,隨機(jī)組合P(AB)≠P(A)*P(B)2、兩對等位基因是非隨機(jī)結(jié)合1、如果A與B是相關(guān)聯(lián)的

P(AB)=D+P(A)*P(B)D是表示兩位點(diǎn)間LD程度值GWAS的基本原理借助于SNP分子遺傳標(biāo)記,進(jìn)行總體關(guān)聯(lián)分析,在全基因組范圍內(nèi)選擇遺傳變異進(jìn)行基因分析,比較異常和對照組之間每個遺傳變異及其頻率的差異,統(tǒng)計分析每個變異與目標(biāo)性狀之間的關(guān)聯(lián)性大小,選出最相關(guān)的遺傳變異進(jìn)行驗(yàn)證,并根據(jù)驗(yàn)證結(jié)果最終確認(rèn)其與目標(biāo)性狀之間的相關(guān)性。例子青藏高原的居民對極端的高海拔的適應(yīng)研究。作者測了50個藏族的外顯子組。找到了青藏高原居民的基因中等位基因頻率變化的候選基因。并通過關(guān)聯(lián)分析最后驗(yàn)證出EPAS1基因與他們的高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論