




已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
群體遺傳學(xué)人群結(jié)構(gòu)推斷軟件structure 2.2使用指南/structure.htmlthe basic algorithm was described by pritchard, stephens & donnelly (2000). extensions to the method were published by falush, stephens and pritchard (2003) and (2007) and by hubisz, falush, stephens and pritchard (2009).1、待分析數(shù)據(jù)文件的編輯可新建文本文件并命名為project_data,以文本編輯的方式編輯數(shù)列:第一列:樣品代碼(成功錄入后被識(shí)別為individual id),每一樣品占兩行,每一行為其一個(gè)基因型,如樣品1的基因型為aa,樣品2的基因型為at,樣品3的基因型為tt,則編輯為:(兩行數(shù)字不一樣則表示雜合數(shù)據(jù))第一列 第二列 第三列1 1 111 121 121 232 232 2如果有多個(gè)等位基因,可以按1,2,3,4,5等順序編碼各樣品的基因型;第二列:人群代碼(成功錄入后被識(shí)別為popid),即第一群人的代碼全為1,第二群人的代碼全為2,第三群人的代碼全為3;(最好說(shuō)是群體類(lèi)群編碼,可以是不同來(lái)源地代號(hào),或是生態(tài)類(lèi)群代碼)(這列最好不要有,后續(xù)選項(xiàng)中一旦選中最后算出的k值很有可能就是群體類(lèi)群數(shù)(popid的數(shù)量)第三列:位點(diǎn)1的分型結(jié)果。如上所述,如果有2個(gè)等位基因,可用1、2代表;如果有多個(gè)等位基因,可分別以1,2,3,4,5等代表;第四列:位點(diǎn)2的分型結(jié)果。編碼方法同上。 2、打開(kāi)structure軟件,選擇file-open data file-選中所編輯好的打他data文件,查看格式、數(shù)據(jù),如有修改應(yīng)保存退出;3、選擇file-new project-step 1-命名project name-選擇存放路徑-選擇保存過(guò)的待分析文件;4、step 2-填入待分析樣品數(shù)量,如220-ploidy of data即選擇單倍體或二倍體,選2-number of loci,選位點(diǎn)個(gè)數(shù)-mimissing data value,一般選-9;5、step 3-依次選擇row of marker names, row of recessive alleles, map distance between loci, phase information等,沒(méi)有就不選;最下面,如果沒(méi)有data file stores data for individuals in a single line就不選;6、step 4-individual id for each individual(選擇) ,putative population origin for each individual(選擇),usepopinfo selection flag(不選),phenotype information(不選),other extra column(不選)以及number of extra column(不選);(其實(shí)應(yīng)根據(jù)你數(shù)據(jù)的實(shí)際情況選或不選)7、點(diǎn)擊“finish”;proceed;8、點(diǎn)擊parameter set-new-length of burnin peroid (填寫(xiě)10000)-number of mcmc reps after burnin (填寫(xiě)10000);(不作數(shù)迭代(burnin peroid )最好設(shè)為10000,而后續(xù)的mcmc最好設(shè)為100000)9、ancestry models,allele frequency model,advanced等均選default setting; enter the name: 輸入名字,運(yùn)行完畢將產(chǎn)生一個(gè)由該名字命名的文件夾以保存運(yùn)算結(jié)果和繪圖。(都default是不科學(xué)的,no admixture model假設(shè)個(gè)體基因源來(lái)源純粹. is appropriate for studying fully discrete populations and is often more powerful than the admixture model at detecting subtle structure.而admixture model.假設(shè)個(gè)體基因源來(lái)源非純粹:individuals may have mixed ancestry. 應(yīng)該根據(jù)你材料具體情況來(lái)選擇模型)10、點(diǎn)擊“start a job”,單擊選中命名的文件夾名稱(chēng),設(shè)置k從2到7等,其它不選,點(diǎn)擊start。(群體較大比如超過(guò)200個(gè)體,起碼算到20,這里number of iterations 最好選3以上,在計(jì)算k時(shí)可能用到)11、點(diǎn)擊“plotting”,選擇剛才命名job的名字,result file選擇run_1, run_2等,即可看到聚類(lèi)的三角圖形。(三角圖是花架子,論文里常用的是bar plot 才是關(guān)鍵)(此后為我續(xù)寫(xiě)內(nèi)容)13.單擊主菜單“view”選項(xiàng)下的simulation summary,會(huì)出現(xiàn)所有運(yùn)行結(jié)果的重要參數(shù)匯總,其中最重要的是看lnpr(x|k)值的變化是否有拐點(diǎn),即后驗(yàn)概率的極大值在k等于幾時(shí)出現(xiàn),特別注意k值持續(xù)增大是常有的事,這時(shí)就要用 用k 來(lái)確定k值,如下圖:k雖然持續(xù)增大,但k可判斷出k應(yīng)該為2.14.在確定k為幾后,點(diǎn)擊相應(yīng)result file選擇run_?(k=?)選項(xiàng),把含有以下內(nèi)容的文本拷貝到excel中編輯inferred ancestry of individuals: label (%miss) pop: inferred clusters 1 7 (0) 1 : 0.996 0.001 0.001 2 10 (0) 1 : 0.635 0.001 0.003 3 26 (2) 1 : 0.991 0.001 0.001 4 28 (6) 1 : 0.991 0.006 0.001 5 65 (2) 2 : 0.991 0.004 0.00115:整理為以下標(biāo)準(zhǔn)格式后就可以放到tassel軟件中計(jì)算用了標(biāo)準(zhǔn)格式:8632q1q2q37 0.0140.9720.01410 0.0030.9930.004260.0710.9170.01228 0.0350.8540.111290.0130.9820.00530 0.7620.0170.22116、注意:運(yùn)行完畢后產(chǎn)生的以“job名字”命名的文件夾中自動(dòng)含有project_data文件,其內(nèi)容與最初編輯的project_data文件完全一致,故原編輯的project_data文件可以刪去。柱形圖繪制軟件distruct使用指南當(dāng)structure軟件運(yùn)行完畢獲得結(jié)果后,往往需要以clumpp或distruct軟件繪制柱形圖。distruct用法如下:1、從/distruct.html下載并解壓縮distruct 1.1壓縮包,可以看到含7個(gè)以casia為名的文件及5個(gè)名字字首為distruct的文件,還有一個(gè)drawparams的文件和一個(gè)顏色文件夾;2、運(yùn)行casia.postscript文件,應(yīng)該能產(chǎn)生一個(gè)含9個(gè)群體柱形圖的casia.pdf文件,這表明系統(tǒng)及軟件正常;3、打開(kāi)casia.popq和casia.indivq將其原內(nèi)容清空并置換為前述structure軟件運(yùn)行后所產(chǎn)生的_run_1_f文件的內(nèi)容(拷貝并粘貼),其中_run_1_f文件同時(shí)含有individual和population兩者的數(shù)據(jù)。以word打開(kāi)casia.indivq文件,將_run_1_f文件后半部分的內(nèi)容自“inferred ancestry of individuals”行以下的數(shù)據(jù)拷貝并粘貼到casia.indivq文件中,全部替換原來(lái)的210行數(shù)據(jù);以excel打開(kāi)casia.popq文件,將_run_1_f文件前半部分含有“proportion of membership of each pre-defined population in each of the 3 clusters”的行下面的數(shù)據(jù)拷貝并粘貼到casia.popq中,并替換原來(lái)的內(nèi)容(k=3是可變的!)。新產(chǎn)生的內(nèi)容注意仍然保持原來(lái)210行數(shù)據(jù)的那種格式。4、打開(kāi)casia.languages文件,將原內(nèi)容“50 indo-european51 dravidian57 indo-european59 indo-european58 indo-european52 linguistic isolate54 indo-european629 altaic699 altaic56 indo-european”替換為現(xiàn)內(nèi)容“1 ceu2 chb3 yri”;保存為原格式;5、打開(kāi)s文件,將原內(nèi)容50 balochi51 brahui57 makrani59 sindhi58 pathan52 burusho54 hazara629 uygur699 yakut56 kalash替換為現(xiàn)內(nèi)容1 ceu2 chb3 yri保存為原格式;6、打開(kāi)casia.perm文件,將原內(nèi)容5 yellow4 pink1 red2 green3 blue_purple中的4、5顏色刪去,并保存為原格式;7、以文本格式打開(kāi)drawparams文件,將drawparams文件中的#define k5 / (int) number of clusters#define numpops 9 / (int) number of pre-defined populations#define numinds 210 / (int) number of indivi
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 兒童繪本創(chuàng)作課件下載
- 感染性心包炎的臨床護(hù)理
- 學(xué)校后勤工作方案學(xué)校
- 區(qū)域經(jīng)理工作總結(jié)
- 2020-2025年中國(guó)火災(zāi)報(bào)警系統(tǒng)工程行業(yè)市場(chǎng)調(diào)查研究及投資戰(zhàn)略咨詢(xún)報(bào)告
- 客服工作總結(jié)與方案典范
- 2024-2030年中國(guó)糧食種植行業(yè)市場(chǎng)深度研究及投資戰(zhàn)略規(guī)劃報(bào)告
- 2024-2030全球家用寵物驅(qū)蟲(chóng)藥物行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 杉木木芯板項(xiàng)目可行性研究報(bào)告技術(shù)工藝+設(shè)備選型+財(cái)務(wù)概算+廠區(qū)規(guī)劃
- 2025年中國(guó)打樁機(jī)彈簧行業(yè)市場(chǎng)發(fā)展前景及發(fā)展趨勢(shì)與投資戰(zhàn)略研究報(bào)告
- DB50-T 1727.2-2024 零散天然氣橇裝回收安全技術(shù)規(guī)程 第2部分:壓縮天然氣
- 店面工程裝修合同書(shū)
- DB33T 1149-2018 城鎮(zhèn)供排水有限空間作業(yè)安全規(guī)程
- 反肩關(guān)節(jié)置換術(shù)的護(hù)理
- 內(nèi)蒙古交通集團(tuán)有限公司社會(huì)化招聘考試試卷及答案2022
- 國(guó)家開(kāi)放大學(xué)《當(dāng)代中國(guó)政治制度》期末考試題庫(kù)
- 智能智能服務(wù)系統(tǒng)開(kāi)發(fā)合同
- 2025屆新高考語(yǔ)文古詩(shī)文默寫(xiě)100題匯編(含答案解析)
- 征信異議申訴合同(2篇)
- 中醫(yī)小兒貼敷培訓(xùn)課件
- 自殺患者應(yīng)急預(yù)案
評(píng)論
0/150
提交評(píng)論