遺傳進化無參-slaf測序項目方案模板_第1頁
遺傳進化無參-slaf測序項目方案模板_第2頁
遺傳進化無參-slaf測序項目方案模板_第3頁
遺傳進化無參-slaf測序項目方案模板_第4頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

背 材料與方 材 參考組確 實驗建庫及高通量................................................................................................... 信息分析流 3.1質(zhì)量值分布檢 3.3數(shù)據(jù)產(chǎn)出和質(zhì)量統(tǒng) SLAF開 SLAF統(tǒng) SLAF分 SNP信息統(tǒng) PCA分 簡化組遺傳進化文章賞 參考文 科它應用數(shù)學和統(tǒng)計學方法研究群體中頻率和型頻率以及影響這些頻率的選擇效所帶來的各種型在數(shù)量上的分布稱為群體的遺傳結(jié)構(gòu)獲知了不同世代中遺傳結(jié)構(gòu)的演SLAF-seq[1]技術作為一種新發(fā)展的技術,通過限制性內(nèi)切酶消化組DNA,選取一定長度的片段進序,降低了組的復雜度,并且不依賴組序列,因而成為SNP標記開發(fā)的首選。相對于傳統(tǒng)的技術,SLAF-seq技術不僅節(jié)省成本和時間,而且本研究利用SLAF-seq簡化組技術,選擇足夠多的樣本,獲得高密度覆蓋全基SNP標記,進行群體進化的研究。材本本個XX參考組確根據(jù)項目物種的組大小以及GC含量等信息選取項目物種或近緣物種的組作酶切方案確實驗建庫及高根據(jù)選定的最適酶切方案,對檢測合格的各樣品組DNA分別進行酶切。對得到的酶切片段(SLAF)進行3′端加A處理、連接Dual-index接頭、PCR擴增、純化、IlluminaHiSeq2500,PE125(PE250)進實驗建庫評

1SLAF實驗流通過水稻晴作為control的數(shù)據(jù)來評估實驗過程是否正常,確定酶切方案槍法和逐步克隆方法進序目前已完成全部核組、葉綠體組和線粒體組測序工作,精確度達到99.99%。主要從以下幾個方面進行評估:比對效率統(tǒng)計,即將reads與參考組進行比對酶切效率評估,即統(tǒng)計reads片段中殘留酶切位點的比例利用Dual-index對得到的原始數(shù)據(jù)進行識別,得到各個樣品的reads。過濾reads的接頭后,進序質(zhì)量和數(shù)據(jù)量的評估。通過Control數(shù)據(jù)評估酶切效率,以此判斷實驗過程的準確性和有效性。根據(jù)生物信息學分析,在群體中開發(fā)全組范圍的SNP質(zhì)量值分布檢通常序列5’端前幾個堿基的錯誤率相對較高,隨著序列的延伸,3’端堿基錯誤率會不斷升高,這是由高通量的技術特點決定的。堿基質(zhì)量30表示堿基的錯誤率為0.1%。樣品的reads質(zhì)量值分布圖見下圖:堿基分布檢SLAF所列為組酶切后的DN段,由于酶切位點在組上的分布是近似響,reads的前兩到三個堿基都是酶切位點序列,因此在堿基分布圖中會出現(xiàn)前端波動較大的現(xiàn)象。樣品的堿基含量分布圖見下圖:數(shù)據(jù)產(chǎn)出和質(zhì)量對各樣品的數(shù)據(jù)進行統(tǒng)計,包括reads數(shù)量、Q30和GC含量,具體結(jié)果見表表1各樣品數(shù)據(jù)統(tǒng)SampleBMKQ30percentageGC……………注SampleID:項目;BMKID:百邁客對項目樣品的統(tǒng)一TotalReads:各樣品的reads數(shù)Q30percentage:質(zhì)量值大于或等于30的堿基所占百分比;GCpercentage:結(jié)果中G和C兩種堿基所占總堿基的百分比;SLAF開readsSNP。SLAF開發(fā)流程見下圖SLAF統(tǒng)本項目共開發(fā)XXX個SLAF每個樣品的平均深度為XX,具體統(tǒng)計見表2統(tǒng)SampleBMKTotalAverage……………注SampleID:項目;BMKID:百邁客對項目樣品的統(tǒng)一SLAFnumber:對應樣品所含有的SLAF數(shù)Totaldepth:對應樣品的在SLAF中的總深度,即總reads數(shù)Averagedepth:平均每個SLAF上對應樣品的reads數(shù)SLAF分SLAF,其中SNP這種類型為多態(tài)性標記,統(tǒng)稱為Marker,本次分析共得到XXX個表3各類型SLAF結(jié)果統(tǒng) No 注:SNP:單核苷酸突變;INDEL:缺失;NoPolymorphism:沒有多態(tài)性;Unknown:類型未知;Repeat:重復序列在開發(fā)得到的XXX個SLAF中多態(tài)性標記共有XXX個多態(tài)性比例達到XXX%SNP根XXXMarker,利用GATKSNP標記檢測。SNP位點詳細4:4樣品SNP信息統(tǒng)計SampleSNPHeterHeter…注:SampleID:樣品;SNPnum:樣品中檢測到的SNP個數(shù);Transition:轉(zhuǎn)換類型SNP個數(shù);Transversion:顛換類型SNP個數(shù);Ti/Tv:轉(zhuǎn)換與顛換數(shù)之比;Heternum:樣品中雜合SNP位點個數(shù);Heterratio:樣品中雜合SNP位點占所有SNP位點的系統(tǒng)發(fā)育分系統(tǒng)發(fā)育樹(phylogenetictreeevolutionarytree進化樹)是描述群體間進化順序的分SNP檢測之后,得到的SNPs可以用于計算種群之間的距離。兩個i和j之LD=1∑

如果兩個的型是AA和

{1,如果兩個的型是AA和本實驗通過MEGA5(Tamuraetal.,2011)軟件[2],利用得到的SNP標記,基于neighbor-joining(SaitouNetal1987)算法[3]對XX份材料進行系統(tǒng)發(fā)育樹分析,目的在于探索每個間的關系。群體結(jié)構(gòu)分則親緣關系稍遠。群體結(jié)構(gòu)分析有助于理解進化過程,并且可以通過型和表型的關聯(lián)研究確定所屬的亞群。在群體世系推斷分析之后,可以將樣本按區(qū)域或種群進行劃分[4]本項目運用admixture(lexanderetal.,2009)軟件[5]SNP標記,基于數(shù)學模型對群體內(nèi)XXAdmixture(cross-validationerror)來判斷最佳K值——K值的交叉驗證誤差最小(cross-validationerror,最終確定群體中最優(yōu)的類群數(shù)目,如下圖所示,K=7時具有最優(yōu)分群數(shù)。 同K值與CV值的對應線,結(jié)果顯示K=7PCA主成分分析(principalcomponentysis)是一種利用正交變換將一組可能是相關變量的觀測值轉(zhuǎn)換為一組稱為主成分線性不相關的變量值。PCA在遺傳學當中主要用于聚類分本實驗運用cluster(Readetal2001)軟件[6]SNP標記,對群體內(nèi)XX份PCAXX份材料的主成分聚類情況,從而知道哪些樣品的注:圖中通過PCA分析將樣品聚為三維,pca1代表第一主成分,pca2代表第二主成分,pca3代表第三主成分。一個點代表一個樣品。不同顏色代表不同的亞種類型,綠色表示亞種類型為1的樣品,紫色表示亞種類型為2的樣品,黃色表示未給定亞種類文章:PopulationgenomicevidenceforadaptivedifferentiationinBalticSeathree-spinedsticklebacks.BMCBiology,2015.這篇文章是對的海三刺魚進行的群體適應性分化的用材料是位于的海10個地點的三刺魚群體,每個群體取36個,對這些群體進行簡化,共獲得14萬SNP進行分析。和溫度的適應性進行關聯(lián)分析,共發(fā)現(xiàn)有297個包含的SNP既在群體分化區(qū)域又與環(huán)境適應性相關。通過對297個進行注釋,發(fā)現(xiàn)15個與早期研究中三刺魚在海洋與淡水的分化有關,還有22個與適應鹽度有關。SunX,LiuD,ZhangX,etal.,SLAF-seq:AnEfficientMethodofLarge-ScaleDeNovoSNPDiscoveryandGenotyUsingHigh-ThroughputSequencing.PLosone,2013,8:e58700.KTamura,etal.,MEGA5:molecularevolutionarygeneticsysis likelihood,evolutionarydistance,and umparsimonymethods.MolBiolEvol,2011,28(10):2731-2739.NSaitouandMNei,Theneighbor-joiningmethod:anewmethodforreconstructingphylogenetictrees.MolBiolEvol,1987,4(4):406-425.Wright,S.,Thegeneticalstructureofpopulations.Ann.Eugen.1951,15,DHAlexander,etal.,Fastmodel-basedestimationofancestryinunrelatedGenomeRes.,2009,19:1655-KanazinV,TalbertH,SeeD,etal.,Discoveryandassayofsingle-nucleotidepolymorphismsinbarley(Hordeumvulgare).PlantMolecularBiology,2002,48:529-537.JuliaC.Jones,ShaohuaFan,PaoloFranchini,etal.,TheevolutionatyhistoryofXiphorusfishandtheirsexuallyselectedsword:agenome-wideapproachusingrest

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論