hi c輔助基因組組裝項(xiàng)目方案_第1頁(yè)
hi c輔助基因組組裝項(xiàng)目方案_第2頁(yè)
hi c輔助基因組組裝項(xiàng)目方案_第3頁(yè)
hi c輔助基因組組裝項(xiàng)目方案_第4頁(yè)
hi c輔助基因組組裝項(xiàng)目方案_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Hi-C技術(shù)構(gòu)建棉花組項(xiàng)目方一、背景介利用Hi-C輔助組組裝背景概Hi-C技術(shù)是染色質(zhì)構(gòu)象捕獲技術(shù)(Chromosomeconformationcapture)結(jié)合高通量(High-throughputsequencing)衍生的一種技術(shù)。Hi-C主要將空間結(jié)構(gòu)的DN段進(jìn)行交聯(lián),并將交聯(lián)的DN段富集,然后進(jìn)行高通量,對(duì)數(shù)據(jù)進(jìn)行分析即可揭示染色質(zhì)間的相互作用。利用Hi-C輔助組組裝主要基于內(nèi)的DNA片段的交互作用大于間的交互作用和內(nèi)的DNA片段間交互作用與其線性距離服從冪次規(guī)律。因而可以實(shí)現(xiàn)將初步組裝的組草圖中的序列定位到,并能夠確定這些序列在上的順序和方向?yàn)楂@得高質(zhì)量的序列圖譜奠定重要的基礎(chǔ)。利用Hi-C輔助組組裝相比于傳統(tǒng)遺傳圖譜在特異性、覆蓋度、誤差和成本上都具有顯著地優(yōu)勢(shì)。首先Hi-CRead在輔助組裝過(guò)程中可以認(rèn)為是一個(gè)分子標(biāo)記,故其在長(zhǎng)度上是普通SSRSNP4-5倍,這使得其比傳統(tǒng)遺傳圖譜上的標(biāo)記具有更高的特異性;其次利用Hi-C技術(shù)能夠捕獲初步組裝的所有的ScaffoldsContigs初步組裝序列的的定位與順序的確定相比遺傳圖譜具備了更高的覆蓋度;再次Hi-C數(shù)據(jù)僅來(lái)源于一個(gè),這就使得該方法連接的scaffold具有更加真因而Hi-C輔助組組裝具有更低的誤差率最后Hi-C的輔助組裝方法要求的基礎(chǔ)數(shù)據(jù)為進(jìn)行組材料的單一株系Hi-C交互數(shù)據(jù),整個(gè)過(guò)程無(wú)需構(gòu)建龐大的遺傳群體和進(jìn)行大規(guī)模的分型工作,具有實(shí)驗(yàn)周期短、規(guī)模小,因而節(jié)約了時(shí)間和成本尤其是對(duì)于高雜合率或者多倍體的植物組的輔助組裝其棉花Hi-C構(gòu)某棉(大小近似亞洲棉1.7Gb)的組由“2+3”技術(shù)已完成,并完成組拼接,其中ScaffoldN50=3.08Mb,ScaffoldN90=517Kb。我們會(huì)基該棉的Sfold水平進(jìn)行構(gòu)建,一般情況大于50Kb的片段即可掛載到染色體上(一般精度會(huì)更高。所以我們至少保證90%的掛載率是沒(méi)有問(wèn)的。在完成構(gòu)建之前,我們會(huì)根據(jù)Scaffold之間的Hi-C互作頻率,來(lái)判斷組大片段組裝的錯(cuò)誤性。在reads深度低的地方為錯(cuò)誤的連接點(diǎn),我們會(huì)將此處斷開(kāi),并重新連接,已糾正組的組裝錯(cuò)(但是糾錯(cuò)可能會(huì)導(dǎo)致Scaffold組裝指標(biāo)的下降)二、建庫(kù)方90%的組序列組裝到上圖Hi-C構(gòu)建原具體的建庫(kù)策略如下表所示1Hi-C量可以選擇與組樣本不同,原則上越近越好。需要送無(wú)污染幼10g三、項(xiàng)目預(yù)整體報(bào)價(jià)5萬(wàn)元(包含樣本的提取、建庫(kù)、和分析四、實(shí)驗(yàn)方實(shí)驗(yàn)流Hi-C技術(shù)是構(gòu)象捕獲技術(shù)結(jié)合高通量衍生的一種技術(shù)主要研究染色質(zhì)的三維結(jié)構(gòu)通過(guò)對(duì)染色質(zhì)內(nèi)全部DNA間的交互作用進(jìn)行捕獲獲得交聯(lián)、內(nèi)切酶酶切、末端修復(fù)、環(huán)化、DNA純化及捕獲和上機(jī)等步驟[4]。圖1Hi-C實(shí)驗(yàn)流程Hi-C文庫(kù)構(gòu)粘性末端,保存互作關(guān)系之間的距離關(guān)系和互作頻率,一般使用HindIII;環(huán)化:將末端修復(fù)后的DNA進(jìn)行環(huán)化,將含有互作的DNA片段之間行環(huán)化,確保后續(xù)和分析過(guò)程中確定互作DNA的位置DNADNA解交聯(lián),純化DNA,300bp-700bp的DNA片段進(jìn)行文庫(kù)構(gòu)建。Hi-C文庫(kù)質(zhì)Hi-C文庫(kù)上機(jī)(庫(kù)檢合格后,應(yīng)用IlluminaHiSeq平臺(tái)進(jìn)行上機(jī)一般用Xten平(分析流對(duì)RawData進(jìn)行數(shù)據(jù)過(guò)濾,去除其中的接頭序列及低質(zhì)量Reads獲得高質(zhì)量的CleanData。將CleanData與初步組裝的組進(jìn)行序列比對(duì),獲得MappedData?;谶@些數(shù)據(jù)將作為文庫(kù)質(zhì)量評(píng)估的依據(jù);利用上步獲得的有效的Hi-C數(shù)據(jù)對(duì)初步組裝的組序列進(jìn)行進(jìn)一步的組Hi-C輔助組組裝分析流程如圖2所示五、結(jié)果

圖2Hi-C輔助組組裝生物信息分析流程組裝結(jié)果統(tǒng)我們對(duì)Hi-C輔助組組裝的初步結(jié)果列在下表中表某組組裝數(shù)據(jù)統(tǒng)計(jì)ShotgunassemblyTotalassemblylength,includinggapsNumberofcontigsorN50scaffoldsize%sequence(%contigs)clusteredinto%clusteredsequence(%contigs)mis-%clusteredsequence(%contigs)%orderedsequence(%contigs)w/ordering%orderedsequence(%contigs)w/orientation注:*:Clustering和Ordering下的contigs均指初步組裝序列中的contig或者scaffold序列;Orderingerror指相對(duì)參考組,在確定順序的序列中與鄰近c(diǎn)ontig或者scaffold序列順序不一致的比例;Orientation組裝結(jié)果統(tǒng)我們基于LACHESIS軟件開(kāi)發(fā)了相關(guān)組裝流程,整合了組糾錯(cuò)功能,并對(duì)組序列進(jìn)行群組的劃分、排序和定向,并對(duì)組裝結(jié)果進(jìn)行評(píng)估。Hi-C對(duì)原組組裝糾表組的統(tǒng)計(jì)信Contig/ScaffoldContig/ScaffoldContig/ScaffoldN50Contig/ScaffoldN90Contig/ScaffoldMaxGaptotallength注:PacBio+BioNanoCorrected:糾錯(cuò)后contig結(jié)果;NGS+PacBio+Bionano+Corrected:scaffold組裝結(jié)Hi-C輔助組組我們會(huì)給出利用Hi-C組裝出的組大小占原組裝組大小的比(掛載效率。以及每個(gè)群組(類似于遺傳圖譜的連鎖群)Hi-C數(shù)據(jù)統(tǒng)計(jì)表格。以及我們能夠確定Scaffold方向和順序的組大小和Scaffold數(shù)目等信Hi-C組裝結(jié)果評(píng)這里除了近緣物種組、Unigene的評(píng)估,我們重點(diǎn)開(kāi)發(fā)了熱圖評(píng)估和近緣物種組的共線性評(píng)估。圖Hi-C組裝交互熱 ScaffoldN50Trachinotus

Colinear BlockDraft LAC

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論