版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、在這個(gè)例子中,來(lái)自于1的條的序列信息(相當(dāng)于的被用于介紹第三代測(cè)序中的單分子實(shí)時(shí)()測(cè)序可以實(shí)現(xiàn)超過(guò)(5的咼度精確測(cè)序,且不受序列中和含量的影響,平均讀長(zhǎng)可達(dá)(最長(zhǎng)),這是如何實(shí)現(xiàn)的呢?這是因?yàn)榧夹g(shù)在與測(cè)序精確度相關(guān)的三個(gè)方面均有獨(dú)到之處:(一致性準(zhǔn)確性)(測(cè)序偏好性)(測(cè)序的表現(xiàn))本文將從專業(yè)客觀的角度從這三方面詳細(xì)闡述測(cè)序技術(shù)的表現(xiàn),圖文并茂,數(shù)據(jù)詳實(shí),請(qǐng)各位看官留步,細(xì)細(xì)品味。(一致性準(zhǔn)確性)一個(gè)典型的測(cè)序過(guò)程通常包括三個(gè)基本步驟:()生成測(cè)序,()將生成的到已知的參考序列上,()為了得到最終的序列而生成。如果樣本是未知起源的,那么第()步就會(huì)被基因組組裝所代替,以便生成一個(gè)新的參考基因
2、組。最后一步是將原始測(cè)序至!J結(jié)果。為了使大家更好的理解測(cè)序技術(shù)是怎樣達(dá)到準(zhǔn)確度的,圖我們先來(lái)一下在系統(tǒng)中,測(cè)序結(jié)果是怎樣得到的。在這個(gè)例子中,一條的被到參考基因組上,紅色箭頭表示與參考基因組不一致的堿基。但是我們不能單憑這一條的結(jié)果就給出生物學(xué)結(jié)論,因?yàn)槲覀儾恢肋@種不一致究竟來(lái)自于真正的生物學(xué)變異還是僅僅是由于測(cè)序錯(cuò)誤導(dǎo)致的。同樣,單憑一條也無(wú)法出,因?yàn)樵谶@種變異里,我們至少需要來(lái)自父方和母方染色體的各一條。因此,要想獲得真實(shí)準(zhǔn)確的生物學(xué)發(fā)現(xiàn),必須通過(guò)將多條進(jìn)行,然后與參考基因組的相同區(qū)域進(jìn)行,換句話說(shuō),需要進(jìn)行為了判斷準(zhǔn)確度是否能達(dá)到或以上,需要把序列與已知的精準(zhǔn)判斷與參考位置究竟是,還
3、是,亦或是那么,同樣的策略其實(shí)也被用于測(cè)序技術(shù)中(見(jiàn)圖)。i.Generatesequenceread:匸Maptoreference:m.Generateconsensus(1Oxcoverage):WlrtwFi-gureObtainingsequencingreulhusngsecond-generationacqu&nargtechnol対i日乩SATJLLijCJi-AATSNP:SrP-TW*TTT9CIKAAT0#:L-芳cRtH77?綽9R4TAERaferBHcaUFigure2.ObiainingsequencingresultsusingSMRTSequencjrt.i,
4、Generatesequenceread:MGmnerateconsensus(10 xcoverage):測(cè)序可以產(chǎn)生更長(zhǎng)的(平均讀長(zhǎng)可達(dá),最長(zhǎng))k但是為了與圖1一致,便于理解,我們?cè)趫D2還是只看的長(zhǎng)度。雖然在技術(shù)中,更容易出錯(cuò)(平均錯(cuò)誤率)%,這些錯(cuò)誤主要由于(水平紅線)和(垂直紅線)引起??紤]到的這些特征,公司開發(fā)了名為工具,專門為進(jìn)行了優(yōu)化。盡管單次讀?。┑腻e(cuò)誤率稍高,但是使用還是可以準(zhǔn)確的將到參考序列的相應(yīng)位置。因此,正如圖中二代測(cè)序的例子一樣,無(wú)論哪種采用技術(shù),沒(méi)有人會(huì)關(guān)注一個(gè)堿基只被測(cè)一次的結(jié)果,最終結(jié)果都是經(jīng)過(guò)分析之后得到的,比如,當(dāng)做到時(shí)候,每個(gè)位置的序列信息就是由10次讀取
5、之后產(chǎn)生的平均結(jié)果而定(如圖中垂直的框)。所以,對(duì)于三代測(cè)序來(lái)說(shuō),針對(duì)每一個(gè)堿基,次讀取中有次都是正確的,足夠讓我們判斷出該位置的正確信息。根據(jù)的這一特點(diǎn),公司也開發(fā)了一個(gè)名為的工具,可以生成高質(zhì)量的序列然而,如果測(cè)序方法本身存在系統(tǒng)錯(cuò)誤,無(wú)論之后的序列是不是正確,測(cè)序結(jié)果都將會(huì)受到影響。也就是說(shuō),如果某個(gè)堿基被系統(tǒng)地讀錯(cuò),那么在之后它也仍然是錯(cuò)的,且這一錯(cuò)誤是無(wú)法通過(guò)增加克服的。而測(cè)序技術(shù)的準(zhǔn)確率之所以能夠,最關(guān)鍵的一點(diǎn)就是由于的錯(cuò)誤是隨機(jī)錯(cuò)誤,這意味著隨著的增加,這種隨機(jī)錯(cuò)誤可以很快被消減掉。這點(diǎn)已經(jīng)有多篇進(jìn)行了理論及實(shí)踐驗(yàn)證。圖說(shuō)明了測(cè)序的準(zhǔn)確度與之間的關(guān)系,星號(hào)代表與達(dá)到一致。-A0P
6、誇g毋W與U與UEOQwithVie怕栢咖國(guó)一的參考序列相比較(例如已有金標(biāo)準(zhǔn)參考序列的物種)??梢圆捎媚承┮驯粶y(cè)序廣泛測(cè)過(guò)的細(xì)菌基因組作為標(biāo)準(zhǔn),如和。該圖表明了雖然的單次讀取的準(zhǔn)確性比其他方法略低,但是一旦增加,準(zhǔn)確率就可以快速提升,很多情況下可以實(shí)現(xiàn)完美的參考基因組。我們可以從看到,測(cè)序的準(zhǔn)確性甚至可以達(dá)到,也就是百萬(wàn)個(gè)堿基里面只發(fā)生個(gè)堿基錯(cuò)誤。生物通的準(zhǔn)確率可以超越其他測(cè)序方法,就是因?yàn)樗请S機(jī)錯(cuò)誤。這也是很多研究都采用來(lái)驗(yàn)證基于其他平臺(tái)發(fā)現(xiàn)的的根本原因中高亮顯示的就是之后的準(zhǔn)確性。在該例中,對(duì)于任何測(cè)序平臺(tái)來(lái)說(shuō),有意義的也都是結(jié)果,而非單次讀取的結(jié)果。WWWLAPf0hHOC五譚pMl
7、MKrActiu;1”J*-f-IE-07pFBfKI441484Mt松1*fCM中IThlgl先的】吋t豐iiSf.UrvA現(xiàn)業(yè)W1-*i*J34V41;:X-W曲TMr已.U輛猝昶H-10|亠護(hù)軽Ng0凰MMMIIWuj4rjmetr*-4ftMiMqj1i:tMMpTrU:d訥*.証汀*ll&Mfl51*1-ffT-WifJimRh4221W*4HILIlT-曠j*.ITgHkR加致3*J*tJ*-j.|I.(1*七*JF112*1j*4俚“D血T倉(cāng)11JH-|Mt*Pit*Jm%11rrMii1LH-tfT*iifKnpariItl-2J!rKhIPrfflu*3|flNkK対瑰i.H
8、E*flffI1AccmvcycxmprwanforMqurongCKmiMogtw(hsstcoiurir,PvcBo1wwnbiyicixncyinb&ti.ndtobkjmni11na454*MarawelMiy).FramKovni(201Genome1*:R101圖是關(guān)于驗(yàn)證的代表性的例子,直接用測(cè)序數(shù)據(jù)驗(yàn)證測(cè)序平臺(tái)產(chǎn)生的,清楚表明了測(cè)序準(zhǔn)確識(shí)別生物學(xué)變異的能力。(測(cè)序偏好性)以上的討論還僅僅限于那些容易被測(cè)到的序列。事實(shí)上,許多測(cè)序方法由于自身技術(shù)及原理的局限性,對(duì)于某些序列或者極端的堿基組成無(wú)能為力,所以對(duì)于這些區(qū)域,準(zhǔn)確率是。尤其對(duì)于極端或的,高度重復(fù)序列,長(zhǎng)同型核苷酸延伸()
9、等區(qū)域,許多測(cè)序系統(tǒng)完全測(cè)不到或者測(cè)序質(zhì)量不好。同樣,回文序列在這些測(cè)序平臺(tái)中也無(wú)法被測(cè)到,因?yàn)榛匚男蛄性跇颖局苽涞臄U(kuò)增階段就已經(jīng)丟失了6基因組上這些區(qū)域往往缺乏,得到的測(cè)序結(jié)果不完整,導(dǎo)致基因組拼接時(shí)片段化嚴(yán)重,有時(shí)甚至?xí)G失掉以上的基因組,這無(wú)疑妨礙了全面鑒定序列以及對(duì)于完整基因組的構(gòu)建。Figjre4.ValidationofSftPsusingSMRTSequencing.FromPughelai.(2012)Nature4BB:1G6-110*.測(cè)序并不會(huì)表現(xiàn)出這種序列偏好性,在整個(gè)基因組的表現(xiàn)都非常穩(wěn)定,即PataJllurnlna便是那些被認(rèn)為非常難測(cè)的區(qū)域。這一優(yōu)勢(shì)可被用于那些
10、其他測(cè)序平臺(tái)上產(chǎn)生的。一個(gè)極端的例子可以用來(lái)證明測(cè)序的無(wú)偏好性,那就是對(duì)數(shù)千個(gè)堿基組成的含量區(qū)域的測(cè)序:三核苷酸的重復(fù)會(huì)導(dǎo)致綜合征(見(jiàn)圖)。同樣,因?yàn)榧夹g(shù)在樣本制備時(shí)無(wú)需擴(kuò)增,也不會(huì)收到回文序列的影響。y-a-*Bfigute5湖/忙l網(wǎng)theSMRT舸iOGHGC呻蟲柏口co時(shí)自刪FromlocmkiMl.(20U|Gcwn*AfC423121-iJ(測(cè)序的表現(xiàn))即便測(cè)序得到的可以達(dá)到準(zhǔn)確,但是,如果它不能夠被準(zhǔn)確的到參考基因組上,我們?nèi)匀坏貌坏娇捎玫男畔?,或者說(shuō)得到的是帶有誤導(dǎo)性質(zhì)的信息。這也就是為什么長(zhǎng)度可以直接影響測(cè)序的準(zhǔn)確度。如果的長(zhǎng)度不足以跨越基因組上含有至少一個(gè)特有的側(cè)翼序列的重
11、復(fù)區(qū)域,該的位置就不能被明確定義,因而,任何通過(guò)該得到的信息都是不明確的,也就是說(shuō)無(wú)法準(zhǔn)確看出該到底在發(fā)生在基因組的哪個(gè)區(qū)域。這種不正確的會(huì)導(dǎo)致生物學(xué)變異的虛假分配()。圖比較了和與人類基因組上一段重復(fù)區(qū)域的結(jié)果。圖中能看到系統(tǒng)錯(cuò)誤對(duì)于的影響,的由于長(zhǎng)度不夠,出現(xiàn)了很多錯(cuò)誤匹配,從而造成假陽(yáng)性。IPscBloRSRANDOMERRORFigufe6.Th白import白nc巳oflongreadlengthsfaraccuratemapprnginsequencing.AdaptedfromCarneiroetaL(2012)BMCGenomics13:375-3B32,Mismappedre
12、adssamegenomeregioncnbothdatictsSYSTEMATICERROR*41It十祈一FW1則可以避免這種錯(cuò)誤匹配,因?yàn)槠渥x長(zhǎng)長(zhǎng),長(zhǎng)達(dá)上萬(wàn)堿基的可以跨越基因組中重復(fù)區(qū)域并且把這些定位在基因組上正確的位置,從而糾正錯(cuò)誤的分配。生物通結(jié)論正是由于技術(shù)具有以上三大特點(diǎn):()產(chǎn)生的是隨機(jī)誤差而非系統(tǒng)誤差;()沒(méi)有序列的偏好性;()具有足以跨越重復(fù)區(qū)域且避免錯(cuò)誤匹配的長(zhǎng)讀長(zhǎng)。才能生成真正全面且高度精確的測(cè)序結(jié)果。生物通附錄:微小變異檢測(cè)對(duì)于那些關(guān)注同一樣本中低頻率()存在的分子的應(yīng)用,確實(shí)是需要盡可能高的準(zhǔn)確率的,以便能進(jìn)行有效區(qū)分。對(duì)于這些應(yīng)用,也開發(fā)了一種測(cè)序模式,可以在分子
13、內(nèi)進(jìn)行,用這種方式產(chǎn)生的單分子測(cè)序的準(zhǔn)確率與相應(yīng)讀長(zhǎng)下一代和二代測(cè)序的準(zhǔn)確率相當(dāng),甚至是還要高。這是通過(guò)模板制備時(shí)生成的的環(huán)狀結(jié)構(gòu)達(dá)到的8這使得酶在同一個(gè)環(huán)上通過(guò)不斷繞圈,從而可以對(duì)同一個(gè)堿基進(jìn)行多次測(cè)序。生物通測(cè)序是目前唯一可以生成分子內(nèi)的技術(shù),即便對(duì)于樣本中含量很低的分子,也可以得到高精確度的堿基序列。這一能力已經(jīng)被利用于檢測(cè)急性髓性白血病中的低頻突變。列出了上文提到的多分子和單分子模式分別適用的應(yīng)用方向。MuHI-MoleculeConsensusSngle-MaleculaConsensus林imb聞dt)novaRareva-fantdetection8ACtfefiovaassembly*Viralqfjasi-speciesGapcKJsng/scafloldingRareresislancsminatonsStnjctijrac-varialiandetectionRare,relatedtranscriptiscfonmsAmpliconseq
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 課題申報(bào)參考:教育數(shù)字化轉(zhuǎn)型下高校輔導(dǎo)員數(shù)字素養(yǎng)測(cè)評(píng)及提升路徑研究
- 2025年度個(gè)人商鋪長(zhǎng)期租賃合同標(biāo)的物詳細(xì)清單3篇
- 二零二五年度出租房屋消防安全設(shè)施改造施工合同4篇
- 二零二五年度假離婚法律風(fēng)險(xiǎn)評(píng)估及解決方案合同3篇
- 2025年度無(wú)人機(jī)租賃合同協(xié)議書8篇
- 2025版木工預(yù)制構(gòu)件生產(chǎn)與安裝合同范本4篇
- 個(gè)人合同擔(dān)保書(2024年樣本):教育貸款擔(dān)保2篇
- 2025年個(gè)人挖機(jī)租賃合同續(xù)簽協(xié)議4篇
- 2025年度個(gè)人委托醫(yī)療健康產(chǎn)業(yè)投資管理協(xié)議2篇
- 2025年門窗行業(yè)產(chǎn)業(yè)扶貧合作協(xié)議3篇
- 2025水利云播五大員考試題庫(kù)(含答案)
- 老年髖部骨折患者圍術(shù)期下肢深靜脈血栓基礎(chǔ)預(yù)防專家共識(shí)(2024版)解讀
- 中藥飲片驗(yàn)收培訓(xùn)
- 手術(shù)室??谱o(hù)士工作總結(jié)匯報(bào)
- DB34T 1831-2013 油菜收獲與秸稈粉碎機(jī)械化聯(lián)合作業(yè)技術(shù)規(guī)范
- 創(chuàng)傷處理理論知識(shí)考核試題及答案
- 肝素誘導(dǎo)的血小板減少癥培訓(xùn)課件
- 抖音認(rèn)證承諾函
- 高等數(shù)學(xué)(第二版)
- 四合一體系基礎(chǔ)知識(shí)培訓(xùn)課件
- ICD-9-CM-3手術(shù)與操作國(guó)家臨床版亞目表
評(píng)論
0/150
提交評(píng)論