Illumina_、454_、ABI_測序儀比較_第1頁
Illumina_、454_、ABI_測序儀比較_第2頁
Illumina_、454_、ABI_測序儀比較_第3頁
Illumina_、454_、ABI_測序儀比較_第4頁
Illumina_、454_、ABI_測序儀比較_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Illumina、454、ABI測序儀比較Illumina測序儀Illumina公司的新一代測序儀GenomeAnalyzer最早由Solexa公司研發(fā),利用其專利核心技術DNA簇和可逆性末端終結(jié)(reversibleterminator),實現(xiàn)自動化樣本制備及基因組數(shù)百萬個堿基大規(guī)模平行測序。川umina公司于2007年花費6億美金的巨資收購了Solexa,就是為了促成GenomeAnalyzer的商品化。GenomeAnalyzer作為新一代測序技術平臺,具有高準確性,高通量,高靈敏度,和低運行成本等突出優(yōu)勢,可以同時完成傳統(tǒng)基因組學研究(測序和注釋)以及功能基因組學(基因表達及調(diào)控,基因

2、功能,蛋白/核酸相互作用)研究。GenomeAnalyzer自上市以來,已經(jīng)為千人基因組計劃立下了赫赫戰(zhàn)功。今年早期,荷蘭科學家利用它首次繪出女性的基因組圖譜。而就在前兩周,Nature雜志上一連出現(xiàn)三個人類基因組圖譜:炎黃一號-第一個亞洲人圖譜;第一個癌癥病人圖譜;第一個非洲人圖譜。它們?nèi)且蕾嘒enomeAnalyzer完成的。嘩,一下就來仨!這和第一個人類基因組圖譜的13年形成了多么鮮明的對照。根據(jù)去年底的數(shù)據(jù),GenomeAnalyzer已售出約200臺,估計是市場占有率最廣的。前不久,華大基因再添置了12臺,準備放在香港和深圳的實驗室,至此華大基因已經(jīng)有29臺GenomeAnalyz

3、er。而著名的麻省理工學院和哈佛大學Broad研究院擁有47臺Illumina測序儀。眾多實驗室之所以選擇Illumina,看中的無疑是GenomeAnalyzer的高性價比。上個月,Illumina將GenomeAnalyzerII升級到GenomeAnalyzerllx,距年底實現(xiàn)單次運行獲得95GB數(shù)據(jù)的宏偉目標又近了-步。GenomeAnalyzerIIx有兩個核心特征:其一是更大的試劑冷卻器,支持超過100個測序循環(huán),進一步提升了系統(tǒng)的易用性和自動化;其二是全新的流動池支架,讓每輪運行所得的高質(zhì)量數(shù)據(jù)增加20%。依靠系統(tǒng)軟件和試劑的改進,GenomeAnalyzerIIx現(xiàn)在能夠支持

4、100bp以上的配對末端讀長,并在每次運行中產(chǎn)生超過20GB的高質(zhì)量數(shù)據(jù)。GenomeAnalyzer技術的基本原理:文庫制備將基因組DNA打成幾百個堿基(或更短)的小片段,在片段的兩個末端加上接頭(adapter)。產(chǎn)生DNA簇利用專利的芯片,其表面連接有一層單鏈引物,DNA片段變成單鏈后通過與芯片表面的引物堿基互補被一端“固定在芯片上。另外一端(5或3)隨機和附近的另外一個引物互補,也被“固定住,形成“橋(bridge)“。反復30輪擴增,每個單分子得到了1000倍擴增,成為單克隆DNA簇。DNA簇產(chǎn)生之后,擴增子被線性化,測序引物隨后雜交在目標區(qū)域一側(cè)的通用序列上。3.測序(:Genom

5、eAnalyzer系統(tǒng)應用了邊合成邊測序(SequencingBySynthesis)的原理。加入改造過的DNA聚合酶和帶有4種熒光標記的dNTP。這些核苷酸是“可逆終止子”,因為3羥基末端帶有可化學切割的部分,它只容許每個循環(huán)摻入單個堿基。此時,用激光掃描反應板表面,讀取每條模板序列第一輪反應所聚合上去的核苷酸種類。之后,將這些基團化學切割,恢復3端粘性,繼續(xù)聚合第二個核苷酸。如此繼續(xù)下去,直到每條模板序列都完全被聚合為雙鏈。這樣,統(tǒng)計每輪收集到的熒光信號結(jié)果,就可以得知每個模板DNA片段的序列。目前的配對末端讀長可達到2x50bp,更長的讀長也能實現(xiàn),但錯誤率會增高。讀長會受到多個引起信號

6、衰減的因素所影響,如熒光標記的不完全切割。Fll-dATP-(blocker)+FL2-dGTP-(blocker)+FL-dCTP-(blocker)+FU-dTTP-jblocker)FlitOfescenGeiEasingi沽fourchannelsChemicleavelabelsand,二;natr.n:n.;-l-wweW4.數(shù)據(jù)分析自動讀取堿基,數(shù)據(jù)被轉(zhuǎn)移到自動分析通道進行二次分析。GenomeAnalyzer系統(tǒng)之所以如此暢銷,關鍵在于其技術上的優(yōu)勢??蓴U展的超高通量GenomeAnalyzer系統(tǒng)目前每次運行后可獲得超過20GB的高品質(zhì)過濾數(shù)據(jù)。這個技術的可擴展性保證了更高的

7、數(shù)據(jù)密度和輸出,能用更少的經(jīng)費完成更復雜的項目。到今年底,通量還有望上升到95GB,相當于人類基因組的30倍覆蓋度。需要樣品量少GenomeAnalyzer系統(tǒng)需要的樣品量低至100ng,能應用在很多樣品有限的實驗(比如免疫沉淀、顯微切割等)中。這也是很多研究人員所考慮的因素。簡單、快速、自動化GenomeAnalyzer系統(tǒng)提供了最簡單和簡潔的工作流程。即使是最小的實驗室也能像大型基因組中心一樣進行大規(guī)模的實驗。制備樣品文庫可以在幾小時內(nèi)完成,一個星期內(nèi)就能得到高精確度的數(shù)據(jù).ClusterStation可以說是GenomeAnalyzer的核心。由獨立軟件控制的自動生成DNA簇的過程可以在

8、5小時之內(nèi)(30分鐘手工操作)完成。這個自動化的流程不需要進行EmulsionPCR,減少了手工操作誤差和污染可能性,也不需要機器人操作或潔凈室。快速的實驗流程使GenomeAnalyzer的能力增至最大,而自動化步移降低了項目的時間和費用。新穎的測序化學技術GenomeAnalyzer通過合成測序來支持大規(guī)模并行測序。利用新穎的可逆熒光標記終止子,可以在DNA鏈延伸的過程中檢測單個堿基摻入。由于四個可逆終止子dNTP在每個測序循環(huán)都存在,自然的競爭減少了摻入的誤差。單個或配對末端支持GenomeAnalyzer系統(tǒng)支持單個片段或配對末端文庫。文庫構建過程簡單,減少了樣品分離和制備的時間。制備

9、基因組DNA的單個片段或配對末端文庫需要6個小時,只有3個小時需要手工操作。2x50個堿基或更長的讀長增加了比對基因組的能力,并拓展了在其他方面的應用。然而,精明的用戶更看重的是性價比,這也是他們選擇Illumina的重要原因。lllumina的售價約為45萬美元,低于454GSFLX的50萬和SOLiD系統(tǒng)的59萬(以上皆為美國的售價)。此外,運行成本也是一個關鍵因素。美國鳳凰城翻譯基因組學研究院(TGen)的主管DavidDuggan曾表示,當年購買新一代測序儀時,每次運行的費用就成為他下決定的主要因素。他最終選擇了MuminaGenomeAnalyzer,因為每輪的運行費用為3000-4

10、000美元(2007年的數(shù)據(jù)),較為合理,而其他測序儀可能更高。當然,他也綜合考慮了通量、運行時間和樣品量。弗吉尼亞聯(lián)邦大學的高原(音譯)博士認為:“GenomeAnalyzer的操作費用、易用性和可擴展性讓我實現(xiàn)了大規(guī)?;蚪M實驗。現(xiàn)在,我的小型實驗室正在進行過去只能在大型基因組中心才能完成的實驗。低樣品需求、簡單的流程、高質(zhì)量的數(shù)據(jù)以及應用靈活性讓IlluminaGenomeAnalyzer從其他高通量測序技術中脫穎而出?!盧OCH-454測序儀454公司可謂新一代測序技術的奠基人。2005年底,454公司推出了革命性的基于焦磷酸測序法的超高通量基因組測序系統(tǒng)GenomeSequencer

11、20System,被Nature雜志以里程碑事件報道,開創(chuàng)了邊合成邊測序(sequencing-by-synthesis)的先河。之后,454公司被羅氏診斷公司以1.55億美元收購。一年后,他們又推出了性能更優(yōu)的第二代基因組測序系統(tǒng)GenomeSequencerFLXSystem(GSFLX)。去年10月,全新的GSFLXTitanium系列試劑和軟件的補充,讓GSFLX的通量一下子提高了5倍,準確性、讀長也進一步提升。想當年,GS20的出現(xiàn),揭開了測序歷史上嶄新的一頁。JonathanRothberg博士就是大規(guī)模并行測序的發(fā)明者,同時也是454的創(chuàng)始人。上世紀90年代,很多學者也都想到了大

12、規(guī)模并行測序,他們試圖將Sanger測序移到芯片上,但都以失敗告終,因為這項技術沒有可擴展性。1999年,Rothberg的兒子出世,他放了兩個星期的陪產(chǎn)假。小家伙出生后被送入嬰兒特護病房,Rothberg非常擔心,甚至想獲取兒子的基因組信息。這段擔驚受怕的經(jīng)歷給了他靈感,他突然意識到焦磷酸測序(pyrosequencing)不僅簡單,而且具有可擴展性。兩個星期之后,Rothberg就開始設計芯片和流動室,讓測序在更小的反應室中進行,并同時進行幾百萬個反應。硬件的設計和制造也只是成功的一半,在樣品制備上還有同樣漫長的路要走。Rothberg摒棄了傳統(tǒng)的細菌克隆與挑選,將DNA打斷成隨機片段,并

13、尋找一種方法來克隆每個片段。受到其他學者乳液實驗的啟發(fā),他也想將DNA放入油包水的乳液中,這樣就省去了反應管。一個好漢三個幫。在JoelBader等人的幫助下,Rothberg驗證了這些想法的可行性,并利用了炸藥中的表面活性劑來維持乳液的熱穩(wěn)定性。就這樣,乳液PCR終于誕生了。之后,454生命科學公司用新一代測序儀對DNA雙螺旋結(jié)構的發(fā)明者JamesWatson進行了基因組測序。第一份個人基因組圖譜的繪制只用了兩年時間,花費不到100萬美元。雖然現(xiàn)在看來這并不算什么,但就當時而言,它相對于人類基因組計劃已是質(zhì)的飛躍。GSFLX系統(tǒng)的工作流程GSFLX系統(tǒng)的流程概括起來,就是一個片段=一個磁珠=

14、一條讀長(Onefragment=Onebead=Oneread)”。1)樣品輸入并片段化:GSFLX系統(tǒng)支持各種不同來源的樣品,包括基因組DNA、PCR產(chǎn)物、BAC、cDNA、小分子RNA等等。大的樣品例如基因組DNA或者BAC等被打斷成300-800bp的片段;對于小分子的非編碼RNA或者PCR擴增產(chǎn)物,這一步則不需要。短的PCR產(chǎn)物則可以直接跳到步驟3)。2)文庫制備:借助一系列標準的分子生物學技術,將A和B接頭(3和5端具有特異性)連接到DNA片段上。接頭也將用于后續(xù)的純化,擴增和測序步驟。具有A、B接頭的單鏈DNA片段組成了樣品文庫。3)一個DNA片段=一個磁珠:單鏈DNA文庫被固定

15、在特別設計的DNA捕獲磁珠上。每一個磁珠攜帶了一個獨特的單鏈DNA片段。磁珠結(jié)合的文庫被擴增試劑乳化,形成油包水的混合物,這樣就形成了只包含一個磁珠和一個獨特片段的微反應器。4)乳液PCR擴增:每個獨特的片段在自己的微反應器里進行獨立的擴增,而沒有其他的競爭性或者污染性序列的影響。整個片段文庫的擴增平行進行。對于每一個片段而言,擴增后產(chǎn)生了幾百萬個相同的拷貝。隨后,乳液混合物被打破,擴增的片段仍然結(jié)合在磁珠上。5)個磁珠=一條讀長:攜帶DNA的捕獲磁珠隨后放入PTP板中進行后繼的測序。PTP孔的直徑(29um)只能容納一個磁珠(20um)。然后將PTP板放置在GSFLX中,測序開始。放置在四個

16、單獨的試劑瓶里的四種堿基,依照T、A、C、G的順序依次循環(huán)進入PTP板,每次只進入一個堿基。如果發(fā)生堿基配對,就會釋放一個焦磷酸。這個焦磷酸在ATP硫酸化酶和螢光素酶的作用下,經(jīng)過一個合成反應和一個化學發(fā)光反應,最終將螢光素氧化成氧化螢光素,同時釋放出光信號。此反應釋放出的光信號實時被儀器配置的高靈敏度CCD捕獲到。有一個堿基和測序模板進行配對,就會捕獲到一分子的光信號;由此一一對應,就可以準確、快速地確定待測模板的堿基序列。這也就是大名鼎鼎的焦磷酸測序。6)數(shù)據(jù)分析:GSFLX系統(tǒng)在10小時的運行當中可獲得100多萬個讀長,讀取超過4-6億個堿基信息。GSFLX系統(tǒng)提供兩種不同的生物信息學工

17、具對測序數(shù)據(jù)進行分析,適用于不同的應用:達400MB的從頭拼接和任何大小基因組的重測序。GSFLX系統(tǒng)的準確率在99%以上。其主要限制來自同聚物,也就是相同堿基的連續(xù)摻入,如AAA或GGG。由于沒有終止元件來阻止單個循環(huán)的連續(xù)摻入,同聚物的長度就需要從信號強度中推斷出來。這個過程就可能產(chǎn)生誤差。因此,454測序平臺的主要錯誤類型是插入-缺失,而不是替換。新升級讓性能全面提升去年底發(fā)布的Titanium系列試劑,是對現(xiàn)有GSFLX平臺的重要升級。升級內(nèi)容包含耗材、試劑和軟件。你無需對儀器的硬件做任何昂貴的升級,只改進試劑和軟件,就能立刻實現(xiàn)性能提升。升級之后,每輪測序能產(chǎn)生100萬個讀長片段,高

18、質(zhì)量(Q20)的讀長增加至400bp。第400個堿基的準確率是99%,之前的更高。通量也提高了5倍,目前每輪運行能獲得4-6億個堿基對,所需時間為10小時。PTP平板的創(chuàng)新重設計重新設計之后,PTP平板上孔的密度更高,利用更小的DNA捕獲磁珠進行金屬覆蓋,改善了信號質(zhì)量,因此讀長的數(shù)量和長度都明顯改善,同時準確性更高。目前孔的直徑是29um,DNA捕獲磁珠的大小是20um。改進的測序試劑改進的GSFLXTitanium試劑顯著降低了背景噪音,因此在幾乎相同的運行時間內(nèi),讀長更加長。升級的軟件優(yōu)化用于超高通量測序的軟件,能輕松對更大、更復雜的基因組進行拼接和作圖。GSFLX2.0版它與以前版本的

19、輸出數(shù)據(jù)也完全兼容,讓片段能夠共同拼接和作圖。廣闊的應用天地在新一代測序技術中,GS系統(tǒng)是最多產(chǎn)的。截至2008年9月,已經(jīng)發(fā)表了250多篇高質(zhì)量的paper。其中Nature20篇、Scienee13篇、Cell6篇、GenomeResearch20篇、PNAS24篇。光是這些數(shù)據(jù)就讓人咂舌。這些研究跨越了測序應用的多個方面:82篇全基因組測序論文包括比較基因組學的從頭測序和重測序;54篇小分子RNA研究;37篇聚焦快速興起的宏基因組學;27篇關于轉(zhuǎn)錄組圖譜分析,包括全轉(zhuǎn)錄組拼接和表達圖譜;13篇研究染色體結(jié)構和表觀遺傳學;10篇有關稀有變異檢測的超深度測序這個新領域;11篇研究古老RNA。

20、其余的文章關注454測序系統(tǒng)的技術和生物信息學。多種多樣的應用彰顯出454測序系統(tǒng)的能力,那些傳統(tǒng)意義上無法用測序來解決的問題現(xiàn)在也一并解決了。454測序系統(tǒng)除了為多項研究領域開辟了基因組分析之路,同時也加速了探索的步伐。一般來說,研究、分析、撰寫并提交論文,經(jīng)同行評議后發(fā)表,需要一年左右的時間。而利用GenomeSequencer系統(tǒng)發(fā)表論文的速度,顯然表明454測序結(jié)果的數(shù)據(jù)質(zhì)量高,且分析簡單。超長讀長與易用的分析工具相結(jié)合,讓研究人員能更集中精力于科學研究,而不是研究測序過程中的某個技術細節(jié)。這樣研究項目能快速完成,接著踏上新的研究道路。與其他新一代測序平臺相比,454平臺的突出優(yōu)勢是讀

21、長。目前GSFLX系統(tǒng)的序列讀長已超過400bp。雖然454平臺的測序成本比其他平臺要高很多,不過對于那些需要長讀長的應用,如從頭拼接和宏基因組學,它仍是最理想的選擇。去年底,美國加利福尼亞大學的研究小組利用全新的GSFLXTitanium系列試劑對海洋樣品的宏基因組進行測序,發(fā)現(xiàn)了一種全新的藍藻物種,文章發(fā)表在11月14日的Scienee雜志上。這項研究是系統(tǒng)升級后發(fā)表的首篇文章。首席研究員JonathanZehr對于獲得數(shù)據(jù)及分析結(jié)果的速度非常震驚。他表示:“多年來我們一直試圖培養(yǎng)這種微生物,但都沒有成功。有了GSFLXTitanium,我們在幾天之內(nèi)就通過單次測序運行,從環(huán)境樣品直接獲得

22、了寶貴的基因組信息。這個系統(tǒng)超長的讀長對于我們從復雜的微生物群體中鑒定并分析這種獨特的細菌基因組來說非常關鍵?!弊罱?,在454測序平臺的協(xié)助下,研究人員完成了油棕櫚的全基因組測序、拼接和注釋。油棕櫚是一種重要的經(jīng)濟作物,它的基因組很大,達17GB?;蚪M的測序工作是由GSFLXTitanium系統(tǒng)完成的,拼接和分析則是由馬來西亞一家生物信息學公司完成的。值得注意的是,這是史上第一次在沒有添加傳統(tǒng)Sanger測序數(shù)據(jù)的情況下,完成了對大且非常復雜的植物基因組進行從頭拼接。這種快速經(jīng)濟的方法為了解多種經(jīng)濟作物的遺傳結(jié)構打開了大門。此外,羅氏旗下的另一家公司NimbleGen正在全球性地捕獲定向重測

23、序市場。NimbleGen序列捕獲芯片與454的測序儀結(jié)合,能讓完整的人外顯組測序成為現(xiàn)實,最終將為研究流水線輸送技術,并促進個性化醫(yī)療的開發(fā).ABI測序儀過去20年,美國應用生物系統(tǒng)公司(ABI)在測序方面一直占據(jù)著壟斷地位。自公司的共同創(chuàng)始人LeroyHood在上世紀80年代中期設計了第一臺自動熒光測序儀之后,生命科學研究就擺脫了手工測序的繁瑣和辛勞,驕傲地邁入自動測序的新時代。直到2005年,454推出了FLX焦磷酸測序平臺,ABI的領先地位開始有些動搖。之后,ABI迅速收購了一家測序公司AgencourtPersonalGenomics,并在2007年底推出了SOLiD新一代測序平臺。

24、從SOLiD到如今的SOLiD3,短短一年多時間,它已經(jīng)上演了一出精彩的“一級方程式賽車”。SOLiD全稱為supportedoligoligationdetetion,它的獨特之處在于以四色熒光標記寡核苷酸的連續(xù)連接合成為基礎,取代了傳統(tǒng)的聚合酶連接反應,可對單拷貝DNA片段進行大規(guī)模擴增和高通量并行測序。就通量而言,SOLiD3系統(tǒng)是革命性的,目前SOLiD3單次運行可產(chǎn)生50GB的序列數(shù)據(jù),相當于17倍人類基因組覆蓋度。而其無以倫比的準確性、系統(tǒng)可靠性和可擴展性更讓它從其他新一代測序平臺中脫穎而出。為什么SOLiD能輕松實現(xiàn)貌似不可能的任務?讓生物通帶你從測序原理入手,一探究竟。SOLi

25、D工作流程a.文庫制備SOLiD系統(tǒng)能支持兩種測序模板:片段文庫(fragmentlibrary)或配對末端文庫(mate-pairedlibrary)。使用哪一種文庫取決于你的應用及需要的信息。片段文庫就是將基因組DNA打斷,兩頭加上接頭,制成文庫。如果你想要做轉(zhuǎn)錄組測序、RNA定量、miRNA探索、重測序、3,5-RACE、甲基化分析、ChIP測序等,就可以用它。如果你的應用是全基因組測序、SNP分析、結(jié)構重排/拷貝數(shù),則需要用配對末端文庫。配對末端文庫是將基因組DNA打斷后,與中間接頭連接,再環(huán)化,然后用EcoP15酶切,使中間接頭兩端各有27bp的堿基,再加上兩端的接頭,形成文庫。b.

26、乳液PCR/微珠富集在微反應器中加入測序模板、PCR反應元件、微珠和引物,進行乳液PCR(EmulsionPCR)。PCR完成之后,變性模板,富集帶有延伸模板的微珠,去除多余的微珠。微珠上的模板經(jīng)過3修飾,可以與玻片共價結(jié)合??吹竭@里,是不是有一種似曾相識的感覺呢?那就對了,此步驟與454的GSFLX基本相同。不過SOLiD系統(tǒng)的微珠要小得多,只有1um。乳液PCR最大的特點是可以形成數(shù)目龐大的獨立反應空間以進行DNA擴增。其關鍵技術是“注水到油”,基本過程是在PCR反應前,將包含PCR所有反應成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構成了

27、獨立的PCR反應空間。理想狀態(tài)下,每個小水滴只含一個DNA模板和一個P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介導的PCR反應,這個DNA模板的拷貝數(shù)量呈指數(shù)級增加,PCR反應結(jié)束后,P1磁珠表面就固定有拷貝數(shù)目巨大的同來源DNA模板擴增產(chǎn)物。微珠沉積3修飾的微珠沉積在一塊玻片上。在微珠上樣的過程中,沉積小室將每張玻片分成1個、4個或8個測序區(qū)域。SOLiD系統(tǒng)最大的優(yōu)點就是每張玻片能容納更高密度的微珠,在同一系統(tǒng)中輕松實現(xiàn)更高的通量。連接測序這一步可就是SOLiD的獨門秘笈了。它的獨特之處在于沒有采用慣常的聚合酶,而用了連接酶。SOLiD連接反應的底物是8堿基單鏈熒光探針混合物。連

28、接反應中,這些探針按照堿基互補規(guī)則與單鏈DNA模板鏈配對。探針的5末端分別標記了CY5、TexasRed、CY3、6-FAM這4種顏色的熒光染料。探針3端15位為隨機堿基,可以是ATCG四種堿基中的任何一種堿基,其中第1、2位構成的堿基對是表征探針染料類型的編碼區(qū),下圖的雙堿基編碼矩陣規(guī)定了該編碼區(qū)16種堿基對和4種探針顏色的對應關系,而35位的“n”表示隨機堿基,68位的“z”指的是可以和任何堿基配對的特殊堿基。Aij匚G1?cuta HYPERLINK http:/www.e www.eVbtF單向SOLiD測序包括五輪測序反應,每輪測序反應含有多次連接反應。第一輪測序的第一次連接反應由連

29、接引物“n”介導,由于每個磁珠只含有均質(zhì)單鏈DNA模板,所以這次連接反應摻入一種8堿基熒光探針,SOLiD測序儀記錄下探針第1、2位編碼區(qū)顏色信息,隨后的化學處理斷裂探針3端第5、6位堿基間的化學鍵,并除去68位堿基及5末端熒光基團,暴露探針第5位堿基5磷酸,為下一次連接反應作準備。因為第一次連接反應使合成鏈多了5個堿基,所以第二次連接反應得到模板上第6、7位堿基序列的顏色信息,而第三次連接反應得到的是第11、12位堿基序列的顏色信息I110earf.yjiwmmiimiiimiiiiimiiimm丁AxfapnerSBCbEFKeTemolaeSEquencePtimgr+Head&閉詡詩S

30、tuswesdllLI丄山丄I丄II1丄1111丄【丄111lempbiaSequence1II1SllillirilHIlillllllllllllll帥勰Sc訕關館BemH5ItmpkiieScuuuiireJF.生物通 HYPERLINK http:/www.e www.ePrrnar幾個循環(huán)之后,引物重置,開始第二輪的測序。由于第二輪連接引物n-1比第一輪錯開一位,所以第二輪得到以0,1位起始的若干堿基對的顏色信息。五輪測序反應反應后,按照第0、1位,第1、2位.的順序把對應于模板序列的顏色信息連起來,就得到由“0,1,2,3”組成的SOLiD原始顏色序列。it142125;1 HYP

31、ERLINK http:/www.ewiol www.ewiol*pQ5iCk*i5-Ofmt#ncyartj&nLHpikmCydfl耳UrriHH創(chuàng)seqprim曰(n-4R陽dPosition同1國可屮鬧7SUnfursalprimestnjl|LIjnvmwnnnmvTLLi叫占LMpilLlMhjll吐gifT,卜,UniyefHlgeqprimer(n-21UnivftrsBIsqprimerrn-3/|r一soe.數(shù)據(jù)分析SOLiD測序完成后,獲得了由顏色編碼組成的SOLiD原始序列。理論上來說,按照雙堿基編碼矩陣”,只要知道所測DNA序列中任何一個位置的堿基類型,就可以將SOL

32、iD原始顏色序列“解碼”成堿基序列。但由于雙堿基編碼規(guī)則中雙堿基與顏色信息的簡并特性(一種顏色對應4種堿基對),前面堿基的顏色編碼直接影響緊跟其后堿基的解碼,所以一個錯誤顏色編碼就會引起“連鎖解碼錯誤”,改變錯誤顏色編碼之后的所有堿基。和其它所有測序儀一樣,測序錯誤在所難免,關鍵是對測序錯誤的評價和后續(xù)處理。由于SOLiD系統(tǒng)采用了雙堿基編碼技術,在測序過程中對每個堿基判讀兩遍,從而減少原始數(shù)據(jù)錯誤,提供內(nèi)在的校對功能。這樣,雙保險確保了SOLiD系統(tǒng)原始堿基數(shù)據(jù)的準確度大于99.94%,而在15X覆蓋率時的準確度可以達到99.999%,是目前新一代基因分析技術中準確度最高的。為避免“連鎖解碼

33、錯誤”的發(fā)生,SOLiD數(shù)據(jù)分析軟件不直接將SOLiD原始顏色序列解碼成堿基序列,而是依靠reference序列進行后續(xù)數(shù)據(jù)分析。SOLiD序列分析軟件首先根據(jù)“雙堿基編碼矩陣把reference堿基序列轉(zhuǎn)換成顏色編碼序列,然后與SOLiD原始顏色序列進行比較,來獲得SOLiD原始顏色序列在reference的位置,及兩者的匹配性信息。Reference轉(zhuǎn)換而成的顏色編碼序列和SOLiD原始序列的不完全匹配主要有兩種情況:“單顏色不匹配”和“兩連續(xù)顏色不匹配”。由于每個堿基都被獨立地檢測兩次,且SNP位點將改變連續(xù)的兩個顏色編碼,所以一般情況下SOLiD將單顏色不匹配處理成測序錯誤,這樣一來,

34、SOLiD分析軟件就完成了該測序錯誤的自動校正;而連續(xù)兩顏色不匹配也可能是連續(xù)的兩次測序錯誤,SOLiD分析軟件將綜合考慮該位置顏色序列的一致性及質(zhì)量值來判斷該位點是否為SNP。在初步了解了SOLiD系統(tǒng)的工作原理之后,我們才能明白它的魅力所在。系統(tǒng)可擴展性SOLiD系統(tǒng)采用開放玻片式的結(jié)構,使用包被DNA樣品的微珠來輸入基因組信息。微珠密度并不是一成不變的,系統(tǒng)支持更高密度的微珠富集。開放式玻片形式、微珠富集、以及軟件算法的結(jié)合,能使平臺輕松升級到更高的通量,而無需對基礎技術和配置做重大改變。這也是SOLiD系統(tǒng)平均每季度將通量擴大一倍的原因所在。無以倫比的通量目前SOLiD3系統(tǒng)單次運行能

35、產(chǎn)生50GB的人基因組序列數(shù)據(jù),相當于基因組的17倍覆蓋度,這顯然是其他任一臺新一代測序系統(tǒng)都無法達到的。今年初,ABI公司和貝勒醫(yī)學院人類基因組測序中心(HGSC)的科學家總結(jié)了他們在千人基因組計劃首次數(shù)據(jù)發(fā)布中的貢獻。作為商業(yè)參與者以及與HGSC共同協(xié)作,ABI公司利用SOLiD系統(tǒng)產(chǎn)生了超過460GB可作圖的序列數(shù)據(jù),比這兩個機構的預定目標高出了65%。而通量的升高也有望進一步降低基因組測序的費用,成本只需1萬美元的人類基因組測序指日可待。最大的靈活性SOLiD3系統(tǒng)具有兩個獨立的流動室,讓用戶能在一臺SOLiD分析儀中運行兩個完全獨立的實驗一一同時提供兩套儀器。玻片也能分成1個、4個或

36、8個小室。而20個條形碼序列則提供了額外的靈活性,顯著增加了定向重測序、表達和ChIP分析的經(jīng)濟性。目前最多能同時運行320個樣品(2x8x20)。至此,SOLiD系統(tǒng)已不再是一臺單純的測序儀,而是成為功能更全面的基因分析儀。除了測序和重測序,還能進行全基因表達圖譜分析、SNP、microRNA、ChIP、甲基化等多種分析。全基因表達圖譜分析芯片大概是目前應用最廣泛的從全局角度分析基因表達整體模式的方法。然而,基于雜交技術的微陣列技術只限用于已知序列,無法檢測新的mRNA;而且雜交技術靈敏度有限,難以檢測低豐度的目標(需要更多的樣品量),難以檢測重復序列;也無法捕捉到目的基因表達水平的微小變化而這恰恰是研究在刺激下或環(huán)境變化時的生物反應所必需的。與芯片技術相比,基于測序的高靈敏SOLiD技術可對單個細胞和癌癥樣品中存在的痕量RNA進行整體的全基因組表達圖譜分析,每次運行能定位高達2億4千萬個標簽(mRNA的相對表達水平可通過系統(tǒng)產(chǎn)生的序列標簽數(shù)目來計算),可檢測低至每個細胞中10-40pg的總RNA,即使mRNA表達水平很低,SOLiD系統(tǒng)也能夠無偏向性地分析樣品中存在的已知和未

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論