DNA存儲技術(shù)解讀_第1頁
DNA存儲技術(shù)解讀_第2頁
DNA存儲技術(shù)解讀_第3頁
DNA存儲技術(shù)解讀_第4頁
DNA存儲技術(shù)解讀_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 解密 DNA存儲技術(shù)究竟牛在哪里? 針對未來存儲密度市場,前期在文章“50TB ExaDrive SSD投入商用”和“HP憶阻器內(nèi)存和IBM原子磁盤”中,分別介紹了大容量SSD、憶阻SCM和原子存儲技術(shù),但今天給大家普及的是另外一種前衛(wèi)技術(shù)DNA存儲技。 DNA存儲則能提供極大密度,是未來大容量存儲較理想的介質(zhì),也是下一代冷存儲的替代品。從原理上來講,DNA存儲是通過DNA中G、T、A和C 4種堿基代表二進(jìn)制數(shù)據(jù)(0、1、2和3),理論上1克DNA可存455EB數(shù)據(jù)。DNA存儲的讀取技術(shù)則是采用DNA測序技術(shù)實(shí)現(xiàn),DNA測序技術(shù)發(fā)展迅速,性能每次可達(dá)960Gb,成本也很低,性價比已經(jīng)接近商用

2、;目前的難題在于DNA存儲的寫性能,當(dāng)前寫性能每天只能達(dá)到Mb量級,極高寫成本使得離商用還有很長的路要走。 由于DNA存儲還有很多技術(shù)難題需要攻克,DNA存儲目前還是原型概念驗(yàn)證階段,主要是學(xué)術(shù)研究機(jī)構(gòu)在從事,至少還需要5年時間才可能有DNA存儲商業(yè)產(chǎn)品應(yīng)用,但從長期投入來看,微軟等廠商覺得是很有投入價值的,這很可能是未來存儲介質(zhì)市場的切入點(diǎn),DNA芯片技術(shù)、芯片電路設(shè)計(jì)和測序合成技術(shù)結(jié)合將可能是繼原子存儲、SCM介質(zhì)之后的下一個存儲技術(shù)熱點(diǎn)。 DNA存儲是將二進(jìn)制文件通過編碼映射成DNA里A、T、G和C堿基序列,按序列順序通過人工合成技術(shù)形成長鏈DNA來保存數(shù)據(jù)的方法成為DNA存儲技術(shù),數(shù)據(jù)

3、寫入即人工合成DNA,數(shù)據(jù)讀取即DNA測序,數(shù)據(jù)拷貝即DNA復(fù)制,利用DNA中堿基序列編碼存儲二進(jìn)制數(shù)據(jù)具體實(shí)例如下所示。 DNA存儲從架構(gòu)上講,主要包括類似于存儲控制器的編解碼器、數(shù)據(jù)讀取寫入設(shè)備和數(shù)據(jù)存儲設(shè)備,從技術(shù)成熟度上講,DNA技術(shù)可以支持開發(fā)DNA存儲原型,但在成本和自動化等方面還面臨技術(shù)的挑戰(zhàn)。編解碼器(存儲控制器)完成二進(jìn)制轉(zhuǎn)換為DNA堿基序列(堿基對A,T,G和C可對應(yīng)0,1,2和3),對誤碼進(jìn)行誤碼糾正、文件索引的方法對效率影響大。寫入設(shè)備(寫磁頭)通過DNA合成含有A、T、G和C的DNA數(shù)據(jù)鏈保存數(shù)據(jù),人工合成DNA。當(dāng)前DNA合成技術(shù)已經(jīng)可以按程序任意組合在DNA鏈條上

4、加入堿基,使得DNA寫入成為可能。存放設(shè)備(磁盤柜)實(shí)現(xiàn)DNA存放,單個細(xì)胞核23對染色體含30億對堿基可存12Gb數(shù)據(jù),1克DNA可存儲EB級數(shù)據(jù)。讀取設(shè)備(讀磁頭)實(shí)現(xiàn)DNA存儲的讀取,基于DNA測序(Sequencing)技術(shù),目前最常用的測序方法是桑格測序法(Sangar)。 Sanger測序的原理是將測序DNA進(jìn)行大量復(fù)制(PCR),將DNA分裝不同試管中,分別加入有剪切作用的染過色的雙脫氧核苷酸ddNTP,反復(fù)PCR循環(huán)讓DNA復(fù)制,當(dāng)遇到ddNTP復(fù)制斷裂,形成長短不一的DNA單鏈,加電出現(xiàn)電泳現(xiàn)象,短鏈DNA游速快,長鏈游速慢,形成長短排序,激光照相,形成排序光譜。 DNA存儲

5、優(yōu)勢是顯然意見的,密度理論上1克DNA可存儲455EB數(shù)據(jù)量,DNA存儲時間也很長,在干冷條件下,可保持100萬年以上,常溫下可保持2000年以上,常溫保存能耗很低,基本不需要電力。但是技術(shù)挑戰(zhàn)也與之并存,存儲密度受到編碼效率、備份數(shù)量、分類索引等方面的制約,通常比理論密度低。 DNA存儲編糾錯挑戰(zhàn):編碼糾錯的原則是避免重復(fù),重復(fù)導(dǎo)致讀錯概率大,最常用的方法是加入驗(yàn)證信息。在解決誤碼問題上,微軟采用了三進(jìn)制編碼原理,在4個堿基中,其中一個堿基用作前一位指示,后三位用作0,1,2編碼。 DNA存儲編索引挑戰(zhàn):目前比較流行的一種DNA存儲索引方法叫KV方式,針對文件,以Key-Value的方法形成

6、Key值,將Key值形成文件頭DNA索引和地址,再將文件內(nèi)容和索引合成DNA。 DNA存儲寫入合成挑戰(zhàn):DNA合成過程是控制4種堿基分別加入DNA合成片段中,將片段鏈接合成較大的片段的過程。DNA合成依然較困難,小片段合成可以在實(shí)驗(yàn)室,但是大規(guī)模合成需要專門基因合成服務(wù)公司才能完成(如GeneArt,Twist Biosicence)。 DNA存儲拷貝技術(shù):DNA復(fù)制通常采用成熟的PCR方法,該方法在1983年發(fā)明。大致過程是先將DNA雙鏈加熱分開,加入聚合酶、DNA引物和堿基,DNA單鏈開始產(chǎn)生雙鏈實(shí)現(xiàn)DNA的復(fù)制。 關(guān)于DNA存儲的技術(shù)研究和應(yīng)用前景十分廣闊,當(dāng)前主流方向聚焦在密度、保存時

7、間、低能耗等優(yōu)點(diǎn),DNA存儲的存取技術(shù)(合成和測序技術(shù))得到了快速發(fā)展,如果能很好地解決成本性能問題,那么在未來,會極大限度加速DNA存儲取代現(xiàn)有存儲的可能性和進(jìn)程。 DNA存儲在歸檔場景具備占地小、能耗低、密度大的特點(diǎn),美國國家圖書館、維基百科、Google有意愿將資料備份在DNA存儲上;在軍事用途應(yīng)用中,可以通過人體攜帶DNA數(shù)據(jù),有了DNA存儲技術(shù),我們?nèi)梭w就是“云硬盤”。在個人應(yīng)用中,未來個人可以隨身攜帶超大容量的DNA USB數(shù)據(jù)盤。 但歸根結(jié)底,DNA存儲商用很大程度依賴DNA合成技術(shù)和測序技術(shù)的發(fā)展,當(dāng)前測序技術(shù)發(fā)展較快如Pacbio、Illumina等公司,DNA合成技術(shù)發(fā)展慢

8、,需要較大的理論和技術(shù)突破才可能,在另一方面,這也可能導(dǎo)致未來商用的不確定性。 DNA存儲技術(shù)如其他技術(shù)發(fā)展,DNA存儲技術(shù)的發(fā)展也離不開所處的生態(tài)環(huán)境,目前值得關(guān)注的生態(tài)圈領(lǐng)域主要包括,DNA芯片、DNA合成技術(shù)、DNA測序等。 DNA芯片主要包括Affymetrix、Illumina和Affymetrix公司,Affymetrix利用基因芯片,通過原位合成法,大規(guī)模生產(chǎn)DNA探針。Illumina和Affymetrix合作開發(fā)DNA探針芯片由于測序。DNA合成包括美國IDT美國、德國GeneART、中國華大基因和提供DNA合成服務(wù)的Twist公司和微軟合作。 DNA存儲至今已有很多成功嘗試,哈弗大學(xué)George Church在2012年首次650KB數(shù)據(jù)寫進(jìn)DNA存儲;EMBL歐洲生物信息實(shí)驗(yàn)室2013年將20MB數(shù)據(jù)寫進(jìn)DNA存儲;這些都是科研機(jī)構(gòu)的嘗試,但在2016年7月,微軟研究院和華盛頓大學(xué)2016年發(fā)布DNA存儲原型論文,并在同年7月將200MB的數(shù)據(jù)放入一段

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論