超級(jí)計(jì)算是基因組學(xué)研究的未來_第1頁
超級(jí)計(jì)算是基因組學(xué)研究的未來_第2頁
超級(jí)計(jì)算是基因組學(xué)研究的未來_第3頁
超級(jí)計(jì)算是基因組學(xué)研究的未來_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.#:第5頁超級(jí)計(jì)算是基因組學(xué)研究的將來目前,基因組學(xué)正處于這樣一個(gè)拐點(diǎn):人類基因組測(cè)序的本錢已經(jīng)低于1000美元,預(yù)計(jì)仍將繼續(xù)下降相比2019年的30億美元。隨著測(cè)序本錢降低,基因檢測(cè)變得越來越普遍,相應(yīng)的基因組數(shù)據(jù)也不斷上升。僅單個(gè)人的基因組“運(yùn)行就會(huì)產(chǎn)生0.5TB1TB=1024GB的原始數(shù)據(jù)圖像文件,這些文件都很復(fù)雜,包含了分散的、非構(gòu)造化的科學(xué)數(shù)據(jù),難以管理和分析。隨著測(cè)序技術(shù)的開展,研究人員面臨的挑戰(zhàn)是如何管理和分析這些大量的、非構(gòu)造化的基因組數(shù)據(jù)。通常,這些數(shù)據(jù)產(chǎn)生于全球各地的學(xué)術(shù)研究、臨床試驗(yàn)和制藥研究。如今許多組織機(jī)構(gòu)都需要更高級(jí)的數(shù)據(jù)分析和管理,應(yīng)用于藥物研發(fā)、疾病基因檢測(cè)

2、以及在臨床應(yīng)用中創(chuàng)立個(gè)性化治療等。但基因組測(cè)序是一個(gè)復(fù)雜多步的過程,包括了DNA序列讀取、基因組序列拼接、變異區(qū)序列分析和重測(cè)序。現(xiàn)實(shí)就是:過去十年間,我們使用的技術(shù)不夠強(qiáng)大,無法分析這些關(guān)鍵數(shù)據(jù)。這樣的技術(shù)在將來注定要被新技術(shù)取代,因?yàn)殡S著基因測(cè)序公司的不斷創(chuàng)新開展,他們對(duì)數(shù)據(jù)分析的需求在更快地增長(zhǎng)中。同時(shí),人們的對(duì)基因組測(cè)序的需求也越來越高。因此,技術(shù)專家要做的就是讓這些數(shù)據(jù)可以通過復(fù)雜的高性能計(jì)算HPC或超級(jí)計(jì)算機(jī)和大數(shù)據(jù)技術(shù)來分析,從而使基因組數(shù)據(jù)的管理和分析更便捷有效。大數(shù)據(jù)自身的問題追求個(gè)性化醫(yī)療的同時(shí)產(chǎn)生了爆炸性的數(shù)據(jù)增長(zhǎng),因?yàn)獒t(yī)生和研究人員希望通過基因測(cè)序的手段,基于患者的疾病

3、表現(xiàn)和對(duì)藥物的耐受性等,對(duì)不同的患者進(jìn)展最正確的個(gè)性化治療。與此同時(shí),隨著基因組學(xué)研究的資金不斷增加,基因測(cè)序越來越商業(yè)化,也進(jìn)一步推動(dòng)了個(gè)性化醫(yī)療的開展。相關(guān)的案例就是,Kaiser Permanente在全美搜集超過210000名患者的DNA樣本、醫(yī)療記錄等,隨后創(chuàng)立了全球最大、最全面的精準(zhǔn)醫(yī)療數(shù)據(jù)庫。在此根底上,研究人員希望從中找到影響各類遺傳疾病的特定基因,以此在臨床應(yīng)用中改善疾病的診斷、治療和預(yù)防。當(dāng)然,要想成功梳理這些復(fù)雜、散點(diǎn)化、非構(gòu)造化的科學(xué)數(shù)據(jù),研究人員需要能大量計(jì)算和高速分析數(shù)據(jù)以及具有靈敏性的計(jì)算系統(tǒng),但是傳統(tǒng)的計(jì)算系統(tǒng)跟不上數(shù)據(jù)需求的開展腳步。可喜的是,隨著現(xiàn)代超級(jí)計(jì)算

4、技術(shù)的到位,研究機(jī)構(gòu)可以不斷增加數(shù)據(jù)量,并分析出有價(jià)值的科學(xué)見解。管理和共享新數(shù)據(jù)要想在數(shù)據(jù)密集的時(shí)代里實(shí)現(xiàn)重大科學(xué)打破,研究團(tuán)隊(duì)需要更快、更便捷地對(duì)大型數(shù)據(jù)集進(jìn)展分析。2019年,美國(guó)著名安康系統(tǒng)INOVA的轉(zhuǎn)化醫(yī)學(xué)研究所ITMI購置了HPC系統(tǒng),使得研究人員能借助基因組數(shù)據(jù)庫,更加準(zhǔn)確、快速地診斷患者,并提供更高程度地治療和護(hù)理。ITMI的系統(tǒng)用于25000個(gè)基因組的數(shù)據(jù)密集型工作負(fù)載,研究人員通過開發(fā)和使用自己的代碼簡(jiǎn)化數(shù)據(jù)管理。有了這種靈敏性,ITMI管理IT的負(fù)擔(dān)明顯降低,同時(shí)也增加了研究工作流的才能,使機(jī)構(gòu)能投入更多的資源用于更具挑戰(zhàn)性的慢性疾病領(lǐng)域。隨著科研機(jī)構(gòu)處理數(shù)據(jù)越來越多,

5、將來資本還將青睞新的超級(jí)計(jì)算解決方案,以改善數(shù)據(jù)的管理和可訪問性。詳細(xì)來講,這些系統(tǒng)將提供更高速的工作流以及更快的組編和分析操作,為研究人員的研究進(jìn)步效率。相對(duì)來講,HPC系統(tǒng)查詢海量數(shù)據(jù)庫的速度要快一個(gè)數(shù)量級(jí),能探究更大的數(shù)據(jù)集,并能同時(shí)進(jìn)展更多數(shù)據(jù)的調(diào)查。為什么數(shù)據(jù)存儲(chǔ)至關(guān)重要基因組學(xué)研究中最大的挑戰(zhàn)就是數(shù)據(jù)集往往需要被存儲(chǔ)、分析,然后再次存儲(chǔ)。舉例來說,美國(guó)基因檢測(cè)公司Human Longevity最近與制藥企業(yè)AstraZeneca合作,對(duì)來自臨床試驗(yàn)的500000個(gè)DNA樣本進(jìn)展測(cè)序分析。該方案預(yù)計(jì)將在2020年前生成一百萬種基因組、分子和臨床數(shù)據(jù)的綜合安康記錄。這將是一個(gè)驚人的數(shù)據(jù)

6、量,所有的數(shù)據(jù)都必須存儲(chǔ)在外部?jī)?chǔ)存器,以便將來通過網(wǎng)絡(luò)傳送到計(jì)算機(jī),分析后再存儲(chǔ)回外部?jī)?chǔ)存器。這個(gè)過程給傳統(tǒng)的IT根底設(shè)施帶來了難以置信的負(fù)擔(dān)。大多數(shù)存儲(chǔ)管理器并不能承受這些工作負(fù)載帶來的壓力,因?yàn)槠洳痪哂挟?dāng)今生物醫(yī)學(xué)應(yīng)用所需的可擴(kuò)展性、持續(xù)性和長(zhǎng)期性,超級(jí)計(jì)算機(jī)的現(xiàn)代基因組學(xué)研究的數(shù)據(jù)將繼續(xù)爆炸性增長(zhǎng)。隨著技術(shù)人員提供千兆級(jí)和將來百萬兆級(jí)的解決方案,幾年前還讓人覺得高深莫測(cè)的數(shù)據(jù),如今都能快速便捷的管理和分析。此外值得快樂的是,超級(jí)計(jì)算系統(tǒng)已經(jīng)變得更加經(jīng)濟(jì)實(shí)惠,也沒有那么復(fù)雜了。超級(jí)計(jì)算機(jī)在基因組學(xué)中具有多種功能,包括協(xié)助組編和識(shí)別研究數(shù)據(jù)中的形式,以及將遺傳序列注釋到圖像建模中。對(duì)于研究機(jī)構(gòu)來說,尋找現(xiàn)代HPC的解決方案非常重要,因?yàn)樗粌H可以分析數(shù)據(jù),而且能輕松存儲(chǔ)數(shù)據(jù),同時(shí)其他研究人員還能再次訪問。美國(guó)硅圖公司SGI提供的存儲(chǔ)系統(tǒng),可以輕松集成高性能計(jì)算和數(shù)據(jù)分析系統(tǒng)功能?,F(xiàn)代HPC系統(tǒng)提供大規(guī)模的、存儲(chǔ)虛擬化的數(shù)據(jù)管理平臺(tái),專門用于管理生命科學(xué)應(yīng)用程序產(chǎn)生的大量構(gòu)造化和非構(gòu)造化的內(nèi)容。在這場(chǎng)搜集、研究、鏈接和分析與個(gè)性化醫(yī)療環(huán)境相關(guān)的關(guān)鍵生物醫(yī)學(xué)研究數(shù)據(jù)的競(jìng)賽中,SGI為研究機(jī)構(gòu)和實(shí)驗(yàn)室的分析和創(chuàng)新提供了一條捷徑。結(jié)語:基因組學(xué)研究將促進(jìn)疾病基因的識(shí)別,加速生物標(biāo)志物的鑒定,并為患者提供針對(duì)性更強(qiáng)的個(gè)性化治療。同時(shí)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論