基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范_第1頁
基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范_第2頁
基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范_第3頁
基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范_第4頁
基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1基因檢測服務(wù)中微生物組數(shù)據(jù)共享規(guī)范GB/T35890高通量測序數(shù)據(jù)序列3.1下列術(shù)語和定義適用于本文件。3.2又稱中介數(shù)據(jù)、中繼數(shù)據(jù),為描述數(shù)據(jù)的數(shù)據(jù),主要是描述數(shù)據(jù)屬性的信息。3.3宏基因組學metagenomics又稱環(huán)境微生物基因組學、元基因組學。是一門以直接從環(huán)境樣品中提取全部微生物的DNA為研究對象,揭示環(huán)境樣品所包含的全部微生物的遺3.4TranscribedSpacer)則被廣泛應(yīng)用在真菌分類鑒定中。擴增子測序既是基于這類標志基因的靶向測3.53.63.723.83.93.10是指以接口等在線形式提供微生物組提交、傳輸、下載等相3.113.123.13指某個酶、功能模塊、功能通路在整個微生物環(huán)境3.143.153.16操作分類單元operationaltaxonomi3.17FASTQ是基于文本的、保存生物序列(通常是核酸序列)和其序列質(zhì)量信息的、每四行表示一條序3.18TSV格式是微生物組生物信息學分析軟件的輸出格式,記錄特征名、樣品編號及對應(yīng)的觀測值(如4縮略語DNA:脫氧核糖核酸(deoxyribonucleicacBIOM:生物觀測矩陣(BiologicalObservationMatUniRef:UniProt參考資料庫(UniProtReferenceClusteAPI:應(yīng)用程序編程接口(ApplicationProgrammingInterface)3(如圖1所示)。在完成數(shù)據(jù)生產(chǎn)和數(shù)據(jù)分析的步驟后,結(jié)果文件及相關(guān)元數(shù)據(jù)應(yīng)抽取為推薦使用RESTfulAPI設(shè)計規(guī)范構(gòu)建相關(guān)數(shù)據(jù)服務(wù),數(shù)6.1微生物組數(shù)據(jù)元數(shù)據(jù)分類微生物組數(shù)據(jù)的元數(shù)據(jù)可分為樣本信息關(guān)聯(lián)的元數(shù)據(jù)、測序數(shù)據(jù)關(guān)聯(lián)的元數(shù)據(jù)和分析級數(shù)據(jù)關(guān)聯(lián)6.2樣本信息關(guān)聯(lián)的元數(shù)據(jù)是是是否是生物學樣本保存溫度,單位:攝氏度否4核酸提取方式,可填寫商業(yè)試劑盒的名字否否否6.3測序數(shù)據(jù)關(guān)聯(lián)的元數(shù)據(jù)否HWJBAYTGAA170328-18是WGA,AMPLICON否METAGENOMIC實驗方式選定,是否使用了任何方法來選擇否否2否否是DNBSEQ-G400,DNBSEQ-G4是DNBSEQ-G400,DNBSEQ-G4是否否否否下機fastq數(shù)據(jù)的reads數(shù),多個數(shù)據(jù)以逗號否割否否否否否質(zhì)控后fastq數(shù)據(jù)的reads數(shù),多個數(shù)據(jù)以逗是是5否否否否是6.4分析級數(shù)據(jù)關(guān)聯(lián)的元數(shù)據(jù)是MetaPhlan2是是MetaPhlan2是是7.1分析級數(shù)據(jù)的分類7.2基因豐度示例1:人類腸道微生物參考基因集(IntegratedGeneC示例2:人類腸道微生物群統(tǒng)一蛋白目錄(UnifiedHumanGastrointestinalProteincat7.3分類學豐度67.4功能豐度微生物組數(shù)據(jù)格式可分為原始數(shù)據(jù)格式和分析級數(shù)據(jù)8.2原始數(shù)據(jù)格式8.3分析級數(shù)據(jù)格式分析級數(shù)據(jù)格式可分為文檔儲存數(shù)據(jù)格式和網(wǎng)絡(luò)傳輸服分析級數(shù)據(jù)軟件宜使用表格分割的文本文件作為輸出結(jié)果,示例基于結(jié)構(gòu)化存儲的元數(shù)據(jù)及分析級數(shù)據(jù),宜構(gòu)建API實現(xiàn)數(shù)據(jù)的在線傳輸及交互。在網(wǎng)絡(luò)服務(wù)的應(yīng)@CL100122427L1C001R001_16CCGCTTTGAGACCTTTGCTGGAAATGGGAA+FFFFFFFF>FCFFFFEFFFFFAFFEFFFEDD@CL100122427L1C001R001_17CCGCTTTGAGACCTTTGCTGGAAATGGGAA+FFFFFFFF>FCFFFFEFFFFFAFFEFFFEDD8TSV格式為可分為緊密型及松散型兩種表格形式,表格形式見B.1和B9BIOM格式被微生物組領(lǐng)域主流軟件所支持,具體格式說明參考官方鏈接(http://biom-format.orBIOM格式有兩個版本:VERSION1.0JSON格式和VERSION2.0HDF5格式,常用格式為JSON - -- - 該微生物的定量的值,如:value:10.23,unit:perc 編碼規(guī)范采用的參考系統(tǒng),如在分類學豐度中可使編號:/Taxonomy/;在功能通路可使用Me

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論