分布式存儲給互聯(lián)網(wǎng)帶來了什么_第1頁
分布式存儲給互聯(lián)網(wǎng)帶來了什么_第2頁
分布式存儲給互聯(lián)網(wǎng)帶來了什么_第3頁
分布式存儲給互聯(lián)網(wǎng)帶來了什么_第4頁
分布式存儲給互聯(lián)網(wǎng)帶來了什么_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、內(nèi)容目錄 HYPERLINK l _TOC_250015 核心觀點 3 HYPERLINK l _TOC_250014 核心推薦邏輯 3 HYPERLINK l _TOC_250013 我們區(qū)別于市場的觀點 3 HYPERLINK l _TOC_250012 分布式存儲將成為下一代互聯(lián)網(wǎng)基礎設施 3 HYPERLINK l _TOC_250011 以 IPFS 協(xié)議為代表的分布式存儲帶來新思路 3 HYPERLINK l _TOC_250010 分布式存儲將帶來互聯(lián)網(wǎng)基礎架構變革 7 HYPERLINK l _TOC_250009 分布式存儲開辟互聯(lián)網(wǎng)基礎設施產(chǎn)業(yè)新格局 9 HYPERLINK

2、 l _TOC_250008 分布式存儲開發(fā)新的存儲市場 9 HYPERLINK l _TOC_250007 分布式存儲已和傳統(tǒng)存儲不斷融合應用 10 HYPERLINK l _TOC_250006 分布式存儲面臨的技術瓶頸與發(fā)展機遇 12 HYPERLINK l _TOC_250005 數(shù)據(jù)價值分層是分布式存儲經(jīng)濟激勵的關鍵 12 HYPERLINK l _TOC_250004 I/O 性能瓶頸需要底層和應用層聯(lián)合優(yōu)化解決 13 HYPERLINK l _TOC_250003 服務質(zhì)量保障 15 HYPERLINK l _TOC_250002 在應用、運營層面中心化組織與分布式存儲將進一步融

3、合 15 HYPERLINK l _TOC_250001 投資建議 16 HYPERLINK l _TOC_250000 風險提示 16圖表目錄圖表 1:IPFS 協(xié)議的分布式系統(tǒng) 4圖表 2:IPFS 協(xié)議構架 4圖表 3:集中化的版本控制系統(tǒng) 5圖表 4:分布式版本控制系統(tǒng) 5圖表 5:Merkle DAG 數(shù)據(jù)結構及功能特點 6圖表 6:DHT 網(wǎng)絡工作原理 6圖表 7:全球數(shù)據(jù)圈每年規(guī)模 7圖表 8:IPFS 協(xié)議關注的基礎問題 7圖表 9:IPFS 與 HTTP 協(xié)議的對比 8圖表 10:IPFS 與 HTTP 尋址方式對比 8圖表 11:全球數(shù)據(jù)量增長狀況 9圖表 12:中國云存儲

4、市場規(guī)模及增速 9圖表 13:中國公有云市場規(guī)模及增速 9圖表 14:個人云盤行業(yè)用戶滲透率及 MAU 10圖表 15:儲迅部分合作伙伴 11圖表 16:高性能分布式文件系統(tǒng) 11圖表 17:CRUST 技術架構:工作量證明層MPoW、區(qū)塊鏈共識層GPoW 及分布式云存儲/計算層 12圖表 18:CRUST 部分合作伙伴 12圖表 19:數(shù)據(jù)價值分層是分布式存儲經(jīng)濟激勵的關鍵 13圖表 20:IPFS 與 HTTP 性能對比:遠程讀取操作的平均延遲 14圖表 21:IPFS 與 HTTP 性能對比:遠程讀取操作的延遲范圍 14圖表 22:IPFS 與 HTTP 性能對比:遠程讀取操作的吞吐量

5、14圖表 23:分布式存儲面臨的技術瓶頸與發(fā)展機遇 15核心觀點核心推薦邏輯基于分布式存儲,將開辟新的存儲應用市場。分布式存儲采用不同于傳統(tǒng)中心化存儲的資源和市場激勵方式,不僅僅是充分利用分布式節(jié)點資源,而是為個人節(jié)點貢獻的內(nèi)容投入市場交換創(chuàng)造了基礎,從而深度挖掘數(shù)據(jù)內(nèi)容價值、開辟全新的應用市場,這在傳統(tǒng)的互聯(lián)網(wǎng)公司控制中心云平臺數(shù)據(jù)的情況下是無法實現(xiàn)的。同時,分布式存儲與中心化存儲將不斷融合,改變現(xiàn)有的互聯(lián)網(wǎng)構架和商業(yè)模式。我們區(qū)別于市場的觀點市場低估了分布式存儲為互聯(lián)網(wǎng)基礎構架和商業(yè)模式帶來的變革與創(chuàng)新空間。市場通常將分布式存儲視為一種新的技術,而忽略了分布式存儲帶來的個人存儲資源、用戶內(nèi)

6、容貢獻價值挖掘和市場交換的潛力。在分布式文件系統(tǒng)的互聯(lián)網(wǎng)上,個人存儲資源可以投入到市場進行資源交換,為用戶貢獻的內(nèi)容在數(shù)據(jù)確權、安全的基礎上進行內(nèi)容價值提供市場交換的平臺。因此,分布式文件系統(tǒng)將會催生更多的全新的互聯(lián)網(wǎng)應用,而非傳統(tǒng)互聯(lián)網(wǎng)的技術迭代。分布式存儲將成為下一代互聯(lián)網(wǎng)基礎設施目前,互聯(lián)網(wǎng)將海量計算機(智能移動)終端連接在一起,使得用戶能夠訪問存儲其他計算機終端上的海量數(shù)據(jù)。數(shù)據(jù)的傳輸與訪問,是基于 HTTP(超文本傳輸協(xié)議)為代表的互聯(lián)網(wǎng)協(xié)議實現(xiàn)的,數(shù)據(jù)是以計算機(服務器)終端IP(或者說域名)為地址進行中心化存儲的,具體存儲數(shù)據(jù)的服務器節(jié)點就像一個集中式的倉庫,要承擔巨大流量訪問、

7、數(shù)據(jù)傳輸壓力。能否將數(shù)據(jù)文件分散存在網(wǎng)絡不同服務器節(jié)點上,革新互聯(lián)網(wǎng)基礎構架?類似 IPFS 這種分布式存儲協(xié)議逐漸興起,作為 HTTP 的補充,打造面向全球、點對點的分布式版本文件系統(tǒng),能將所有具有相同文件系統(tǒng)的計算設備連接在一起。就 IPFS 而言,用戶尋找的是存儲在某地方的內(nèi)容(這些內(nèi)容分散在不同的服務器節(jié)點),而不是某地址,就只需確認驗證內(nèi)容的哈希,這樣就能過獲得速度更快、安全、健壯、持久的網(wǎng)頁。我們將探討分布式存儲將如何帶來互聯(lián)網(wǎng)基礎構架的變革,將創(chuàng)造怎樣的新的應用場景和市場。以 IPFS 協(xié)議為代表的分布式存儲帶來新思路IPFS 協(xié)議是一個將多種成功的分布式系統(tǒng)思路與區(qū)塊鏈相結合的

8、文件存儲和內(nèi)容分發(fā)網(wǎng)絡協(xié)議,為用戶提供統(tǒng)一的可尋址數(shù)據(jù)存儲。IPFS(Inter-Planetary File System)由 Protocol Lab 提出,字面意義是星際文件系統(tǒng)。其本質(zhì)是一個 P2P 的分布式存儲系統(tǒng),將所有具有相同文件系統(tǒng)的計算設備連接在一起,目標是補充甚至替代超文本傳輸協(xié)議 HTTP。與現(xiàn)有Web 協(xié)議不同的是,對于一個存放在 IPFS 網(wǎng)絡的文件資源,不是用基于域名的地址去訪問,而是通過基于文件內(nèi)容生成的唯一編碼去訪問,不需要驗證發(fā)送者的身份,只需要驗證內(nèi)容的哈希,可以讓網(wǎng)頁的速度更快、更安全。IPFS 的網(wǎng)絡上運行著一條區(qū)塊鏈,即用來存儲互聯(lián)網(wǎng)文件的哈希值表,每

9、次有網(wǎng)絡訪問,即要在鏈上查詢該內(nèi)容(文件)的地址。IPFS 協(xié)議最大的特色是系統(tǒng)的耦合及設計的綜合性,其整合的分布式技術包括 BitTorrent 協(xié)議、版本控制系統(tǒng) Git、MerkelDAG、分布式哈希表 DHT和自認證文件系統(tǒng) SFS。因此在 IPFS 系統(tǒng)中,人人都可以作為存儲文件的服務器。圖表 1:IPFS 協(xié)議的分布式系統(tǒng)資料來源:公開資料整理,國盛證券研究所IPFS 協(xié)議借鑒了 BitTorrent 協(xié)議諸多優(yōu)點,并進行了創(chuàng)新,打造持久且分布式存儲和共享文件的網(wǎng)絡傳輸協(xié)議。BitTorrent(簡稱 BT)是一種廣泛應用的內(nèi)容分發(fā)協(xié)議,特點是充分利用用戶的上載帶寬,使得下載用戶越

10、多,下載速度越快。在中心化存儲的 FTP、HTTP 協(xié)議中,每個用戶下載所需文件,各個用戶之間沒有交互。如 HTTP,每次當同時訪問和下載文件的用戶過多時,由于服務器處理能力和帶寬的限制,下載速度會急劇下降,部分用戶甚至會無法訪問服務器。而 BT 協(xié)議下,分配器或文件持有者將文件發(fā)送給一名用戶,再由這名用戶轉發(fā)給其它用戶,用戶之間相互轉發(fā)自己所擁有的文件部分,直到每個用戶的下載全部完成。這種方法可以使下載服務器同時處理多個大體積文件的下載請求,而無須占用大量帶寬,因此常用于大型文檔和自由軟件的發(fā)布以降低服務器負擔。IPFS 團隊對BitTorrent 進行了創(chuàng)新,增加了信用和帳單體系來激勵每個

11、節(jié)點分享數(shù)據(jù),稱為 BitSwap 協(xié)議。用戶在 BitSwap 里分享數(shù)據(jù)會增加信用分,從其他節(jié)點接受數(shù)據(jù)則會降低信用分。如果用戶只去檢索數(shù)據(jù)而不分享數(shù)據(jù),信用分就會越來越低,而被其它節(jié)點忽略。圖表 2:IPFS 協(xié)議構架資料來源:星際文件系統(tǒng) IPFS 生態(tài)研究報告,國盛證券研究所類似于于互聯(lián)網(wǎng)的七層協(xié)議模型,IPFS 構架分為八層子協(xié)議棧。IPFS 作為分布式存儲協(xié)議,核心功能包括:文件內(nèi)容多人協(xié)調(diào)和版本可回溯、不可篡改,DHT 管理帶來的離散性、伸縮性和良好的容錯性,以及基于 IPNS 的文件域名系統(tǒng)。內(nèi)容版本方面,IPFS 使用分布式版本控制系統(tǒng) Git,支持多人協(xié)同工作,記錄每次更

12、新并標記不同的版本號,一旦發(fā)生問題,可以將文件回溯到之前的任何一個版本。本地版本控制系統(tǒng)和集中化的版本控制系統(tǒng)都是由單一服務器保存所有文件的修訂版本,一旦服務器發(fā)生故障,則面臨丟失所有數(shù)據(jù)的風險。Git 是分布式版本控制系統(tǒng)(DVCS)的一種,客戶端除了保存最新版本的文件,還把代碼倉庫和歷史記錄都完整地鏡像下來。這樣,任何一處協(xié)同工作的服務器發(fā)生故障,都可以用任何一個本地倉庫進行恢復。Git還可以比較文件變化細節(jié),查出誰進行了什么修改,從而可以在發(fā)生問題時快速準確的找出原因。更進一步,許多 DVCS 系統(tǒng)都可以指定和若干不同的遠端代碼倉庫進行交互,用戶可以在同一個項目中和不同工作小組的人相互協(xié)

13、作,根據(jù)需要設定不同的協(xié)作流程,而這在以前的系統(tǒng)中是無法實現(xiàn)的。圖表 3:集中化的版本控制系統(tǒng)圖表 4:分布式版本控制系統(tǒng)資料來源:Git 官網(wǎng)、國盛證券研究所資料來源:Git 官網(wǎng)、國盛證券研究所IPFS 團隊對 Git 數(shù)據(jù)結構進行改造,在 Merkle Tree 的基礎上得到了 Merkel DAG,擁有內(nèi)容尋址、防篡改、去重三大功能。IPFS 將文件劃分成單個大小不超過 256kB 的數(shù)據(jù)塊,每個數(shù)據(jù)塊擁有唯一的哈希值,并構造一個 Merkel DAG 將所有文件碎片組織起來。Merkel DAG 是實現(xiàn)版本化文件系統(tǒng)的一種核心數(shù)據(jù)結構,比Merkle Tree 的限制更少,但是保留了

14、其兩點精髓:1)父節(jié)點哈希由子節(jié)點哈希決定,即父節(jié)點哈希由子節(jié)點哈希拼接的字符串再次哈希而成;2)父節(jié)點中包含指向子節(jié)點的信息。任何一個下層節(jié)點的改動都將導致上層節(jié)點哈希值的變動,最終根節(jié)點的哈希值也將變動,因此 Merkle DAG 的三大功能得以實現(xiàn):1)內(nèi)容尋址:使用多重哈希來唯一識別一個數(shù)據(jù)塊的內(nèi)容; 2)防篡改:數(shù)據(jù)接受方只需一段 Merkle 路徑上的哈希值,就可以檢查數(shù)據(jù)是否被篡改;3)去重:內(nèi)容相同的數(shù)據(jù)塊的哈希是相同的,可據(jù)此刪除重復數(shù)據(jù),節(jié)省存儲空間。圖表 5:Merkle DAG 數(shù)據(jù)結構及功能特點資料來源:IPFS 白皮書,國盛證券研究所IPFS 的路由功能采用分布式哈

15、希列表 DHT,幫助客戶節(jié)點快速找到所需數(shù)據(jù)所在的節(jié)點,具有離散性、伸縮性和良好的容錯性。DHT 是一種分布式哈希表,通過存儲的鍵值對提供查詢服務:鍵值對存儲在 DHT 中,節(jié)點可以檢索給定鍵對應的值,鍵值對的映射由網(wǎng)絡中所有的節(jié)點維護。在不需要服務器的情況下,每個節(jié)點負責一小部分路由和數(shù)據(jù)存儲,從而實現(xiàn)整個 DHT 網(wǎng)絡的尋址和存儲。即使有節(jié)點加入或離開,對整個網(wǎng)絡的影響也很小,因此 DHT 可以擴展到非常龐大的節(jié)點(上千萬)。DHT 具有以下性質(zhì):1)離散型:構成系統(tǒng)的節(jié)點之間都是對等的,沒有中央控制機制進行協(xié)調(diào);2)伸縮性:不論系統(tǒng)有多少節(jié)點,都要求高效工作;3)容錯性:不斷有節(jié)點加入和

16、離開,不影響整個系統(tǒng)的工作。圖表 6:DHT 網(wǎng)絡工作原理資料來源:維基百科,國盛證券研究所IPNS 是 IPFS 的文件域名系統(tǒng),像 HTTP 系統(tǒng)的域名(網(wǎng)址)一樣,使用戶搜索文件時只需查詢文件名,而不受文件內(nèi)容變更的影響。IPFS 中文件的哈希值完全取決于文件內(nèi)容,不僅難以記憶,一旦修改文件內(nèi)容其哈希值也會發(fā)生改變,每次更新文件后都需更新引用的哈希值,十分不便。為了能夠在不破壞其鏈接的情況下更改文件內(nèi)容,IPFS團隊使用了一種標記更新網(wǎng)址哈希的域名系統(tǒng),即星際名稱系統(tǒng) IPNS。IPNS 是一個去中心化的命名系統(tǒng),使用類似哈希的地址安全地指向可變內(nèi)容,每個文件都可以被協(xié)作命名為易讀的名字

17、,通過搜索就可以找到文件。自認證文件系統(tǒng) SFS 對文件進行命名,同時提供了 IPNS 以解決傳播問題,很好地解決了當前用戶不習慣輸入哈希值訪問文件的問題,在現(xiàn)有的互聯(lián)網(wǎng)系統(tǒng)和IPFS 系統(tǒng)間搭建了一個橋梁。簡單的說,基于 IPFS 協(xié)議存儲的文件是打散成許多可驗證的碎片文件(數(shù)據(jù)通過哈希值編碼進行唯一標記),分布在網(wǎng)絡中,訪問者通過內(nèi)容編碼找到這些文件的位臵后進行下載,由于是分散存儲(同一個內(nèi)容可能多臺服務器存儲),不必須要求所有節(jié)點服務器都 必須在線,以此 IPFS 希望達到創(chuàng)建持久且分布式存儲和共享文件的網(wǎng)絡傳輸協(xié)議的目標。而 HTTP 為代表傳統(tǒng)的中心化存儲差別十分明顯HTTP 的文件

18、是中心化的方式存儲,通過文件的域名進行訪問,且域名文件服務器需要保持在線,否則將無法訪問。分布式存儲將帶來互聯(lián)網(wǎng)基礎架構變革隨著互聯(lián)網(wǎng)與通信、人工智能、物聯(lián)網(wǎng)、云計算/邊緣計算等技術的發(fā)展,萬事萬物都可以被記錄并用數(shù)據(jù)表達,數(shù)據(jù)從單一內(nèi)部小數(shù)據(jù)向多元動態(tài)大數(shù)據(jù)轉變。據(jù) IDC 預測,全球數(shù)據(jù)圈的規(guī)模將由 2018 年的 33ZB 增長至 2025 年的 175ZB,且文本、圖片、視頻等非結構化數(shù)據(jù)將擁有更高的增長率,在整體數(shù)據(jù)圈的占比也將持續(xù)增加。因此,需要更先進的互聯(lián)網(wǎng)基礎架構來對數(shù)據(jù)進行采集、存儲和利用。圖表 7:全球數(shù)據(jù)圈每年規(guī)模資料來源:IDC,國盛證券研究所目前,中心化互聯(lián)網(wǎng)架構下的

19、主要問題集中在安全性、時效性和集中化三個方面,而以IPFS 為代表的分布式存儲協(xié)議將通過解決以下問題帶來互聯(lián)網(wǎng)構架的變革:圖表 8:IPFS 協(xié)議關注的基礎問題問題描述數(shù)據(jù)存儲的安全性 分布式存儲使數(shù)據(jù)脫離了集中管理,存儲的安全性大大提高。IPFS 協(xié)議將文件打碎成若干數(shù)據(jù)塊并進行分布式存儲,具有良好的防篡改作用。另一方面,整個網(wǎng)絡中存在多個備份,可以有效避免戰(zhàn)爭、自然災害等外在原因造成的中心數(shù)據(jù)丟失,有助于提高長期數(shù)據(jù)保存的安全性。用戶協(xié)作的時效性 所有網(wǎng)絡終端節(jié)點都可以作為網(wǎng)絡的運營者和服務器,使用者越多,下載速度越快。使用去中心化版本控制系統(tǒng),用戶可以和同一個項目中的不同工作小組相互協(xié)作

20、,還可以根據(jù)需要設定不同的協(xié)作流程。每個用戶的每次修改都被完整記錄,方便文件的更新和回溯。降低存儲和帶寬成本中心化數(shù)據(jù)存儲依賴于 IDC 機房,大數(shù)據(jù)時代背景下集中存儲的硬件成本急劇上升。在中心化存儲的協(xié)議中,用戶之間沒有交互,大量用戶訪問和下載文件是對服務器處理能力和帶寬的極大挑戰(zhàn)。使用分布式存儲系統(tǒng),可以充分利用用戶存儲空間和帶寬資源,大幅降低存儲和帶寬成本。與區(qū)塊鏈技術結合區(qū)塊鏈的本質(zhì)是一個去中心化的賬本,其開發(fā)瓶頸之一是如何在鏈上存儲大量數(shù)據(jù)。以 IPFS 為代表的分布式存儲系統(tǒng)可能解決這個問題,成為未來區(qū)塊鏈領域的基礎架構。資料來源:國盛證券研究所圖表 9:IPFS 與HTTP 協(xié)議

21、的對比IPFSHTTP采取分布式存儲數(shù)據(jù)采取中心化存儲數(shù)據(jù)通過內(nèi)容尋址(網(wǎng)站內(nèi)容生成唯一對應的哈希值),利用分布式哈希表(DHT)查詢、下載、驗證通過域名找到服務器所在 IP 地址,而后訪問文件所在路徑下載單個節(jié)點不需要不間斷運行服務器需要不間斷運行,否則連接就會中斷,內(nèi)容無法傳送保證網(wǎng)站數(shù)據(jù)的永久性,同時提供版本回溯功能服務器端數(shù)據(jù)需要備份,否則刪除不可恢復過渡依賴主干網(wǎng),占用帶寬和服務器存儲,易受管制、封鎖、可以突破中心網(wǎng)絡帶寬的限制,并降低延時文件更新傳播需要項目所有者更新版本后加密全網(wǎng)傳播,節(jié)點在驗證后進行更新,更新傳播速度可能受限資料來源:國盛證券研究所監(jiān)控和 DDoS 攻擊;易受天

22、災人禍影響中心化服務器,不存在文件更新傳播的問題傳統(tǒng)的 HTTP 協(xié)議使用非對稱架構實現(xiàn)網(wǎng)絡的高并發(fā),但是中心服務器難以負擔過大的傳輸數(shù)據(jù)量,影響用戶體驗,云計算廠商和電信運營商需要為此付出較大的設備成本。 IPFS 協(xié)議解決了熱點文件的存儲問題,但一個文件只有被不斷訪問才能確保其存儲有效性,冷門且具有價值的文件容易丟失,主要原因是激勵層缺失導致的節(jié)點不穩(wěn)定性。目前,一種對標 IPFS 的分布式技術 HTTPX(網(wǎng)格裂變系統(tǒng))也在悄然崛起,提供去中心化的 CDN 服務、存儲服務和 GPU 算力服務。HTTPX 兼顧了 HTTP 協(xié)議的優(yōu)勢,對路由和傳輸邏輯進行重新定義,采用對稱架構,將網(wǎng)絡的分

23、裂做到了前所未有的程度。圖表 10:IPFS 與HTTP 尋址方式對比資料來源:國盛證券研究所HTTPX 是一種更輕量化、更靈活、性能更加完善的 P2P 技術。HTTPX 的技術架構設計屬于網(wǎng)格設計,每一個節(jié)點既是獨立個體也是全局功能體,可以支持存儲、計算和傳輸數(shù)據(jù)。用戶連接最近的節(jié)點接入 HTTPX 網(wǎng)絡,該節(jié)點將尋址找到臨近節(jié)點,發(fā)現(xiàn)百萬級別的信息,定位資源存儲節(jié)點,并通過最優(yōu)網(wǎng)絡傳輸路徑回傳到用戶臨近節(jié)點。HTTPX和 IPFS 相比具有明顯優(yōu)勢,有望將云計算服務推向新的高峰:高性能:網(wǎng)格系統(tǒng)設計大幅縮短用戶到節(jié)點的物理距離和網(wǎng)絡距離,實際測試中 TTL下降 60%,提供更低延時的優(yōu)質(zhì)服

24、務響應;低成本:為產(chǎn)業(yè)鏈服務,定價較低;硬件兼容性高,可部署到家庭、社區(qū)、辦公場所;兼容性強:兼容 HTTP、HTTPS 協(xié)議,同時提供高級 HTTPX 開源代碼接入模式;實力雄厚:采用 P2P 思想,CDN 支撐能力出眾;提供存儲、GPU 資源的挖礦模式,真正做到一機多用??焖侔l(fā)布:帶寬需求大,發(fā)布周期短,資源提供方不用擔心項目延期帶來的資本周轉問題。分布式存儲開辟互聯(lián)網(wǎng)基礎設施產(chǎn)業(yè)新格局分布式存儲開發(fā)新的存儲市場全球數(shù)據(jù)量的爆發(fā)式增長推動云存儲市場的快速發(fā)展。云存儲是一種以數(shù)據(jù)存儲和管理為核心的云計算服務,指通過集群應用、網(wǎng)絡技術或分布式文件系統(tǒng)等,將網(wǎng)絡中大量不同類型的存儲設備通過應用軟

25、件集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務訪問功能的系統(tǒng)。換句話說,云存儲就是將資源放到云上供人存取,用戶可以在任何時間、任何地點,通過可連網(wǎng)裝臵連接到云上方便地存取數(shù)據(jù)。圖表 11:全球數(shù)據(jù)量增長狀況資料來源:IDC,國盛證券研究所根據(jù)云存儲服務性質(zhì)的不同,可以分為公有云、私有云和混合云。其中,公有云面向包括個人、家庭、企業(yè)在內(nèi)的多種客戶;私有云由企業(yè)或組織使用及維護,用戶在個性化等方面有更多的控制權;混合云將公有云和私有云進行混合和匹配,達成相對高性價比解決方案。據(jù)IDC 預測,2025 年中國數(shù)據(jù)規(guī)模將達到 48.6ZB,其中超過 80%為非結構化數(shù)據(jù),且由于發(fā)展滯后北美 4-5 年

26、,中國云市場增速高于全球水平。2018 年中國云計算整體市場規(guī)模達 962.8 億元,增速為 39.2%。其中,公有云市場規(guī)模達到 437 億元,增速為 65.2%,預計接下來三年內(nèi)仍將快速增長。圖表 12:中國云存儲市場規(guī)模及增速圖表 13:中國公有云市場規(guī)模及增速13.55103.30%100.57%90.81%91.38%78.43%7.083.531.850.510.911614121086420201220132014201520162017120%100%80%60%40%20%0%中國云存儲市場規(guī)模(億美元)增長率資料來源:IDC、國盛證券研究所資料來源:中國信息通信研究院、國盛

27、證券研究所分布式存儲將開辟新的應用場景,充分激發(fā)個人存儲資源和內(nèi)容貢獻的市場價值,創(chuàng)新互聯(lián)網(wǎng)商業(yè)模式。隨著分布式存儲技術和生態(tài)的發(fā)展,將充分激發(fā)個人存儲資源市場的資源配臵,激勵更多的個人存儲資源進入市場即個人可以將閑臵的存儲資源投入到分布式存儲系統(tǒng)進行市場交換,這在傳統(tǒng)互聯(lián)網(wǎng)巨頭控制中心云模式下是無法實現(xiàn)的。更重要的是,個人在互聯(lián)網(wǎng)上的內(nèi)容共享將可以安全地進行發(fā)布、交換和價值共享。如 D.Tube 是一個加密分布式視頻平臺,建立在 STEEM 區(qū)塊鏈和 IPFS 點對點網(wǎng)絡之上,目標是成為 YouTube 的替代品,允許用戶在 IPFS 基礎上觀看或上傳視頻,并在不可變的 STEEM 區(qū)塊鏈上

28、進行分享或評論,同時賺取加密通證。D.Tube 的所有數(shù)據(jù)都是公開的,任何有互聯(lián)網(wǎng)連接的人都可以對其進行分析,無需廣告即可運行,提供了最佳的用戶體驗??梢赃@樣說,幾乎任何現(xiàn)有的互聯(lián)網(wǎng)應用都可以遷移到分布式文件系統(tǒng)上,獲得新的體驗和創(chuàng)新商業(yè)模式,這里面的想象空間是無限的。邊緣云計算和小型數(shù)據(jù)中心成為行業(yè)趨勢,分布式存儲有望率先打開個人云存儲市場空間。2019 年 11 月,手機上網(wǎng)用戶規(guī)模達 13.1 億,個人網(wǎng)盤月度活躍用戶超 1 億,個人存儲市場仍有龐大的潛在用戶基礎和可利用存儲空間。面對數(shù)據(jù)規(guī)模的高速增長,邊緣云計算和分布式存儲成為行業(yè)趨勢,利用分布式文件系統(tǒng)將個人閑臵的存儲資源投入到網(wǎng)絡

29、中,進行市場交換,將成為分布式存儲率先進入的領域之一,目前已有這方面的初創(chuàng)應用。圖表 14:個人云盤行業(yè)用戶滲透率及 MAU14012020.20%19.90%20.90%21.00%21.30%22.30%22.10%106.520%1008093.488.187.88690.210015%6010%405%2000%2018.112019.012019.032019.052019.072019.092019.11MAU(百萬)對全國手機網(wǎng)民的滲透率資料來源:AURORA 極光、國盛證券研究所分布式存儲已和傳統(tǒng)存儲不斷融合應用在分布式存儲的實際應用中無法避免一定程度的中心化,因此常和傳統(tǒng)存儲

30、方案融合應用。分布式存儲會帶來系統(tǒng)性能和管理成本的問題,因此現(xiàn)有的存儲解決方案通常將分布式技術與傳統(tǒng)存儲方案相結合:一方面,對數(shù)據(jù)進行分布式備份保存,使數(shù)據(jù)更接近邊緣側,同時避免數(shù)據(jù)的物理損壞和人為篡改;另一方面,通過一定程度的集中存儲和集中管理來降低系統(tǒng)運維成本,提高服務質(zhì)量。案例 1):儲迅的分布式存儲云服務上海儲迅信息技術有限公司(StorSwift)是一家專注于企業(yè)生產(chǎn)數(shù)據(jù)存儲和管理的高新技術企業(yè),核心團隊來自于美國存儲公司 Rasilient,有超過 15 年的存儲行業(yè)研發(fā)和運維經(jīng)驗。儲迅在大規(guī)模存儲運維、存儲安全及性能優(yōu)化領域擁有核心的硬件軟件技術,迄今為止已部署和存儲超過 300

31、PB 的關鍵業(yè)務存儲數(shù)據(jù),其中對圖像數(shù)據(jù)的存儲和處理在業(yè)界處于領先地位。儲迅已在安防、醫(yī)療、媒資等行業(yè)提供了成功的存儲解決方案,和因特爾、中國移動等多家企業(yè)開展業(yè)務合作。圖表 15:儲迅部分合作伙伴資料來源:儲迅官網(wǎng)、國盛證券研究所儲迅為企業(yè)提供專業(yè)的分布式數(shù)據(jù)存儲方案,在數(shù)據(jù)存儲優(yōu)化、I/O 優(yōu)化、大規(guī)模系統(tǒng)運維管理等方面經(jīng)驗豐富。主打產(chǎn)品有高性能分布式文件系統(tǒng)、分布式塊存儲、分布式對象存儲網(wǎng)關等,同時提供從硬件選型到挖礦程序優(yōu)化、存儲性能優(yōu)化、運維調(diào)度等一整套的 Filecoin 解決方案。和傳統(tǒng)的集中數(shù)據(jù)中心存儲相比,分布式存儲的優(yōu)點在于數(shù)據(jù)存儲更加分散,對地理位臵的依賴性更弱,可以規(guī)避

32、多種風險,實現(xiàn)企業(yè)輕資產(chǎn)運營,降低運維成本。圖表 16:高性能分布式文件系統(tǒng)資料來源:儲迅官網(wǎng)、國盛證券研究所案例 2):CRUST 鏈接分布式云CRUST 是基于有意義工作量證明機制(MPoW)和擔保權益證明共識(GPoS)構建的數(shù)字加密應用層,同時也是一種支持去中心化存儲與計算的新一代區(qū)塊鏈技術。 CRUST 實現(xiàn)了去中心化存儲的激勵層協(xié)議,適配包括 IPFS 在內(nèi)的多種存儲層協(xié)議,并對應用層提供支持:第一層量化資源和工作量,提供了一個讓所有人都能認可的計算方式 MPoW,這是解決問題的根本;第二層利用 GPoS 達成共識,共同維護網(wǎng)絡;第三層為用戶提供去中心化的存儲服務和檢索服務,同時

33、CRUST 的架構也有能力對去中心化計算層提供支持,構建分布式云生態(tài)。圖表 17:CRUST 技術架構:工作量證明層MPoW、區(qū)塊鏈共識層GPoW 及分布式云存儲/計算層資料來源:CRUST 白皮書、國盛證券研究所CRUST 與 Filecoin 最大的不同點是采用了可信執(zhí)行環(huán)境(TEE),核心概念是用一個第三方硬件為載體,保證其中創(chuàng)建和運行的數(shù)據(jù)不可被攻擊和篡改。主流的芯片廠家如 Intel、AMD、ARM 等,生產(chǎn)的 CPU 內(nèi)都有 TEE 空間,可以在其中運行開源的、通過 CRUST社區(qū)成員認可的程序包,實現(xiàn)對資源量化工作的監(jiān)督,進而把量化證明通過簽名發(fā)送到區(qū)塊鏈網(wǎng)絡。Filecoin

34、對節(jié)點工作量的證明采用的方法是零知識證明和網(wǎng)絡交叉驗證,同樣是開源算法,但是帶來了硬件消耗和帶寬需求的問題,還需要刻意提高算法的復雜度來保證節(jié)點短時間內(nèi)不能作弊。TEE 則解決了這些問題,在本地就可以完成資源證明過程,降低網(wǎng)絡資源占用,簡化工作量量化的過程。另外,由于 TEE 內(nèi)程序?qū)?shù)據(jù)進行封裝保存時無須擔心被篡改,算法效率更高,用戶可以獲得更好的使用體驗。圖表 18:CRUST 部分合作伙伴資料來源:CRUST 官網(wǎng)、國盛證券研究所分布式存儲面臨的技術瓶頸與發(fā)展機遇數(shù)據(jù)價值分層是分布式存儲經(jīng)濟激勵的關鍵不同數(shù)據(jù)的市場價值是不同的,不同個體對相同數(shù)據(jù)的價值判斷也并不一致。而存儲節(jié)點并不知道數(shù)

35、據(jù)的內(nèi)容、難以評判數(shù)據(jù)價值的情況下,如何有效將存儲激勵與數(shù)據(jù)市場價值做到優(yōu)化配臵?數(shù)據(jù)價值分層是甄別數(shù)據(jù)價值以及實現(xiàn)有效激勵的關鍵。分布式的節(jié)點負責存儲數(shù)據(jù)碎片,但并不知道數(shù)據(jù)內(nèi)容以及數(shù)據(jù)的價值,也就是說,礦工的工作量衡量如果不能考慮數(shù)據(jù)價值的因素,就很難實現(xiàn)更優(yōu)化的市場激勵調(diào)節(jié)。以 Filecoin 采用的時空證明(PoST)機制為例,礦工節(jié)點的存儲工作量衡量,與文件碎片內(nèi)容的數(shù)據(jù)價值無關。Filecoin 目前并沒有對數(shù)據(jù)價值進行具體分層,只做了垃圾數(shù)據(jù)和可驗證數(shù)據(jù)的區(qū)分。目前現(xiàn)存的共識機制,均僅限于礦工的存儲工作量衡量,而無法代表數(shù)據(jù)價值。礦工節(jié)點的物理損毀、網(wǎng)絡服務質(zhì)量差的成本是以經(jīng)濟

36、激勵來衡量,但因此造成的用戶數(shù)據(jù)服務質(zhì)量和數(shù)據(jù)價值損失并不對等。簡單說,礦工最多損失的是系統(tǒng)經(jīng)濟激勵,而用戶損失的可能是數(shù)據(jù)的損毀或極差業(yè)務服務質(zhì)量畢竟對于礦工來說,數(shù)據(jù)的價值是的核心衡量因素是存儲容量。應考慮底層構架和應用層結合的方式解決數(shù)據(jù)分層問題。解決數(shù)據(jù)價值分層,對分布式存儲的經(jīng)濟激勵十分關鍵。在基礎構架層面難以單獨解決,必須結合應用層來實現(xiàn)。結合應用場景,在應用層實現(xiàn)數(shù)據(jù)的分層,從而實現(xiàn)礦工節(jié)點的分層;如,對于一些服務質(zhì)量、內(nèi)容價值較高的數(shù)據(jù),則可以圈定一個激勵價格較高的礦工市場,同時對礦工節(jié)點的硬件配臵、服務質(zhì)量做更高的要求。這類應用在私有網(wǎng)絡、局域網(wǎng)更方便實現(xiàn)。針對不同的應用場景

37、,采用不同的應用層策略。也就是說,廣泛而統(tǒng)一的分布式存儲網(wǎng)絡很難滿足各個場景和用戶個體的需求,針對不同場景采取不同的應用層解決方案來完成數(shù)據(jù)價值分層是可行的方案。圖表 19:數(shù)據(jù)價值分層是分布式存儲經(jīng)濟激勵的關鍵資料來源:國盛證券研究所I/O 性能瓶頸需要底層和應用層聯(lián)合優(yōu)化解決分布式存儲會帶來系統(tǒng) I/O 性能問題。和傳統(tǒng)存儲系統(tǒng)相比,分布式存儲需要將文件打碎、多節(jié)點備份保存,在查詢使用數(shù)據(jù)時需要進行大量碎片文件的調(diào)度工作,工程量極大。另外,當文件較大時,用于內(nèi)容尋址的哈希表也會很大,尋址時間也會更長。更為關鍵的是,礦工節(jié)點的網(wǎng)絡資源狀況對網(wǎng)絡 I/O 性能的影響也存在諸多不確定性,尤其是那

38、些流媒體數(shù)據(jù),若某些數(shù)據(jù)碎片的節(jié)點網(wǎng)絡狀況較差,則會影響整個數(shù)據(jù)文件的訪問服務質(zhì)量。中心化存儲下,通過 CDN 等手段可以解決這些問題,擁有較好的客戶體驗。因此,現(xiàn)有的分布式存儲系統(tǒng)的 I/O 效率是技術新能方面首要考慮的問題之一,從代碼實現(xiàn)到協(xié)議層都有很大的優(yōu)化空間,還需要進一步突破。實驗測試顯示 IPFS 的 I/O 性能還有待進一步改善。由于采用分布式存儲,文件的讀取受到節(jié)點自身及全網(wǎng)其它節(jié)點的影響,主要包括:節(jié)點數(shù)量和穩(wěn)定性、帶寬、網(wǎng)絡(地理)位臵等。來自復旦大學的研究人員對 IPFS 的 I/O 性能做了一項實驗,并和 HTTP 進行對比,以驗證 IPFS 網(wǎng)絡處理請求時的延遲和吞吐

39、量表現(xiàn)。遠程讀取操作的平均延遲方面,當請求是小的請求時,在 1k-4k 間,HTTP 延遲比 IPFS 低。遇到 16-256k 之間的文件,IPFS 的延遲狀況由于HTTP。當處理大文件請求時,IPFS 在延遲上的表現(xiàn)不盡人意,尤其是請求大小朝貢 16MB 時,IPFS 的處理時間接近了 20 秒。超過 64MB 時,延遲更是可以達到 70 秒,是 HTTP(10 秒)的 7 倍。當然,這是實驗室測試條件下的結果,在實際應用過程中,尚未有具有說服性的案例;無論如何,IPFS 等分布式存儲方案若想替代 HTTP 等中心化方式,還有很多底層技術構架、協(xié)議和應用生態(tài)方面的改進與探索。圖表 20:I

40、PFS 與HTTP 性能對比:遠程讀取操作的平均延遲資料來源:Understanding I/O performance of IPFS storage: a clients perspective、國盛證券研究所圖表 21:IPFS 與HTTP 性能對比:遠程讀取操作的延遲范圍資料來源:Understanding I/O performance of IPFS storage: a clients perspective、國盛證券研究所圖表 22:IPFS 與HTTP 性能對比:遠程讀取操作的吞吐量資料來源:Understanding I/O performance of IPFS storage: a clients per

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論