私有云平臺下的存儲架構(gòu)規(guī)劃設(shè)計_第1頁
私有云平臺下的存儲架構(gòu)規(guī)劃設(shè)計_第2頁
私有云平臺下的存儲架構(gòu)規(guī)劃設(shè)計_第3頁
私有云平臺下的存儲架構(gòu)規(guī)劃設(shè)計_第4頁
私有云平臺下的存儲架構(gòu)規(guī)劃設(shè)計_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、引言相對于其他云計算技術(shù)來講,私有云平臺應(yīng)該算是最早進(jìn)入企業(yè)的IT基礎(chǔ)架構(gòu)。越來越多的私有云平臺開始支持各類存儲架構(gòu),如何選擇可以融入私有云平臺的存儲架構(gòu)成為關(guān)鍵問題。二、總體規(guī)劃設(shè)計思路存儲本身是用來承載數(shù)據(jù),對于存儲架構(gòu)的設(shè)計,必然離不開數(shù)據(jù)的分析。所以在企業(yè)私有云平臺下對存儲架構(gòu)的規(guī)劃和設(shè)計也同樣需要一個以數(shù)據(jù)分析為起點的整體規(guī)劃思路??偨Y(jié)下來,筆者認(rèn)為從數(shù)據(jù)分析到技術(shù)架構(gòu)分析的完整閉環(huán)思路,如圖1所示:圖1:數(shù)據(jù)分析到技術(shù)架構(gòu)分析完整閉環(huán)思路圖按照圖1所示,存儲架構(gòu)的規(guī)劃需要分三個步驟進(jìn)行。首先,需要從企業(yè)內(nèi)部業(yè)務(wù)數(shù)據(jù)層面進(jìn)行梳理和分析,包括業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)類型、數(shù)據(jù)當(dāng)前的規(guī)模以及膨脹的速度、數(shù)據(jù)讀寫分布的比例以及隨機(jī)順序的相關(guān)特征、數(shù)據(jù)訪問的并發(fā)量問題、數(shù)據(jù)重要性分級以及數(shù)據(jù)保存的安全性要求等;其次,根據(jù)數(shù)據(jù)梳理的結(jié)果進(jìn)一步分析存儲架構(gòu)的規(guī)劃設(shè)計,在通過對數(shù)據(jù)的結(jié)構(gòu)類型、數(shù)據(jù)規(guī)模、并發(fā)需求、讀寫特點綜合分析之后可以確定分布式架構(gòu)和集中式架構(gòu)的選型和拓?fù)湟?guī)模,對數(shù)據(jù)分級和安全需求進(jìn)行綜合分析之后,可以決定架構(gòu)當(dāng)中的冗余性設(shè)計策略和備份歸檔策略,讀寫特點和并發(fā)量的分析又可以定位架構(gòu)當(dāng)中存儲介質(zhì)以及性能平衡的一些策略;最后,我們通過對底層架構(gòu)選型和規(guī)劃分析,再結(jié)合管理維度所需要達(dá)到的目標(biāo),來確定應(yīng)用接口層、中間功能層以及運維層面需要達(dá)到的一系列對數(shù)據(jù)的使用、監(jiān)控、加工、分析、報告等各方面的存儲管理指標(biāo)。三、數(shù)據(jù)業(yè)務(wù)梳理分析1.按照業(yè)務(wù)維度為前提的原則存儲是私有云當(dāng)中核心的三大資源之一,存儲資源的分配需要秉承著以合適合理的性價比原則進(jìn)行分配。而對于企業(yè)來講,所有的業(yè)務(wù)系統(tǒng)是有著重要性、安全性等業(yè)務(wù)方面的區(qū)分的,而這些屬性維度的判斷是與每一個業(yè)務(wù)系統(tǒng)精密綁定的,因此數(shù)據(jù)分析的第一步就是要根據(jù)應(yīng)用系統(tǒng)的業(yè)務(wù)特性需求進(jìn)行分級劃分,并且針對每一個業(yè)務(wù)系統(tǒng)進(jìn)行其他維度的梳理和細(xì)分。例如,在銀行業(yè)當(dāng)中,企業(yè)的所有應(yīng)用系統(tǒng)會參照銀監(jiān)局以及人民銀行的相關(guān)要求(業(yè)務(wù)連續(xù)性、數(shù)據(jù)安全、數(shù)據(jù)審核等)并且結(jié)合自己企業(yè)的實際業(yè)務(wù)需求情況(核心、交易、渠道系統(tǒng))進(jìn)行細(xì)化分級,這些細(xì)化分級之后的標(biāo)準(zhǔn)是進(jìn)行數(shù)據(jù)梳理分析的前提條件。2.數(shù)據(jù)梳理常規(guī)指標(biāo)在明確了企業(yè)數(shù)據(jù)業(yè)務(wù)分級標(biāo)準(zhǔn)的前提下,我們在對企業(yè)存量數(shù)據(jù)和未來數(shù)據(jù)進(jìn)行梳理和分析的時候,需要對所進(jìn)行分析的業(yè)務(wù)系統(tǒng)數(shù)據(jù)定義一系列梳理的指標(biāo),包括數(shù)據(jù)類型、規(guī)模、讀寫特點、最大并發(fā)、訪問要求等。就金融行業(yè)而言,筆者認(rèn)為有以下幾個必須要采集分析的指標(biāo):1)類型:企業(yè)存量數(shù)據(jù)都有哪些類型?這里的類型從廣義上看是指結(jié)構(gòu)化和非結(jié)構(gòu)化類型,具體分析的時候針對結(jié)構(gòu)化和非結(jié)構(gòu)化進(jìn)行細(xì)分,比如非結(jié)構(gòu)化的又可以按照數(shù)據(jù)的功能維度區(qū)分為日志、備份、圖片、視頻、鏡像等等,那么日志又分為賬務(wù)日志、業(yè)務(wù)日志、運維日志等。劃分的越細(xì),后續(xù)的基礎(chǔ)架構(gòu)匹配就會越契合。2)規(guī)模:規(guī)模是指數(shù)據(jù)存量規(guī)模以及膨脹的規(guī)模,不僅僅需要判斷目前的情況,還需要預(yù)測未來的發(fā)展,所以這個指標(biāo)的分析是要分兩部分(存量和未來)來進(jìn)行的。3)重要性:重要性主要是根據(jù)前邊我們對數(shù)據(jù)業(yè)務(wù)分級標(biāo)準(zhǔn)制定的。4)讀寫分布:這個指標(biāo)主要是希望明確數(shù)據(jù)業(yè)務(wù)的讀寫類型和比例,它是指導(dǎo)我們進(jìn)行存儲技術(shù)架構(gòu)選型的重要指標(biāo)。具體細(xì)分可以分為順序讀、順序?qū)?、隨機(jī)讀、隨機(jī)寫,同時分析出各自的大概比例。5)性能要求:性能要求體現(xiàn)在業(yè)務(wù)層面對客戶層的反饋快慢需求上,比如銀行的交易系統(tǒng)對性能的要求非常高,同樣映射到數(shù)據(jù)訪問的要求也必須是高性能的讀寫。6)事務(wù)性:事務(wù)性主要是業(yè)務(wù)對數(shù)據(jù)的完整性和一致性要求。例如銀行的交易系統(tǒng)和賬務(wù)系統(tǒng)要求的是數(shù)據(jù)的強(qiáng)一致性,不允許任何臟讀、臟寫,而電子商務(wù)類的購物車數(shù)據(jù)要求的是弱一致性,可以包容某些程度的臟讀。四、存儲架構(gòu)選型思路1.分布式與集中式的選擇其實每一種存儲技術(shù)架構(gòu)最初的誕生和應(yīng)用都是與契合它的業(yè)務(wù)場景密不可分的,互聯(lián)網(wǎng)企業(yè)在特定業(yè)務(wù)場景下對業(yè)務(wù)需求使得互聯(lián)網(wǎng)企業(yè)在存儲架構(gòu)的選擇中,最終選擇了分布式架構(gòu)。不是集中式架構(gòu)長得不漂亮,互聯(lián)網(wǎng)企業(yè)才最終擁抱了分布式架構(gòu),而是集中式在互聯(lián)網(wǎng)的特定業(yè)務(wù)場景下無法解決其業(yè)務(wù)需求,互聯(lián)網(wǎng)企業(yè)才最終選擇了分布式,這個擁抱過程一定融入了太多的無奈。所以我們金融行業(yè)企業(yè)今天選擇存儲技術(shù)架構(gòu)的初衷和源動力也應(yīng)該從業(yè)務(wù)場景需求出發(fā)。接下來,我們來看看對各種主流存儲技術(shù)架構(gòu)特性的概括性描述:集中式架構(gòu)最大的優(yōu)點在于其對業(yè)務(wù)事務(wù)性的保護(hù)和其穩(wěn)定的架構(gòu),這也是它長期在金融行業(yè)交易業(yè)務(wù)場景下占據(jù)核心存儲架構(gòu)地位的主要原因。但是它的不足在于它對大規(guī)模并發(fā)支持顯得無能為力,無論它的控制器擴(kuò)展能力如何,畢竟是有限的,這也是互聯(lián)網(wǎng)企業(yè)放棄它的主要原因。恰恰相反,分布式架構(gòu)對大規(guī)模海量數(shù)據(jù)的并發(fā)訪問有很好的契合性,但同樣有著對業(yè)務(wù)的強(qiáng)烈的事務(wù)性保護(hù)不夠或者需要付出很大的代價等不足之處??纯礃I(yè)內(nèi)對特定存儲技術(shù)產(chǎn)品的評價,例如“GFS是一種適合大文件,尤其是GB級別的大文件存儲場景的分布式存儲系統(tǒng)”、“GFS非常適合對數(shù)據(jù)訪問延遲不敏感的搜索引擎服務(wù)”、“GlusterFS是可以代替NAS的通用分布式文件系統(tǒng)存儲技術(shù),可配置性較強(qiáng)”、“對于并發(fā)讀寫操作的性能穩(wěn)定性上,Ceph遠(yuǎn)勝于Swift”,“在4K-128K數(shù)據(jù)大小的范圍內(nèi),Ceph和Swift的讀性能表現(xiàn)都是最佳的”、“對于并發(fā)寫操作,Ceph的并發(fā)量越高其性能表現(xiàn)越接近Swift,并發(fā)量越少其性能表現(xiàn)會明顯遜色于Swift”。從以上摘錄的一些對特定產(chǎn)品的分析來看,每一種存儲技術(shù)架構(gòu)都有其特定的優(yōu)勢和劣勢。我們不僅僅需要根據(jù)數(shù)據(jù)梳理分析的結(jié)果確定什么樣的數(shù)據(jù)放在集中式架構(gòu)上,什么樣的數(shù)據(jù)需要放在分布式架構(gòu)上,我們更需要根據(jù)這些架構(gòu)的優(yōu)劣分析確定應(yīng)該放在什么樣的集中式和什么樣的分布式上。2.存儲資源類型的選擇存儲資源類型包括Object、Block、FS這些資源類型,如何將這些資源匹配到合適的場景上?可能對于Block來講,大家比較容易做判斷,一般會把企業(yè)業(yè)務(wù)系統(tǒng)當(dāng)中關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)放在Block資源上,根據(jù)業(yè)務(wù)性能需求在Block資源上再做個細(xì)分。例如我們根據(jù)數(shù)據(jù)梳理結(jié)果當(dāng)中的性能要求、并發(fā)訪問、重要性等方面的綜合分級與Block資源池當(dāng)中的性能分級對應(yīng)并做分別對應(yīng)。同時,我們需要考慮其中的變化因素,因為數(shù)據(jù)業(yè)務(wù)訪問的指標(biāo)是動態(tài)的,原有的匹配很可能會與實際的變化產(chǎn)生沖突,這個時候就需要緩沖資源的設(shè)計以及自動化平衡策略的利用,例如集中式存儲當(dāng)中的分層策略。對于Object和FS來講,可能有些人容易混淆。比如對于圖片數(shù)據(jù),似乎放在FS資源池和Object資源池沒有太大區(qū)別。對于小規(guī)模的數(shù)據(jù)量來講,如果應(yīng)用接口沒有限制,那么確實底層存儲資源池類型的選擇沒有那么清晰。但是如果考慮到存量和未來的數(shù)據(jù)量規(guī)模、數(shù)據(jù)平均大小、數(shù)據(jù)訪問特點等因素,就需要做一個準(zhǔn)確的判斷了。FS存儲資源的訪問是要依賴樹狀的索引,而Object存儲資源的訪問是靠哈希計算的支持。當(dāng)數(shù)據(jù)量到達(dá)一定規(guī)模之后,索引的掃描顯然要差于哈希的計算。從訪問特點適應(yīng)性來看,索引的隨機(jī)性也會差于哈希的隨機(jī)性。因此,雖然很多存儲架構(gòu)可以在上層進(jìn)行接口的整合,比如Ceph可以基于Object實現(xiàn)Block和FS,但是從技術(shù)架構(gòu)的選擇上來講,準(zhǔn)確直接更有效。五、存儲資源管理設(shè)計1.數(shù)據(jù)應(yīng)用接口說到數(shù)據(jù)應(yīng)用接口,其實主要是借用公有云思維的產(chǎn)物。無論是騰訊云還是阿里云,幾乎都可以看到公有云上的一些特殊存儲產(chǎn)品,它們是基于特定應(yīng)用場景數(shù)據(jù)設(shè)計出來的優(yōu)化存儲服務(wù)產(chǎn)品。比如針對云盤、備份數(shù)據(jù)、視頻數(shù)據(jù)、圖片數(shù)據(jù)、鏡像數(shù)據(jù)等專門設(shè)計的存儲資源服務(wù)。用戶不再需要關(guān)心底層基礎(chǔ)架構(gòu)的規(guī)劃、配置、優(yōu)化等方面的事宜,因為這些事情已經(jīng)被整合到存儲資源池的設(shè)計當(dāng)中了。作為企業(yè)來講,其實是有一些特定場景下的數(shù)據(jù)可以如此設(shè)計的,尤其是對一些書庫類型單一、數(shù)據(jù)膨脹速度較快、數(shù)據(jù)量規(guī)模較大的場景:比如金融企業(yè)的影像平臺數(shù)據(jù),可以考慮將對象存儲資源和文檔數(shù)據(jù)庫整合形成一個完整的閉環(huán)存儲資源服務(wù)接口。2.云化管理思維雖然存儲技術(shù)架構(gòu)會有精準(zhǔn)的選型匹配要求,但是基于未來膨脹式的數(shù)據(jù)發(fā)展規(guī)模以及不斷變化的基于互聯(lián)網(wǎng)模式的業(yè)務(wù)革新,對于數(shù)據(jù)的管理也不可能依靠有限技術(shù)工程師的精準(zhǔn)管理了,需要在資源管理、配置優(yōu)化、運維管理等方面實現(xiàn)相應(yīng)的標(biāo)準(zhǔn)化、自動化以及智能化。這一點也需要向公有云借鑒。首先,從資源的注冊請求、創(chuàng)建配置、分配發(fā)布到資源的注冊銷毀、對象消除、回收控制都需要基于統(tǒng)一的平臺接口實現(xiàn)應(yīng)用標(biāo)準(zhǔn)化調(diào)用,我們只需要在管理應(yīng)用中定義符合企業(yè)標(biāo)準(zhǔn)的資源管理流程;其次,從動態(tài)性管理來講,無論是虛擬資源的增加減少以及物理資源的拓?fù)渥兓?,都?yīng)該以運維數(shù)據(jù)為支撐建立自動化的控制標(biāo)準(zhǔn),同樣以管理應(yīng)用調(diào)用的方式來實現(xiàn)全自動化,而不是傳統(tǒng)虛擬化模式下的半自動化。再有,從運維角度來看,一方面運維采集的數(shù)據(jù)不再應(yīng)該是設(shè)備日志了,采集的數(shù)據(jù)應(yīng)該擴(kuò)展到外部訪問和內(nèi)部系統(tǒng)變化相關(guān)的系列數(shù)據(jù)體系上,不僅僅

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論