下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
HDFS云存儲(chǔ)技術(shù)可靠性簡(jiǎn)介隨著Web2.0的發(fā)展,信息量呈爆炸性增長(zhǎng),數(shù)據(jù)存儲(chǔ)逐漸成為制約企業(yè)發(fā)展的關(guān)鍵問題。高可靠性、高通用性、高擴(kuò)展性、大容量,云存儲(chǔ)以傳統(tǒng)數(shù)據(jù)中心無法比擬的優(yōu)勢(shì)特性,本文針對(duì)目前較流行的云存儲(chǔ)技術(shù)HDFS,詳細(xì)地分析了其可靠性特性。引言隨著Web2.0的發(fā)展.信息量呈爆炸性增長(zhǎng).?dāng)?shù)據(jù)存儲(chǔ)逐漸成為制約企業(yè)發(fā)展的關(guān)鍵問題。越來越多的企業(yè)開始將數(shù)據(jù)存儲(chǔ)分離出來作為獨(dú)立的項(xiàng)目進(jìn)行管理。高可靠性、高通用性、高擴(kuò)展性、大容量.云存儲(chǔ)以傳統(tǒng)數(shù)據(jù)中心無法比擬的優(yōu)勢(shì)特性.正在成為企業(yè)實(shí)現(xiàn)提高效率、降低成本的重要選擇。HDFS是當(dāng)前應(yīng)用最廣泛的云存儲(chǔ)技術(shù)之一.本文詳細(xì)分析HDFS云存儲(chǔ)技術(shù)的可靠性1、云計(jì)算技術(shù)系統(tǒng)結(jié)構(gòu)云計(jì)算是一種商業(yè)計(jì)算模型。它將計(jì)算任務(wù)分布在大量計(jì)算機(jī)構(gòu)成的資源池上,使各種應(yīng)用系統(tǒng)能夠根據(jù)需要獲取計(jì)算力、存儲(chǔ)空問和信息服務(wù)。點(diǎn)擊圖片查看大圖圖1云計(jì)算技術(shù)體系結(jié)構(gòu)云計(jì)算技術(shù)體系結(jié)構(gòu)分為4層:物理資源層、資源池層、管理中間件層和SOA構(gòu)建層,如圖1所示。物理資源層包括計(jì)算機(jī)、存儲(chǔ)器、網(wǎng)絡(luò)設(shè)施、數(shù)據(jù)庫(kù)和軟件等:資源池層是將大量相同類型的資源構(gòu)成同構(gòu)或接近同構(gòu)的資源池,如計(jì)算資源池、數(shù)據(jù)資源池等。管理中間件負(fù)責(zé)對(duì)云計(jì)算的資源進(jìn)行管理.并對(duì)眾多應(yīng)用任務(wù)進(jìn)行調(diào)度,使資源能夠高效、安全地為應(yīng)用提供服務(wù):S0A構(gòu)建層將云計(jì)算能力封裝成標(biāo)準(zhǔn)的WebServices服務(wù),并納入到SOA體系進(jìn)行管理和使用.包括服務(wù)注冊(cè)、查找、訪問和構(gòu)建服務(wù)工作流等。管理中間件和資源池層是云計(jì)算技術(shù)的最關(guān)鍵部分,SOA構(gòu)建層的功能更多依靠外部設(shè)施提供。云計(jì)算的管理中間件負(fù)責(zé)資源管理、任務(wù)管理、用戶管理和安全管理等工作資源管理負(fù)責(zé)均衡地使用云資源節(jié)點(diǎn).檢測(cè)節(jié)點(diǎn)的故障并試圖恢復(fù)或屏蔽之,并對(duì)資源的使用情況進(jìn)行監(jiān)視統(tǒng)計(jì).對(duì)云計(jì)算的可靠性有至關(guān)重要的作用下面結(jié)合HDFS介紹云存儲(chǔ)技術(shù)的可靠性。2、HDFS體系結(jié)構(gòu)Hadoop是Apache基金會(huì)的一個(gè)開源項(xiàng)目.參考Google的GFS(GoogleFileSystem)和Map/Reduce計(jì)算模型研發(fā)出HDFS(HadoopDistributedFileSystem)和自己的Map/Reduce框架。Hadoop主要由Yahoo開發(fā),F(xiàn)acebook、Amazon和Last.fm公司也都在使用Hadoop。點(diǎn)擊圖片查看大圖圖2HDFS體系結(jié)構(gòu)如圖2所示.Hadoop檔案系統(tǒng)(HadoopDistributedFileSystern.HDFS)被設(shè)計(jì)成適合運(yùn)行在通用硬件上的分布式文件系統(tǒng).其具有高容錯(cuò)性.能提供高吞吐量的數(shù)據(jù)訪問.非常適合于大規(guī)模數(shù)據(jù)集上的應(yīng)用。3、HDFS可靠性為了保障HDFS的高可靠性。HDFS有如下5個(gè)特性。(1)冷備機(jī)制HDFS中SecondaryNameNode對(duì)NameNode中元數(shù)據(jù)提供了冷備方案SecondaryNameNode將Na—meNode的fsimage與editlog從Namenode復(fù)制到臨時(shí)目錄,將fsitnage同editlog合并,并產(chǎn)生新的Fsimage并把產(chǎn)生的新的Isirnage上傳給NameNode,最后清除NameNode中的editlog(2)租約機(jī)制NameNode在打開或創(chuàng)建一個(gè)文件,準(zhǔn)備追加寫之前,會(huì)與此客戶端簽訂一份租約??蛻舳藭?huì)定時(shí)輪詢續(xù)簽租約。NameNode始終在輪詢檢查所有租約,查看是否有到期未續(xù)的租約。如果一切正常,該客戶端完成寫操作,會(huì)關(guān)閉文件,停止租約,一旦有所意外,比如文件被刪除了,客戶端宕機(jī)了,當(dāng)超過租約期限時(shí),NameNode就會(huì)剝奪此租約,將這個(gè)文件的享用權(quán),分配給他人。如此,來避免由于客戶端停機(jī)帶來的資源被長(zhǎng)期霸占的問題。(3)數(shù)據(jù)的正確性與一致性在HDFS中,為了保證數(shù)據(jù)的正確性和同一份數(shù)據(jù)的一致性,做了大量的工作。首先,每一個(gè)數(shù)據(jù)塊,都有一個(gè)版本標(biāo)識(shí),一旦數(shù)據(jù)塊上的數(shù)據(jù)有所變化,此版本號(hào)將向前增加。在NameNode上,保存有此時(shí)每個(gè)數(shù)據(jù)塊的版本,一旦出現(xiàn)數(shù)據(jù)服務(wù)器上相關(guān)數(shù)據(jù)塊版本與其不一致,將會(huì)觸發(fā)相關(guān)的恢復(fù)流程。這樣的機(jī)制保證了各個(gè)數(shù)據(jù)服務(wù)器器上的數(shù)據(jù)塊,在基本大方向上都是一致的。但是,由于網(wǎng)絡(luò)的復(fù)雜性,簡(jiǎn)單的版本信息無法保證具體內(nèi)容的一致性。因此,為了保證數(shù)據(jù)內(nèi)容上的一致,必須要依照內(nèi)容,給出簽名。當(dāng)客戶端向數(shù)據(jù)服務(wù)器追加寫人數(shù)據(jù)包時(shí),每一個(gè)數(shù)據(jù)包的數(shù)據(jù),都會(huì)切分成512字節(jié)大小的段,作為.huisheliren簽名驗(yàn)證的基本單位,在HDFS中,把這個(gè)數(shù)據(jù)段稱為Chunk,即傳輸塊。在每一個(gè)數(shù)據(jù)包中,都包含若干個(gè)傳輸塊以及每一個(gè)傳輸塊的簽名,一旦發(fā)現(xiàn)當(dāng)前的傳輸塊簽名與在客戶端中的簽名不一致,整個(gè)數(shù)據(jù)包的寫人被視為無效。(4)系統(tǒng)升級(jí)回滾當(dāng)升級(jí)某個(gè)集群的Hadoop的時(shí)候,正如任何軟件的升級(jí)一樣,可能會(huì)引人新的bug或者不兼容的修改導(dǎo)致現(xiàn)有的應(yīng)用出現(xiàn)過去沒有發(fā)現(xiàn)的問題。在所有重要的HDFS安裝應(yīng)用中,是不允許出現(xiàn)因丟失任何數(shù)據(jù)需要從零開始重啟HDFS的情況。HDFS允許管理員恢復(fù)到Hadoop的早期版本,并且將集群的狀態(tài)回滾到升級(jí)前。點(diǎn)擊圖片查看大圖圖3系統(tǒng)升級(jí)回滾如圖3所示,升級(jí)時(shí),NameNode會(huì)將新的版本號(hào),通過DataNode的登錄應(yīng)答返回。DataNode收到以后,會(huì)將當(dāng)前的數(shù)據(jù)塊文件目錄改名,從curren,改名為previous.tmp,建立一個(gè)snapshot,然后重建current目錄。重建包括重建VERSION文件,重建對(duì)應(yīng)的子目錄,然后建立數(shù)據(jù)塊文件和數(shù)據(jù)塊元數(shù)據(jù)文件到previous.tmp的硬連接。建立硬連接意味著在系統(tǒng)中只保留一份數(shù)據(jù)塊文件和數(shù)據(jù)塊元數(shù)據(jù)文件,current和previous.tmp中的相應(yīng)文件,在存儲(chǔ)中,只保留一份。當(dāng)所有的這些工作完成以后,會(huì)在current里寫人新的VER-SION文件,并將previous.tmp目錄改名為previous,完成升級(jí)。回滾相對(duì)簡(jiǎn)單,因?yàn)樗械呐f版本信息都保存在previou、目錄里?;貪L首先將current目錄改名為re-moved.tmp,然后將previous目錄改名為current,最后刪除removed.tmp目錄。提交的過程,就是將上面的previous目錄改名為finalized.tmp,然后啟動(dòng)一個(gè)線程,將該目錄刪除。(5)安全模式在啟動(dòng)的時(shí)候,名字節(jié)點(diǎn)進(jìn)入一個(gè)特殊的狀態(tài)叫做安全模式。安全模式是不發(fā)生文件塊的復(fù)制的。NN接受來自DN的心跳和塊報(bào)告。一個(gè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 開學(xué)典禮觀后感范文15篇
- 愚人節(jié)主題方案(資料11篇)
- 感恩父母孝順父母的演講稿6篇
- 產(chǎn)品營(yíng)銷策劃實(shí)施方案
- 初級(jí)會(huì)計(jì)實(shí)務(wù)-《初級(jí)會(huì)計(jì)實(shí)務(wù)》預(yù)測(cè)試卷162
- 個(gè)人車輛出租給公司進(jìn)行項(xiàng)目運(yùn)輸協(xié)議(2025版)3篇
- 二零二五版房地產(chǎn)售后服務(wù)代理銷售合同2篇
- 2025版跨境電商平臺(tái)實(shí)習(xí)生試用期勞動(dòng)合同規(guī)范3篇
- 二零二五版施工混凝土分包合同施工環(huán)境保護(hù)協(xié)議3篇
- 部編版一年級(jí)語(yǔ)文下冊(cè)識(shí)字5《動(dòng)物兒歌》精美課件
- 江西省部分學(xué)校2024-2025學(xué)年高三上學(xué)期1月期末英語(yǔ)試題(含解析無聽力音頻有聽力原文)
- 基底節(jié)腦出血護(hù)理查房
- 工程公司總經(jīng)理年終總結(jié)
- 2024年海南省高考地理試卷(含答案)
- 【企業(yè)盈利能力探析的國(guó)內(nèi)外文獻(xiàn)綜述2400字】
- 三年級(jí)上冊(cè)數(shù)學(xué)口算題1000道帶答案
- 蘇教版(2024新版)一年級(jí)上冊(cè)科學(xué)全冊(cè)教案教學(xué)設(shè)計(jì)
- 期末綜合測(cè)試卷一(試題)-2023-2024學(xué)年一年級(jí)下冊(cè)數(shù)學(xué)滬教版
- 江西警察學(xué)院治安學(xué)專業(yè)主干課程教學(xué)大綱 文檔
- 醫(yī)美整形銷售培訓(xùn)課件
- 芯片研發(fā)項(xiàng)目計(jì)劃表模板
評(píng)論
0/150
提交評(píng)論