



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1 .非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)架構(gòu)文件存取統(tǒng)一接口HadoooHDFSHBase在上圖中,描述了非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)架構(gòu)的基本組成部分,其中:1. 文件存取統(tǒng)一接口,封裝了對(duì)數(shù)據(jù)中心所以非結(jié)構(gòu)化數(shù)據(jù)的讀寫操作接口。2. HadoopHDFS負(fù)責(zé)對(duì)大文件的存儲(chǔ),以HDFS:為文件協(xié)議標(biāo)準(zhǔn)3. HBase通過維護(hù)一張文件表完成小文件的存儲(chǔ),以HBase:為文件協(xié)議標(biāo)識(shí)1.1 文件存取統(tǒng)一接口1.1.1 文件存儲(chǔ)接口對(duì)文件進(jìn)行存儲(chǔ)前,接口根據(jù)文件的大小和HDFS文件分塊的配置大小進(jìn)行比較,當(dāng)文件超過設(shè)定大小時(shí),接口認(rèn)為該文件是大文件,直接分配到HDFS文件存儲(chǔ)接口進(jìn)行寫入;否則當(dāng)文件小與塊大小時(shí)
2、,根據(jù)系統(tǒng)維護(hù)的Hbase小文件存儲(chǔ)通用存儲(chǔ)表進(jìn)行存儲(chǔ)管理。文件存低接口時(shí)序國IIBzfc存嘴稀口發(fā)牽苜判斷文午的存慚式大文件相提讓分.屬性生成通監(jiān)存儲(chǔ)儲(chǔ)法一士成存儲(chǔ)路徑,保存文件返回通”存楠路徑卜文件生蕨件嚏一標(biāo)識(shí)卬保存標(biāo)詛,文件名稱、文件流返回Hba存儲(chǔ)路役Lzr排叫件存幅接.對(duì)直接存儲(chǔ)到HDFS的文件,則文件路徑以HDFS為中心存儲(chǔ)文件協(xié)議頭,文件路徑則根據(jù)該文件的業(yè)務(wù)屬性做完文件的路徑,文件名稱保留原有名稱,例如:HDFS:/aaa/bbb.zip.對(duì)通過Hbase管理的小文件,則文件路徑以HBASE為中心存儲(chǔ)文件協(xié)議頭,文件路徑不需要分文件夾,直接以文件的唯一標(biāo)識(shí)標(biāo)識(shí)即可,例如:HB
3、ASE:/uuid1.1.2文件讀取接口文件讀取時(shí),通過識(shí)別URL,確定文件的存儲(chǔ)方式,然后找到對(duì)應(yīng)的存儲(chǔ)接口獲取文件。5加脂存儲(chǔ)掩口讀取文件00蛉E:/s5Ahrip)應(yīng)蔽件存儲(chǔ)方式二I讀取文件返回文件文件讀取接口返回文件HadoopHDFS存儲(chǔ)接口完成大文件的存儲(chǔ)與讀取接口操作。Hbase存儲(chǔ)接口文件通用存儲(chǔ)表結(jié)構(gòu):Hbas已文件統(tǒng)一管理表文“土唯一標(biāo)識(shí)yarchar(32)<uk>文件存儲(chǔ)方式varchar(l)文件名稱varchar(200)文件大小口皿ber(18)文件二進(jìn)制流binary表存在兩個(gè)列簇,default列簇負(fù)責(zé)存儲(chǔ)基礎(chǔ)屬性信息,用一個(gè)單獨(dú)的列簇存儲(chǔ)圖片內(nèi)容
4、。HBase是采用面向列的存儲(chǔ)模型,按列簇來存儲(chǔ)和處理數(shù)據(jù),即同一列簇的數(shù)據(jù)會(huì)連續(xù)存儲(chǔ)。HBase在存儲(chǔ)每個(gè)列簇時(shí),會(huì)以Key-Value的方式來存儲(chǔ)每行單元格(Cell)中的數(shù)據(jù),形成若干數(shù)據(jù)塊,然后把數(shù)據(jù)塊保存到HFile中,最后把HFile保存到后臺(tái)的HDFS上。由于用單元格(Cell)存儲(chǔ)圖片小文件的內(nèi)容,上述存儲(chǔ)數(shù)據(jù)的過程實(shí)際上隱含了把圖片小文件打包的過程。默認(rèn)情況下,HBase數(shù)據(jù)塊PM制為64KR由于圖片內(nèi)容作為單元格(Cell)的值保存,其大小受制于數(shù)據(jù)塊的大小。在應(yīng)用中需根據(jù)最大圖片大小對(duì)HBase數(shù)據(jù)塊大小進(jìn)行修改。具體修改方法是在表創(chuàng)建時(shí),用HColumnDescriptor指定數(shù)據(jù)塊大小,可分列簇指定,具體配置如下圖:(NAMEFAMILIES->(NAME'
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 教育大數(shù)據(jù)提升教學(xué)質(zhì)量的創(chuàng)新路徑
- 如何運(yùn)用教育技術(shù)提升企業(yè)內(nèi)訓(xùn)中的混合式學(xué)習(xí)效果研究報(bào)告
- 2025年房屋整體質(zhì)量無損檢測分析系統(tǒng)合作協(xié)議書
- 學(xué)生心理健康與學(xué)校教育的融合發(fā)展
- 商業(yè)視角下的數(shù)字化教學(xué)設(shè)計(jì)與實(shí)施策略
- 醫(yī)療心理輔導(dǎo)在疾病康復(fù)中的作用
- 提升教學(xué)質(zhì)量5G網(wǎng)絡(luò)在教育技術(shù)中的應(yīng)用策略
- 合同與信息管理類
- 教育園區(qū)的辦公空間與智慧圖書館建設(shè)
- 基于AI的教學(xué)管理系統(tǒng)開發(fā)與實(shí)踐研究報(bào)告
- 民宿托管運(yùn)營合同模板
- 2024鄭州鐵路職業(yè)技術(shù)學(xué)院教師招聘考試筆試試題
- DL5009.2-2013 電力建設(shè)安全工作規(guī)程 第2部分:電力線路-www.biao-zhun.cn
- CHT 9008.3-2010 基礎(chǔ)地理信息數(shù)字成果1:500 1:1 000 1:2 000數(shù)字正射影像圖(正式版)
- 四川省成都市2024年七年級(jí)下學(xué)期期末數(shù)學(xué)試題附答案
- 體育館安全協(xié)議書
- 科目余額表模板
- 人口社會(huì)學(xué)(楊菊華 第二版) 課件 第8-14章 婚姻家庭-人口特征與民生發(fā)展
- 《字體設(shè)計(jì)》課程標(biāo)準(zhǔn)
- 異位妊娠護(hù)理查房課件
- 天津小學(xué)生詩詞大賽備考試題庫500題(五六年級(jí))
評(píng)論
0/150
提交評(píng)論