




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1 .非結(jié)構(gòu)化數(shù)據(jù)存儲非結(jié)構(gòu)化數(shù)據(jù)存儲架構(gòu)文件存取統(tǒng)一接匚HadoopHDFSHBase在上圖中,描述了非結(jié)構(gòu)化數(shù)據(jù)存儲架構(gòu)的基本組成部分,其中:1 .文件存取統(tǒng)一接口,封裝了對數(shù)據(jù)中心所以非結(jié)構(gòu)化數(shù)據(jù)的讀寫操作接口。2. HadoopHDFS負(fù)責(zé)對大文件的存儲,以HDFS:為文件協(xié)議標(biāo)準(zhǔn)3. HBase通過維護(hù)一張文件表完成對小文件的存儲,以HBase:為文件協(xié)議標(biāo)識1.1 文件存取統(tǒng)一接口1.1.1 文件存儲接口對文件進(jìn)行存儲前,接口根據(jù)文件的大小和HDFS文件分塊的配置大小進(jìn)行比較,當(dāng)文件超過設(shè)定大小時(shí),接口認(rèn)為該文件是大文件,直接分配到HDFS文件存儲接口進(jìn)行寫入;否則當(dāng)文件小與塊大小
2、時(shí),根據(jù)系統(tǒng)維護(hù)的Hbase小文件存儲通用存儲表進(jìn)行存儲管理。文件存儲接口周和療件在儲播口發(fā)幅由建工El M存陞持二口方一牛乎行健去直ies麻部明。藏陰友計(jì)用據(jù)世禹Ji性生成皿f赤儡路柱.生財(cái)仲臉嬲m1B轆贏哀悻茗粗文件該Jr丁 .匚 1T. -J, rr1_t r返回必/存儲躇往L返回交并存情路程pE-u-Tr'*"=1 .對直接存儲到HDFS的文件,則文件路徑以HDFS為中心存儲文件協(xié)議頭,文件路徑則根據(jù)該文件的業(yè)務(wù)屬性做完文件的路徑,文件名稱保留原有名稱,例如:HDFS:/aaa/bbb.zip2 .對通過Hbase管理的小文件,則文件路徑以HBASE為中心存儲文件協(xié)議
3、頭,文件路徑不需要分文件夾,直接以文件的唯一標(biāo)識標(biāo)識即可,例如:HBASE:/uuid1.1.2文件讀取接口文件讀取時(shí),通過識別URL ,確定文件的存儲方式,然后找到對應(yīng)的存儲接口獲取文件。文件讀即接口發(fā)起舂;讀里文件(XBASE:/八bbbrA識別文件存儲方式苣助丁律返回文件調(diào)回文件1.1 HadoopHDFS存儲接口完成大文件的存儲與讀取接口操作O1.2 Hbase存儲接口文件通用存儲表結(jié)構(gòu):管理表文件唯一標(biāo)識varohar(32)<pk>支佯存儲方式varchar(1)文件名稱varchar(200)文件大小number(18)文件二進(jìn)制流binary表存在兩個(gè)列簇,defa
4、ult列簇負(fù)責(zé)存儲基礎(chǔ)屬性信息,用一個(gè)單獨(dú)的列簇存儲圖片內(nèi)容。HBase是采用面向列的存儲模型,按列簇來存儲和處理數(shù)據(jù),即同一列簇的數(shù)據(jù)會連續(xù)存儲。HBase在存儲每個(gè)列簇時(shí),會以Key-Value的方式來存儲每行單元格(Cell)中的數(shù)據(jù),形成若干數(shù)據(jù)塊,然后把數(shù)據(jù)塊保存到HFile中,最后把HFile保存到后臺的HDFS上。由于用單元格(Cell)存儲圖片小文件的內(nèi)容,上述存儲數(shù)據(jù)的過程實(shí)際上隱含了把圖片小文件打包的過程。默認(rèn)情況下,HBase數(shù)據(jù)塊限制為64KB。由于圖片內(nèi)容作為單元格(Cell)的值保存,其大小受制于數(shù)據(jù)塊的大小。在應(yīng)用中需根據(jù)最大圖片大小對HBase數(shù)據(jù)塊大小進(jìn)行修改。具體修改方法是在表創(chuàng)建時(shí),分列簇指定,具體配置如下圖:用HColumnD
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)生互評對提升表達(dá)能力的心得體會
- 商品混凝土攪拌站現(xiàn)場安全管理制度范文
- 大學(xué)生英語趣配音競賽計(jì)劃
- 檔案保管及管理機(jī)構(gòu)職責(zé)說明
- 小學(xué)美術(shù)教師藝術(shù)素養(yǎng)計(jì)劃
- 新人教版八年級歷史下冊教學(xué)計(jì)劃
- 幼兒美術(shù)教育實(shí)習(xí)總結(jié)范文
- 抗菌藥物合理使用管理工作流程
- 鄉(xiāng)鎮(zhèn)小學(xué)道德法治教學(xué)工作計(jì)劃
- 隧道工程文明施工管理體系與措施
- 員工帶小孩管理制度
- 2025年中國高壓電源供應(yīng)器行業(yè)市場調(diào)查、投資前景及策略咨詢報(bào)告
- 2024年中國黑龍江省農(nóng)藥市場調(diào)查報(bào)告
- 衛(wèi)生法律法規(guī)典型案例解析
- 注塑廠薪資管理制度
- 2025-2030年中國黑膠唱片行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報(bào)告
- LINE6效果器HD300中文說明書
- 可編程控制技術(shù)課件
- 2025年目標(biāo)管理實(shí)施與評估考試試卷及答案
- 【邵陽】2024年湖南邵陽新邵縣事業(yè)單位招聘工作人員44人筆試附帶答案詳解
- 外賣餐飲平臺管理制度
評論
0/150
提交評論