版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、技術(shù)創(chuàng)新,變革未來HBase應用最佳實踐詳解內(nèi)容HBase安裝HBase常用命令HBase優(yōu)化 HBase應用場景HBase表設(shè)計HBase安裝本地模式偽分布模式,可以學習HBase的各種特性所有守護進程全部運行在一個物理節(jié)點集群模式所有守護進程分布在不同物理節(jié)點HBase安裝先要安裝HadoopHBase與Zookeeper、Hadoop版本要匹配幾個重要的配置文件hdfs-site.xml:拷貝到HBASE_HOME/confhbase-env.sh:啟動HBase的一些設(shè)置hbase-site.xml:HBase在hdfs上的數(shù)據(jù)目錄, zookeeper的主機和端口regionserv
2、ers:配置RegionServer的主機列表backup-master:配置備用Master的列表HBase安裝hbase-env.sh中的主要配置export JAVA_HOME=/usr/java/jdk1.7.0_79/export HADOOP_HOME=/var/hadoop/hadoop-2.6.0/export HADOOP_CONF_DIR=$HADOOP_HOMEetc/hadoopexport HBASE_HOME=/var/hbase/hbase-1.0.0-cdh5.4.5export HBASE_CONF_DIR=$HBASE_HOME/confexport HBA
3、SE_LIBRARY_PATH=$HBASE_HOME/lib/nativeexport LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HBASE_HOME/lib/nativeHBase安裝hbase-site.xml中的主要配置namevaluehbase.cluster.distributedtruehbase.rootdirhdfs:/huike:9000/perty.clie ntPort2181HBase常用命令start-hbase.shstop-hbase.shhb
4、ase-daemon.sh start masterhbase-daemon.sh stop masterhbase-daemon.sh start regionserverhbase-daemon.sh stop regionservergraceful_stop.sh restartHBase常用命令建表hbase create test,cf新建記錄hbase put test,1,cf:a,2修改表屬性hbase describe testhbase alter test,NAME = cf,DATA_BLOCK_ENCODING =PREFIX_TREE刪表hbase disable
5、 test hbase drop testHBase常用命令compacthbase(main):006:0 major_compact testBalancehbase(main):006:0 balancerHBase優(yōu)化垃圾回收優(yōu)化使用CMS垃圾回收機制啟用壓縮GZIP、Snappy、LZO,推薦SnappyMemStore緩存配置HBase優(yōu)化Region拆分和合并預建分區(qū),避免自動split,提高hbase響應速度Region均衡避免出現(xiàn)Region熱點現(xiàn)象,按照table級別進行balance盡量只用1-2個列族定期建表,如每月中旬建立下一個月的表,表名中含有年 月HBase優(yōu)化參
6、數(shù)默認值說明hbase.hregion.majorco mpaction604800000major compaction的執(zhí)行周期,默認 是一天,可以設(shè)置為0禁用,利用后臺 調(diào)度,在業(yè)務不忙的時間點單獨運行hbase.regionserver.han dler.count10處理rpc請求的線程數(shù),請求較多的情 況下可以適當調(diào)大hfile.block.cache.size0.4RS中block cache占堆內(nèi)存大小的比例, 在讀大于寫的情況下,可以適當調(diào)大, 但是要防止block cache與memstore的 百分比之和大于80%,出現(xiàn)OOMhbase.regionserver.glob
7、 al.memstore.size0.4RS中Memstore占用的內(nèi)存百分比HBase優(yōu)化參數(shù)默認值說明pactio nThreshold3可以調(diào)大,如設(shè)置為6,Store下面有超過這 個數(shù)目的文件個數(shù),可觸發(fā)minor compacthbase.master.loadbalan ce.bytablefalse改為true,默認按照regionserver去balance 會出現(xiàn)熱點情況hbase.hregion.max.filesi ze10737418240Region大小大于此值,hbase就會split,可 根據(jù)存儲內(nèi)容進行適當調(diào)整,如存儲文件應 該將此值設(shè)置更大hbase.bala
8、ncer.period300000RegionServer負載均衡時間間隔,默認5分 鐘,可稍微調(diào)長至半小時或1小時,HBase優(yōu)化參數(shù)默認值說明paction.max10一次minor compact文件個數(shù)的最大值hbase.hstore.blockin gStoreFiles10一個store下面的文件超過這個值之后,block住 所有的put delete操作,直到compact完成為止hbase.hregion.memstore.flush.size134217728Memstore中的數(shù)據(jù)達到128m,會flush到磁盤上hbase.hregion.mems tore.block.
9、multiplier4當memstore中的數(shù)據(jù)達到此參數(shù)與hbase.hregion.memstore.flush.size相乘的時候,block住更新操作,如果寫入請求較 高的情況下可以適當提高此倍率HBase應用場景大數(shù)據(jù)集上對數(shù)據(jù)進行隨機讀寫操作大數(shù)據(jù)集上高并發(fā)操作,如每秒對PB級數(shù) 據(jù)進行上千次操作讀寫訪問均是非常簡單的操作,不需要跨 行跨表的事務支持以及join操作隨著數(shù)據(jù)量的增加,容易擴展HBase應用場景歷史記錄查詢上百億行數(shù)據(jù)每天新增上千萬行查詢場景簡單,檢索條件少成本低HBase應用場景用戶歷史訂單交易評價記錄電信話費用戶畫像監(jiān)控記錄HBase表設(shè)計RowKey設(shè)計保證唯一
10、性長度越短越好散列:rowkey均勻分布在各個hbase節(jié)點上,用MD5(用戶 ID/手機號/QQ號)取前幾位+ (用戶ID/手機號/QQ號)+發(fā)生時間(毫秒)+隨機數(shù),把數(shù)據(jù)打散到各Region沒有散列值,如時間字段作為Rowkey的起始,會導致 熱數(shù)據(jù)集中在一個RegionServer上同一次查詢的數(shù)據(jù)存儲在一起HBase表設(shè)計預建分區(qū)提前對表進行分區(qū),防止Region SplitRegion數(shù)量計算確定按年/季/月建表,如果數(shù)據(jù)量特別大,不能只有1個表確定HFile最大大小,例如10G假設(shè)有1個列族,1個月的數(shù)據(jù)有5T則需要5T/(10G * 1)=512個Region預建分區(qū)可以多估一
11、點,分裂時寫入或查詢數(shù)據(jù)很緩慢HBase表設(shè)計建表屬性BLOOMFILTER = ROW:啟用bloom過濾器,保證根據(jù)Rowkey在 HFile中查找會非常快VERSIONS = 1:保存幾個版本,要保存10個版本,把數(shù)字改成10IN_MEMORY = false:列族數(shù)據(jù)是否常駐內(nèi)存TTL = FOREVER:列族數(shù)據(jù)永遠不刪除,如果只保存多少天,可 以設(shè)置這個值,如果設(shè)置了天數(shù),HBase會定時掃描整個列族,為刪 除數(shù)據(jù)做準備,耗資源COMPRESSION = NONE:HFile壓縮格式,一般用SNAPPYHBase表設(shè)計建表屬性BLOCKCACHE = true:針對列族,是否啟用BLOCKCACHEBLOCK
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學《中學思想政治課專題》2022-2023學年第一學期期末試卷
- 福建師范大學《學校德育理論與實踐》2021-2022學年第一學期期末試卷
- 2024年二建機電預測A卷講義(可打印版)
- 枸杞種植公司虧損原因分析報告模板
- 福建師范大學《山水畫基礎(chǔ)二》2022-2023學年第一學期期末試卷
- 浙江省杭州市2018年中考英語真題(含答案)
- 光伏項目承諾書
- 操作系統(tǒng) 課件 第5、6章 存儲管理、文件系統(tǒng)
- 2024年黔東南客運資格證題庫
- 2024年西寧客車從業(yè)資格證考試試題答案
- 魯科版五四制七年級上冊生物全冊單元測試卷
- 如何-我為什么選擇安惠
- 人教版二年級上冊數(shù)學期中測試卷含答案【奪分金卷】
- 四年級上冊數(shù)學課件-認識梯形-人教版-(3)(共25張PPT)
- 蘇科版2022-2023二年級上冊勞動與技術(shù)《07小鳥歸巢》教案
- TSG-R0005-2022《移動式壓力容器安全技術(shù)監(jiān)察規(guī)程》(2022版)
- 車間安全安全逃生示意圖
- 人衛(wèi)版外科學腹部損傷課件
- 福建廣播電視大學中國現(xiàn)當代文學名著導讀(2)-形成性考核三答案
- 《四川省普通高中學業(yè)水平考試成績證明》表
- 癲癇持續(xù)狀態(tài)課件
評論
0/150
提交評論