![2024攜程HBase 實踐應用_第1頁](http://file4.renrendoc.com/view8/M00/23/19/wKhkGWb608aAMZnFAAF3tHho70E898.jpg)
![2024攜程HBase 實踐應用_第2頁](http://file4.renrendoc.com/view8/M00/23/19/wKhkGWb608aAMZnFAAF3tHho70E8982.jpg)
![2024攜程HBase 實踐應用_第3頁](http://file4.renrendoc.com/view8/M00/23/19/wKhkGWb608aAMZnFAAF3tHho70E8983.jpg)
![2024攜程HBase 實踐應用_第4頁](http://file4.renrendoc.com/view8/M00/23/19/wKhkGWb608aAMZnFAAF3tHho70E8984.jpg)
![2024攜程HBase 實踐應用_第5頁](http://file4.renrendoc.com/view8/M00/23/19/wKhkGWb608aAMZnFAAF3tHho70E8985.jpg)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
攜程HBaseHBase目前我們使用的HBase版本為1.2.0-cdh5.7.1版,表的數量1000張以上,大表超過了100TBQPS5HDFS50TB(HBaseOpenTSDB,將埋點數據分析給應用,查看應用請求量和延遲等HBaseBUHermesJstormjobidHBaseHBaseSSD集群訪問延遲基本控制在10ms以內。除了以上場景外,其他所有業(yè)務線都用到了HBase。使用方式基本類似,實時寫一般通過Jstorm/HBaseAPI寫入HBase,批量寫一般通過SPARK/MR/Hive/Kylin等,應用讀取HBase再去使用。hickwallOSjmxAPIHBaseHDFSzookeeper的其它數據。數據落地到inflexDB,然后在Griffin上展示,同時依據一些規(guī)則產生一些告警。flashCompaction隊列,flash隊列請求比較大意味著機群的寫負載比較重,如果高峰期Compaction隊列有積壓需要調整Compaction策略,避免業(yè)務高峰期影響性能。Blockcache中讀取,這樣讀寫延遲比較高。Hlog、Storefile文件數過大,則表明寫的負載比較重,也會根據Storefile文件大小,如Regionserver上總Storefile文件大小預估MajorCompaction的消耗。MajorCompaction將所有數據讀出來寫成一個新的文件,如果Storefile很大,預示著Compaction消耗也很大。GetScanputGCGCGC功能,其思路是建一個表,建表的時候首先會知道集群有多少RegionServer,根據RegionServer數量進行預分區(qū),構建Region;檢查確保每個RegionServer上都有Region;然后每個一段時間對所有RegionServer進行put/scan一行,分別獲取耗時。這樣得到一個直觀的數據可以了解到用戶的訪問延遲或者哪個RegionServer的響應延遲則,比如連續(xù)失敗N次需要報警燈等。HBasePingPingDisk況,CPUCPUSWAPSWAP率,QPS表示請求量,NetWork展示最近每塊網卡的流量使用情況,IO指IO延遲。覽”看板,展示了集群總的請求量,以及某些指標MaxTopN的RegionServer,比如說想知道有哪些RegionServer的請求量是最高的,可以通過MaxTopN指標展示哪些RegionServer它的作用是讓我們快速發(fā)現表有沒有熱點或者熱點是在哪個RegionServer需要從InfluxDB上根據自己需要自定義查詢,如下圖二所示“自定義查詢”,比如想查詢集群中請求量最大的表有哪些或者整個集群中最熱的Region是哪個,可以通過自定義查BomHBaseGuava依賴的是11版,而很多用戶使用的第三方產品可能依賴的是18版,那么就會產生版本的ShadeGuavaABQConfigB集群,那么客戶端在新建連接的時候就能感知到配置信息發(fā)生了變化,這時候就會關閉AConnectionTablenewConnectionBADashBoard方便地告訴用戶應用響應慢是因為用戶邏輯慢還是由于HBase響應慢。Hive上操作,把A集群的數據先加入到Hive,然后再寫入B集群,從而完成遷移;平時Export/Import,其優(yōu)點是可以使用增量遷移,在遷移時可以指定時間戳;遷移較快的是直接CopyHFile,然后在新集群直接BulkLoad,因為它跳過了HBase層面的HDFSHBase,等等,我們基本不采用這種方式。我們采用的升級基本是先搭建一個新的1.2的集群,然后在Hive上操作,把HBase0.94上的數據先讀到Hive,然后再1.2我們還可以通過修改Replication,通過模擬Replication來完成遷移。ReplicationReplication并解析數據,然后將數據寫入到Slave集群。SlaveKAFKA,再用Jstrom消費寫入新的集群中。采用這種方式來完成遷移。CompactionCompaction,然后通過腳本以Region為單位進行MajorCompaction,周期為N天,周期根據lastMajorCompactionTimestamp、TTL、writes高峰期觸發(fā)Split,對性能損耗非常大。候,可能表已存在,那么如何避免呢?我們通過獲取Client設置不當報錯以及其他熱點問ClientRegionMovedExceptionRegionSplit的方式,避免業(yè)務高峰期自己Split。rowkeyRegion較小時,實現自動化Split過熱的Region。比如某個Client一直報錯RegionMovedException?很多時候是因為Region遷移了報錯。當發(fā)生錯誤后我們開始查找問題,如下圖所示,當hbase.client.retries.number<=1非常低時出現錯誤直接throwable,沒有重試機會。IO我們通過查看性能,發(fā)現有一個RegionServer在這個時間點CPU有沖高,然后我們也發(fā)CPU_wioIOHBase通過如下命令查看SMART信息:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 化學教師教學工作總結15篇
- 浙江省湖州市2022-2023學年高一上學期期末調研測試化學試題含解析
- 2025年度企業(yè)員工技能提升培訓合同-@-1
- 甘肅省歷年中考語文現代文閱讀真題10篇(截至2024年)
- 2025年度地質災害風險評估勘察分包合同
- 2025年度環(huán)境風險評估與咨詢合同范本
- 2025年度知識產權保護居間服務合同范本
- 2025年度礦山安全生產責任及管理合同
- 2025年度大型餐飲企業(yè)雞類產品長期供應合同范本
- 2025年度廣告活動策劃與執(zhí)行合同-@-3
- 裝修工程延期協議
- 《梅大高速茶陽路段“5·1”塌方災害調查評估報告》專題警示學習
- 道路標線施工技術規(guī)程(已執(zhí)行)
- 物理調查問卷
- 給排水管道工程分項、分部、單位工程劃分
- 《傻子上學》臺詞
- 高中英語新課程標準解讀 (課堂PPT)
- 石灰石石膏濕法脫硫化學分析方案
- 《數學趣味活動》PPT課件.ppt
- 《無成人陪伴兒童乘機申請書》樣本
- 銅冶煉渣選銅尾礦還原焙燒—磁選回收鐵工藝研究
評論
0/150
提交評論