版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
今天分享的內(nèi)容分為兩部分,第一部分是Druid原理,包括相關(guān)選型、原理、架構(gòu)以及調(diào)優(yōu)經(jīng)驗(yàn)。第二部分是BDAS使用場(chǎng)景,是基于Druid做的監(jiān)控日志報(bào)表系統(tǒng)。DruidMOLAPMMDBPreAGG,是一個(gè)如kafka插件、mysql插件、hdfs插件等。我們從去年五月份做技術(shù)選型,sparkSchemafree,之前不用最后沒(méi)有選用spark是因?yàn)椴l(fā)量上不去,因?yàn)槲覀儤I(yè)務(wù)并發(fā)量可能上千,使用spark很容易造成高溫。ElasticSearch也是很熱門的一個(gè)領(lǐng)域,大家常見(jiàn)的理解就是一個(gè)全文搜索的引擎,其實(shí)在分析方面也有很多新技術(shù)。其特性也是Schemafree,本身架構(gòu)兼容這種數(shù)據(jù)格式,對(duì)比Druid的優(yōu)點(diǎn)是會(huì)保存原始數(shù)據(jù)。同時(shí)擁有一個(gè)完整的技術(shù)棧(elk),非要做倒排索引,但是索引數(shù)據(jù)量和原始數(shù)據(jù)相差不大,最后舍棄。Druid亞秒級(jí),數(shù)據(jù)可用毫秒級(jí),基本滿足需求;Lambda架構(gòu),擴(kuò)張性、容錯(cuò)性高,我們選用Druid。SQLonHadoopMPP(大規(guī)模并行處理)CS(列式存儲(chǔ)),特性,SQL支持良好,定制化硬件,天花板低(PB級(jí)別以下),非線性拓展,擴(kuò)容需要停Druid,將其定位為實(shí)時(shí)可用一個(gè)上升的SaaS層服務(wù),支持大型冷數(shù)據(jù)上的OLAP場(chǎng)景,實(shí)現(xiàn)對(duì)一個(gè)多維度高基數(shù)的亞秒縮。SegmentDruidtimestamp接下來(lái)講一下Druid數(shù)據(jù)流轉(zhuǎn),流轉(zhuǎn)圖中有很多節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)都有自己的職責(zé)。中間有zookeeper,每一個(gè)節(jié)點(diǎn)都或多或少與其相連,zookeeperzookeeperBrokerREST些查詢轉(zhuǎn)發(fā)到Realtime和Historical節(jié)點(diǎn)。從這兩個(gè)節(jié)點(diǎn)拿數(shù)據(jù),然后將節(jié)點(diǎn)返回給HistoricalBroker在查詢數(shù)據(jù)時(shí)現(xiàn)在本地找,然后在深度存儲(chǔ)里查找,查找到后返回給Broker,沒(méi)有與其他節(jié)點(diǎn)關(guān)聯(lián)。在Zookeeper的管理下提供服務(wù),并使用Zookeeper監(jiān)視信號(hào)加載或刪除互相不通信,同樣利用zookeeper同步,將信息解耦開來(lái)。用、可復(fù)制,并且處于“最佳”配置。同時(shí)通過(guò)從MySQL讀取數(shù)據(jù)段的元數(shù)據(jù)信息,來(lái)決定哪些數(shù)據(jù)段應(yīng)該在集群中被加載,使用Zookeeper來(lái)確定哪個(gè)Historical節(jié)點(diǎn)存Zookeeper條目告訴Historical節(jié)點(diǎn)加載和刪除新數(shù)據(jù)段。該節(jié)點(diǎn)可以是一個(gè),多個(gè)的節(jié)點(diǎn)進(jìn)行選舉產(chǎn)生Leader,其余節(jié)點(diǎn)作為備份,一般兩個(gè)也是滿足需求的。實(shí)時(shí)節(jié)點(diǎn)Realtime是實(shí)時(shí)攝取數(shù)據(jù),負(fù)責(zé)監(jiān)聽輸入數(shù)據(jù)流并讓其在內(nèi)部的Druid系統(tǒng)立broker回給broker。如果Realtime和Historical節(jié)點(diǎn)同時(shí)返回同一種數(shù)據(jù),Broker會(huì)認(rèn)為身會(huì)存儲(chǔ)數(shù)據(jù),如果超過(guò)一段時(shí)間窗口會(huì)將數(shù)據(jù)傳入深度存儲(chǔ),深度存儲(chǔ)將數(shù)據(jù)提供給Historical節(jié)點(diǎn)。MySQLzookeeperDruidDeepStorageHDFSS3或本地磁盤,用來(lái)保存“冷數(shù)據(jù)”,有兩個(gè)個(gè)數(shù)據(jù)來(lái)源,一個(gè)是批數(shù)據(jù)攝入,另一個(gè)來(lái)自實(shí)時(shí)節(jié)點(diǎn);ZooKeeperMySQL局部過(guò)熱,影響查詢性能。沒(méi)有絕對(duì)master丟棄掉,就會(huì)出現(xiàn)數(shù)據(jù)庫(kù)性能問(wèn)題。社區(qū)比較成熟的框架就是數(shù)據(jù)實(shí)時(shí)進(jìn)來(lái)寫到kafka,kafka數(shù)據(jù)兩次消費(fèi),一次在存儲(chǔ)節(jié)點(diǎn)上,一次在Hadoop上,如果數(shù)據(jù)不完整就再在Hadoop做一次embedding操作,補(bǔ)回?cái)?shù)據(jù)。上面是一個(gè)推薦的架構(gòu),希望broker節(jié)點(diǎn)越多越好,Coordinator節(jié)點(diǎn)兩個(gè),overload對(duì)于broker消耗內(nèi)存大戶,建議20G-30G堆內(nèi)存,歷史節(jié)點(diǎn)除了內(nèi)存還有硬盤消耗,希望用更多的內(nèi)存去釋放硬盤的IO,Coordinator消耗內(nèi)存相對(duì)較小,只需要滿足要求即可。查詢時(shí)盡量做一些聚合優(yōu)化,在攝入就做聚合,盡量少去groupbyHistorical和Realtime分離,Coordinator和Broker分離,在Broker上加Nginx做負(fù),讓Cognos(Oracle)處理清單報(bào)表,上線有十年歷史。隨著數(shù)據(jù)量的增長(zhǎng)、以及分析處理的訴求增加,Cognos在cube過(guò)大時(shí)受限的DBASDruidhive分析,12Druid,實(shí)現(xiàn)多維分析功能。線上一共有數(shù)十個(gè)數(shù)據(jù)源,最大數(shù)據(jù)間<2s。接下來(lái)介紹下在HDFS下的使用場(chǎng)景,第一種是透視圖概念,用戶在某一定條件(不斷衰減)查看數(shù)據(jù)大體概要,一般采用TopN查詢,秒級(jí)響應(yīng)。響應(yīng)方式是在前端一個(gè)維度一個(gè)維度拖動(dòng),后端將上一次結(jié)果緩存,最后只查詢幾個(gè)維度。TopN查詢第一次查詢只查redis查詢速度明顯下降。我們引入單線程當(dāng)初考慮了兩種方式,第一種方式是依次將N個(gè)維度topNM*N*PtopN的時(shí)間,這樣存在一個(gè)問(wèn)題就是順序不能保障。第二種方式采用遞歸的方式,并統(tǒng)一由線程池執(zhí)行(是不是線程開線程?不是)AAB改為維度A+A1A+A2A+A1B+B1,這樣可以充分利用Druid序,花費(fèi)的時(shí)間可能多點(diǎn),,大約需要N*M個(gè)topN的時(shí)間。都將其組裝成一起,當(dāng)超過(guò)4-5個(gè)維度就會(huì)效率很低。改進(jìn)的方式也是采用多線程,前面b
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 北師大版四年級(jí)上冊(cè)數(shù)學(xué)第一單元 認(rèn)識(shí)更大的數(shù) 測(cè)試卷及答案【網(wǎng)校專用】
- 睿彩塑膠擴(kuò)產(chǎn)二期建設(shè)項(xiàng)目環(huán)評(píng)報(bào)告表
- 粉煤灰資源化利用制磚項(xiàng)目環(huán)評(píng)報(bào)告表
- IATF169492016汽車質(zhì)量管理體系標(biāo)準(zhǔn)試卷
- 2024年防汛抗洪應(yīng)急預(yù)案考試練習(xí)試卷附答案
- 車輛檢修工必知必會(huì)復(fù)習(xí)試題有答案
- 特種作業(yè)人員 低壓電工作業(yè) 理論考試專項(xiàng)測(cè)試卷
- 古董維護(hù)服務(wù)協(xié)議
- 評(píng)級(jí)練習(xí)試題
- 2024腳手架勞務(wù)分包合同范本
- 防火門窗施工方案
- “雙師教學(xué)”在初中數(shù)學(xué)課堂中的應(yīng)用
- 戰(zhàn)略合作簽約儀式教育PPT課程課件
- 土方填筑碾壓試驗(yàn)報(bào)告
- 老舊小區(qū)排水部分雨污水改造監(jiān)理細(xì)則
- 2022年地殼運(yùn)動(dòng)與變化教案與學(xué)案
- 上海市單位退工證明退工單(四聯(lián))
- 《建筑起重吊裝工程安全技術(shù)規(guī)程》JGJ276
- 市政道路水穩(wěn)層項(xiàng)目施工合同
- 睿丁英語(yǔ)小紅帽和大灰狼的故事
- 轉(zhuǎn)人教版七年級(jí)上期中復(fù)習(xí)教案
評(píng)論
0/150
提交評(píng)論