版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、關(guān)于Flume課程內(nèi)容Flume簡(jiǎn)介Flume示例Flume配置Flume實(shí)戰(zhàn)2/51什么是Flume3/51什么是FlumeFlume是一個(gè)高可用的,高可靠的,分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)Flume支持在日志系統(tǒng)中定制各類(lèi)數(shù)據(jù)發(fā)送方,用于收集數(shù)據(jù);同時(shí),F(xiàn)lume提供對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單處理,并寫(xiě)到各種數(shù)據(jù)接受方(可定制)的能力。4/51Flume原理5/51Flume原理6/51Flume原理Flume的數(shù)據(jù)流由事件(Event)貫穿始終。Event是Flume的基本數(shù)據(jù)單位,它攜帶日志數(shù)據(jù)(字節(jié)數(shù)組形式)并且攜帶有頭信息,Event由Agent的Source生成,當(dāng)Source捕獲事
2、件后會(huì)進(jìn)行特定的格式化,然后Source會(huì)把事件推入(單個(gè)或多個(gè))Channel中。Channel可以看作是一個(gè)緩沖區(qū),它將保存Event直到Sink處理完該Event。Sink負(fù)責(zé)持久化日志或者把Event推向另一個(gè)Source。7/51Flume AgentAgent由Source、Channel和Sink組成。Flume內(nèi)部有一個(gè)或者多個(gè)AgentAgent中可以包含多個(gè)Source和Sink。Agent是一共獨(dú)立的守護(hù)進(jìn)程(JVM)8/51Flume Agent-SourceSource 負(fù)責(zé)數(shù)據(jù)的產(chǎn)生或收集,一般是對(duì)接RPC的程序或者是其他的Flume節(jié)點(diǎn)的SinkSource接收數(shù)
3、據(jù),并將接收的數(shù)據(jù)以Flume的Event格式傳遞給Channel9/51Flume AgentSource類(lèi)型10/51Flume Agent-ChannelChannel 是短暫的存儲(chǔ)容器,負(fù)責(zé)數(shù)據(jù)的存儲(chǔ),將從Source處接收到的Event格式的數(shù)據(jù)緩存起來(lái),直到被Sink消費(fèi)掉Channel類(lèi)似一個(gè)先進(jìn)先出的隊(duì)列,數(shù)據(jù)只有存儲(chǔ)在下一個(gè)存儲(chǔ)位置(可能是最終的存儲(chǔ)位置,如HDFS;也可能是下一個(gè)Flume節(jié)點(diǎn)的Channel),數(shù)據(jù)才會(huì)從當(dāng)前的Channel中刪除。這個(gè)過(guò)程是通過(guò)事務(wù)來(lái)控制的,這樣就保證了數(shù)據(jù)的可靠性。11/51Flume Agent12/51Flume Agent-Sin
4、kSink負(fù)責(zé)數(shù)據(jù)的轉(zhuǎn)發(fā),它從Channel消費(fèi)數(shù)據(jù)(Events)并將其傳遞給目標(biāo)地。目標(biāo)地可能是另一個(gè)Sink,也可能是hdfs、logger、avro、thrift、ipc、file、null、Hbase、solr等13/51Flume AgentSink類(lèi)型14/51Flume的特點(diǎn)Flume提供收集、移動(dòng)、聚合大量日志數(shù)據(jù)的服務(wù)實(shí)時(shí)的基于事件的流數(shù)據(jù)架構(gòu)在生產(chǎn)和消費(fèi)者之間啟動(dòng)協(xié)調(diào)作用提供了事務(wù)保證,確保Event可靠傳輸15/51課程內(nèi)容Flume簡(jiǎn)介Flume示例Flume配置Flume實(shí)戰(zhàn)16/51netcat簡(jiǎn)介17/51netcat簡(jiǎn)介netcat是網(wǎng)絡(luò)工具中的瑞士軍刀,它能
5、通過(guò)TCP和UDP在網(wǎng)絡(luò)中讀寫(xiě)數(shù)據(jù)。netcat所做的就是在兩臺(tái)電腦之間建立鏈接并返回兩個(gè)數(shù)據(jù)流。netcat應(yīng)用場(chǎng)景:建立一個(gè)服務(wù)器,傳輸文件,與朋友聊天,傳輸流媒體或者用它作為其它協(xié)議的獨(dú)立客戶(hù)端。18/51Flume配置-netcat19/51課程內(nèi)容Flume簡(jiǎn)介Flume示例Flume配置Flume實(shí)戰(zhàn)20/51Flume配置(1)-定義流21/51Flume配置(1)定義流示例22/51說(shuō)明:一個(gè)名為agent_foo的agent,從一個(gè)外部的avro client讀取數(shù)據(jù),然后經(jīng)過(guò)channel,再發(fā)送到HDFSFlume配置(2)-配置組件23/51Flume配置(2)配置組件
6、示例24/51Flume配置-單agent多流25/51Flume配置-單agent多流示例26/51Flume配置多agent流27/51為了能使數(shù)據(jù)流跨越多個(gè)agent或者跳,前一個(gè)agent的sink和當(dāng)前一跳的source需要同樣是avro類(lèi)型的,并且sink需要指定source的hostname(或者ip地址)和端口號(hào)。Flume配置多agent流(1)28/51Flume配置多agent流(2)29/51合并數(shù)據(jù)流30/51扇出流31/51扇出流扇出(fan out):一個(gè)Source的數(shù)據(jù)發(fā)送到多個(gè)SinkFlume支持多路輸出event流到一個(gè)或多個(gè)目的地。這是靠定義一個(gè)多路數(shù)
7、據(jù)流實(shí)現(xiàn)的,它可以實(shí)現(xiàn)復(fù)制和選擇性路由一個(gè)event到一個(gè)或者多個(gè)channel。這個(gè)扇出可以是復(fù)制(replicating)或者多路輸出(multiplexing)。在復(fù)制數(shù)據(jù)流的情況下,每一個(gè)event被發(fā)送所有的channel中在多路輸出的情況下,一個(gè)event被發(fā)送到一部分可用的channel中32/51扇出流配置(1)33/51扇出流配置(2)34/51扇出流示例(1)35/51課程內(nèi)容Flume簡(jiǎn)介Flume示例Flume配置Flume實(shí)戰(zhàn)36/51實(shí)驗(yàn)說(shuō)明Spooling Directory Source37/51實(shí)驗(yàn)38/51實(shí)驗(yàn)Spooling Directory Source監(jiān)測(cè)配置的目錄下新增的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度柴油產(chǎn)品質(zhì)量檢測(cè)與認(rèn)證合同范本4篇
- 二零二五年度文化創(chuàng)意產(chǎn)業(yè)合作合同及產(chǎn)品開(kāi)發(fā)2篇
- 二零二五年度能源行業(yè)勞動(dòng)合同及節(jié)能減排協(xié)議3篇
- 二零二五年度藝術(shù)品在線(xiàn)交易平臺(tái)版權(quán)購(gòu)買(mǎi)合同4篇
- 2025年版農(nóng)產(chǎn)品質(zhì)量安全檢測(cè)服務(wù)合同模板3篇
- 2025年度旅行社旅游教育培訓(xùn)課程轉(zhuǎn)讓及合作推廣合同4篇
- 2025年度廠(chǎng)房改造裝修工程竣工驗(yàn)收合同模板4篇
- 2025年度智能設(shè)備租賃與質(zhì)押擔(dān)保服務(wù)合同4篇
- 二零二五年度餐飲企業(yè)員工薪酬福利管理合同3篇
- 二手房房屋買(mǎi)賣(mài)合同
- 以發(fā)展為導(dǎo)向共創(chuàng)教育新篇章-2024年期末校長(zhǎng)總結(jié)講話(huà)稿
- 2025年焊工安全生產(chǎn)操作規(guī)程(2篇)
- 廣東省廣州越秀區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末數(shù)學(xué)試卷(含答案)
- 臨床經(jīng)鼻高流量濕化氧療患者護(hù)理查房
- 2024年貴州省中考數(shù)學(xué)真題含解析
- 參考新醫(yī)大-中央財(cái)政支持地方高校發(fā)展專(zhuān)項(xiàng)資金建設(shè)規(guī)
- 《中醫(yī)內(nèi)科學(xué)關(guān)格》課件
- 2024年中國(guó)PCB板清洗劑市場(chǎng)調(diào)查研究報(bào)告
- 《紙管》規(guī)范要求
- 【數(shù)學(xué)】2021-2024年新高考數(shù)學(xué)真題考點(diǎn)分布匯
- 2024年育嬰師合同協(xié)議書(shū)
評(píng)論
0/150
提交評(píng)論