版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、目錄(ml):什么(shn me)是大數(shù)據(jù)Hadoop介紹(jisho)-HDFS、MR、Hbase大數(shù)據(jù)平臺應(yīng)用舉例-騰訊公司的大數(shù)據(jù)平臺架構(gòu)“就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式”。大數(shù)據(jù)的4V特征-來源公司的“大數(shù)據(jù)”隨著公司業(yè)務(wù)的增長,大量和流程、規(guī)則相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)也爆發(fā)式增長。比如:1、業(yè)務(wù)系統(tǒng)現(xiàn)在平均每天存儲20萬張圖片,磁盤空間每天消耗100G;2、平均每天產(chǎn)生簽約視頻文件6000個,每個平均250M,磁盤空間每天消耗1T;三國里的“大數(shù)據(jù)”“草船借箭(co chun ji jin)”和大數(shù)據(jù)有什么關(guān)系呢?對
2、天象的觀察是基于一種對風、云、溫度、濕度、光照和所處節(jié)氣的綜合分析(fnx)這些數(shù)據(jù)來源于多元化的“非結(jié)構(gòu)(jigu)”類型,并且數(shù)據(jù)量較大,只不過這些數(shù)據(jù)輸入到的不是電腦,而是人腦并最終通過計算分析得出結(jié)論。Google分布式計算的三駕馬車Google File System用來解決數(shù)據(jù)存儲的問題,采用N多臺廉價的電腦,使用冗余(也就是一份文件保存多份在不同的電腦之上)的方式,來取得讀寫速度與數(shù)據(jù)安全并存的結(jié)果。Map-Reduce說穿了就是函數(shù)式編程,把所有的操作都分成兩類,map與reduce,map用來將數(shù)據(jù)分成多份,分開處理,reduce將處理后的結(jié)果進行歸并,得到最終的結(jié)果。Big
3、Table是在分布式系統(tǒng)上存儲結(jié)構(gòu)化數(shù)據(jù)的一個解決方案,解決了巨大的Table的管理、負載均衡的問題。Hadoop體系架構(gòu)Hadoop核心(hxn)設(shè)計HDFS介紹(jisho)-文件(wnjin)讀流程Client向NameNode發(fā)起文件(wnjin)讀取的請求。NameNode返回文件(wnjin)存儲的DataNode的信息(xnx)。Client讀取文件信息。HDFS介紹-文件寫流程Client向NameNode發(fā)起文件(wnjin)寫入的請求。NameNode根據(jù)文件大小和文件塊配置(pizh)情況,返回給Client它所管理(gunl)部分DataNode的信息。Client將文
4、件劃分為多個Block,根據(jù)DataNode的地址信息,按順序?qū)懭氲矫恳粋€DataNode塊中。MapReduce映射、化簡編程模型輸入數(shù)據(jù)-Map分解任務(wù)-執(zhí)行并返回結(jié)果-Reduce匯總結(jié)果-輸出結(jié)果Hbase分布式數(shù)據(jù)(shj)存儲系統(tǒng)Client:使用(shyng)HBase RPC機制(jzh)與HMaster和HRegionServer進行通信Zookeeper:協(xié)同服務(wù)管理,HMaster通過Zookeepe可以隨時感知各個HRegionServer的健康狀況HMaster:管理用戶對表的增刪改查操作HRegionServer:HBase中最核心的模塊,主要負責響應(yīng)用戶I/O請求
5、,向HDFS文件系統(tǒng)中讀寫數(shù)據(jù)HRegion:Hbase中分布式存儲的最小單元,可以理解成一個TableHStore:HBase存儲的核心。由MemStore和StoreFile組成。HLog:每次用戶操作寫入Memstore的同時,也會寫一份數(shù)據(jù)到HLog文件還有哪些NoSQL產(chǎn)品?為什么要使用(shyng)NoSQL?一個高并發(fā)(bngf)網(wǎng)站的DB進化史關(guān)系(gun x)模型聚合數(shù)據(jù)模型的轉(zhuǎn)換-基本變換關(guān)系(gun x)模型聚合(jh)數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)嵌變換(binhun)關(guān)系(gun x)模型聚合(jh)數(shù)據(jù)模型的轉(zhuǎn)換-分割(fng)變換關(guān)系模型聚合數(shù)據(jù)模型的轉(zhuǎn)換-內(nèi)聯(lián)變換Hadoo
6、p2.0MapReduce:JobTracker:協(xié)調(diào)(xitio)作業(yè)的運行。TaskTracker:運行作業(yè)劃分(hu fn)后的任務(wù)。大數(shù)據(jù)(shj)的技術(shù)領(lǐng)域騰訊大數(shù)據(jù)現(xiàn)狀(xinzhung)(資料來自2014.4.11 騰訊分享(fn xin)日大會(dhu))騰訊大數(shù)據(jù)(shj)平臺產(chǎn)品架構(gòu)騰訊大數(shù)據(jù)平臺與業(yè)務(wù)(yw)平臺的關(guān)系公司(n s)數(shù)據(jù)處理平臺的基礎(chǔ)架構(gòu)公司大數(shù)據(jù)(shj)平臺架構(gòu)圖應(yīng)用(yngyng)一數(shù)據(jù)分析應(yīng)用(yngyng)二視頻存儲應(yīng)用(yngyng)三離線日志分析應(yīng)用(yngyng)五在線數(shù)據(jù)分析參考資料:京東基于(jy)Samza的流式計算(j sun)實踐內(nèi)容總結(jié)(1)目錄:什么是大數(shù)據(jù)Hadoop介紹-HDFS、MR、Hbase大數(shù)據(jù)平臺應(yīng)用舉例-騰訊公司的大數(shù)據(jù)平臺架構(gòu)“就像望遠鏡讓我們能夠
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度特殊功能性內(nèi)墻涂料研發(fā)與應(yīng)用合同3篇
- 二零二五年度公司對公司智能化辦公租賃合同3篇
- 2025上海市國有土地使用權(quán)出讓合同范本
- 二零二五年度能源企業(yè)公司掛靠能源供應(yīng)合同3篇
- 2025年度內(nèi)部承包合同協(xié)議書:XX部門內(nèi)部承包銷售業(yè)績提成協(xié)議3篇
- 二零二五年度全款購車車輛認證合同模板3篇
- 二零二五年度農(nóng)村房屋贈與合同附帶農(nóng)用設(shè)備配套協(xié)議
- 2025年度土地流轉(zhuǎn)承包與農(nóng)村金融服務(wù)合作協(xié)議3篇
- 二零二五年度解除勞動合同經(jīng)濟補償金及員工心理咨詢服務(wù)合同3篇
- 2025年度辦公室租賃合同(含企業(yè)活動策劃與執(zhí)行)3篇
- 2021-2022學年山東省濟寧市高一上學期期末考試英語試題(解析版)(不含聽力音頻)
- T-PPAC 402-2022 企業(yè)專利密集型產(chǎn)品評價方法
- 配電自動化終端運行維護管理規(guī)定
- 監(jiān)護人考試試題
- 中醫(yī)醫(yī)療技術(shù)相關(guān)性感染預防與控制
- 2024年工貿(mào)重點企業(yè)有限空間作業(yè)專家指導服務(wù)專題培訓
- 2024年注冊安全工程師考試題庫及參考答案【完整版】
- 第十二章 全等三角形 作業(yè)設(shè)計-2023-2024學年人教版八年級數(shù)學上冊
- 建筑結(jié)構(gòu)荷載規(guī)范DBJ-T 15-101-2022
- 制藥專業(yè)畢業(yè)設(shè)計開題報告
- 普通心理學智慧樹知到期末考試答案2024年
評論
0/150
提交評論