




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
云計(jì)算(第三版)CLOUDCOMPUTINGThirdEdition第5章Hadoop2.0主流開源云架構(gòu)(二)云計(jì)算(第三版)CLOUDCOMPUTINGThird5.1引例5.2Hadoop2.0簡述5.3Hadoop2.0部署5.4Hadoop2.0體系架構(gòu)5.5Hadoop2.0訪問接口5.6Hadoop2.0編程接口5.1引例5.2Hadoop2.0簡述5.3Hado5.2Hadoop2.0簡述5.2.1Hadoop2.0由來5.2.2Hadoop2.0相關(guān)項(xiàng)目5.2.3Hadoop應(yīng)用5.2Hadoop2.0簡述5.2.1Hadoop45.2Hadoop2.0簡述Hadoop2.0由來開源組織Apache成立開源搜索引擎項(xiàng)目NutchApache實(shí)現(xiàn)了Nutch版的NDFS和MapReduceNDFS和MapReduce移出Nutch,形成獨(dú)立項(xiàng)目,稱為Hadoop。工業(yè)界稱Hadoop1.X及其以前的版本(0.23.X除外)為Hadoop1.0,稱Hadoop2.X及其以后版本為Hadoop2.02002年2004年2006年45.2Hadoop2.0簡述Hadoop2.0由來開5將Hadoop2.0部署至集群后,通過調(diào)用Hadoop2.0程序庫,能夠用簡單的編程模型來處理分布在不同機(jī)器上的大規(guī)模數(shù)據(jù)集。由于采用客戶-服務(wù)器模式,Hadoop2.0很容易從一臺機(jī)器擴(kuò)展至成千上萬臺機(jī)器,并且每臺機(jī)器都能提供本地計(jì)算存儲和本地計(jì)算??紤]到集群中每臺機(jī)器都可能會出問題(如硬件失效),Hadoop2.0本身從設(shè)計(jì)上就在程序?qū)右?guī)避了這些問題。5.2Hadoop2.0簡述Hadoop2.0由來Hadoop2.0分布式存儲(HDFS)分布式操作系統(tǒng)(Yarn)5將Hadoop2.0部署至集群后,通過調(diào)用Hadoop65.2Hadoop2.0簡述Hadoop2.0由來Hadoop至少應(yīng)當(dāng)包含分布式存儲和分布式計(jì)算兩個模塊,下面給出Hadoop1.0項(xiàng)目模塊。HadoopCommon聯(lián)系HDFS和MapReduce的紐帶,它一方面為另外兩組件提供一些公用jar包,另一方面也是程序員訪問其他兩模塊的接口。HDFSHadoop的分布式文件系統(tǒng)。主要提供分布式存儲服務(wù)。HadoopMapReduce分布式計(jì)算框架。主要負(fù)責(zé)資源管理、任務(wù)調(diào)度和MapReduce算法實(shí)現(xiàn)。65.2Hadoop2.0簡述Hadoop2.0由來H5.2Hadoop2.0簡述5.2.1Hadoop2.0由來5.2.2Hadoop2.0相關(guān)項(xiàng)目5.2.3Hadoop應(yīng)用5.2Hadoop2.0簡述5.2.1Hadoop8Hadoop云計(jì)算系統(tǒng)Google云計(jì)算系統(tǒng)HadoopHDFSGoogleGFSHadoopMapReduceGoogleMapReduceHBaseGoogleBigTableZooKeeperGoogleChubbyPigGoogleSawzall5.2Hadoop2.0簡述Google云計(jì)算組件和Hadoop及其相關(guān)項(xiàng)目之間的對應(yīng)關(guān)系:Hadoop2.0相關(guān)項(xiàng)目8Hadoop云計(jì)算系統(tǒng)Google云計(jì)算系統(tǒng)Hadoop9ClouderaManager/AmbariHueBigTopAvroMahoutRHadoopHivePigImaplaSerachOozieHcataLogCassandraSqoopFlumeChukwaWebHDFSZookeeperMapReduceHbaseYarnHDFS5.2Hadoop2.0簡述Hadoop2.0相關(guān)項(xiàng)目近幾年工業(yè)界圍繞Hadoop進(jìn)行了大量的外圍產(chǎn)品開發(fā),下圖描述了各個產(chǎn)品項(xiàng)目之間的層次關(guān)系。9ClouderaManager/AmbariHueBig5.2Hadoop2.0簡述5.2.1Hadoop2.0由來5.2.2Hadoop2.0相關(guān)項(xiàng)目5.2.3Hadoop應(yīng)用5.2Hadoop2.0簡述5.2.1Hadoop115.2Hadoop2.0簡述Hadoop應(yīng)用構(gòu)建大型分布式集群數(shù)據(jù)倉庫數(shù)據(jù)挖掘115.2Hadoop2.0簡述Hadoop應(yīng)用構(gòu)建大型5.1引例5.2Hadoop2.0簡述5.3Hadoop2.0部署5.4Hadoop2.0體系架構(gòu)5.5Hadoop2.0訪問接口5.6Hadoop2.0編程接口5.1引例5.2Hadoop2.0簡述5.3Hado5.3Hadoop2.0部署5.3.1部署綜述5.3.2傳統(tǒng)解壓包部署5.3Hadoop2.0部署5.3.1部署綜述5.3145.3Hadoop2.0部署部署綜述安裝方式簡單易用煩瑣易錯隱藏了太多細(xì)節(jié)有助于讀者深入理解Hadoop傳統(tǒng)解壓包方式Linux標(biāo)準(zhǔn)方式部署環(huán)境不需要與其他節(jié)點(diǎn)交互,不需要使用HDFS,直接讀寫本地的文件系統(tǒng)單機(jī)模式偽分布模式分布式模式在一臺單機(jī)上運(yùn)行,用不同的進(jìn)程模仿分布式運(yùn)行中的各類節(jié)點(diǎn)在不同的機(jī)器上部署系統(tǒng)145.3Hadoop2.0部署部署綜述安裝簡單易用煩瑣155.3Hadoop2.0部署部署步驟制定部署規(guī)劃準(zhǔn)備機(jī)器準(zhǔn)備機(jī)器軟件環(huán)境下載Hadoop解壓Hadoop配置Hadoop啟動Hadoop測試Hadoop部署前工作部署Hadoop155.3Hadoop2.0部署部署步驟制定部署規(guī)劃準(zhǔn)備1)硬件環(huán)境由于分布式計(jì)算需要用到很多機(jī)器,部署時用戶須提供多臺機(jī)器,至于提供幾臺,須根據(jù)“部署規(guī)劃”確定。實(shí)際上,完全模式部署Hadoop時,最低需要兩臺機(jī)器(一個主節(jié)點(diǎn),一個從節(jié)點(diǎn)),此外,硬件方面,每臺機(jī)器最低要求有1GB內(nèi)存,20GB硬盤空間。5.3Hadoop2.0部署準(zhǔn)備環(huán)境1)硬件環(huán)境5.3Hadoop2.0部署準(zhǔn)備環(huán)境175.3Hadoop2.0部署準(zhǔn)備環(huán)境2)軟件環(huán)境大量的實(shí)踐證明,在Linux環(huán)境下使用Hadoop則更加穩(wěn)定高效須注意的是新裝系統(tǒng)(CentOS)的機(jī)器不可以直接部署Hadoop修改機(jī)器名添加域名映射關(guān)閉防火墻安裝JDK175.3Hadoop2.0部署準(zhǔn)備環(huán)境2)軟件環(huán)境大量185.3Hadoop2.0部署關(guān)于Hadoop依賴軟件SSH只是給sbin/start-yarn.sh等幾個start-x.sh與stop-x.sh腳本使用Hadoop本身是一堆Java代碼,而Java代碼并不依賴SSH本節(jié)使用的Hadoop版本為穩(wěn)定版Hadoop-2.2.0.tar.gzCentOS版本為64位CentOS-6.5JDK版本為jdk-7u40-linux-x64.rpm185.3Hadoop2.0部署關(guān)于Hadoop依賴軟件5.3Hadoop2.0部署5.3.1部署綜述5.3.2傳統(tǒng)解壓包部署5.3Hadoop2.0部署5.3.1部署綜述5.35.3Hadoop2.0部署傳統(tǒng)解壓包部署現(xiàn)有三臺機(jī)器,且它們都剛裝好64位CentOS-6.5,安裝系統(tǒng)時用戶名為joe,請按要求完成:①修改三臺機(jī)器名為cMaster,cSlave0和cSlave1,并添加域名映射、關(guān)閉防火墻和安裝JDK。②以cMaster作為主節(jié)點(diǎn),cSlave0和cSlave1作為從節(jié)點(diǎn),部署Hadoop?!纠?-5】205.3Hadoop2.0部署傳統(tǒng)解壓包部署現(xiàn)有三臺機(jī)器,5.3Hadoop2.0部署傳統(tǒng)解壓包部署1.制定部署規(guī)劃此Hadoop集群需三臺機(jī)器(cMaster,cSlave0和cSlave1),其中cMaster作為主節(jié)點(diǎn),cSlave0和cSlave1作為從節(jié)點(diǎn)。2.準(zhǔn)備機(jī)器準(zhǔn)備三臺機(jī)器,它們可以是實(shí)體機(jī)也可以是虛擬機(jī),若使用虛擬機(jī)。3.準(zhǔn)備機(jī)器軟件環(huán)境三臺機(jī)器都要完成:修改機(jī)器名、添加域名映射、關(guān)閉防火墻和安裝JDK。215.3Hadoop2.0部署傳統(tǒng)解壓包部署1.制定部署規(guī)5.3Hadoop2.0部署傳統(tǒng)解壓包部署4.下載Hadoop谷歌搜索“Hadoopdownload”并下載,以joe用戶身份,將Hadoop分別復(fù)制到三臺機(jī)器上。5.解壓Hadoop分別以joe用戶登錄三臺機(jī)器,每臺都執(zhí)行如下命令解壓Hadoop文件:6.配置Hadoop三臺機(jī)器都要配置,且配置相同225.3Hadoop2.0部署傳統(tǒng)解壓包部署4.下載Had5.3Hadoop2.0部署傳統(tǒng)解壓包部署7.啟動Hadoop首先,在主節(jié)點(diǎn)cMaster上格式化主節(jié)點(diǎn)命名空間其次,在主節(jié)點(diǎn)cMaster上啟動存儲主服務(wù)namenode和資源管理主服務(wù)resourcemanager。最后,在從節(jié)點(diǎn)上啟動存儲從服務(wù)datanode和資源管理從服務(wù)nodemanager8.測試Hadoop235.3Hadoop2.0部署傳統(tǒng)解壓包部署7.啟動HaHadoop2.0部署通過上述單機(jī)部署和集群部署,可以看出,Hadoop本
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇財(cái)經(jīng)職業(yè)技術(shù)學(xué)院《打印創(chuàng)新設(shè)計(jì)》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津醫(yī)科大學(xué)臨床醫(yī)學(xué)院《電視節(jié)目播音主持實(shí)訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 邵陽職業(yè)技術(shù)學(xué)院《結(jié)構(gòu)設(shè)計(jì)軟件應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 長春職業(yè)技術(shù)學(xué)院《三維動畫MAYA》2023-2024學(xué)年第二學(xué)期期末試卷
- 內(nèi)江師范學(xué)院《SAS與統(tǒng)計(jì)分析》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年重慶市建筑安全員考試題庫附答案
- 長春師范大學(xué)《公共管理與公共政策實(shí)務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 西安航空學(xué)院《老年認(rèn)知癥的篩查與干預(yù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南京科技職業(yè)學(xué)院《會展設(shè)計(jì)實(shí)務(wù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 襄陽職業(yè)技術(shù)學(xué)院《現(xiàn)代環(huán)境分析技術(shù)與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025新人教版英語七年級下單詞默寫表(小學(xué)部分)
- 2025年春新外研版(三起)英語三年級下冊課件 Unit6第1課時Startup
- 2025江蘇蘇州高新區(qū)獅山商務(wù)創(chuàng)新區(qū)下屬國企業(yè)招聘9人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 平拋運(yùn)動的經(jīng)典例題
- 錄井作業(yè)現(xiàn)場風(fēng)險評估及控制措施
- 2025年度商會工作計(jì)劃
- 社區(qū)管理與服務(wù)專業(yè)實(shí)習(xí)總結(jié)范文
- 施工現(xiàn)場5S管理規(guī)范
- 【MOOC】中級財(cái)務(wù)會計(jì)-西南交通大學(xué) 中國大學(xué)慕課MOOC答案
- 延續(xù)護(hù)理服務(wù)課件
- 2024年濰坊工程職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫
評論
0/150
提交評論