Hadoop運維雜記_第1頁
Hadoop運維雜記_第2頁
Hadoop運維雜記_第3頁
Hadoop運維雜記_第4頁
Hadoop運維雜記_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Hadoop運維雜記今日菜單 Hadoop在XXX 說說Cloudera和它的產(chǎn)品們 運維雜記幾次重大事故Hadoop在藍(lán)汛服務(wù)設(shè)備6000節(jié)點設(shè)備300集群30臺集群使用率40%每日掃描數(shù)據(jù)6TB輸出數(shù)據(jù)1.5TB GZ原始數(shù)據(jù)3TB lzo系統(tǒng)結(jié)構(gòu)Apache Hadoop與CDH版本關(guān)系A(chǔ)pache:0.20.205 = 1.00.23 = 2.0Cloudera CDH:CDH3對應(yīng)0.20.2CDH4基于對應(yīng)2.0CDH為什么更好? 安裝升級更簡單: yum ,tar, rpm, cloudera manager 四種安裝方法 更快獲取新功能和修正新bug 年度release,季度u

2、pdate Yum安裝自動匹配合適的生態(tài)系統(tǒng)版本 自動目錄配置(logs,conf),以及hdfs和mapred用戶創(chuàng)建 詳細(xì)的文檔CDH3u3重大改善CDH3u4重大改善Cloudera ManagerCloudera Training 關(guān)于Training 分為Administrator和Development兩門課程 關(guān)于認(rèn)證考試 關(guān)于證書Hadoop成長之路 Hadoop開發(fā),測試用了半年 2011年底上線運行至今 目前生產(chǎn)環(huán)境只用到了HDFS和MapReduce事故一 傷不起的內(nèi)存 現(xiàn)象:系統(tǒng)上線第二天,Jobtracker不工作,web頁面打不開 原因:一次提交Job數(shù)量太多,導(dǎo)致

3、Jobtracker 內(nèi)存溢出 解決:調(diào)大JT內(nèi)存;限制Running Job數(shù)量 現(xiàn)象:NN內(nèi)存溢出,重啟后發(fā)現(xiàn)50030頁面顯示fsimage損壞,調(diào)查發(fā)現(xiàn)SNN fsimage同樣損壞了 原因:小文件太多導(dǎo)致NN/SNN內(nèi)存溢出,導(dǎo)致fsimage文件損壞,但是重啟后的NN可以正常服務(wù)。 解決:Cloudera google group去救,獲得后門腳本事故二 低效的MapReduce Job 現(xiàn)象:MapReduce Job執(zhí)行時間過長 原因:MR中用到了Spring,小文件導(dǎo)致Map方法效率低下,GZ文件讀寫效率低 解決:MR去Spring化;開啟JVM重用;使用LZO作為輸入和ma

4、p輸出結(jié)果;加大reduce并行copy線程數(shù)壓縮與MapReduce性能 前提:大量小文件 輸入147GB,文件數(shù)45047,平均3MB CPU 8 core;32GB內(nèi)存;7200轉(zhuǎn)磁盤;28臺Slave機(jī)器輸出類型輸出類型耗時耗時GZ26minTEXT24minLZO18min 如果輸入是大塊的LZO文件,則只需要11min事故三 OMG,整個集群完蛋了 現(xiàn)象:早上來發(fā)現(xiàn)所有DataNode都dead了,重啟后10分鐘,DN陸續(xù)又都dead了;調(diào)查發(fā)現(xiàn)節(jié)點有8%左右丟包率 原因:交換機(jī)模塊故障;DN不能Hold住大量小文件 解決:升級3u2到3u4;設(shè)置DN內(nèi)存到2GB遇到無法跨越的問題解決辦法 加入Hadoop官方Mail List 加入Cloudera Googl

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論