Hadoop開源軟件與云計算_第1頁
Hadoop開源軟件與云計算_第2頁
Hadoop開源軟件與云計算_第3頁
Hadoop開源軟件與云計算_第4頁
Hadoop開源軟件與云計算_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

中科f陰苴用

Hadoop開源軟件與云計算

查禮(char@)

中科院計算所

2010.10.11

內(nèi)容提要

?大規(guī)模數(shù)據(jù)處理研究背景

會大規(guī)模數(shù)據(jù)處理開源軟件Hadoop

會分布式數(shù)據(jù)存儲計算相關(guān)研究@ICT

內(nèi)容提要

?大規(guī)模數(shù)據(jù)處理研究背景

0大規(guī)模數(shù)據(jù)處理開源軟件Hadoop

分布式數(shù)據(jù)存儲計算相關(guān)研究@ICT

研究背景

?云計算的外延主要是大規(guī)模數(shù)據(jù)處理和基礎(chǔ)設(shè)施彈性管理及租約式供

應(yīng)

?通信、網(wǎng)絡(luò)、存儲、傳感器等電子信息技術(shù)飛速發(fā)展導(dǎo)致數(shù)據(jù)規(guī)模極

大增加

?:?傳統(tǒng)的存儲并處理這些數(shù)據(jù)的技術(shù)手段遇到瓶頸

Processing100TBdatasets

OnenodeScanning?50MB/s=35,000min

1000nodeScanning?50MB/s=35min

D*?yP""Ac<M(

SearchEngineDataWarehousingLogProcessing

MapReduce并行編程模型

?E.g.,IO10Internetwebpages

5Reduce對處理結(jié)果進行聚集

■系統(tǒng)處理資源分配和可靠性問題

■Map:對所有單詞產(chǎn)生(word,count〉對

■Reduce:累計單詞數(shù)

WhyMapReduce?

?:?簡單VS.復(fù)雜

■并行計算模式簡單,編程容易。與MPI、

OpenMP相比門檻低

■為用戶屏蔽數(shù)據(jù)通信、并發(fā)、同步、一致性等

問題

?:?專用VS.通用

■適用于大規(guī)模數(shù)據(jù)處理,如搜索引擎、用戶日

志分析等

■計算與存儲方式緊密結(jié)合

■利于提高系統(tǒng)擴展性名

GFS-Google分布式文件系統(tǒng)

?:?特點

■GFS中所存儲的文件通常較大(GB級),采用

64MB數(shù)據(jù)塊作為基本存儲單元;

■Google業(yè)務(wù)邏輯特點決定了GFS中的文件讀多

寫少,寫主要是追加操作,基本不存在隨機寫

操作;

■GFS的負(fù)載主要是對大文件的流式處理,客戶

端緩存無意義;

-64MB數(shù)據(jù)塊降低了元數(shù)據(jù)的數(shù)量,因此系統(tǒng)

可使用單元數(shù)據(jù)服務(wù)器結(jié)構(gòu)。.

SanjayGhemawat,et.al.,TheGoogle

FileSystem,SOSP'03

內(nèi)容提要

?大規(guī)模數(shù)據(jù)處理研究背景

大規(guī)模數(shù)據(jù)處理開源軟件Hadoop

分布式數(shù)據(jù)存儲計算相關(guān)研究@ICT

Hadoop系統(tǒng)

?ApacheNutch,2002

?NDFS+MapReduce,2004

?Hadoop,2006

?ApacheHadoop,200過**I哂)

■/

■Book:

http:〃ore/catalog/9780596521998/index.html

>WritteninJava>Runson

?DoesworkwithotherLinux,Windowsandmore

languagesCommodityhardwarewithhighfailure

rate

Hadooo組成部分

OIJHDFS4HadoopDistrbutionFileSystem

expressingdataanalysisprograms

。MapReduce

0PigProject

Ahigh-leveldata-flowlanguageforparallelcomputation

pMhiaxncvtiMn

ZooKeepetAhigh-performancecoordinationservice

;Goo9WCtahby/x*MAC*

a*Avrodataserializationsystem

Protocol

,0chukwadatacollectionsystem

;;HBasestructureddatastorage

datawarehouse

HiveQL

HDFS設(shè)計目標(biāo)

?VeryLargeDistributedFileSystem

■lOKnodes,100millionfiles,10PB

?ConvenientClusterManagement

■Loadbalancing

■Nodefailures

■Clusterexpansion

?OptimizedforBatchProcessing

■Allowmovecomputationtodata

■Maximizethroughput

HDFS體系結(jié)構(gòu)

HadoopMapReduce處理流程二TE…""

內(nèi)容提要

?大規(guī)模數(shù)據(jù)處理研究背景

0大規(guī)模數(shù)據(jù)處理開源軟件Hadoop

分布式數(shù)據(jù)存儲計算相關(guān)研究@ICT

數(shù)據(jù)計算相關(guān)研究@ICT

?:?軟件系統(tǒng)

?大規(guī)模數(shù)據(jù)處理系統(tǒng)(VegaCloudDCP)

?:?關(guān)鍵技術(shù)

■列存儲數(shù)據(jù)管理技術(shù)(RCFile)

■DOT聚簇式互補索引(CCIndex)

■HDFSNameNode高可用增強

■資源感知MapReduce任務(wù)調(diào)度

■小文件存儲優(yōu)化

VDCP大規(guī)模數(shù)據(jù)處理系統(tǒng)構(gòu)成

應(yīng)用戶行為數(shù)據(jù)挖掘計算機科學(xué)文獻共享系統(tǒng)

其他應(yīng)用

用(離線處理類)(存儲?在線處理類)

.

大并行連接優(yōu)化聚簇式互補索弓1

川E

規(guī)IVHBase

列存儲數(shù)據(jù)管數(shù)據(jù)在線恢復(fù)

數(shù)

Hadoop

據(jù)

處I

Resource-aware

IMapReduceJobTrackerTaskTracker

理動態(tài)任務(wù)調(diào)度器

HDFSNameNodeDataNode小文件存儲優(yōu)化

高而用增強

列存儲數(shù)據(jù)管理-RCFile

?將分布式數(shù)據(jù)處理系統(tǒng)中以記錄為單位的存儲結(jié)構(gòu)變?yōu)橐粤袨閱挝?/p>

的存儲結(jié)構(gòu),進而減少磁盤訪問數(shù)量,提高查詢處理性能。

?由于相同屬性值具有相同數(shù)據(jù)類型和相近的數(shù)據(jù)特性,以屬性值為

單位進行壓縮存儲的壓縮比更高,能節(jié)省更多的存儲空間。

Relation

RCFile

WBytesRecordRelation

SyncNumberA|B[C|D

HDFSBlockRowGroup

CompressedCompressedHDFS

KeysLengthsKeysData

StoreBlock110111112113116BytesMeradara

102112122132SyncHeader

RowGroup1

CompressedValuesLengths103113123133

StoreBlock2104114124134匚F1二41C3.1;:1"、

105115105135111,112,113,114.115

CompressedValuesDataRowGroup2

StoreBlock3121,122,123,124125

121,131)131,132,133,134.135

(102,112,122,132)

II

(105,115.125,135)RowGroupn

列存儲-RCFile

①分布式文件系統(tǒng)中高效的列數(shù)據(jù)組織方式

SequenceFile:關(guān)系數(shù)據(jù)水平拆分為塊,塊內(nèi)按行序存儲

?RCFile:關(guān)系數(shù)據(jù)水平拆分,分片內(nèi)按列序存儲(已應(yīng)用于Facebook

Inc.)

②提供與Hadoop框架兼容的列存儲文件訪問接口,支持

Hadoop程序?qū)α写鎯ξ募嘘P(guān)系數(shù)據(jù)的透明訪問。

③支持列數(shù)據(jù)獨立壓縮機制,在不影響列數(shù)據(jù)獨立訪問的

前提下降低存儲空間消耗。

?RLE:行程長度編碼

?BitMap:位圖編碼

?Zlib,Gzip等:通用壓縮方法

RCFile在Hive體系結(jié)構(gòu)中的位置

J,,

Application/EndUser

WebUI+HiveCLI+MapReduceHDFS

JDBC/ODBCUser-defined

Browse,Query,DDLMap-reduceScripts

MetaStoreUDF/UDAF

substr

sum

ThriftAPIaverage

FileFormats

SerDe

□TextFile

CSVSequenceFile

ThriftC***RCFile^2>

Regex

Reference:ZhengShao@HadoopinChma2009

RCFile存儲空間對比

數(shù)據(jù)表存儲空間比較:

儲格式原始文件大小壓縮行存儲文件大RCFILE壓RCFILE文

數(shù)康、小縮文件大小件長度同

M5.49X

uri_infor10.11MB2.13MB1.8MB/

user_login_data68.71MB21.03MB20.28MB/3.57%1

16.48%I

url_access_data219.44MB69.59MB58.12MBI

30.7%/

lineitem724.66MB227.07MB157.29MB\

注:RCFILE文件長度同比減小二(RCFILE壓縮文件大小-壓縮行存

儲文件大?。?壓縮行存儲文件大小

RCFile查詢性能對比

?:?在Hive中測試RCFile的性能

測試環(huán)境

節(jié)點操作系統(tǒng):LinuxCentOSrelease5.3

■CPU:4核AuthenticAMD1.8GHz

內(nèi)存:5GB

?:?測試查詢

selectl_returnflag,l_linestatus,sum(l_quantity)assum_qty,sum(l_extendedprice)as

sum_base_price,sum(l_extendedprice*(1-l_discount))assum_disc_price,sum(l_extendedprice*

(1-l_discount)*(1+l_tax))assum_chargefromlineitemwherel_shipdate<='1998-12-01'group

byl_returnflag,l_linestatus;

?:?測試結(jié)果

單位:秒

節(jié)點也模4nodes7nodes

、、、存儲方式

RCFile性靛RCFile性能提RCFile性能RCFile崢提

提高(對比高(對比行存提高(對比高(對比行存

行存儲行存儲壓縮RCFile壓縮行存儲)儲壓寫、行存儲行存儲壓縮RCFile壓縮行存儲)儲壓縮)

5GB971797.1185.0612%63.4365.2961.024%

10GB16771172.53153.229%I11%\96.2397.5688.978%I9%

112%

15GB240.56243.19214.5211%|130.59140.10121.817%113%|

100GB1561791574.941370.3012%\13%j797.86785.73670.3416%V5%/

加速性能:5GB28%/10GB42%/15GB43%/100GB51%

互補式聚簇索引(CQndex)

?研究動機

-多種的資源發(fā)現(xiàn)請求是多維區(qū)間查詢ComplementaryClusteringIndex

?網(wǎng)絡(luò)應(yīng)用中多維區(qū)間查詢是普遍需求

-不斷增大的數(shù)據(jù)量提出了挑戰(zhàn):性能、存儲開銷、可靠性

?應(yīng)用需要什么樣的數(shù)據(jù)模型?

/數(shù)據(jù)模型介于

實現(xiàn)復(fù)雜性增加M

R:模型

數(shù)據(jù)邏輯OrderedTable

關(guān)聯(lián)強度?和關(guān)系模型之間

-

多列多表,關(guān)系模型-/思路:增強高可擴

但表間有關(guān)系(關(guān)系數(shù)據(jù)庫)-

&展性、高性能、高可

K

w

s靠性的分布式順序表

多列多表,

fc

但表間無關(guān)系商(DistribuedOrdered

-以支持

-Table,DOT)

-

-多維區(qū)間查詢__

單列單表-^CCIndexW^^T^S

的索引百匚矗

基于主鍵的多維通用關(guān)系O:

區(qū)間查詢區(qū)間查詢查詢數(shù)據(jù)查詢能力

基于HBase實現(xiàn)CCIndex

?把用于備份數(shù)據(jù)的副本組織成為多份互為補

充和校驗的互補聚簇索引表,利用索引表上

高效的連續(xù)掃描代替原表上的隨機讀取。

多屬性區(qū)間查詢、?基于分布式順序表的分片信息對子查詢結(jié)果

查詢優(yōu)化、記錄查詢優(yōu)化集的大小進行估算,最后挑選最小子查詢執(zhí)

級數(shù)據(jù)恢復(fù)行查詢過程。

?通過互補聚簇索引表和互補校驗表進行數(shù)據(jù)

數(shù)據(jù)恢復(fù)恢復(fù),保證可恢復(fù)性同時僅少量增加存儲開

CCIndex銷。

CQndex數(shù)據(jù)組織

基于ApacheHBase

CC1T2,key2=idx2+id+idx2Length

ComplementalClusteringIndexTable(CC1T0)

-禁用底層HDFS的副key2idxlinfo

ididxlidx2info

本機制nl00102cpuinfol

001cpunlinfol

nlOO2O2meminfo2

-互補聚簇表和互補檢002memnlinfo2

n200402cpu1nfo4

查表用HBase存儲003netn3info3

n3OO3O2netinfo3

-數(shù)據(jù)物理分布004cpun2info4

多張互補聚簇索引表1dx2key2idxl

CCIT

-分別以某索引列全局CCIT1,key1=idx1+id+idx1Length

有序keyl1dx2infoCCT2,

ComplementalCheckTable,CCTO,replicated

-其主鍵為索引列的值replicatedcpu00103nlinfol

+原主鍵+索引列的值cpu00403n2info4

的長度memOO2O3nlinfo2

netOO3O3n3info3

-隨機變連續(xù)

keylIidx2

Primarykey

互補校驗表CCTCCTl,

replicatedindexcolumn

-存儲主鍵和索引列的

IIdata卜

對應(yīng)關(guān)系

查詢優(yōu)化與數(shù)據(jù)恢復(fù)

region1startkey=>2endregion1startkey=>0end

key=>3key=>3

通過CCT校驗數(shù)據(jù),并從其它表中

region2startkey=>3endregion2startkey=>3end

key=>5key=>8獲取數(shù)據(jù),修補缺失。

CC1T2,key2=idx2+id+idx2Length

ConiplenientalClusteringIndexTable(CCITO)

key2info

region60startkey=>90idinfow

region60startkey=>852nl00102infol

endkey=>93endkey=>91001infol

*nlOO2O2info2

002info2

n200402info4

region61startkey=>93region61startkey=>91003info3w

n300302

endkey=>100endkey=>100004info4info3

metadataoftableindexedbymetadataoftableindexedbyIkey2

id

CPULoadmemoryusagekey2

id9

data

找到內(nèi)存占用較高但CPU較空閑的Server

query:select,where(CPULoad<50andmemoryusage>98)74CCIT1,keyl=idxI+id-idxILength

7

keylinfoCCT2,

c(mplementalCheckTable.CCTO,replicated

個個2

40region1regionreplicatedcpu00103infol

I\掃描按內(nèi)存占用率索引表,并用CPULoad篩cpu00403info4

?LZ選結(jié)果LostdatairrFn?

netOO3O3info3

\|keyl

RyercheckCCT||Primarykey

keyl44^CCTl,

通過分片信息預(yù)估掃描范圍,優(yōu)化data

7re)licatedIndexcolumn

查詢執(zhí)行速度。mem00203*||data

<>

CCIndex應(yīng)用效果

■環(huán)境:3節(jié)點

-雙CPU共4核,2.0

GHzAMDOpteron,6

(

SGB內(nèi)存,186GB

VP5

。RAID1SCSI磁盤,千

①。

M

)兆以太網(wǎng)

?負(fù)載

-100萬隨機生成數(shù)據(jù),

長度1K字節(jié),

-主鍵+3個索引列

■測試內(nèi)容

?CCIndex的索引掃描操作吞吐率是隨機讀寫,連續(xù)讀寫,

IndexedTable的11.4倍掃描原表,掃描索引

?CCIndex的隨機寫和順序?qū)懲掏侣史謩e比

IndexedTable快54.9%和121.4%

注:IndexedTable是HBase中的二級索引實現(xiàn)

CCIndex應(yīng)用效果

?CCIndex與

IndexedTable相比:

-索引列數(shù)N,取

值從2到4_

—IndexTable的副

本數(shù),取值為

N+1(估計值)

-記錄長度蟒5/四

長,取值從10到30

?CCIndex存儲開銷相

CCIndex應(yīng)用效果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論