版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
中科f陰苴用
Hadoop開(kāi)源軟件與云計(jì)算
查禮(char@)
中科院計(jì)算所
2010.10.11
內(nèi)容提要
?大規(guī)模數(shù)據(jù)處理研究背景
會(huì)大規(guī)模數(shù)據(jù)處理開(kāi)源軟件Hadoop
會(huì)分布式數(shù)據(jù)存儲(chǔ)計(jì)算相關(guān)研究@ICT
內(nèi)容提要
?大規(guī)模數(shù)據(jù)處理研究背景
0大規(guī)模數(shù)據(jù)處理開(kāi)源軟件Hadoop
分布式數(shù)據(jù)存儲(chǔ)計(jì)算相關(guān)研究@ICT
研究背景
?云計(jì)算的外延主要是大規(guī)模數(shù)據(jù)處理和基礎(chǔ)設(shè)施彈性管理及租約式供
應(yīng)
?通信、網(wǎng)絡(luò)、存儲(chǔ)、傳感器等電子信息技術(shù)飛速發(fā)展導(dǎo)致數(shù)據(jù)規(guī)模極
大增加
?:?傳統(tǒng)的存儲(chǔ)并處理這些數(shù)據(jù)的技術(shù)手段遇到瓶頸
Processing100TBdatasets
OnenodeScanning?50MB/s=35,000min
1000nodeScanning?50MB/s=35min
D*?yP""Ac<M(
SearchEngineDataWarehousingLogProcessing
MapReduce并行編程模型
?E.g.,IO10Internetwebpages
5Reduce對(duì)處理結(jié)果進(jìn)行聚集
■系統(tǒng)處理資源分配和可靠性問(wèn)題
■Map:對(duì)所有單詞產(chǎn)生(word,count〉對(duì)
■Reduce:累計(jì)單詞數(shù)
WhyMapReduce?
?:?簡(jiǎn)單VS.復(fù)雜
■并行計(jì)算模式簡(jiǎn)單,編程容易。與MPI、
OpenMP相比門檻低
■為用戶屏蔽數(shù)據(jù)通信、并發(fā)、同步、一致性等
問(wèn)題
?:?專用VS.通用
■適用于大規(guī)模數(shù)據(jù)處理,如搜索引擎、用戶日
志分析等
■計(jì)算與存儲(chǔ)方式緊密結(jié)合
■利于提高系統(tǒng)擴(kuò)展性名
GFS-Google分布式文件系統(tǒng)
?:?特點(diǎn)
■GFS中所存儲(chǔ)的文件通常較大(GB級(jí)),采用
64MB數(shù)據(jù)塊作為基本存儲(chǔ)單元;
■Google業(yè)務(wù)邏輯特點(diǎn)決定了GFS中的文件讀多
寫少,寫主要是追加操作,基本不存在隨機(jī)寫
操作;
■GFS的負(fù)載主要是對(duì)大文件的流式處理,客戶
端緩存無(wú)意義;
-64MB數(shù)據(jù)塊降低了元數(shù)據(jù)的數(shù)量,因此系統(tǒng)
可使用單元數(shù)據(jù)服務(wù)器結(jié)構(gòu)。.
SanjayGhemawat,et.al.,TheGoogle
FileSystem,SOSP'03
內(nèi)容提要
?大規(guī)模數(shù)據(jù)處理研究背景
大規(guī)模數(shù)據(jù)處理開(kāi)源軟件Hadoop
分布式數(shù)據(jù)存儲(chǔ)計(jì)算相關(guān)研究@ICT
Hadoop系統(tǒng)
?ApacheNutch,2002
?NDFS+MapReduce,2004
?Hadoop,2006
?ApacheHadoop,200過(guò)**I哂)
■/
■Book:
http:〃ore/catalog/9780596521998/index.html
>WritteninJava>Runson
?DoesworkwithotherLinux,Windowsandmore
languagesCommodityhardwarewithhighfailure
rate
Hadooo組成部分
OIJHDFS4HadoopDistrbutionFileSystem
expressingdataanalysisprograms
。MapReduce
0PigProject
Ahigh-leveldata-flowlanguageforparallelcomputation
pMhiaxncvtiMn
ZooKeepetAhigh-performancecoordinationservice
;Goo9WCtahby/x*MAC*
a*Avrodataserializationsystem
Protocol
,0chukwadatacollectionsystem
;;HBasestructureddatastorage
datawarehouse
HiveQL
HDFS設(shè)計(jì)目標(biāo)
?VeryLargeDistributedFileSystem
■lOKnodes,100millionfiles,10PB
?ConvenientClusterManagement
■Loadbalancing
■Nodefailures
■Clusterexpansion
?OptimizedforBatchProcessing
■Allowmovecomputationtodata
■Maximizethroughput
HDFS體系結(jié)構(gòu)
HadoopMapReduce處理流程二TE…""
內(nèi)容提要
?大規(guī)模數(shù)據(jù)處理研究背景
0大規(guī)模數(shù)據(jù)處理開(kāi)源軟件Hadoop
分布式數(shù)據(jù)存儲(chǔ)計(jì)算相關(guān)研究@ICT
數(shù)據(jù)計(jì)算相關(guān)研究@ICT
?:?軟件系統(tǒng)
?大規(guī)模數(shù)據(jù)處理系統(tǒng)(VegaCloudDCP)
?:?關(guān)鍵技術(shù)
■列存儲(chǔ)數(shù)據(jù)管理技術(shù)(RCFile)
■DOT聚簇式互補(bǔ)索引(CCIndex)
■HDFSNameNode高可用增強(qiáng)
■資源感知MapReduce任務(wù)調(diào)度
■小文件存儲(chǔ)優(yōu)化
VDCP大規(guī)模數(shù)據(jù)處理系統(tǒng)構(gòu)成
應(yīng)用戶行為數(shù)據(jù)挖掘計(jì)算機(jī)科學(xué)文獻(xiàn)共享系統(tǒng)
其他應(yīng)用
用(離線處理類)(存儲(chǔ)?在線處理類)
.
大并行連接優(yōu)化聚簇式互補(bǔ)索弓1
川E
規(guī)IVHBase
列存儲(chǔ)數(shù)據(jù)管數(shù)據(jù)在線恢復(fù)
模
數(shù)
Hadoop
據(jù)
處I
Resource-aware
IMapReduceJobTrackerTaskTracker
理動(dòng)態(tài)任務(wù)調(diào)度器
平
臺(tái)
HDFSNameNodeDataNode小文件存儲(chǔ)優(yōu)化
高而用增強(qiáng)
列存儲(chǔ)數(shù)據(jù)管理-RCFile
?將分布式數(shù)據(jù)處理系統(tǒng)中以記錄為單位的存儲(chǔ)結(jié)構(gòu)變?yōu)橐粤袨閱挝?/p>
的存儲(chǔ)結(jié)構(gòu),進(jìn)而減少磁盤訪問(wèn)數(shù)量,提高查詢處理性能。
?由于相同屬性值具有相同數(shù)據(jù)類型和相近的數(shù)據(jù)特性,以屬性值為
單位進(jìn)行壓縮存儲(chǔ)的壓縮比更高,能節(jié)省更多的存儲(chǔ)空間。
Relation
RCFile
WBytesRecordRelation
SyncNumberA|B[C|D
HDFSBlockRowGroup
CompressedCompressedHDFS
KeysLengthsKeysData
StoreBlock110111112113116BytesMeradara
102112122132SyncHeader
RowGroup1
CompressedValuesLengths103113123133
StoreBlock2104114124134匚F1二41C3.1;:1"、
105115105135111,112,113,114.115
CompressedValuesDataRowGroup2
StoreBlock3121,122,123,124125
121,131)131,132,133,134.135
(102,112,122,132)
II
(105,115.125,135)RowGroupn
列存儲(chǔ)-RCFile
①分布式文件系統(tǒng)中高效的列數(shù)據(jù)組織方式
SequenceFile:關(guān)系數(shù)據(jù)水平拆分為塊,塊內(nèi)按行序存儲(chǔ)
?RCFile:關(guān)系數(shù)據(jù)水平拆分,分片內(nèi)按列序存儲(chǔ)(已應(yīng)用于Facebook
Inc.)
②提供與Hadoop框架兼容的列存儲(chǔ)文件訪問(wèn)接口,支持
Hadoop程序?qū)α写鎯?chǔ)文件中關(guān)系數(shù)據(jù)的透明訪問(wèn)。
③支持列數(shù)據(jù)獨(dú)立壓縮機(jī)制,在不影響列數(shù)據(jù)獨(dú)立訪問(wèn)的
前提下降低存儲(chǔ)空間消耗。
?RLE:行程長(zhǎng)度編碼
?BitMap:位圖編碼
?Zlib,Gzip等:通用壓縮方法
RCFile在Hive體系結(jié)構(gòu)中的位置
J,,
Application/EndUser
WebUI+HiveCLI+MapReduceHDFS
JDBC/ODBCUser-defined
Browse,Query,DDLMap-reduceScripts
MetaStoreUDF/UDAF
substr
sum
ThriftAPIaverage
FileFormats
SerDe
□TextFile
CSVSequenceFile
ThriftC***RCFile^2>
Regex
Reference:ZhengShao@HadoopinChma2009
RCFile存儲(chǔ)空間對(duì)比
數(shù)據(jù)表存儲(chǔ)空間比較:
儲(chǔ)格式原始文件大小壓縮行存儲(chǔ)文件大RCFILE壓RCFILE文
數(shù)康、小縮文件大小件長(zhǎng)度同
M5.49X
uri_infor10.11MB2.13MB1.8MB/
user_login_data68.71MB21.03MB20.28MB/3.57%1
16.48%I
url_access_data219.44MB69.59MB58.12MBI
30.7%/
lineitem724.66MB227.07MB157.29MB\
注:RCFILE文件長(zhǎng)度同比減小二(RCFILE壓縮文件大小-壓縮行存
儲(chǔ)文件大?。?壓縮行存儲(chǔ)文件大小
RCFile查詢性能對(duì)比
?:?在Hive中測(cè)試RCFile的性能
測(cè)試環(huán)境
節(jié)點(diǎn)操作系統(tǒng):LinuxCentOSrelease5.3
■CPU:4核AuthenticAMD1.8GHz
內(nèi)存:5GB
?:?測(cè)試查詢
selectl_returnflag,l_linestatus,sum(l_quantity)assum_qty,sum(l_extendedprice)as
sum_base_price,sum(l_extendedprice*(1-l_discount))assum_disc_price,sum(l_extendedprice*
(1-l_discount)*(1+l_tax))assum_chargefromlineitemwherel_shipdate<='1998-12-01'group
byl_returnflag,l_linestatus;
?:?測(cè)試結(jié)果
單位:秒
節(jié)點(diǎn)也模4nodes7nodes
、、、存儲(chǔ)方式
RCFile性靛RCFile性能提RCFile性能RCFile崢提
提高(對(duì)比高(對(duì)比行存提高(對(duì)比高(對(duì)比行存
行存儲(chǔ)行存儲(chǔ)壓縮RCFile壓縮行存儲(chǔ))儲(chǔ)壓寫、行存儲(chǔ)行存儲(chǔ)壓縮RCFile壓縮行存儲(chǔ))儲(chǔ)壓縮)
5GB971797.1185.0612%63.4365.2961.024%
10GB16771172.53153.229%I11%\96.2397.5688.978%I9%
112%
15GB240.56243.19214.5211%|130.59140.10121.817%113%|
100GB1561791574.941370.3012%\13%j797.86785.73670.3416%V5%/
加速性能:5GB28%/10GB42%/15GB43%/100GB51%
互補(bǔ)式聚簇索引(CQndex)
?研究動(dòng)機(jī)
-多種的資源發(fā)現(xiàn)請(qǐng)求是多維區(qū)間查詢ComplementaryClusteringIndex
?網(wǎng)絡(luò)應(yīng)用中多維區(qū)間查詢是普遍需求
-不斷增大的數(shù)據(jù)量提出了挑戰(zhàn):性能、存儲(chǔ)開(kāi)銷、可靠性
?應(yīng)用需要什么樣的數(shù)據(jù)模型?
/數(shù)據(jù)模型介于
實(shí)現(xiàn)復(fù)雜性增加M
R:模型
數(shù)據(jù)邏輯OrderedTable
關(guān)聯(lián)強(qiáng)度?和關(guān)系模型之間
-
多列多表,關(guān)系模型-/思路:增強(qiáng)高可擴(kuò)
但表間有關(guān)系(關(guān)系數(shù)據(jù)庫(kù))-
&展性、高性能、高可
K
w
s靠性的分布式順序表
多列多表,
fc
但表間無(wú)關(guān)系商(DistribuedOrdered
定
-以支持
-Table,DOT)
-
-多維區(qū)間查詢__
單列單表-^CCIndexW^^T^S
的索引百匚矗
基于主鍵的多維通用關(guān)系O:
區(qū)間查詢區(qū)間查詢查詢數(shù)據(jù)查詢能力
基于HBase實(shí)現(xiàn)CCIndex
?把用于備份數(shù)據(jù)的副本組織成為多份互為補(bǔ)
充和校驗(yàn)的互補(bǔ)聚簇索引表,利用索引表上
高效的連續(xù)掃描代替原表上的隨機(jī)讀取。
多屬性區(qū)間查詢、?基于分布式順序表的分片信息對(duì)子查詢結(jié)果
查詢優(yōu)化、記錄查詢優(yōu)化集的大小進(jìn)行估算,最后挑選最小子查詢執(zhí)
級(jí)數(shù)據(jù)恢復(fù)行查詢過(guò)程。
?通過(guò)互補(bǔ)聚簇索引表和互補(bǔ)校驗(yàn)表進(jìn)行數(shù)據(jù)
數(shù)據(jù)恢復(fù)恢復(fù),保證可恢復(fù)性同時(shí)僅少量增加存儲(chǔ)開(kāi)
CCIndex銷。
CQndex數(shù)據(jù)組織
基于ApacheHBase
CC1T2,key2=idx2+id+idx2Length
ComplementalClusteringIndexTable(CC1T0)
-禁用底層HDFS的副key2idxlinfo
ididxlidx2info
本機(jī)制nl00102cpuinfol
001cpunlinfol
nlOO2O2meminfo2
-互補(bǔ)聚簇表和互補(bǔ)檢002memnlinfo2
n200402cpu1nfo4
查表用HBase存儲(chǔ)003netn3info3
n3OO3O2netinfo3
-數(shù)據(jù)物理分布004cpun2info4
多張互補(bǔ)聚簇索引表1dx2key2idxl
CCIT
-分別以某索引列全局CCIT1,key1=idx1+id+idx1Length
有序keyl1dx2infoCCT2,
ComplementalCheckTable,CCTO,replicated
-其主鍵為索引列的值replicatedcpu00103nlinfol
+原主鍵+索引列的值cpu00403n2info4
的長(zhǎng)度memOO2O3nlinfo2
netOO3O3n3info3
-隨機(jī)變連續(xù)
keylIidx2
Primarykey
互補(bǔ)校驗(yàn)表CCTCCTl,
replicatedindexcolumn
-存儲(chǔ)主鍵和索引列的
IIdata卜
對(duì)應(yīng)關(guān)系
查詢優(yōu)化與數(shù)據(jù)恢復(fù)
region1startkey=>2endregion1startkey=>0end
key=>3key=>3
通過(guò)CCT校驗(yàn)數(shù)據(jù),并從其它表中
region2startkey=>3endregion2startkey=>3end
key=>5key=>8獲取數(shù)據(jù),修補(bǔ)缺失。
CC1T2,key2=idx2+id+idx2Length
ConiplenientalClusteringIndexTable(CCITO)
key2info
region60startkey=>90idinfow
region60startkey=>852nl00102infol
endkey=>93endkey=>91001infol
*nlOO2O2info2
002info2
n200402info4
region61startkey=>93region61startkey=>91003info3w
n300302
endkey=>100endkey=>100004info4info3
metadataoftableindexedbymetadataoftableindexedbyIkey2
id
CPULoadmemoryusagekey2
id9
data
找到內(nèi)存占用較高但CPU較空閑的Server
query:select,where(CPULoad<50andmemoryusage>98)74CCIT1,keyl=idxI+id-idxILength
7
keylinfoCCT2,
c(mplementalCheckTable.CCTO,replicated
個(gè)個(gè)2
40region1regionreplicatedcpu00103infol
I\掃描按內(nèi)存占用率索引表,并用CPULoad篩cpu00403info4
?LZ選結(jié)果LostdatairrFn?
netOO3O3info3
\|keyl
RyercheckCCT||Primarykey
keyl44^CCTl,
通過(guò)分片信息預(yù)估掃描范圍,優(yōu)化data
7re)licatedIndexcolumn
查詢執(zhí)行速度。mem00203*||data
<>
CCIndex應(yīng)用效果
■環(huán)境:3節(jié)點(diǎn)
-雙CPU共4核,2.0
GHzAMDOpteron,6
(
SGB內(nèi)存,186GB
VP5
」
。RAID1SCSI磁盤,千
①。
M
)兆以太網(wǎng)
?負(fù)載
-100萬(wàn)隨機(jī)生成數(shù)據(jù),
長(zhǎng)度1K字節(jié),
-主鍵+3個(gè)索引列
■測(cè)試內(nèi)容
?CCIndex的索引掃描操作吞吐率是隨機(jī)讀寫,連續(xù)讀寫,
IndexedTable的11.4倍掃描原表,掃描索引
?CCIndex的隨機(jī)寫和順序?qū)懲掏侣史謩e比
IndexedTable快54.9%和121.4%
注:IndexedTable是HBase中的二級(jí)索引實(shí)現(xiàn)
CCIndex應(yīng)用效果
?CCIndex與
IndexedTable相比:
-索引列數(shù)N,取
值從2到4_
—IndexTable的副
本數(shù),取值為
N+1(估計(jì)值)
-記錄長(zhǎng)度蟒5/四
長(zhǎng),取值從10到30
?CCIndex存儲(chǔ)開(kāi)銷相
CCIndex應(yīng)用效果
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 產(chǎn)后肚子黑的健康宣教
- Hebra癢疹的臨床護(hù)理
- 牛皮癬的臨床護(hù)理
- 《解讀營(yíng)銷半天》課件
- 風(fēng)險(xiǎn)評(píng)估與管理計(jì)劃
- 教師繼續(xù)教育與培訓(xùn)計(jì)劃
- 私人保齡球館租賃合同三篇
- 影視拍攝合同三篇
- 教學(xué)任務(wù)完成情況分析報(bào)告計(jì)劃
- 中高端女包行業(yè)相關(guān)投資計(jì)劃提議范本
- 胃食管反流病課件
- 第十四講 建設(shè)鞏固國(guó)防和強(qiáng)大人民軍隊(duì)PPT習(xí)概論2023優(yōu)化版教學(xué)課件
- 凸透鏡成像的規(guī)律說(shuō)課公開(kāi)課一等獎(jiǎng)市賽課一等獎(jiǎng)?wù)n件
- 中煤塔山煤礦基本情況介紹
- 中藥分析概論
- 專精特新專題解讀與分析報(bào)告
- 歡樂(lè)喜劇人小沈陽(yáng)《不差錢2》小品臺(tái)詞
- 地質(zhì)災(zāi)害危險(xiǎn)性評(píng)估報(bào)告
- 水產(chǎn)動(dòng)物營(yíng)養(yǎng)原理蛋白質(zhì)營(yíng)養(yǎng)
- 2023年英語(yǔ)競(jìng)賽人教新版小學(xué)六年級(jí)英語(yǔ)競(jìng)賽試題
- 2022-2023學(xué)年廣東省廣州市黃埔區(qū)八區(qū)聯(lián)考高一年級(jí)上冊(cè)學(xué)期期末數(shù)學(xué)試題【含答案】
評(píng)論
0/150
提交評(píng)論