下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)倉(cāng)庫(kù)的多維模型和數(shù)據(jù)立方體與OLAP中分別對(duì)多維模型和OLAP的一些基本概念進(jìn)行了介紹,這篇文章是基于那兩篇文章的深入擴(kuò)展,主要介紹的是多維OLAP中兩個(gè)重要構(gòu)成元素維和立方的結(jié)構(gòu)和組成??赡軆?nèi)容會(huì)偏向于模型構(gòu)建方面,對(duì)那方面不太感興趣的同學(xué)可以直接跳過(guò)。 維(Dimension)維是用于從不同角度描述事物特征的,一般維都會(huì)有多層(Level),每個(gè)Level都會(huì)包含一些共有的或特有的屬性(Attribute),可以用下圖來(lái)展示下維的結(jié)構(gòu)和組成:以時(shí)間維為例,時(shí)間維一般會(huì)包含年、季、月、日這幾個(gè)Level,每個(gè)Level一般都會(huì)有ID、NAME、DESCRIPTION這幾個(gè)公共屬性,這幾個(gè)
2、公共屬性不僅適用于時(shí)間維,也同樣表現(xiàn)在其它各種不同類(lèi)型的維。其中ID一般被視為代理主鍵(Agent),它只被用于作為唯一性標(biāo)志,并且是多維模型中關(guān)聯(lián)關(guān)系的代理者,在業(yè)務(wù)層面并不具有任何意義;NAME一般是業(yè)務(wù)主鍵(Business),在業(yè)務(wù)層面限制唯一性,一般作為數(shù)據(jù)裝載(Load)時(shí)的關(guān)聯(lián)鍵;而DESCRIPTION則記錄了詳細(xì)描述信息,在多維展示和分析時(shí)我們都會(huì)選擇使用DESCRIPTION來(lái)表述具體含義。這3個(gè)屬性一般是所有Level都會(huì)共用的,而比如用于描述星期幾的屬性weekid可能只會(huì)用于“日期”這層,因?yàn)槟暝露疾痪邆溥@一信息。所以圖中我將Attributes放到了一個(gè)層面上,就如
3、同是不同的Level從底層的多個(gè)Attributes中選取自身所需的屬性,Attributes層是包含著各個(gè)Level的共有和特有屬性的集合。 Hierarchy因?yàn)椴恢涝趺捶g好,所以還是用英文吧。Hierarchy(等級(jí)、層級(jí)的意思),中文的OLAP相關(guān)文檔中普遍翻譯為“層次”,而上面的Level被普遍翻譯為“級(jí)別”,我經(jīng)常會(huì)被這樣的翻譯搞混淆,所以我上面也一直用Level,至少對(duì)我來(lái)說(shuō)這樣看起來(lái)反而清晰點(diǎn) 。因?yàn)樯厦孢@個(gè)結(jié)構(gòu)的維是無(wú)法直接應(yīng)用于OLAP的,我前面的文章有介紹,其實(shí)OLAP需要基于有層級(jí)的自上而下的鉆取,或者自下而上地聚合。所以每一個(gè)維必須有Hierarchy,至少有一個(gè)
4、默認(rèn)的,當(dāng)然可以有多個(gè),見(jiàn)下圖:有了Hierarchy,維里面的Level就有了自上而下的樹(shù)形結(jié)構(gòu)關(guān)系,也就是上層的每一個(gè)成員(Member)都會(huì)包含下層的0個(gè)或多個(gè)成員,也就是樹(shù)的分支節(jié)點(diǎn)。這里需要注意的是每個(gè)Hierarchy樹(shù)的根節(jié)點(diǎn)一般都設(shè)置成所有成員的匯總(Total),當(dāng)該維未被OLAP中使用時(shí),默認(rèn)顯示的就是該維上的匯總節(jié)點(diǎn),也就是該維所有數(shù)據(jù)的聚合(或者說(shuō)該維未被用于細(xì)分)。Hierarchy中的每一層都會(huì)包含若干個(gè)成員(Member),還是以時(shí)間維,假設(shè)我們建的是2006-2015這樣一個(gè)時(shí)間跨度的時(shí)間維,那么最高層節(jié)點(diǎn)僅有一個(gè)Total的成員,包含了所有這10年的時(shí)間,而年
5、的那層Level中包含2006、20072015這10個(gè)成員,每一年又包含了4個(gè)季度成員,每個(gè)季度包含3個(gè)月份成員這樣似乎順理成章多了,我們就可以基于Hierarchy做一些OLAP操作了。每個(gè)Hierarchy都包含了一個(gè)樹(shù)形結(jié)構(gòu),但維中也可以包含多個(gè)Hierarchy,正如上圖所示,維中的Hierarchy相互獨(dú)立地構(gòu)建了自己的樹(shù)形結(jié)構(gòu)。還是以時(shí)間維為例,時(shí)間維可以根據(jù)日歷(Calendar)時(shí)間組建日歷的Hierarchy,也可以根據(jù)財(cái)務(wù)(Fiscal)時(shí)間組建財(cái)務(wù)的Hierarchy,而其中財(cái)務(wù)季度的劃分可能并不與日歷一致,基于這種多樣的Hierarchy,我們?cè)诮M建多維模型時(shí)可以按需
6、選擇合適的,比如給財(cái)務(wù)部的數(shù)據(jù)分析模型選用財(cái)務(wù)Hierarchy,而其他部門(mén)的分析人員顯然希望看到日歷樣式的Hierarchy,這樣就完美地滿(mǎn)足了不同的需求。多種的Hierarchy劃分同樣適用于產(chǎn)品維,根據(jù)產(chǎn)品類(lèi)型、產(chǎn)品規(guī)格等劃分 Hierarchy,對(duì)于按多種條件的產(chǎn)品篩選和檢索是十分有效的,實(shí)例可以參見(jiàn)淘寶搜索商品界面和太平洋電腦中產(chǎn)品報(bào)價(jià)界面分類(lèi)篩選模塊,這里不再截圖了。立方(Cube)這里所說(shuō)的立方其實(shí)就是多維模型中間的事實(shí)表(Fact Table),它會(huì)引用所有相關(guān)維的維主鍵作為自身的聯(lián)合主鍵,加上度量(Measure)和計(jì)算度量(Calculated Measure)就組成了立方
7、的結(jié)構(gòu):度量是用于描述事件的數(shù)字尺度,比如網(wǎng)站的瀏覽量(Pageviews)、訪問(wèn)量(Visits),再如電子商務(wù)的訂單量、銷(xiāo)售額等。度量是實(shí)際儲(chǔ)存于物理表中的,而計(jì)算度量則沒(méi)有,計(jì)算度量是通過(guò)度量計(jì)算得到的,比如同比(如去年同期的月利潤(rùn))、環(huán)比(如上個(gè)月的利潤(rùn))、利率(如環(huán)比利潤(rùn)增長(zhǎng)率)、份額(如該月中某類(lèi)產(chǎn)品利潤(rùn)所占比例)、累計(jì)(如從年初到當(dāng)前的累加利潤(rùn))、移動(dòng)平均(如最近7天的平均利潤(rùn)額)等,這些計(jì)算度量在Oracle中都可以借助分析函數(shù)直接計(jì)算得到,相信大部分的OLAP組件都會(huì)提供類(lèi)似在時(shí)間序列上的分析功能。而這些計(jì)算度量往往對(duì)于分析而言更具意義,立方中借助與各個(gè)維的關(guān)聯(lián)關(guān)系從不同的角度和層面來(lái)展現(xiàn)這些度量。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 長(zhǎng)春金融高等專(zhuān)科學(xué)?!逗蜌馀璧爻练e學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 食品檢驗(yàn)取樣技術(shù)規(guī)程
- 保險(xiǎn)風(fēng)險(xiǎn)應(yīng)對(duì)策略模板
- IT部門(mén)年度工作報(bào)告模板
- 聲音科學(xué)詳解模板
- 生物技術(shù)基礎(chǔ)培訓(xùn)模板
- 問(wèn)卷調(diào)查報(bào)告格式
- 二零二五版商用鍋爐運(yùn)行安全保障合同范本3篇
- 統(tǒng)編版五年級(jí)語(yǔ)文上冊(cè)寒假作業(yè)(十)(有答案)
- 2024-2025學(xué)年天津市和平區(qū)高一上學(xué)期期末質(zhì)量調(diào)查數(shù)學(xué)試卷(含答案)
- DL∕T 1631-2016 并網(wǎng)風(fēng)電場(chǎng)繼電保護(hù)配置及整定技術(shù)規(guī)范
- 電廠C級(jí)檢修工藝流程
- 函授本科《小學(xué)教育》畢業(yè)論文范文
- 高考高中英語(yǔ)單詞詞根詞綴大全
- 藥用輔料聚乙二醇400特性、用法用量
- 《中小學(xué)機(jī)器人教育研究(論文)11000字》
- GB/T 22085.1-2008電子束及激光焊接接頭缺欠質(zhì)量分級(jí)指南第1部分:鋼
- 全過(guò)程人民民主學(xué)習(xí)心得體會(huì)
- 2023年上海期貨交易所招聘筆試題庫(kù)及答案解析
- word企業(yè)管理封面-可編輯
- 全國(guó)醫(yī)療服務(wù)價(jià)格項(xiàng)目規(guī)范(2012年版)-工作手冊(cè)
評(píng)論
0/150
提交評(píng)論