




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第2-1章數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)——維度建模1數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型分類2維度模型的相關(guān)概念3維度模型的結(jié)構(gòu)2.1數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型分類
2.1數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型分類維度模型范式模型DataVault模型Anchor模型2.2維度模型的相關(guān)概念
RalphKimball,數(shù)據(jù)倉(cāng)庫(kù)方面的知名學(xué)者,畢業(yè)于斯坦福大學(xué)。他創(chuàng)立的維度建模方法論(或Kimball方法論)已經(jīng)成為決策支持領(lǐng)域的金科玉律。該方法非常直觀,緊緊圍繞業(yè)務(wù)模型,不需要經(jīng)過(guò)特別的抽象處理,即可完成維度建模。2.2.1粒度(Granularity)
粒度是指數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)單元的詳細(xì)程度和級(jí)別,確定數(shù)據(jù)倉(cāng)庫(kù)的粒度是設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的一個(gè)最重要方面。
數(shù)據(jù)越詳細(xì),粒度越小級(jí)別就越低;數(shù)據(jù)綜合度越高,粒度越大級(jí)別就越高。例如,地址數(shù)據(jù)中“北京市”比“北京市海淀區(qū)”的粒度大。2.2.2維度(Dimension)和維度表
維度(簡(jiǎn)稱為維)是指人們觀察事物的特定的角度,概念上類似于關(guān)系表的屬性。例如企業(yè)常常關(guān)心產(chǎn)品銷售數(shù)據(jù)隨著時(shí)間推移而變化的情況,這是從時(shí)間的角度來(lái)觀察產(chǎn)品的銷售,即時(shí)間維;企業(yè)也常常關(guān)心本企業(yè)的產(chǎn)品在不同地區(qū)的銷售分布情況,這是從地理分布的角度來(lái)觀察產(chǎn)品的銷售,即地區(qū)維。存放維數(shù)據(jù)的表稱為維表,如下表所示就是一個(gè)時(shí)間維表。維表中的數(shù)據(jù)具有維層次結(jié)構(gòu),包含維屬性和維成員。編號(hào)日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年2.維屬性和維成員一個(gè)維是通過(guò)一組屬性來(lái)描述的,如時(shí)間維包含年份、季度、月份和日期等屬性,這里的年份、季度等稱為時(shí)間維的維屬性。維的一個(gè)取值稱為該維的一個(gè)維成員,如果一個(gè)維是多層次的,那么該維的維成員是在不同維層次的取值組合。例如,一個(gè)時(shí)間維具有年份、季度、月份、日期四個(gè)層次,分別在四個(gè)層次各取一個(gè)值,就得到時(shí)間維的一個(gè)維成員,即某年某季某月某日。編號(hào)日期月份季度年份12015.1.52015年1月2015年1季度2015年22015.3.82015年3月2015年1季度2015年32015.10.12015年10月2015年4季度2015年42015.12.32015年12月2015年4季度2015年3.維層次同一維度可以存在細(xì)節(jié)程度不同的各個(gè)值,可以將粒度大的值映射到粒度小的值,這樣構(gòu)成維層次(或維層次結(jié)構(gòu))或概念分層,即將低層概念映射到更一般的高層概念,概念分層允許在各種抽象級(jí)審查和處理數(shù)據(jù)。例如對(duì)于地點(diǎn)維,有“杭州→浙江→中國(guó)”的維層次。又例如時(shí)間維,可以從年、季度、月份、日期來(lái)描述,那么“年份→季度→月份→日期”就是維層次。時(shí)間維維屬性2014/20152014年二季度2014年4月2014年4月25日維成員維層次2.2.3度量(Measure)或事實(shí)(Fact)度量是數(shù)據(jù)倉(cāng)庫(kù)中的信息單元,即多維空間中的一個(gè)單元,用以存放數(shù)據(jù),也稱為事實(shí)(Fact)。通常是數(shù)值型數(shù)據(jù)并具有可加性。例如:
(日期,商品,地區(qū),銷售量,銷售金額)其中,銷售量、銷售金額就是兩個(gè)度量。事實(shí)表時(shí)間維鍵顧客維鍵地區(qū)維鍵商品維鍵銷售數(shù)量銷售金額(元)1111115001222250001333128001444375002.2.4多維數(shù)據(jù)集數(shù)據(jù)倉(cāng)庫(kù)和OLAP服務(wù)是基于多維數(shù)據(jù)模型的,這種模型將多維數(shù)據(jù)集看作數(shù)據(jù)立方體(DataCube)形式。多維數(shù)據(jù)集可以用一個(gè)多維數(shù)組來(lái)表示,它是維和度量列表的組合表示。一個(gè)多維數(shù)組可以表示為:
(維1,維2,……,維n,度量列表)某商店銷售情況表按多維數(shù)組組織起來(lái)的三維立方體增加顧客維度后,按四維數(shù)組組織起來(lái)的多維立方體2.3維度模型的結(jié)構(gòu)多維數(shù)據(jù)模型簡(jiǎn)潔、面向主題的由維度表和事實(shí)表組成直觀的展示數(shù)據(jù)組織形式,利于數(shù)據(jù)的訪問(wèn)常見的多維數(shù)據(jù)模型有三種結(jié)構(gòu):星型模型、雪花模型、事實(shí)星座模型1)
星形模型
星形模型(Starschema)是由一個(gè)事實(shí)表和一組維表組成,每個(gè)維表都有一個(gè)維主鍵,所有這些維組合成事實(shí)表的主鍵,換言之,事實(shí)表主鍵的每個(gè)元素都是維表的外鍵。該模式的核心是事實(shí)表,通過(guò)事實(shí)表將各種不同的維表連接起來(lái),各個(gè)維表都連接到中央事實(shí)表。(1)星形模型的基本結(jié)構(gòu)星形模型的基本結(jié)構(gòu)如下:
【例2.1】一個(gè)“銷售”數(shù)據(jù)倉(cāng)庫(kù)的星形模型如圖2.5所示。該模式包含一個(gè)中心事實(shí)表“銷售事實(shí)表”和4個(gè)維表:時(shí)間維表、銷售商品維表、銷售地點(diǎn)維表和顧客維表。在銷售事實(shí)表中存儲(chǔ)著四個(gè)維表的主鍵和兩個(gè)度量“銷售量”和“銷售金額”。提問(wèn):星形模型的特點(diǎn):維度表只與事實(shí)表關(guān)聯(lián),維度表彼此之間沒(méi)有任何聯(lián)系。每個(gè)維度表中的主碼都只能是單列的,同時(shí)該主碼被放置在事實(shí)數(shù)據(jù)表中,作為事實(shí)數(shù)據(jù)表與維表連接的外碼。星型模式是以事實(shí)表為核心,其他的維度表圍繞這個(gè)核心表呈星型狀分布。2)雪花模型(1)雪花模型的基本結(jié)構(gòu)
雪花模型(Snowflakeschema)是對(duì)星形模型的擴(kuò)展,每一個(gè)維表都可以向外連接多個(gè)詳細(xì)類別表。在這種模式中,維表除了具有星形模型中維表的功能外,還連接對(duì)事實(shí)表進(jìn)行詳細(xì)描述的詳細(xì)類別表,詳細(xì)類別表通過(guò)對(duì)事實(shí)表在有關(guān)維上的詳細(xì)描述達(dá)到了縮小事實(shí)表和提高查詢效率的目的,雪花模型的基本結(jié)構(gòu)如下:維表數(shù)據(jù)規(guī)范化星形模型雖然是一個(gè)關(guān)系模型,但是它不是一個(gè)規(guī)范化的模型,在星形模型中,維表被故意地非規(guī)范化了,雪花模型對(duì)星形模型的維表進(jìn)一步標(biāo)準(zhǔn)化,對(duì)星形模型中的維表進(jìn)行了規(guī)范化處理。
【例2.2】在圖2.5的星形模型中,每維只用一個(gè)維表表示,而每個(gè)維表包含一組屬性。例如,銷售地點(diǎn)維表包含屬性集{Location_id,街道,城市,省,國(guó)家}。圖2.5這種模式可能造成某些冗余,例如,可能存在城市、省、國(guó)家字段的數(shù)據(jù)冗余:{101,“解放大道100號(hào)”,“武漢”,“湖北省”,“中國(guó)”}{201,“解放大道85號(hào)”,“武漢”,“湖北省”,“中國(guó)”}{255,“解放大道205號(hào)”,“武漢”,“湖北省”,“中國(guó)”}可以對(duì)地點(diǎn)維表進(jìn)一步規(guī)范化,如圖2.7所示,這樣就構(gòu)成了“銷售”數(shù)據(jù)倉(cāng)庫(kù)的雪花模型。圖2.7地點(diǎn)維表數(shù)據(jù)規(guī)范化提問(wèn):雪花模型的特點(diǎn):某個(gè)維表不與事實(shí)表直接關(guān)聯(lián),而是與另一個(gè)維表關(guān)聯(lián)??梢赃M(jìn)一步細(xì)化查看數(shù)據(jù)的粒度。維表和與其相關(guān)聯(lián)的其他維表也是靠外碼關(guān)聯(lián)的。也以事實(shí)數(shù)據(jù)表為核心。(2)雪花模型和星形模型的比較比較項(xiàng)目星形模型雪花模型記錄行數(shù)多少表數(shù)量少多搜索維的時(shí)間快慢可讀性容易難3)事實(shí)星座模型(1)事實(shí)星座模型的基本結(jié)構(gòu)通常一個(gè)星形模型或雪花模型對(duì)應(yīng)一個(gè)問(wèn)題的解決(一個(gè)主題域),它們都有多個(gè)維表,但是只能存在一個(gè)事實(shí)表。在一個(gè)多主題域的復(fù)雜數(shù)據(jù)倉(cāng)庫(kù)中可能存放多個(gè)事實(shí)表,此時(shí)就會(huì)出現(xiàn)多個(gè)事實(shí)表共享某一個(gè)或多個(gè)維表的情況,這就是事實(shí)星座模型(FactConstellationsschema)。
【例2.3】在圖2.5的星形模型的基礎(chǔ)上,增加一個(gè)供貨分析主題,包括供貨時(shí)間(Time_id)、
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 住宅室內(nèi)裝修合同
- 三農(nóng)村基層法治建設(shè)與實(shí)踐方案
- 模板安裝施工方案
- 建筑施工工程承包合同條例
- 鋪筑施工方案
- 洗手間防水卷材的施工方案
- 《大數(shù)據(jù)技術(shù)導(dǎo)論》-教案
- 安徽省宿州市靈璧縣2024-2025學(xué)年上學(xué)期八年級(jí)數(shù)學(xué)期末試卷(原卷版+解析版)
- 自貢賓館消防施工方案
- 年產(chǎn)1000噸微生物菌劑項(xiàng)目環(huán)評(píng)報(bào)告表
- GB/T 17187-2009農(nóng)業(yè)灌溉設(shè)備滴頭和滴灌管技術(shù)規(guī)范和試驗(yàn)方法
- GB/T 12624-2006勞動(dòng)防護(hù)手套通用技術(shù)條件
- GB/T 12459-1990鋼制對(duì)焊無(wú)縫管件
- 公司參觀登記表
- GB 20517-2006獨(dú)立式感煙火災(zāi)探測(cè)報(bào)警器
- 診所備案信息表2022
- 儀器校正培訓(xùn)教材課件
- 混凝土裂縫類型產(chǎn)生原因以及防治處理措施課件
- 腰椎間盤突出癥教學(xué)查房課件
- 21世紀(jì)中美關(guān)系發(fā)展趨勢(shì)課件
- 房建工程施工監(jiān)理實(shí)施細(xì)則培訓(xùn)資料
評(píng)論
0/150
提交評(píng)論